Предполагаемое среднее - Assumed mean

В статистике предполагаемый средний представляет собой способ для вычисления среднего арифметического и стандартного отклонения набора данных. Это упрощает расчет точных значений вручную. Его интерес сегодня в основном исторический, но его можно использовать для быстрой оценки этой статистики. Существуют и другие методы быстрого расчета, которые больше подходят для компьютеров, которые также обеспечивают более точные результаты, чем очевидные методы.

Пример

Во-первых: ищется среднее значение следующих чисел:

219, 223, 226, 228, 231, 234, 235, 236, 240, 241, 244, 247, 249, 255, 262

Предположим, мы начинаем с правдоподобного первоначального предположения о том, что среднее значение составляет около 240. Тогда отклонения от этого «предполагаемого» среднего значения следующие:

−21, −17, −14, −12, −9, −6, −5, −4, 0, 1, 4, 7, 9, 15, 22

Сложив их, можно сделать вывод, что:

22 и −21 почти отменяются, оставляя +1,
15 и −17 почти сокращаются, оставляя −2,
9 и −9 отменяют,
7 + 4 отменяет −6-5,

и так далее. Остается сумма −30. Таким образом, среднее из этих 15 отклонений от предполагаемого среднего составляет −30/15 = −2. Следовательно, это то, что нам нужно добавить к предполагаемому среднему значению, чтобы получить правильное среднее значение:

правильное среднее = 240-2 = 238.

Метод

Метод зависит от оценки среднего и округления до более удобного для расчета значения. Затем это значение вычитается из всех значений выборки. Когда образцы классифицируются по диапазонам равного размера, выбирается центральный класс, и количество диапазонов из него используется в расчетах. Например, для роста людей в качестве предполагаемого среднего может использоваться значение 1,75 м.

Для набора данных с предполагаемым средним значением x 0 предположим:

потом

или для стандартного отклонения выборки с использованием поправки Бесселя :

Пример использования диапазонов классов

Если имеется большое количество выборок, можно быстро получить разумную оценку среднего и стандартного отклонения, сгруппировав выборки в классы с использованием диапазонов равного размера. Это вносит ошибку квантования, но обычно достаточно точен для большинства целей, если используются 10 или более классов.

Например, за исключением,

167,8 175,4 176,1 166 174,7 170,2 178,9 180,4 174,6 174,5 182,4 173,4 167,4 170,7 180,6 169,6 176,2 176,3 175,1 178,7 167,2 180,2 180,3 164,7 167,9 179,6 164,9 173,2 180,3 168 175,5 172,9 182,2 166,7 172,4 189 180,3 172,9 182,2 166,7 172,4 181,9 175,6 172,9 182,2 166,7 172,4 181,180 172,1 172,8 166,7 172,4 181,9 178,1 172,8 172,8 166,7 172,4 183 180,1 178,1 172,8 166,7 172,8 178,1 178,1 178,1 172,8 166,7 172,4 181,9 175,6 172,8 166,7 172,4 183 180,1 175,6 172,9 163,3 172,5 163,4 165,9 178,2 174,6 174,3 170,5 169,7 176,2 175,1 177 173,5 173,6 174,3 174,4 171,1 173,3 164,6 173 177,9 166,5 159,6 170,5 174,7 182 172,7 175,9 171,5 167,1 176,9 181,7 170,7 177,54 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1 177,1

Минимальные и максимальные значения - 159,6 и 187,6, мы можем сгруппировать их следующим образом, округляя числа в меньшую сторону. Размер класса (CS) равен 3. Предполагаемое среднее значение находится в центре диапазона от 174 до 177, что составляет 175,5. Различия подсчитываются по классам.

Наблюдаемые числа в диапазонах
Диапазон подсчет частота класс diff частота × разница частота × разница 2
159–161 / 1 −5 −5 25
162–164 //// / 6 −4 −24 96
165–167 //// //// 10 −3 −30 90
168–170 //// //// /// 13 −2 −26 52
171–173 //// //// //// / 16 −1 −16 16
174–176 //// //// //// //// //// 25 0 0 0
177–179 //// //// //// / 16 1 16 16
180–182 //// //// / 11 2 22 44 год
183–185 0 3 0 0
186–188 // 2 4 8 32
Сумма N = 100 А = -55 В = 371

Среднее значение тогда оценивается как

что очень близко к фактическому среднему значению 173,846.

Стандартное отклонение оценивается как

Рекомендации