Проверка статистических гипотез
Методы проверки статистических гипотез занимают центральное место в исследованиях математической статистики. Статистической гипотезой называется некоторое предположение, которое принимается или отвергается на основании эмпирических данных.
Нулевой (основной) называют выдвинутую гипотезу /То-
Конкурирующей (альтернативной) называют гипотезу Н, которая противоречит нулевой гипотезе. Если в итоге проверки основная гипотеза отвергается, то принимается конкурирующая. В итоге проверки гипотезы могут быть совершены ошибки двух родов.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через а. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в среднем в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу). Часто вместо уровня значимости а задают доверительную вероятность р = 1 - а, которая имеет смысл несовершения ошибки.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через 0. Величина 1-0 называется мощностью критерия.
Статистическим критерием (или просто критерием) называют метод проверки гипотезы. Как правило, все критерии имеют следующий алгоритм:
на основании выборочных данных рассчитывают некоторую величину Z, называемую статистикой критерия;
по специальным статистическим таблицам или на ЭВМ находят критическое значение статистики критерия ZKp — на основании объема выборки и уровня значимости;
из сравнения Z и ZKp делают вывод о принятии Но или Н.
Критерии согласия.
Одной из важнейших групп критериев проверки статистических гипотез являются критерии проверки гипотез о виде распределений (критерии согласия). Они по выборочным данным проверяют предположение о принадлежности генеральной совокупности к тому или иному виду распределений. Одним из наиболее мощных критериев согласия является критерий Пирсона, называемый еще критерием хи-квадрат. Его суть заключается в сравнении теоретических частот элементов выборки щ (для дискретных распределений) с теоретическими частотами п ? = пр,, где р, — вероятность принять это значение, рассчитанное по исследуемому закону распределения. Если распределение непрерывное, то строится группированный статистический ряд из к интервалов и р, = F(bi)-F(ai) является вероятностью попасть в z-й интервал группировки (здесь Г(х) — функция распределения проверяемого закона). Статистикой кри-
2 Л (п~п')2
терия является величина % = 2^------— . Критическое значение критерия рав-
,=1 п'
но обратному распределению хи-квадрат со степенями свободы (к - г - 1): %2r = X-c№~r ~ 1)’ где г — число оцениваемых параметров закона распределения. Распределение можно считать соответствующим теоретическому, если выполняется условие %2 < %2Г. Рассмотрим решение данной задачи на примере.
ПРИМЕР 3.3.1. Имеется выборка прибыли (тыс. р.) коммерческой фирмы за 40 дней. Необходимо проверить статистическую гипотезу о том, что прибыль данной фирмы распределена по нормальному закону распределения. Взять уровень значимости «=0,05 (табл. 3.3.1).
Таблица 3.3.1
Выборка прибыли коммерческой фирмы за 40 дней (тыс. |
Р.) |
||||||||||||||||||
64 |
56 |
69 |
78 |
78 |
83 |
47 |
65 |
77 |
57 |
61 |
52 |
50 |
58 |
60 |
48 |
62 |
63 |
68 |
64 |
64 |
64 |
79 |
66 |
65 |
62 |
85 |
75 |
88 |
61 |
82 |
52 |
72 |
75 |
84 |
66 |
62 |
73 |
64 |
74 |
РЕШЕНИЕ. Для проверки гипотезы о принадлежности генеральной совокупности нормальному виду распределений необходимо строить группированный статистический ряд, т. к. нормальное распределение является непрерывным. Для этого нужно знать размах выборки, который равен разнице между максимальным и минимальным элементами выборки. Кроме того, нужно рассчитать точечные оценки математического ожидания и среднеквадратического отклонения (СКО). Открываем электронную таблицу и вводим данные выборки в ячейки А2-А41, делаем подписи для расчетных параметров в соответствии с рис. 3.3.1.
А |
в |
С |
D |
Е |
I “ |
G |
|
1 |
Выборка |
Параметры |
Интервалы |
Частота |
Вер-ть |
Теор.част. |
Критерий |
2 |
64 |
Объем |
|||||
3 |
56 |
||||||
4 |
69 |
Максимум |
|||||
5 |
78 |
||||||
6 |
78 |
Минимум |
|||||
7 |
83 |
||||||
8 |
47 |
Среднее |
|||||
9 |
65 |
||||||
10 |
77 |
|ско |
|||||
11 |
57 |
Рис. 3.3.1
Вычисляем параметры по выборке. Для этого вводим в ячейку ВЗ «=СЧЁТ(А2:А41)» (здесь и далее кавычки вводить не надо, функции можно вводить с помощью мастера функций из категории «Статистические», ссылки на ячейки можно ввести, щелкнув мышью по ячейке). В В5 вводим «=МАКС(А2:А41)», в В7 «=МИН(А2:А41)», в В9 «=СРЗНАЧ(А2:А41)», в Bl 1 «=СТАНДОТКЛОН(А2:А41)».
Видно, что весь диапазон значений элементов лежит на интервале от 47 до 88. Разобьем этот интервал на интервалы группировки: [0; 50], (50; 55], (55; 60], (60; 65], (65; 70], (70; 75], (75; 80], (80; 85], (85; 90]. Для этого вводим в ячейки С2-С11 границы интервалов (табл. 3.3.2).
Таблица 3.3.2
Ячейка |
С2 |
СЗ |
С4 |
С5 |
С6 |
С7 |
С8 |
С9 |
СЮ |
СИ |
Число |
0 |
50 |
55 |
60 |
65 |
70 |
75 |
80 |
85 |
90 |
Для вычисления частот п используем функцию ЧАСТОТА. Для этого в D3 вводим формулу «=ЧАСТОТА(А2:А41;СЗ:С11)». Затем обводим курсором ячейки D3-D11, выделяя их, и нажимаем F2, а затем одновременно Ctrl+Shift+Enter. В результате в ячейках D3-D11 окажутся значения частот.
Для расчета теоретической вероятности р, = F{bi) - F(a?) вводим в ячейку ЕЗ разницу между функциями нормального распределения (функция НОРМРАСП категории «Статистические») с параметрами: «X» — значение границы интервала, «Среднее» — ссылка на ячейку В9, «Стандартное откл» — ссылка на Bl 1, «Интегральная» — 1. В результате в ЕЗ будет формула «=НОРМРАСП(СЗ;$В$9;$В$11;1)-НОРМРАСП(С2;$В$9;$В$11;1)».
Автозаполняем эту формулу на ЕЗ-Е10, перемещая нижний правый угол ЕЗ до ячейки ЕЮ. В последней ячейке столбца Е11 для соблюдения условия нормировки вводим дополнение предыдущих вероятностей до единицы. Для этого вводим в Е11
«=1-СУММ(ЕЗ:Е10)».
Для расчета теоретической частоты и' = прt вводим в F3 формулу «=ЕЗ*$В$3», автозаполняем ее на F3-F11.
(и-п')2 П
Для вычисления элементов суммы ----критерия Пирсона вводим в
п'
G3 значение «=(D3-F3)*(D3-F3)/F3» и автозаполняем его на диапазон G3-G11.
Находим значение критерия и критическое значение для этого вводим в F12 подпись «Сумма», а в F13 подпись «Критич.». Вводим в соседние ячейки формулы — в G12: «=CYMM(G3:G11)», а в G13 «=ХИ20БР(0,05;6)», здесь параметр а = 0,05 взят из условия, а степень свободы (к - г - 1) = (9 - 2 -
1) = 6, так как к = 9 — число интервалов группировки, а г = 2, т. к. были оценены два параметра нормального распределения: математическое ожидание и СКО. Получили два числа: /2 = 0,942, а критическое значение = 12,59. Видно, что /2 < %2Г , то есть можно считать, что прибыль данной фирмы распределена по нормальному закону распределения (рис. 3.3.2).
Проверим это, построив графики плотностей эмпирического и теоретического распределений. Ставим курсор в любую свободную ячейку и вызываем мастер диаграмм (Вставка/Диаграмма). Выбираем тип диаграммы «График» и вид «График с маркерами» самый левый во второй строке, нажимаем «Далее». Ставим курсор в поле «Диапазон» и, удерживая кнопку CTRL, обводим мышью область ячеек D3-D11, а затем F3-F11. Переходим на закладку «Ряд» и в поле «Подписи оси X» обводим область СЗ-С11. Нажимаем «Готово». Видно, что графики достаточно хорошо совпадают, что говорит о соответствии данных нормальному закону.
Тот факт, что число продаж можно считать распределенным нормально, очень важен. Это позволяет делать различные вероятностные оценки, например, находить вероятности того, что за день будет продано более т автомобилей. Это позволит применять методы регрессионного анализа, основанные на методе наименьших квадратов и многое другое.
Критерий Пирсона также можно использовать для проверки предположения о том, что полученные в результате наблюдений данные соответствуют нормам. Пусть имеются некоторые показатели, которые должны соответствовать стандартным нормам. Для проверки из генеральной совокупности получается выборка значений данных показателей. Рассматривается гипотеза о том, что отклонения от норм невелики, и ими можно пренебречь.

? Гривая Гаусса нормального закона —Эмпирическое распределение
Рис. 3.3.2
Рассмотрим проверку гипотезы на примере.
ПРИМЕР 3.3.2. На консервном заводе принимаемое зерно горошка считается высшего сорта, если в нем не менее 60 % зерна размером более 7 мм в диаметре, не менее 20 % зерна размером 5-7 мм, 10 % зерна 4-5 мм и 10 % зерна менее 4 мм в диаметре. На завод привезли партию зерна, из которой отобрали одну тонну для проверки. В результате оказалось, что зерна размером более 7 мм в диаметре — 550 кг, зерна размером 5-7 мм — 220 кг, зерна 4-5 мм — 120 кг и зерна размером менее 4 мм — 110 кг. Можно ли с вероятностью 0,95 (а = 0,05) говорить о том, что привезенное зерно высшего сорта?
РЕШЕНИЕ. Если бы зерно точно соответствовало норме, то его количество из одной тонны распределялось бы по размерам как 600, 200, 100 и 100 кг. Введем в А1 заголовок «НОРМА» и ниже в А2-А5 показатели — числа 600, 200, 100, 100. В ячейку В1 введем заголовок «НАБЛЮДЕНИЯ» и ниже в В2-В5 наблюдаемые показатели 550, 220, 120, 110. В третьем столбце вводим формулы для критерия: в С1 заголовок «КРИТЕРИИ», в С2 формулу «=(А2-В2)*(А2-В2)/А2». Автозаполнением размножим эту формулу на СЗ-С5. В ячейку С6 запишем общее значение критерия — сумму столбца С2-С5. Для этого поставим курсор в С6 и, вызвав функции в категории «Математические», найдем СУММ и в аргументе «Число 1» укажем ссылку на С2-С5. Получится результат критерия Z = 11,16667. Для ответа на вопрос, соответствуют ли опытные показатели нормам, Z сравнивают с критическим значением 7.кр. Вводим в D1 текст «критическое значение», в Е1 вводим функцию ХИ2ОБР (категория «Статистиче ские»), у которой два аргумента: «Вероятность» — вводится уровень значимости а = 1 — р (в нашем случае 1 - 0,95 = 0,05) и «Степени_свободы» — вводят число (и - 1), где п — число норм (в нашем случае 4-1=3). Результат 7,814725. Видно, что критическое значение меньше критерия, следовательно, опытные данные не соответствуют стандартам и зерно с заданной вероятностью нельзя отнести к высшему сорту.