Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона
Пусть X — исследуемая случайная величина, закон распределения которой неизвестен, но есть основания предположить, что X имеет нормальное (или любое другое) распределение.
Критерий проверки гипотезу о предполагаемом законе неизвестного распределения называется критерием согласия.
Существует несколько критериев согласия: («хи квадрат») Пирсона, Колмогорова, Смирнова и др.
Критерий х Пирсона - наиболее часто употребляемый на практике. Рассмотрим применение этого критерия для проверки гипотезы о нормальном распределении генеральной совокупности. Следовательно, требуется при заданном уровне значимости проверить нулевую гипотезу А/0: генеральная совокупность распределена нормально.
Для решения этой задачи необходимо:
1. По выборке объема п, извлеченной из генеральной совокупности, построить эмпирическое распределение в виде последовательности равноотстоящих вариант и соответствующих им частот либо в виде последовательности интервалов (Xif и соответствующих им частот (Иг - сумма частот, попавших в i-й интервал):
Таблица 6.2
_______Таблица эмпирического распределения частот_______
Варианты |
||||
Частоты |
' 1 1 |
Таблица 6.3
Таблица эмпирического распределения частот
А |
(х2;х3) |
|||
Частоты |
Из — |
п. |
1
Если эмпирическое распределение такого вида как представлено в таблице 6.2, то следует вычислить выборочную среднюю %в, выборочное среднее квадратическое отклонение <ТВ и вычислить теоретические частотыгде n - объем выборки (И = Пг + П2 + ••• + h - шаг (разность между соседними вариантами);
u, =
ф(-х) =
3. Сравниваем эмпирические частоты с теоретическими П i с помощью критерия Пирсона:
для чего необходимо найти расчетное значение критерия :
2 V-n'i){{Вычислить выборочную среднюю х* и выборочное среднее квадратическое отклонение О’*; 2 Пронормировать X, т.е. перейти к случайной величине Z = (X-x*)/a* и вычислить концы интервалов zi = (X — ^*)/
а затем по таблице критических точек распределения по данно-му уровню значимости а и числу степеней свободы k= s-3 (s - число различных вариант либо число различных интервалов выборки) найти критическую точку ХкР(«Л). Если Хр<^Кр, то нет основа-2 2
ний отвергнуть нулевую гипотезу; если Хр>Хкр- т0 нулевую гипотезу следует отвергнуть.
Если эмпирическое распределение имеет вид как представлено в таблице 6.3, то необходимо:
1. Найти середины частичных интервалов
х(* = (х, + х1+1)/2
и записать статистическое распределение
X" |
||||
«7_______ |
ni |
ПХ |
__ |
4. Вычислить теоретические частоты = пРь где п - объем
выборки (п = + п2 Н-----Ь ni), Р[ = Ф(Х+1) — Ф(Х) - вероят
ность попадания X в интервал (х, Хг+1), Ф(г?) - функция Лапласа.
5. Сравнить эмпирические частоты с теоретическими как это было описано выше.
Пример 6.4. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема п= 150________________________
Г |
[75;77,5) |
[77,5 ;80) |
[80;82,5) |
[82,5;85) |
[85;87,5) |
2 |
10 |
15 |
18 |
20 |
|
ТП? = — п |
0,013 |
0,067 |
0,100 |
0,120 |
0,133 |
4 |
[87,5 ;90) |
[90;92,5) |
[92,5;95) |
[95;97,5) |
[97,5; 100) |
22 |
24 |
20 |
13 |
6 |
|
mi = — п |
0,147 |
0,160 |
0,133 |
0,087 |
0,040 |
Решение. Найдем середины ж* частичных интервалов (xi#Xi+1) заданного интервального эмпирического распределения и запишем распределение равноотстоящих вариант (частоты Ъ = ____________________________
76,25 |
78,75 |
81,25 |
83,75 |
86,25 |
88,75 |
91,25 |
93,75 |
96,25 |
98,75 |
|
XX__ |
2 |
10 |
15 |
18 |
20 |
22 |
24 |
20 |
13 |
6 |
Таблица 6.4
Вычисление интервалов
i |
Г раницы интервала |
Границы интервала |
||||
X |
xt+i |
|||||
1 |
75 |
77,5 |
- |
-10,85 |
— <у: |
-1,94 |
2 |
77,5 |
80,0 |
-10,85 |
-8,35 |
-1,94 |
-1,49 |
3 |
80,0 |
82,5 |
-8,35 |
-5,85 |
-1,49 |
-1,05 |
4 |
82,5 |
85,0 |
-5,85 |
-3,35 |
-1,05 |
-0,60 |
5 |
85,0 |
87,5 |
-3,35 |
-0,85 |
-0,60 |
-0,15 |
6 |
87,5 |
90,0 |
-0,85 |
1,65 |
-0,15 |
0,30 |
7 |
90,0 |
92,5 |
1,65 |
4,15 |
0,30 |
0,74 |
8 |
92,5 |
95,0 |
4,15 |
6,65 |
0,74 |
1,19 |
9 |
95,0 |
97,5 |
6,65 |
9,15 |
1,19 |
1,64 |
10 |
97,5 |
100,0 |
9,15 |
- |
1,64 |
ОС |
Таблица 6.5
Вычисление теоретических частот
i |
Границы интервала |
Pi= |
= 150Р. |
|||
Zi+1 |
||||||
1 |
— СС' |
-1,94 |
-0,5000 |
-0,4738 |
0,0262 |
3,93 |
2 |
-1,94 |
-1,49 |
-0,4738 |
-0,4319 |
0,0419 |
6,28 |
3 |
-1,49 |
-1,05 |
-0,4319 |
-0,3531 |
0,0788 |
11,82 |
4 |
-1,05 |
-0,60 |
-0,3531 |
-0,2257 |
0,1274 |
19,11 |
5 |
-0,60 |
-0,15 |
-0,2257 |
-0,0596 |
0,1661 |
24,92 |
6 |
-0,15 |
0,30 |
-0,0596 |
0,1179 |
0,1775 |
26,62 |
7 |
0,30 |
0,74 |
0,1179 |
0,2703 |
0,1524 |
22,86 |
8 |
0,74 |
1,19 |
0,2703 |
0,3830 |
0,1127 |
16,90 |
9 |
1,19 |
1,64 |
0,3830 |
0,4495 |
0,0665 |
9,98 |
10 |
1,64 |
CCS |
0,4495 |
0,5000 |
0,0505 |
7,58 |
Суммы |
1 |
150 |
Таблица 6.6
Вычисление
i |
ni |
nf — |
(п* - О2 |
з 1 |
и? |
||
1 |
2 |
3,93 |
-1,93 |
3,7249 |
0,9478 |
4 |
1,0178 |
2 |
10 |
6,28 |
3,72 |
13,8384 |
2,2036 |
100 |
15,9236 |
3 |
15 |
11,82 |
3,18 |
10,1124 |
0,8555 |
225 |
19,0355 |
4 |
18 |
19,11 |
-1,1 1 |
1,2321 |
0,0645 |
324 |
16,9545 |
5 |
20 |
24,92 |
-4,92 |
24,2064 |
0,9714 |
400 |
16,0514 |
6 |
22 |
26,62 |
-4,62 |
21,3444 |
0,8018 |
484 |
18,1818 |
7 |
24 |
22,86 |
1,14 |
1,2996 |
0,0568 |
576 |
25,1968 |
8 |
20 |
16,90 |
3,10 |
9,6100 |
0,5686 |
400 |
23,6686 |
9 |
13 |
9,98 |
3,02 |
9,1204 |
0,9139 |
169 |
16,9339 |
10 |
6 |
7,58 |
-1,58 |
2,4964 |
0,3293 |
36 |
4,7493 |
Суммы |
150 |
150 |
= 7,7132 |
157,7132 |
Вычислим выборочную среднюю %* и выборочное среднее квадратическое отклонение (7*:
13252,5
= ; =--- , = 8 5
- 1 п 150___
- ?Г* = = |4688.5 = 5 59
- ?у п 150 *
Найдем интервалы j), для чего составим таблицу 3.4.
Определим теоретические вероятности Рг и теоретические частоты п = nPj = 150Рг Для этого составим таблицу 3.4. Значение функции Лапласа находим по таблице приложения 2.
Сравним эмпирические и теоретические частоты с использованием критерия /2 Пирсона. Для вычисления расчетного значения критерия /2 составим таблицу 3.5, последние два столбца которой служат для контроля вычислений:
- п = 157,7132 - 150 = 7,7132 =
По таблице критических точек распределения (таблица Пирсона) [7J по уровню значимости я = 0,05 и числу степеней свободы k=s-3=10-3=7
(s=10 - число интервалов) находим критическую точку j^(0,05; 7)=14,1.
Поскольку < /2р, нет оснований отвергнуть нулевую гипотезу о нормальном распределении генеральной совокупности. Т. е. эмпирические и теоретические частоты различаются незначимо.
Выводы по лекции
- 1. Основной задачей теории статистических гипотез является по результатам эксперимента (по данным выборки) сделать обоснованные выводы о свойствах генеральной совокупности.
- 2. Статистическая проверка гипотез тесно связана с теорией оценивания параметров распределений. При обработке результатов измерений для выяснения того или иного случайного явления прибегают к высказыванию гипотез (предположений).
- 3. Статистические критерии не доказывают справедливости гипотезы, а лишь устанавливают на принятом уровне значимости ее согласие или несогласие с результатом наблюдений.
Вопросы для самопроверки
- 1. Сформулируйте нулевую гипотезу о числовом значении математического ожидания нормального распределения при неизвестной дисперсии.
- 2. Сформулируйте альтернативные гипотезы о числовом значении математического ожидания нормального распределения при неизвестной дисперсии
- 3. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о числовом значении математического ожидания нормального распределения при неизвестной дисперсии.
- 4. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
- 5. Сформулируйте нулевую гипотезу о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
- 6. Сформулируйте альтернативные гипотезы о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
- 7. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
- 8. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
- 9. Сформулируйте нулевую гипотезу о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
- 10. Сформулируйте альтернативные гипотезы о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
- 11. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
- 12. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
- 13. Сформулируйте нулевую гипотезу о равенстве дисперсий двух нормальных распределений.
- 14. Сформулируйте альтернативные гипотезы о равенстве дисперсий двух нормальных распределений..
- 15. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве дисперсий двух нормальных распределений.
- 16. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
Литература: 2, 3, 6, 8.