Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона

Пусть X — исследуемая случайная величина, закон распределения которой неизвестен, но есть основания предположить, что X имеет нормальное (или любое другое) распределение.

Критерий проверки гипотезу о предполагаемом законе неизвестного распределения называется критерием согласия.

Существует несколько критериев согласия: («хи квадрат») Пирсона, Колмогорова, Смирнова и др.

Критерий х Пирсона - наиболее часто употребляемый на практике. Рассмотрим применение этого критерия для проверки гипотезы о нормальном распределении генеральной совокупности. Следовательно, требуется при заданном уровне значимости проверить нулевую гипотезу А/0: генеральная совокупность распределена нормально.

Для решения этой задачи необходимо:

1. По выборке объема п, извлеченной из генеральной совокупности, построить эмпирическое распределение в виде последовательности равноотстоящих вариант и соответствующих им частот либо в виде последовательности интервалов (Xif и соответствующих им частот (Иг - сумма частот, попавших в i-й интервал):

Таблица 6.2

_______Таблица эмпирического распределения частот_______

Варианты

Частоты

' 1 1

Таблица 6.3

Таблица эмпирического распределения частот

А

23)

Частоты

Из

п.

1

Если эмпирическое распределение такого вида как представлено в таблице 6.2, то следует вычислить выборочную среднюю %в, выборочное среднее квадратическое отклонение <ТВ и вычислить теоретические частотыгде n - объем выборки (И = Пг + П2 + ••• + h - шаг (разность между соседними вариантами);

u, =

ф(-х) =

3. Сравниваем эмпирические частоты с теоретическими П i с помощью критерия Пирсона:

для чего необходимо найти расчетное значение критерия :

2 V-n'i){{Вычислить выборочную среднюю х* и выборочное среднее квадратическое отклонение О’*; 2 Пронормировать X, т.е. перейти к случайной величине Z = (X-x*)/a* и вычислить концы интервалов zi = (X — ^*)/

а затем по таблице критических точек распределения по данно-му уровню значимости а и числу степеней свободы k= s-3 (s - число различных вариант либо число различных интервалов выборки) найти критическую точку ХкР(«Л). Если Хр<^Кр, то нет основа-2 2

ний отвергнуть нулевую гипотезу; если Хр>Хкр- т0 нулевую гипотезу следует отвергнуть.

Если эмпирическое распределение имеет вид как представлено в таблице 6.3, то необходимо:

1. Найти середины частичных интервалов

х(* = (х, + х1+1)/2

и записать статистическое распределение

X"

«7_______

ni

ПХ

__

4. Вычислить теоретические частоты = пРь где п - объем

выборки (п = + п2 Н-----Ь ni), Р[ = Ф(Х+1) — Ф(Х) - вероят

ность попадания X в интервал (х, Хг+1), Ф(г?) - функция Лапласа.

5. Сравнить эмпирические частоты с теоретическими как это было описано выше.

Пример 6.4. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема п= 150________________________

Г

[75;77,5)

[77,5 ;80)

[80;82,5)

[82,5;85)

[85;87,5)

2

10

15

18

20

ТП? = —

п

0,013

0,067

0,100

0,120

0,133

4

[87,5 ;90)

[90;92,5)

[92,5;95)

[95;97,5)

[97,5; 100)

22

24

20

13

6

mi

= — п

0,147

0,160

0,133

0,087

0,040

Решение. Найдем середины ж* частичных интервалов (xi#Xi+1) заданного интервального эмпирического распределения и запишем распределение равноотстоящих вариант (частоты Ъ = ____________________________

76,25

78,75

81,25

83,75

86,25

88,75

91,25

93,75

96,25

98,75

XX__

2

10

15

18

20

22

24

20

13

6

Таблица 6.4

Вычисление интервалов

i

Г раницы интервала

Границы интервала

X

xt+i

1

75

77,5

-

-10,85

— <у:

-1,94

2

77,5

80,0

-10,85

-8,35

-1,94

-1,49

3

80,0

82,5

-8,35

-5,85

-1,49

-1,05

4

82,5

85,0

-5,85

-3,35

-1,05

-0,60

5

85,0

87,5

-3,35

-0,85

-0,60

-0,15

6

87,5

90,0

-0,85

1,65

-0,15

0,30

7

90,0

92,5

1,65

4,15

0,30

0,74

8

92,5

95,0

4,15

6,65

0,74

1,19

9

95,0

97,5

6,65

9,15

1,19

1,64

10

97,5

100,0

9,15

-

1,64

ОС

Таблица 6.5

Вычисление теоретических частот

i

Границы интервала

Pi=

= 150Р.

Zi+1

1

— СС'

-1,94

-0,5000

-0,4738

0,0262

3,93

2

-1,94

-1,49

-0,4738

-0,4319

0,0419

6,28

3

-1,49

-1,05

-0,4319

-0,3531

0,0788

11,82

4

-1,05

-0,60

-0,3531

-0,2257

0,1274

19,11

5

-0,60

-0,15

-0,2257

-0,0596

0,1661

24,92

6

-0,15

0,30

-0,0596

0,1179

0,1775

26,62

7

0,30

0,74

0,1179

0,2703

0,1524

22,86

8

0,74

1,19

0,2703

0,3830

0,1127

16,90

9

1,19

1,64

0,3830

0,4495

0,0665

9,98

10

1,64

CCS

0,4495

0,5000

0,0505

7,58

Суммы

1

150

Таблица 6.6

Вычисление

i

ni

nf

(п* - О2

з 1

и?

1

2

3,93

-1,93

3,7249

0,9478

4

1,0178

2

10

6,28

3,72

13,8384

2,2036

100

15,9236

3

15

11,82

3,18

10,1124

0,8555

225

19,0355

4

18

19,11

-1,1 1

1,2321

0,0645

324

16,9545

5

20

24,92

-4,92

24,2064

0,9714

400

16,0514

6

22

26,62

-4,62

21,3444

0,8018

484

18,1818

7

24

22,86

1,14

1,2996

0,0568

576

25,1968

8

20

16,90

3,10

9,6100

0,5686

400

23,6686

9

13

9,98

3,02

9,1204

0,9139

169

16,9339

10

6

7,58

-1,58

2,4964

0,3293

36

4,7493

Суммы

150

150

= 7,7132

157,7132

Вычислим выборочную среднюю %* и выборочное среднее квадратическое отклонение (7*:

13252,5

= ; =--- , = 8 5

  • 1 п 150___
  • ?Г* = = |4688.5 = 5 59
  • п 150 *

Найдем интервалы j), для чего составим таблицу 3.4.

Определим теоретические вероятности Рг и теоретические частоты п = nPj = 150Рг Для этого составим таблицу 3.4. Значение функции Лапласа находим по таблице приложения 2.

Сравним эмпирические и теоретические частоты с использованием критерия /2 Пирсона. Для вычисления расчетного значения критерия /2 составим таблицу 3.5, последние два столбца которой служат для контроля вычислений:

- п = 157,7132 - 150 = 7,7132 =

По таблице критических точек распределения (таблица Пирсона) [7J по уровню значимости я = 0,05 и числу степеней свободы k=s-3=10-3=7

(s=10 - число интервалов) находим критическую точку j^(0,05; 7)=14,1.

Поскольку < /2р, нет оснований отвергнуть нулевую гипотезу о нормальном распределении генеральной совокупности. Т. е. эмпирические и теоретические частоты различаются незначимо.

Выводы по лекции

  • 1. Основной задачей теории статистических гипотез является по результатам эксперимента (по данным выборки) сделать обоснованные выводы о свойствах генеральной совокупности.
  • 2. Статистическая проверка гипотез тесно связана с теорией оценивания параметров распределений. При обработке результатов измерений для выяснения того или иного случайного явления прибегают к высказыванию гипотез (предположений).
  • 3. Статистические критерии не доказывают справедливости гипотезы, а лишь устанавливают на принятом уровне значимости ее согласие или несогласие с результатом наблюдений.

Вопросы для самопроверки

  • 1. Сформулируйте нулевую гипотезу о числовом значении математического ожидания нормального распределения при неизвестной дисперсии.
  • 2. Сформулируйте альтернативные гипотезы о числовом значении математического ожидания нормального распределения при неизвестной дисперсии
  • 3. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о числовом значении математического ожидания нормального распределения при неизвестной дисперсии.
  • 4. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
  • 5. Сформулируйте нулевую гипотезу о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
  • 6. Сформулируйте альтернативные гипотезы о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
  • 7. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве математических ожиданий двух нормальных распределений с известными дисперсиями.
  • 8. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
  • 9. Сформулируйте нулевую гипотезу о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
  • 10. Сформулируйте альтернативные гипотезы о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
  • 11. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве математических ожиданий двух нормальных распределений с неизвестными, но равными дисперсиями.
  • 12. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?
  • 13. Сформулируйте нулевую гипотезу о равенстве дисперсий двух нормальных распределений.
  • 14. Сформулируйте альтернативные гипотезы о равенстве дисперсий двух нормальных распределений..
  • 15. Опишите этапы проверки нулевой гипотезы для всех случаев альтернативной гипотезы о равенстве дисперсий двух нормальных распределений.
  • 16. В каком случае подтверждается нулевая гипотеза, а в каком опровергается?

Литература: 2, 3, 6, 8.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >