Проверка нормальности распределения (только при ν < 33%)

Рабочий лист «Пункт 3».

Использование показателей асимметрии и эксцесса

А

В

С

D

E

F

1

2

3

Ассиметрия и эксцесс

4

5

1)

б

О, =---— =

° шГ!

0,1639

7

8

m4 -> gi = —r-3 =

9

= -0,5807

10

m2

11

^n-(n-l) = *

12

2)

G1

! j = 1686

13

n— 2

14

i r

15

G2 =

(п-2)

g. +б] =

-0,5196

16

(n-3)

17

18

3)

I 6 -n-(n —

1)

19

S°1 =

V(n-2)-(n+l)-

in -4-*44

0,3217

20

21

22

sc.

0,6335

?3)-(n —2)-(n+3)

23

l(n-

>-(n+5)

24

25

4)

3*Sgl=

0,9652

26

5*Sg2 =

3,1675

  • 27

Измерения подчиняются нормальному закону

Вычисление показателей асимметрии и эксцесса.

Показатель асимметрии вычисляется по формуле т з

g. = -^77 = 0,1639. т 2

Для симметричных распределений т, = 0 ng. = 0. Левосторонняя асимметрия оказывается при > 0, правосторонняя при g1 < 0.

Показатель эксцесса равен

/И 4

g, = — - 3 = -0,5807.

1П 2

Для нормального распределения g2 - 0. Заостренное распределение частот дает значение g2 > 0, пологое распределение ведет к g2 < 0.

Судя по полученным оценкам, у нас наблюдается пологое распределение с левосторонней асимметрией.

Вычисление несмещенных оценок для показателей асимметрии и эксцесса

G =

y/n*(n - 1) п - 2

?gi = 0,1686;

п — 1 г 1

G2 = 7---7777---77* + + 6 = -0,5196.

(и-2)*(и-3) L J

Вычисление среднеквадратичных отклонений для показателей асимметрии и эксцесса

SGl =

6*и*(и - 1)

= 0,3217;

  • (и - 2)* (и + 1)* (w + 3)
  • 24*и*(и -1)2

(п - 3)*(и - 2)*(п + 3)*(л + 5) 0,6335.

Если одновременно выполняются условия, что |GJ < 3 * Sq и |G,| < 5 * Sq2 , то гипотеза нормальности исследуемого распределения может быть принята

В нашем случае 0,1686 < 3 * 0,3217 и 0,5196 <5 * 0,6335, т. е. распределение можно считать нормальным.

Использование χ2-критерия

Разбивают весь массив исходных данных на классы Разбиение на классы можно выполнить по правилу Штюргеса. Количество классов при этом вычисляется по формуле

к « 1 + 3,32 * lg(n) « 1 + 3,32 * lg(55) « 7.

Размах варьирования (после удаления выброса) равен

D = х - х . =22. max min

Зная эти величины, вычисляем величину шага для каждого класса: h = Г>/А: = 22 / 7 = 3,14.

Для удобства расчетов увеличиваем шаг до 4. В этом случае, чтобы перекрыть весь интервал данных, потребуется шесть классов.

D < h * к.

Первый класс - это интервал измерений от 166 до 170, второй -от 170 до 174 и т. д.

Имея эту информацию, можно определить количество измерений (частоту - Ь ), попадающих в каждый класс.

В случае ручного расчета исходные данные (рост студентов) сортируют по возрастанию. При этом данные, попадающие на левую и правую границы интервала (например, рост в 170 см.), будем учитывать только один раз (когда они попали на левую границу).

Количество измерений, попавших в каждый класс, можно определить и автоматически, используя функцию ЧАСТОТА. В этом случае предварительная сортировка данных не требуется. Но чтобы результаты совпали с ручным расчетом, в таблице необходимо изменить правую границу. Так как у нас результаты измеряются с точностью до одного сантиметра, то правая граница должна быть уменьшена в этом пределе (например, на один миллиметр). В этом случае рост в 170 см будет учитываться в следующем классе.

Найденные результаты помещают в следующую таблицу.

А

В

С

D

Е

F

G

Н

1

J

40

41

левая граница

правая граница

середина интервала

ЧИСЛО попаданий

ОТНОСИТ, частота

накопл. частота

42

166

170

168

9

0,1636

0,1636

43

170

174

172

10

0,1818

0,3455

44

174

178

176

16

0,2909

0,6364

45

178

182

180

12

0,2182

0,8545

46

182

186

184

7

0,1273

0,9818

47

186

190

188

1

0,0182

1

ло

Функция ЧАСТОТА является функцией работы с массивами, поэтому перед ее вводом необходимо выделить нужное количество ячеек (ячейки Н42:Н47). После этого вводят функцию. Ее первым аргументом является интервал ячеек, содержащих результаты измерений. Второй аргумент - это адреса ячеек, содержащих правые границы классов (ячейки F42-.F47).

После завершения ввода функции одновременно нажимаются клавиши Ctrl + Shift + Enter.

В этой таблице относительная частота попадания в каждый класс определяется как отношение количества попаданий в этот класс к общему количеству измерений.

Наколенная частота в первом классе равна относительной частоте первого класса. Накопленная частота для второго класса равна сумме относительных частот первого и второго класса и т. д.

Имея эти данные, можно построить кумулятивную линию, полигон и гистограмму частот.

Кумулятивная линия (или график накопленных частот) строится в координатах «относительная накопленная частота попадания измерения в интервал - номер класса». Левая граница первого класса соответствует нулевой относительной накопленной частоте; левая граница второго класса - относительной частоте попадания измерений в первый класс; левая граница третьего класса - сумме частот попадания измерений в первый и второй классы и т. д. Кумулятивная линия служит оценкой функции распределения F(x) в точке х.

Гистограмма и полигон строятся в координатах «количество попаданий в данный интервал - интервал измерений, разделенный на классы». При построении гистограммы частота попаданий в каждом классе остается постоянной, а при построении полигона проводится плавная кривая через середину каждого класса. Гистограмма и полигон служат оценкой плотностей вероятности.

Вычисляют средневзвешенный рост студента (х )

и стандарт этой величины (s )

В приведенных ниже формулах b - количество попаданий в данный класс, х. - середина каждого класса, и - общее количество экспериментов, к - количество классов:

к

X bj* Xj

;=1

к — 2

X bj*(x j-x)

7 = 1_______________

П - 1

Для поиска этих величин заполняют вспомогательную таблицу.

А

В

С

D

Е

F

G

Н

59

60

Ц

xi

bj*Xj

bj (Xj - хср)

61

9

168

1512

586,5203

62

10

172

1720

165,8711

63

16

176

2816

0,0846

64

12

180

2160

185,0817

65

7

184

1288

439,8916

66

1

188

188

142,2598

67

Сумма =

9684

1519,7091

СП

Результаты последующих вычислений реализуются следующим алгоритмом

• Вычисляют величину z по формуле:

Ху- X

z J = ~

  • 5
  • • Используя найденные значения zy, формируют с помощью таблицы математической статистики (ординаты стандартной нормальной кривой) вектор-столбец f(z). Если таблицы отсутствуют, то можно использовать функцию НОРМ.СТ.РАСП с двумя параметрами. Первым параметром является найденная величина zj, второй параметр должен быть равен нулю.

• Вычислив величину т = п * h / $ = 55 *4 / 5,3050 = 41,4705, находят ожидаемую по стандартному нормальному распределению частоту попадания в каждый класс Е:

Е. = f(z)*m.

• Вычисляют теоретическое значение /2-критерия:

Результаты всех этих вычислений удобно свести в следующую таблицу.

А В

с

D

Е

1 F

G

н

U

75

76

f[il

ЕШ

(b[j]-E[j])A2/E[j]

77

1,5217

0,1253

5,2

2,7815

78

0,7677

0,2971

12,3

0,4374

79

0,0137

0,3989

16,5

0,0178

S0

0,7403

0,3033

12,6

0,0266

81

1,4943

0,1306

5,4

0,4625

82

2,2483

0,0319

1,3

0,0781

83

Всего:

3,804

Используя табличное значение ^-критерия, делают вывод о нормальности исследуемого распределения

Табличное значение х2^ = 6,250 берется из таблицы процентных точек ^-распределения и зависит отр - уровня значимости и/- числа степеней свободы. В данном случае f = к - 1 - 2 (двойка появилась за счет того, что оцениваются два параметра х и s ). Это же значение может быть найдено с помощью функции ХИ2.ОБР(0,9; 3). Первым параметром этой функции является доверительная вероятность, а вторым - число степеней свободы.

Так как х2 < т0 с данной доверительной вероятностью гипотеза о нормальности исследуемого распределения принимается.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >