- Проверка нормальности распределения (только при ν < 33%)
- Использование показателей асимметрии и эксцесса
- Вычисление показателей асимметрии и эксцесса.
- Вычисление несмещенных оценок для показателей асимметрии и эксцесса
- Вычисление среднеквадратичных отклонений для показателей асимметрии и эксцесса
- Использование χ2-критерия
Проверка нормальности распределения (только при ν < 33%)
Рабочий лист «Пункт 3».
Использование показателей асимметрии и эксцесса
А |
В |
С |
D |
E |
F |
||
1 |
|||||||
2 |
|||||||
3 |
Ассиметрия и эксцесс |
||||||
4 |
|||||||
5 |
1) |
||||||
б |
О, =---— = ° шГ! |
0,1639 |
|||||
7 |
|||||||
8 |
m4 -> gi = —r-3 = |
||||||
9 |
= -0,5807 |
||||||
10 |
m2 |
||||||
11 |
^n-(n-l) = * |
||||||
12 |
2) |
G1 |
! j = 1686 |
||||
13 |
n— 2 |
||||||
14 |
i r |
||||||
15 |
G2 = |
(п-2) |
g. +б] = |
-0,5196 |
|||
16 |
(n-3) |
||||||
17 |
|||||||
18 |
3) |
I 6 -n-(n — |
1) |
||||
19 |
S°1 = |
V(n-2)-(n+l)- |
in -4-*44 |
0,3217 |
|||
20 |
|||||||
21 | |||||||
22 |
sc. |
0,6335 | |||||
?3)-(n —2)-(n+3) |
|||||||
23 |
l(n- |
>-(n+5) |
|||||
24 |
|||||||
25 |
4) |
3*Sgl= |
0,9652 |
||||
26 |
5*Sg2 = |
3,1675 |
|||||
|
Измерения подчиняются нормальному закону |
Вычисление показателей асимметрии и эксцесса.
Показатель асимметрии вычисляется по формуле т з
g. = -^77 = 0,1639. т 2
Для симметричных распределений т, = 0 ng. = 0. Левосторонняя асимметрия оказывается при > 0, правосторонняя при g1 < 0.
Показатель эксцесса равен
/И 4
g, = — - 3 = -0,5807.
1П 2
Для нормального распределения g2 - 0. Заостренное распределение частот дает значение g2 > 0, пологое распределение ведет к g2 < 0.
Судя по полученным оценкам, у нас наблюдается пологое распределение с левосторонней асимметрией.
Вычисление несмещенных оценок для показателей асимметрии и эксцесса
G =
y/n*(n - 1) п - 2
?gi = 0,1686;
п — 1 г 1
G2 = 7---7777---77* + + 6 = -0,5196.
(и-2)*(и-3) L J
Вычисление среднеквадратичных отклонений для показателей асимметрии и эксцесса
SGl =
6*и*(и - 1)
= 0,3217;
- (и - 2)* (и + 1)* (w + 3)
- 24*и*(и -1)2
(п - 3)*(и - 2)*(п + 3)*(л + 5) 0,6335.
Если одновременно выполняются условия, что |GJ < 3 * Sq и |G,| < 5 * Sq2 , то гипотеза нормальности исследуемого распределения может быть принята
В нашем случае 0,1686 < 3 * 0,3217 и 0,5196 <5 * 0,6335, т. е. распределение можно считать нормальным.
Использование χ2-критерия
Разбивают весь массив исходных данных на классы Разбиение на классы можно выполнить по правилу Штюргеса. Количество классов при этом вычисляется по формуле
к « 1 + 3,32 * lg(n) « 1 + 3,32 * lg(55) « 7.
Размах варьирования (после удаления выброса) равен
D = х - х . =22. max min
Зная эти величины, вычисляем величину шага для каждого класса: h = Г>/А: = 22 / 7 = 3,14.
Для удобства расчетов увеличиваем шаг до 4. В этом случае, чтобы перекрыть весь интервал данных, потребуется шесть классов.
D < h * к.
Первый класс - это интервал измерений от 166 до 170, второй -от 170 до 174 и т. д.
Имея эту информацию, можно определить количество измерений (частоту - Ь ), попадающих в каждый класс.
В случае ручного расчета исходные данные (рост студентов) сортируют по возрастанию. При этом данные, попадающие на левую и правую границы интервала (например, рост в 170 см.), будем учитывать только один раз (когда они попали на левую границу).
Количество измерений, попавших в каждый класс, можно определить и автоматически, используя функцию ЧАСТОТА. В этом случае предварительная сортировка данных не требуется. Но чтобы результаты совпали с ручным расчетом, в таблице необходимо изменить правую границу. Так как у нас результаты измеряются с точностью до одного сантиметра, то правая граница должна быть уменьшена в этом пределе (например, на один миллиметр). В этом случае рост в 170 см будет учитываться в следующем классе.
Найденные результаты помещают в следующую таблицу.
А |
В |
С |
D |
Е |
F |
G |
Н |
1 |
J |
||
40 |
|||||||||||
41 |
левая граница |
правая граница |
середина интервала |
ЧИСЛО попаданий |
ОТНОСИТ, частота |
накопл. частота |
|||||
42 |
166 |
170 |
168 |
9 |
0,1636 |
0,1636 |
|||||
43 |
170 |
174 |
172 |
10 |
0,1818 |
0,3455 |
|||||
44 |
174 |
178 |
176 |
16 |
0,2909 |
0,6364 |
|||||
45 |
178 |
182 |
180 |
12 |
0,2182 |
0,8545 |
|||||
46 |
182 |
186 |
184 |
7 |
0,1273 |
0,9818 |
|||||
47 |
186 |
190 |
188 |
1 |
0,0182 |
1 |
|||||
ло |
Функция ЧАСТОТА является функцией работы с массивами, поэтому перед ее вводом необходимо выделить нужное количество ячеек (ячейки Н42:Н47). После этого вводят функцию. Ее первым аргументом является интервал ячеек, содержащих результаты измерений. Второй аргумент - это адреса ячеек, содержащих правые границы классов (ячейки F42-.F47).
После завершения ввода функции одновременно нажимаются клавиши Ctrl + Shift + Enter.
В этой таблице относительная частота попадания в каждый класс определяется как отношение количества попаданий в этот класс к общему количеству измерений.
Наколенная частота в первом классе равна относительной частоте первого класса. Накопленная частота для второго класса равна сумме относительных частот первого и второго класса и т. д.
Имея эти данные, можно построить кумулятивную линию, полигон и гистограмму частот.
Кумулятивная линия (или график накопленных частот) строится в координатах «относительная накопленная частота попадания измерения в интервал - номер класса». Левая граница первого класса соответствует нулевой относительной накопленной частоте; левая граница второго класса - относительной частоте попадания измерений в первый класс; левая граница третьего класса - сумме частот попадания измерений в первый и второй классы и т. д. Кумулятивная линия служит оценкой функции распределения F(x) в точке х.

Гистограмма и полигон строятся в координатах «количество попаданий в данный интервал - интервал измерений, разделенный на классы». При построении гистограммы частота попаданий в каждом классе остается постоянной, а при построении полигона проводится плавная кривая через середину каждого класса. Гистограмма и полигон служат оценкой плотностей вероятности.

Вычисляют средневзвешенный рост студента (х )
и стандарт этой величины (s )
В приведенных ниже формулах b - количество попаданий в данный класс, х. - середина каждого класса, и - общее количество экспериментов, к - количество классов:
к
X bj* Xj
;=1
к — 2
X bj*(x j-x)
7 = 1_______________
П - 1
Для поиска этих величин заполняют вспомогательную таблицу.
А |
В |
С |
D |
Е |
F |
G |
Н |
||
59 | |||||||||
60 |
Ц |
xi |
bj*Xj |
bj (Xj - хср) |
|||||
61 |
9 |
168 |
1512 |
586,5203 |
|||||
62 |
10 |
172 |
1720 |
165,8711 |
|||||
63 |
16 |
176 |
2816 |
0,0846 |
|||||
64 |
12 |
180 |
2160 |
185,0817 |
|||||
65 |
7 |
184 |
1288 |
439,8916 |
|||||
66 |
1 |
188 |
188 |
142,2598 |
|||||
67 |
Сумма = |
9684 |
1519,7091 |
||||||
СП |
Результаты последующих вычислений реализуются следующим алгоритмом
• Вычисляют величину z по формуле:
Ху- X
z J = ~
- 5
- • Используя найденные значения zy, формируют с помощью таблицы математической статистики (ординаты стандартной нормальной кривой) вектор-столбец f(z). Если таблицы отсутствуют, то можно использовать функцию НОРМ.СТ.РАСП с двумя параметрами. Первым параметром является найденная величина zj, второй параметр должен быть равен нулю.
• Вычислив величину т = п * h / $ = 55 *4 / 5,3050 = 41,4705, находят ожидаемую по стандартному нормальному распределению частоту попадания в каждый класс Е:
Е. = f(z)*m.
• Вычисляют теоретическое значение /2-критерия:
Результаты всех этих вычислений удобно свести в следующую таблицу.
А В |
с |
D |
Е |
1 F |
G |
н |
U |
|
75 |
||||||||
76 |
f[il |
ЕШ |
(b[j]-E[j])A2/E[j] |
|||||
77 |
1,5217 |
0,1253 |
5,2 |
2,7815 |
||||
78 |
0,7677 |
0,2971 |
12,3 |
0,4374 |
||||
79 |
0,0137 |
0,3989 |
16,5 |
0,0178 |
||||
S0 |
0,7403 |
0,3033 |
12,6 |
0,0266 |
||||
81 |
1,4943 |
0,1306 |
5,4 |
0,4625 |
||||
82 |
2,2483 |
0,0319 |
1,3 |
0,0781 |
||||
83 |
Всего: |
3,804 |
||||||
Используя табличное значение ^-критерия, делают вывод о нормальности исследуемого распределения
Табличное значение х2^ = 6,250 берется из таблицы процентных точек ^-распределения и зависит отр - уровня значимости и/- числа степеней свободы. В данном случае f = к - 1 - 2 (двойка появилась за счет того, что оцениваются два параметра х и s ). Это же значение может быть найдено с помощью функции ХИ2.ОБР(0,9; 3). Первым параметром этой функции является доверительная вероятность, а вторым - число степеней свободы.
Так как х2 < т0 с данной доверительной вероятностью гипотеза о нормальности исследуемого распределения принимается.