Проверка нормальности распределения
Пусть из генеральной совокупности извлечена выборка х,, х2,...,х„. Требуется проверить гипотезу, что генеральная совокупность имеет нормальный закон распределения.
Вычислим следующие выборочные характеристики
- 1
х - — У X, — среднюю арифметическую,
п /=,
? 1 ”
S' = — / /л,- - х)" — выборочную дисперсию,
П /=1
ГГ
- S = у S — среднеквадратическое отклонение от среднего,
- 1 п
рк — — У (х,: — х) , k-Ъ, 4 — центральные моменты треть-« /=1
его и четвертого порядков.
На их основе может быть рассчитан коэффициент асимметрии пли скошенности (skewness):
г3 =е-^- — нормированный центральный момент гретьего ст
порядка.
Если г3=0 — распределение симметрично,
если r3<0 — левосторонняя асимметрия, если г3>0 — правосторонняя асимметрия.
Среднеквадратическая ошибка коэффициента асимметрии вычисляется по формуле
[б
(5а = - —, где п — объем выборки.
V п
3
, то гипотеза о нормальности
Критерий 1. Если распределения отвергается.
Другой критерий нормальности может быть построен на основе расчета эксцесса пли куртозпса (kurtosis) распределения, характеризующего форм}7 распределения, его крутость, то есть высоковершинность (островершинность), означающую тонкие хвосты, пли его нпзковершинность (плосковершпнностъ), означающую более толстые хвосты, чем у нормального распределения.
В качестве меры крутости используется нормированный момент четвертого порядка (эксцесс)
г =^-
4 ст4
Если г4—3, то распределение близко к нормальному,
если г7>3, то распределение высоковершинное, если zy<3, то распределение низковершинное.
Среднеквадратическая ошибка эксцесса
, где п — объем выборки.
Критерий 2. Если
-3
>3, то гипотеза о нормальности
распределения отвергается.
Джарк и Бера (Jark, Вега, 1980) построили критерий нормальности регрессионных остатков, использующий оценки коэффициента асимметрии и эксцесса одновременно.
Их статистика имеет вид
JB = n lr/+-L(r4-3)2 ~z2(2) (5)
(o 24 J
и распределена как с двумя степенями свободы.
Предполагается, что регрессия включает свободный член.
Критерий 3. Если /В>/2табл(2) при заданном уровне значимости (например, при сг=0,05), то гипотеза о нормальности отвергается.