Построение гистограммы и проверка нормальности распределения

Гистограмма (или полигон) распределения - графическое отображение mj=f(j) частот по интервалам в диапазоне рассеивания - помогает визуально оценить сходство (или отличие) истинных случайных величин с нормальным распределением [1].

Гистограмма выполняется в виде столбиковой диаграммы или в виде многоугольника (полигона) с вершинами в средних точках на вершинах столбцов.

Диапазон изменения вычисляется по формуле

R лах ^min • (1-9)

Число интервалов диапазона рассчитывается следующим образом:

1=1+3,321g п, (1.10)

где п - число измерений в ряду.

Длина интервала определяется по формуле

а = р (1.11)

Результат округляется до целого числа. Затем строится гистограмма, пример которой представлен на рис. 1.16.

6

Пример построения гистограммы

Рис. 1.16. Пример построения гистограммы

Также для оценки нормальности распределения используются показатели асимметрии и эксцесса (о них говорилось в п. 1.2.1)

Если выполняется формула (1.12), то асимметрия значима, и гипотеза о нормальности распределения отвергается; а если неравенство (1.12) не выполняется, то асимметрия незначима, и гипотеза о нормальности распределения принимается.

tA = ^>tTA, (1.12)

где показатель асимметрии А в точечном виде вычисляется по формуле (1.5),

Sa - ошибка показателя асимметрии:

I 6 • (п -1)

SA =---------— (1.13)

V(n + l)-(n + 3)

1та-табличное значение асимметрии: tTA=1та=1,63 (q=5%) q - уровень значимости.

Если выполняется формула (1.14), то эксцесс значим, и гипотеза о нормальности распределения отвергается; а если неравенство

(1.14) не выполняется, то эксцесс незначим, и гипотеза о нормальности распределения принимается.

|Е|

tE - -т— - tTE , (1-14)

где показатель эксцесса Е в точечном виде вычисляется по формуле (1.7),

Se - ошибка показателя эксцесса:

I 24-n-(n-2)-(n-3) ----------№ (п +1)“ • (п + 3) • (п + 5)

(те-табличное значение эксцесса: tTE=^(q), tTE =2.

Более строгим критерием для проверки нормальности считается критерий Пирсона % - (хи-квадрат).

Критерий Пирсона рассчитывается по формуле

пр:

(1.16)

где pj - теоретическая вероятность попадания случайной величины в j-й интервал:

pj= Ф0(и j) -Фо(t,7 j); (1.17)

npj - теоретическая частота попадания значения в j-й интервал.

Значение нормированной функции Лапласа для нижних и верхних границ интервалов определяют по формулам:

л/2л- i

Фо('«Р =

_г_ е 2 dt,

(1.18) где tH j, t« j - нормированные значения нижних и верхних границ интервала:

Если выполняется условие

(1-20)

то гипотеза о нормальности принимается с надежностью большей q% (q > 10%). Если не выполняется данное условие, то гипотеза о нормальности отвергается с надежностью Р >100 -q% (q < 5 %).

Табличное значение критерия Пирсона (приложение А)

=(Р(^ 0,

где f= 1-3 - число степеней свободы для - критерия.

Программа Statistica позволяет построить гистограмму и рассчитать критерий Пирсона.

Для вывода результатов нужно выбрать команду Анализ и в раскрывшемся меню указать метод «Подгонка распределения». Появится диалоговое окно, в котором нужно выбрать тип случайной величины: «Непрерывная» или «Дискретная». В данном случае «Непрерывная», затем выбрать тип распределения - «Нормальное».

После этого необходимо указать переменную для анализа. В соответствующих полях нужно ввести минимальное и максимальное значения (в программе это нижний и верхний пределы) выборки, а также число интервалов (в программе это число категорий).

Затем нужно выбрать вкладку «Опции», выбрать поле «хи-квадрат», убрать галочку в поле «Составные интервалы». После этого следует выбрать вкладку «Параметры», выбрать пункт «Таблица частот», а потом «График гистограммы и кривой нормального распределения».

Пример расчета частот

Рис. 1.17. Пример расчета частот

Пример вывода гистограммы

Рис. 1.18. Пример вывода гистограммы

Таблица частот включает в себя несколько значений:

  • - нижняя (левая) граница интервала;
  • - частоты;
  • - накопленные частоты (в программе это кумулятивные частоты);
  • - частости;
  • - накопленные частости (в программе это кумулятивные частости);
  • - проценты;
  • - накопленные проценты (рис. 1.17).

Гистограмма включает в себя частоты в виде столбиков, наложенную кривую нормального распределения и значение критерия Пирсона (хи-квадрат) (рис. 1.18).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >