Нормальное распределение

При построении статистических моделей, отражающих социальные или экономические явления или процессы, наиболее широко применяется нормальное распределение.

Закон распределения вероятностей, названный законом нормального распределения, открыл английский математик Абрахам де Муавр (1667 — 1754) при решении некоторых задач, относящихся к случайным играм. В начале XIX в. Пьер Лаплас (1749 — 1827) и Карл Гаусс (1777 - 1855) независимо друг от друга и, возможно, не зная результатов работ А. де Муавра, опубликовали свои исследования, связанные с законом нормального распределения. Общие условия возникновения закона нормального распределения и его дальнейшую разработку продолжил русский математик А.М. Ляпунов (1857 — 1918).

Функция и кривая Гаусса — Лапласа играют весьма важную роль в статистической теории и практике, поэтому они носят также названия закона нормального распределения и нормальной кривой (см. рис. 5.18).

Полученная кривая будет представлять собой математическую функцию, характеризующую исследуемый ряд распределения. Графически такая закономерность распределения случайных величин представляет собой кривую симметричной колоколообразной формы, которую иначе называют нормальным распределением.

Распределение непрерывной случайной величины (х) называют нормальным, если соответствующая ей плотность распределения выражается формулой

где у — ордината или высота кривой на любом расстоянии от х, т.е.

от центра распределения, где х = 0. Вправо от центра распределения х имеет положительные значения, а влево — отрицательные;

(х — х) — отклонение варианты от средней арифметической величины;

о — среднее квадратическое отклонение, отражающее амплитуду колебания отдельных значений случайной величины от средней арифметической; п = 3,1416;

е = 2,7183 — основание натурального логарифма;

— нормированное отклонение;

— максимальная ордината, соответствующая точке х; по мере удаления от этой точки, т.е. от центра распределения, ордината уменьшается и кривая асимптотически приближается к оси абсцисс.

Вычисленные параметры у для различных значений г позволяют определить ординаты кривой нормального распределения. Важным условием нормирования является требование, чтобы вся площадь, заключенная под кривой нормального распределения, равнялась единице.

Если принять, что о = 1, то уравнение (5.29) будет иметь вид:

Кривая, описываемая этим уравнением, отражает закон нормального распределения с площадью под кривой, равной единице, и называется стандартизованной кривой распределения, или кривой Гаусса. Нормальный закон распределения определяется двумя параметрами: средней величиной х и средним квадратическим отклонением о.

Эта кривая обладает свойством симметричности, т.е. равномерно убывает в обе стороны от середины, поэтому средняя арифметическая, медиана и мода в нормальном распределении совпадают. Геометрически (о) определяет две точки перегиба кривой нормального распределения, т.е. точки, в которых кривая из вогнутой становится выпуклой, и наоборот. Эти точки находятся вправо и влево от центра (по оси абсцисс) на расстоянии, равном среднему квадратическому отклонению (о). Обе ветви кривой нормального распределения асимптотически приближаются к оси абсцисс. Забегая вперед, следует отметить, что максимальное и минимальное значения результатов статистического наблюдения практически не удаляются от среднего значения больше чем на три о.

Наряду с практически симметричными распределениями встречаются и асимметричные ряды со сдвигом максимума от средних значений вправо или влево (рис. 5.19).

Аналитически они характеризуются нарушением равенства между модой, медианой и средней арифметической величиной распределения.

Асимметрию принято различать по тому, в какой стороне находится растянутое крыло кривой распределения. Если растянутое крыло находится справа от вершины, то такого рода асимметрия называется правосторонней, положительной, и наоборот.

Асимметрия распределения

Рис. 5.19. Асимметрия распределения

В качестве показателя асимметрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению рассматриваемого ряда распределения в кубе:

где для сгруппированных данных.

Коэффициент асимметрии величина не именованная. Он колеблется в пределах от нуля до единицы. Очевидно, что при симметричных распределениях коэффициент асимметрии равен нулю. Асимметрия считается незначительной, если А5 меньше или равно 0,25. При А5 больше 0,5 асимметрия считается значительной.

Наряду с симметричными и скошенными распределениями вариационные ряды могут иметь отклонения по высоте.

Отклонение высоты максимума вверх или вниз от вершины кривой нормального распределения называется эксцессом (рис. 5.20).

Показатель эксцесса для сгруппированных данных вычисляется по формуле

где — центральный момент четвертого порядка.

Эксцесс распределения

Рис. 5.20. Эксцесс распределения

Если кривая распределения характеризуется высоковершин- ностью, то эксцесс называется положительным. Кривая распределения, для которой характерна выраженная плосковершин- ность, свидетельствует об отрицательном эксцессе.

Показатели асимметрии и эксцесса имеют большое значение для анализа статистической совокупности, так как они отражают не только форму, но и позволяют определить однородность исследуемых социально-экономических явлений или процессов.

Для изучения нормального распределения воспользуемся командой Сервис -»Анализ данных и в открывшемся диалоговом окне выберем опцию Генерация случайных чисел. Зададим следующие установки (рис. 5.21).

Скопируем интервал в соседний столбец. Отсортируем данные по возрастанию. В ячейках С2.С8 зададим интервалы возможных значений. В нашем случае они составят —3, —2, —1,0, 1, 2 и 3. Рассчитаем частоту попадания значений в заданные интервалы. Для этого выделим ячейки 02:09 (функция возвращает на одно значение больше, чем это было указано в массиве интервалов) и вызовем функцию ЧАСТОТА. В диалоговом окне укажем массив с исходными упорядоченными данными и массив с выбранными интервалами. Нажав клавиши Сгг/+5Л/Д щелкнем по кнопке ОК. Это позволит просчитать все значения частот одновременно для различных интервалов. Рассчитаем относительные частоты. Для этого разделим значения ячеек 02:09

Установки диалогового окна Генерация случайных чисел

Рис. 5.21. Установки диалогового окна Генерация случайных чисел

на 100. Результаты поместим в ячейки Е2: Е9. Выделим столбец О и с помощью команды Формат -н> СтолбецСкрыть скроем его.

Построим точечную диаграмму со значениями, соединенными сглаживающими линиями. Внешний вид полученной диаграммы показан на рис. 5.22.

При этом по горизонтали расположены интервалы возможных значений (варианты), а по вертикали — соответствующие частоты.

Точность построения графика зависит от величины выбранного частичного интервала и количества исходных данных. Наиболее интересные варианты рассмотрены в приложении 7.

Аналогичным образом следует изучить остальные типы распределений, меняя объем выборки и интервалы значений.

График эмпирического распределения выборки объемом 100 значений из нормально распределенной генеральной совокупности с параметрами 0 и 1

Рис. 5.22. График эмпирического распределения выборки объемом 100 значений из нормально распределенной генеральной совокупности с параметрами 0 и 1

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >