Степенные средние величины
Основной характеристикой центра распределения является средняя величина, опирающаяся на всю информацию об изучаемом явлении. Однако в ряде случаев средняя величина должна быть дополнена и даже заменена модой или медианой.
Мода - это значение признака, наиболее часто встречающегося в данном ряду распределения, т. е. имеющего наибольшую численность в ряду распределения.
Медиана — это значение признака у той единицы наблюдения, которая занимает в ранжированной (упорядоченной) последовательности этих единиц серединное значение.
Например, показатель среднего дохода, вычисленный как средняя величина, очень чувствителен к увеличению или уменьшению доли высокодоходных или низкодоходных групп населения. В статистике большинства развитых стран для характеристики общего уровня доходов приводится не средний, а медианный уровень, т. е. уровень, выше и ниже которого получает доход одинаковое число работников.
Еще одной характеристикой, применяемой при исследовании доходов, является мода, представляющая собой наиболее распространенный уровень дохода.
Отличие модального уровня доходов от среднего уровня заключается в том, что он характеризует действительный доход «среднего» человека, а не средний доход абстрактного человека.
Средний доход превосходит медианный и модальный, причем его рост происходит, в основном, за счет увеличения доли лиц, имеющих высокие доходы, т. е. использование показателя среднего дохода приводит к существенному завышению уровня доходов основной массы населения и в значительной мере скрывает процесс их дифференциации. Значение модального дохода тяготеет к низкодоходным группам населения и отклоняется от медианного дохода в меньшую сторону. Приведем в качестве примера показатели дохода населения за 2012 год по Санкт-Петербургу, Ленинградской области и Москве (табл. 6.9).
Таблица 6.9
Распределение доходов населения
Территория |
Среднедушевой доход, р./мес. |
Медианный доход, р./мес. |
Модальный доход, р./мес. |
Санкт-Петербург |
27 399 |
19464 |
9822 |
Ленинградская обл. |
17283 |
13494 |
8225 |
Москва |
48 343 |
31365 |
1320 |
Примечание. Данные с сайта http://www.gks.ru/ Федеральной службы государственной статистики.
Мода применяется при изучении спроса населения на товары широкого потребления (например, на обувь, одежду и т. д.), когда интерес представляет определение модального размера, пользующегося наибольшим спросом.
Мода, в зависимости от вида ряда (дискретного или интервального), находится по-разному.
В дискретном ряду она определяется визуально, т. е. отыскивается значение признака, имеющее численность (в абсолютном или относительном выражении) большую, чем любое другое его значение. Это и есть мода. Если несколько значений признака имеют одинаковую, наибольшую по сравнению с другими, численность, то это означает, что в ряду не одна, а несколько мод, например две. Ряд с двумя модами называют двумодальным (бимодальным). А если их больше двух, ряд называют полимодальным. Если все значения ряда имеют одинаковую численность, то этот ряд не имеет моды.
Пример. Требуется определить моду по данным о распределении семей региона по числу детей (табл. 6.10).
Таблица 6.10
Распределение семей по числу детей
Число детей в семье |
0 |
1 |
2 |
3 |
4 |
5 |
Число семей, тыс. |
15 |
25 |
20 |
15 |
10 |
5 |
Просматривая частоты ряда (число семей), отметим, что наибольшая частота - 25. Эта частота соответствует семьям с одним ребенком. Таким образом, мода указывает, что в регионе наиболее часто встречаются однодетные семьи.
Вычисление моды для интервального вариационного ряда происходит в два этапа:
- • сначала определяется модальный интервал (визуально по максимальной частоте);
- • затем - значение модальной величины признака по формуле
Мо = + А------,
где Mo - мода; А - величина модального интервала (разность между верхней и нижней границами); xQ — нижняя граница модального интервала; f - численность модального интервала (частота или час-тость);^^ - численность интервала, предшествующего модальному; f - численность интервала, следующего за модальным.
Пример. По данным о распределении 100 фотографов по дневной выработке определить моду (иначе - модальное значение) дневного числа фотографий у данной совокупности работников (табл. 6.11).
Таблица 6.11
Распределение объема услуг фотографов
Число фотографий в день, шт. |
40-44 |
44-48 |
48-52 |
52-56 |
56-60 |
Итого |
Число работников |
12 |
28 |
36 |
16 |
8 |
100 |
Определим модальный интервал. Наибольшая численность равна 36 и соответствует интервалу 48-52. Значение моды
Мо = 48 + 4
- 36-28 (36-28)+ (36-16)
- 4-8
= 48 + —= 49,14 = 49
28
шт.
Мода интервального ряда графически определяется по гистограмме. Для этого правая вершина модального прямоугольника соединяется прямой с правым верхним углом предыдущего прямоугольника, а левая вершина модального прямоугольника - с левым верхним углом последующего прямоугольника (рис. 6.1). Абсцисса точки пересечения этих прямых и будет модой распределения.

Рис. 6.1. Графическое определение моды в равноинтервальном ряду
Медиана, как и мода, по-разному определяется для дискретного и интервального ряда, что проиллюстрируем приведенными ниже примерами.
Пример. Известен возраст пяти молодых людей. Запишем в виде ряда их номера в порядке увеличения возраста. Требуется найти медиану (медианное значение) возраста этой группы (табл. 6.12).
Таблица 6.12
Распределение пяти молодых людей по возрасту
Номер |
1 |
2 |
3 |
4 |
5 |
Возраст, лет |
18 |
19 |
20 |
21 |
22 |
Медиана есть срединное значение признака, т. е. значение признака у единицы совокупности, находящейся в середине ряда. В середине ряда - номер 3. Следовательно, возраст этого человека и есть медианный возраст или, кратко, медиана (Me). Она равна 20 годам. Обозначив номер единицы совокупности, находящейся в середине ряда, через NMe, а численность ряда через п, определим:
= 3.
Добавим к ряду номер и возраст еще одного человека: номер 6, 23 года. Нечетный ряд превратился в четный, и в его середине находятся два номера: 3 и 4. В таком случае за медиану принимается:
- • средняя величина из значений признака у единиц совокупности, находящихся в середине ряда, если признак (возраст) считается непрерывной величиной. В нашем примере: 3-20 лет; 4-21 год; Me = 20,5;
- • любое значение признака из двух близлежащих, если признак считается дискретным. В нашем примере выбор осуществляется из № 3 - 20 лет или № 4 - 21 год, например, принимаем Me = 20.
Порядковый номер единицы наблюдения, соответствующей медиане, можно формально определить следующим образом:
п + 1 ~2~’
для совокупности с нечетным числом единиц где п - число единиц в данной совокупности, Me = xw+1
____•_для совокупности с четным числом единиц наблюдения невозможно установить единую единицу, занимающую среднее положение. Поэтому появляется относительный «центр»
В том случае, когда число единиц наблюдения совокупности достаточно велико и значение признака не подвержено резким колебаниям, возможен упрощенный расчет медианы для второй ситуации. Тогда
Me = хп
Пример. Требуется определить медиану на основании распределения 101 семьи по числу детей, представленного в табл. 6.13.
Таблица 6.13
Распределение семей по числу детей
Число детей в семье |
1 |
2 |
3 |
4 |
5 |
6 |
Итого |
Число семей |
10 |
40 |
30 |
10 |
7 |
14 |
101 |
Номер единицы совокупности, находящейся в середине ряда, аг Ю1 + 1 П ^Ме=~у- = 51.
Медианным значением признака обладает семья 51. Для определения положения этого номера необходимо рассчитать накопленные частоты: 10, 50, 80, 90, 97, 101. Для семей с одним ребенком -номера 1-10; с двумя детьми - номера 11-50; с тремя детьми - номера 51-80.
Тогда Me - 3. Это значение медианы для дискретных рядов.
Вычисление медианы для интервального вариационного ряда происходит в два этапа:
- 1) сначала определяется медианный интервал;
- 2) затем значение медианы признака вычисляется по формуле
Me = xn + А---1-----------,
О А
J т
где х0 - нижняя граница медианного интервала; Л - величина медианного интервала; Z/- численность ряда (сумма частот или частостей); f - численность медианного интервала; 5 - накопленная частота до медианного интервала.
Пример. Определить медиану интервального ряда для распределения фотографов по дневной выработке (по которому определялась мода) (табл. 6.14).
Таблица 6.14
Распределение объема услуг фотографов
Число фотографий в день, шт. |
Число фотографов, % к итогу |
Накопленные итоги |
40-44 |
12 |
12 |
44-48 |
28 |
40 |
48-52 |
36 |
76 |
52-56 |
16 |
92 |
56-60 |
8 |
100 |
Итого |
100 |
X |
Для решения задачи нужно определить интервал, в котором заключена медиана - медианный интервал. Это тот интервал, до которого сумма (накопленный итог) численностей меньше половины всей численности ряда, а с прибавлением его численности - больше половины.
По накопленным итогам половина численности
Сумма первых двух интервалов равна 40, т. е. меньше половины численности ряда. Если же мы прибавим численность третьего интервала, равную 36, то получим сумму, превышающую половину. Отсюда следует, что медианным является третий интервал 48-52. Медиана
Ме = 48 + 4
- 1^-40 , 2___________;
- 49,14 =49 шт.
- 36
Следовательно, 50 % фотографов снимают в день меньше 49 фотографий, а 50 % - больше 49. Медиану можно показать графически на кумуляте вариационного ряда. На оси накопленных частот откладываем значение NMe. Точка кумуляты, имеющая значение по оси ординат NMe, по оси абсцисс будет иметь значение признака, равное медианному (рис. 6.2).

Рис. 6.2. Кумулята вариационного интервального ряда с обозначенной медианой
Мода и медиана не требуют знания всех индивидуальных значений признака и поэтому могут быть использованы в качестве наиболее типичного значения признака в неоднородной совокупности.
В некоторых случаях мода и медиана количественно сходны со средней. При нормальном распределении все три показателя имеют одинаковую величину.
Мода и медиана дают представление о структуре совокупности, поэтому их называют структурными средними. В отличие от средней величины, которая рассчитывается на базе всех значений признака, мода и медиана характеризуют величину конкретного варианта, занимающего определенное положение в ранжированном вариационном ряду.
Структурные характеристики распределения: квантили распределения и мода
К структурным характеристикам ряда распределения кроме медианы и моды относят и другие квантили распределения (квартили, децили и др.).
Квантиль распределения - это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности.
Виды квантилей:
- 1) медиана (Me) - значение признака, приходящееся на середину упорядоченной совокупности;
- 2) квартили ((?1/4, ??2/4 = Me, Q3/4) - значения признака, делящие упорядоченную совокупность на четыре равные (по числу единиц) части;
- 3) децили (Qo Q02,..., Q09) - значения признака, делящие упорядоченную совокупность на 10 равных частей;
- 4) процентили (??001, 0ОО2,..., ??099) - значения признака, делящие упорядоченную совокупность на 100 равных частей.
Если данные сгруппированы, то значение квантиля определяется по накопленным частотам. При этом находится номер группы, которая содержит z-й квантиль как номер первой группы от начала ряда, в которой сумма накопленных частот равна или превышает N., где i -индекс квантиля.
Если ряд интервальный, то значение квантиля уточняется по формуле где Xg - нижняя граница интервала, в котором находится z-й квантиль; F' - сумма накопленных частот интервалов, предшествующих
М. В. Веронская. Статистика. Часть 1 интервалу, в котором находится i-й квантиль; Ng “ частота интервала, в котором находится i-й квантиль.
Квантили распределения представляют собой обобщающие показатели, характеризующие структуру распределения признака в совокупности.
Наиболее распространенным видом квантилей является медиана. Медиана не требует знания всех индивидуальных значений признака. Она не чувствительна к крайним значениям признака, которые могут резко отличаться от основной массы его значений. Поэтому медиану используют как наиболее надежный показатель типичного значения признака в неоднородной совокупности.