Критерий Фишера сравнения дисперсий.

Используется в случае, если нужно проверить, различается ли разброс данных (дисперсии) у двух выборок. Дисперсия характеризует однородность, стабильность распределения. Представим два магазина. Средние объемы продаж в них примерно равны. Но в первом каждый день продажи примерно одинаковы, стабильны, а во втором: то очень много — то очень мало, но в среднем так же, как и в первом, то есть дисперсия во втором магазине намного больше, чем в первом.

Для проверки статистической гипотезы о равенстве дисперсий служит F-критерий Фишера. Основной характеристикой критерия является уровень значимости а, который имеет смысл вероятности совершить статистическую ошибку, предполагая, что дисперсии и, следовательно, точность, различаются. Вместо а в задачах также иногда задают доверительную вероятность р = 1 - а, имеющую смысл вероятности того, что дисперсии и в самом деле равны. Обычно выбирают критическое значение уровня значимости, например 0,05 или 0,1, и если а больше критического значения, то дисперсии считаются равными, в противном случае — различны. При этом критерий может быть односторонним, когда нужно проверить, что дисперсия конкретной выделенной выборки больше, чем у другой, и двусторонним, когда просто нужно показать, что дисперсии не равны. Существуют два способа проверки таких гипотез. Рассмотрим их на примерах.

ПРИМЕР 3.3.3. Фирма имеет два магазина в городах Воронеж и Липецк. Необходимо проверить, одинаково стабильно происходят продажи в разных городах или нет, то есть сравнить дисперсии с доверительной вероятностью 0,95. Для проверки гипотезы взяли данные о продажах товара за 12 недель в обоих городах (табл. 3.3.3).

Таблица 3.3.3

Воронеж

47,5

52,9

51,3

48,1

52,6

49,4

48,0

52,3

45,9

52,6

46,8

49,0

Липецк

52,5

50,5

48,4

48,6

50,6

50,0

50,1

49,5

49,7

51,1

49,2

49,7

РЕШЕНИЕ. По условию задачи критерий двусторонний, так как требуется проверить различие дисперсий (точностей). Доверительная вероятность задана р = 0,95, следовательно, уровень значимости а = 1 - р = 1 -0,95 = 0,05 . Вводим данные выборок (без подписей) в две строчки в ячейки A1-L1 и A2-L2 соответственно. Для вычисления уровня значимости двустороннего критерия служит функция ФТЕСТ(массив1; массив2). Вводим в А4 подпись «Уровень значимости», а в В4 функцию ФТЕСТ, аргументами которой должны быть ссылки на ячейки A1-L1 и A2-L2 соответственно. Результат 0,011591293 говорит о том, что вероятность ошибиться, приняв гипотезу о различии дисперсий, около 0,01, что меньше критического значения, заданного в условии задачи 0,05. Следовательно, можно говорить, что опытные данные с большой вероятностью подтверждают предположение о том, что дисперсии разные и однородность (стабильность) продаж в городах различная.

Другой способ решения задачи — использование надстройки «Анализ данных» (Data Analysis). Для ее подключения нужно в меню «СЕРВИС» выбрать «НАДСТРОЙКИ» и поставить флажок напротив «Пакет анализа» (Analysis ToolPak). После этого в меню «СЕРВИС» появится пункт «АНАЛИЗ ДАННЫХ» (Data Analysis). При работе в «EXCEL 2007» или более поздней версии нажимаем левой кнопкой мыши по круглой кнопке «Office» в верхнем левом углу экрана, внизу выбираем «Параметры EXCEL», слева выбираем НАДСТРОЙКИ, нажимаем кнопку «Перейти» внизу окна и в открывшемся окне проверяем наличие флажка напротив пункта «Пакет анализа» (Analysis ToolPak), «ОК». В меню ДАННЫЕ выбираем «Пакет анализа» (Analysis ToolPak), открывается окно надстройки, в котором выбираем «Двухвыборочный F-тест для дисперсий» (F-test Two-Sample for Variances). В открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал переменной 2» (Variable 1 Range) вводим ссылки на данные (A1-L1 и A2-L2 соответственно), если имеются подписи данных, то ставим флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее вводим уровень значимости в поле «Альфа» (Alpha) (по условию это 0,05, и данное значение уже указано по умолчанию). В разделе «Параметры вывода» (Output Options) ставим метку около «Выходной интервал» (Output Range) помещаем курсор в появившееся поле напротив надписи, щелкаем левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. При нажатии на «ОК» появляется таблица результата. Сдвигаем границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. В таблице указаны средние и дисперсии каждой выборки, значение F-критерия, односторонний критический уровень значимости в строке «P(F<=f) одностороннее» («P(F<=f) one-tail») и критическое значение F-критерия (F critical one tail). Если значение F-критерия ближе к единице, чем F-критическое, то с заданной вероятностью можно считать, что дисперсии равны. Об этом же говорит и то, что критический уровень значимости «P(F<=f) одностороннее» больше заданного значения а. В нашем случае F-критерий равен 5,128, а F-критическое 2,818, то есть F-критерий дальше от единицы, чем критическое значение. Это говорит о том, что дисперсии разные и однородность (стабильность) продаж в городах различная.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >