Критерий Фишера сравнения дисперсий.
Используется в случае, если нужно проверить, различается ли разброс данных (дисперсии) у двух выборок. Дисперсия характеризует однородность, стабильность распределения. Представим два магазина. Средние объемы продаж в них примерно равны. Но в первом каждый день продажи примерно одинаковы, стабильны, а во втором: то очень много — то очень мало, но в среднем так же, как и в первом, то есть дисперсия во втором магазине намного больше, чем в первом.
Для проверки статистической гипотезы о равенстве дисперсий служит F-критерий Фишера. Основной характеристикой критерия является уровень значимости а, который имеет смысл вероятности совершить статистическую ошибку, предполагая, что дисперсии и, следовательно, точность, различаются. Вместо а в задачах также иногда задают доверительную вероятность р = 1 - а, имеющую смысл вероятности того, что дисперсии и в самом деле равны. Обычно выбирают критическое значение уровня значимости, например 0,05 или 0,1, и если а больше критического значения, то дисперсии считаются равными, в противном случае — различны. При этом критерий может быть односторонним, когда нужно проверить, что дисперсия конкретной выделенной выборки больше, чем у другой, и двусторонним, когда просто нужно показать, что дисперсии не равны. Существуют два способа проверки таких гипотез. Рассмотрим их на примерах.
ПРИМЕР 3.3.3. Фирма имеет два магазина в городах Воронеж и Липецк. Необходимо проверить, одинаково стабильно происходят продажи в разных городах или нет, то есть сравнить дисперсии с доверительной вероятностью 0,95. Для проверки гипотезы взяли данные о продажах товара за 12 недель в обоих городах (табл. 3.3.3).
Таблица 3.3.3
Воронеж |
47,5 |
52,9 |
51,3 |
48,1 |
52,6 |
49,4 |
48,0 |
52,3 |
45,9 |
52,6 |
46,8 |
49,0 |
Липецк |
52,5 |
50,5 |
48,4 |
48,6 |
50,6 |
50,0 |
50,1 |
49,5 |
49,7 |
51,1 |
49,2 |
49,7 |
РЕШЕНИЕ. По условию задачи критерий двусторонний, так как требуется проверить различие дисперсий (точностей). Доверительная вероятность задана р = 0,95, следовательно, уровень значимости а = 1 - р = 1 -0,95 = 0,05 . Вводим данные выборок (без подписей) в две строчки в ячейки A1-L1 и A2-L2 соответственно. Для вычисления уровня значимости двустороннего критерия служит функция ФТЕСТ(массив1; массив2). Вводим в А4 подпись «Уровень значимости», а в В4 функцию ФТЕСТ, аргументами которой должны быть ссылки на ячейки A1-L1 и A2-L2 соответственно. Результат 0,011591293 говорит о том, что вероятность ошибиться, приняв гипотезу о различии дисперсий, около 0,01, что меньше критического значения, заданного в условии задачи 0,05. Следовательно, можно говорить, что опытные данные с большой вероятностью подтверждают предположение о том, что дисперсии разные и однородность (стабильность) продаж в городах различная.
Другой способ решения задачи — использование надстройки «Анализ данных» (Data Analysis). Для ее подключения нужно в меню «СЕРВИС» выбрать «НАДСТРОЙКИ» и поставить флажок напротив «Пакет анализа» (Analysis ToolPak). После этого в меню «СЕРВИС» появится пункт «АНАЛИЗ ДАННЫХ» (Data Analysis). При работе в «EXCEL 2007» или более поздней версии нажимаем левой кнопкой мыши по круглой кнопке «Office» в верхнем левом углу экрана, внизу выбираем «Параметры EXCEL», слева выбираем НАДСТРОЙКИ, нажимаем кнопку «Перейти» внизу окна и в открывшемся окне проверяем наличие флажка напротив пункта «Пакет анализа» (Analysis ToolPak), «ОК». В меню ДАННЫЕ выбираем «Пакет анализа» (Analysis ToolPak), открывается окно надстройки, в котором выбираем «Двухвыборочный F-тест для дисперсий» (F-test Two-Sample for Variances). В открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал переменной 2» (Variable 1 Range) вводим ссылки на данные (A1-L1 и A2-L2 соответственно), если имеются подписи данных, то ставим флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее вводим уровень значимости в поле «Альфа» (Alpha) (по условию это 0,05, и данное значение уже указано по умолчанию). В разделе «Параметры вывода» (Output Options) ставим метку около «Выходной интервал» (Output Range) помещаем курсор в появившееся поле напротив надписи, щелкаем левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. При нажатии на «ОК» появляется таблица результата. Сдвигаем границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. В таблице указаны средние и дисперсии каждой выборки, значение F-критерия, односторонний критический уровень значимости в строке «P(F<=f) одностороннее» («P(F<=f) one-tail») и критическое значение F-критерия (F critical one tail). Если значение F-критерия ближе к единице, чем F-критическое, то с заданной вероятностью можно считать, что дисперсии равны. Об этом же говорит и то, что критический уровень значимости «P(F<=f) одностороннее» больше заданного значения а. В нашем случае F-критерий равен 5,128, а F-критическое 2,818, то есть F-критерий дальше от единицы, чем критическое значение. Это говорит о том, что дисперсии разные и однородность (стабильность) продаж в городах различная.