Критерий Стьюдента сравнения средних
Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо различаются. Существуют три разновидности критерия: один для связанных выборок и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Выборки называются связанными, если каждому значению с любым номером первой выборке будет соответствовать некоторое значение с тем же номером, характеризующее тот же объект, но в других условиях. Например, один и тот же кусок мяса взвешивается на одних весах (элемент первой выборки) и на других (элемент второй). Если выборки не связаны и измерения проводятся по разным объектам, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же, как и в случае сравнения дисперсий имеются 2 способа решения задачи, которые рассмотрим на примере.
ПРИМЕР 3.3.4. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформления упаковки (табл. 3.3.4).
Таблица 3.3.4
До смены |
16 |
19 |
14 |
15 |
17 |
16 |
19 |
16 |
19 |
14 |
15 |
19 |
После смены |
18 |
19 |
21 |
15 |
19 |
18 |
15 |
20 |
17 |
16 |
21 |
15 |
Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?
РЕШЕНИЕ. По условию р = 0,99, а = 0,01, выборки не связаны, критерий односторонний, т. к. нужно доказать, что средние показателя, представленного второй выборкой, больше, чем у первой. Вводим в ячейки А1-М1 и А2-М2 исходные данные с подписями. Так как выборки не связаны, то предварительно сравниваем дисперсии. В свободную ячейку вводим функцию «=ФТЕСТ(В1:М1;В2:М2)>>. Результат 0,67, что намного больше, чем уровень значимости а. В результате проверки дисперсии оказываются равными.
Первый способ решения задачи, как и в случае дисперсий, - использование стандартной функции. Ею является ТТЕСТ(массив1; массив2; хвосты; тип), решающий задачу по t-критерию Стьюдента. В ячейку В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргументы функции:
- - массив 1, массив2 — исходные данные (ссылки на А1-М1 и A2-L2);
- - хвосты — вид критерия: если 1 — односторонний критерий, если 2 — двусторонний (в нашем случае ставится единица);
- - тип — тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями — ставим 2, для несвязанных выборок с неравними дисперсиями ставим 3. В нашем случае дисперсии равны, поэтому выбираем 2.
Функция возвращает критическое значение уровня значимости, имеющего смысл ошибиться, приняв гипотезу о различии средних. Если критическое значение больше заданного, то средние нужно считать равными. Вводим в свободную ячейку «=ТТЕСТ(В1:М1;В2:М2;1;2)». Результат в нашем случае 0,081 больше заданного а = 0,01. Следовательно, смена производителем упаковки не привела к среднему увеличению продаж и изменения в количествах продаж, вероятнее всего, связано с какими-то случайными факторами.
Второй способ — использование пакета «Анализ данных» (Data Analysis). Способ вызова и подключения его был описан ранее. В зависимости от типа критерия выбирается один из трех: «Парный двухвыборочный t-тест для средних» (t-Teat: Paired Two Sample for Means) — для связанных выборок и «Двухвыборочный t-тест с одинаковыми дисперсиями» (t-Teat: Two Sample Assuming Equal Variances) или «Двухвыборочный t-тест с разными дисперсиями» (t-Teat: Two Sample Assuming Unequal Variances) — для несвязанных выборок. Вызовите тест с одинаковыми дисперсиями, в открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал переменной 2» (Variable 2 Range) введите ссылки на данные (А1-М1 и A2-L2 соответственно). Если имеются подписи данных, то поставьте флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее введите уровень значимости в поле «Альфа» (Alpha) — 0,01. Поле «Гипотетическая средняя разность» (Hypothesized Mean Difference) оставляют пустым. В разделе «Параметры вывода» (Output Options) поставьте метку около «Выходной интервал» (Output Range), поместите курсор в появившемся поле напротив надписи, щелкните левой кнопкой в ячейке В7. Вывод результата будет осуществляться, начиная с этой ячейки. При нажатии на «ОК», появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличьте ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику (t-stat), критические значения этих статистик и критические уровни значимости <