Критерий Стьюдента сравнения средних

Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо различаются. Существуют три разновидности критерия: один для связанных выборок и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Выборки называются связанными, если каждому значению с любым номером первой выборке будет соответствовать некоторое значение с тем же номером, характеризующее тот же объект, но в других условиях. Например, один и тот же кусок мяса взвешивается на одних весах (элемент первой выборки) и на других (элемент второй). Если выборки не связаны и измерения проводятся по разным объектам, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же, как и в случае сравнения дисперсий имеются 2 способа решения задачи, которые рассмотрим на примере.

ПРИМЕР 3.3.4. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформления упаковки (табл. 3.3.4).

Таблица 3.3.4

До смены

16

19

14

15

17

16

19

16

19

14

15

19

После смены

18

19

21

15

19

18

15

20

17

16

21

15

Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?

РЕШЕНИЕ. По условию р = 0,99, а = 0,01, выборки не связаны, критерий односторонний, т. к. нужно доказать, что средние показателя, представленного второй выборкой, больше, чем у первой. Вводим в ячейки А1-М1 и А2-М2 исходные данные с подписями. Так как выборки не связаны, то предварительно сравниваем дисперсии. В свободную ячейку вводим функцию «=ФТЕСТ(В1:М1;В2:М2)>>. Результат 0,67, что намного больше, чем уровень значимости а. В результате проверки дисперсии оказываются равными.

Первый способ решения задачи, как и в случае дисперсий, - использование стандартной функции. Ею является ТТЕСТ(массив1; массив2; хвосты; тип), решающий задачу по t-критерию Стьюдента. В ячейку В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргументы функции:

  • - массив 1, массив2 — исходные данные (ссылки на А1-М1 и A2-L2);
  • - хвосты — вид критерия: если 1 — односторонний критерий, если 2 — двусторонний (в нашем случае ставится единица);
  • - тип — тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями — ставим 2, для несвязанных выборок с неравними дисперсиями ставим 3. В нашем случае дисперсии равны, поэтому выбираем 2.

Функция возвращает критическое значение уровня значимости, имеющего смысл ошибиться, приняв гипотезу о различии средних. Если критическое значение больше заданного, то средние нужно считать равными. Вводим в свободную ячейку «=ТТЕСТ(В1:М1;В2:М2;1;2)». Результат в нашем случае 0,081 больше заданного а = 0,01. Следовательно, смена производителем упаковки не привела к среднему увеличению продаж и изменения в количествах продаж, вероятнее всего, связано с какими-то случайными факторами.

Второй способ — использование пакета «Анализ данных» (Data Analysis). Способ вызова и подключения его был описан ранее. В зависимости от типа критерия выбирается один из трех: «Парный двухвыборочный t-тест для средних» (t-Teat: Paired Two Sample for Means) — для связанных выборок и «Двухвыборочный t-тест с одинаковыми дисперсиями» (t-Teat: Two Sample Assuming Equal Variances) или «Двухвыборочный t-тест с разными дисперсиями» (t-Teat: Two Sample Assuming Unequal Variances) — для несвязанных выборок. Вызовите тест с одинаковыми дисперсиями, в открывшемся окне в полях «Интервал переменной 1» (Variable 1 Range) и «Интервал переменной 2» (Variable 2 Range) введите ссылки на данные (А1-М1 и A2-L2 соответственно). Если имеются подписи данных, то поставьте флажок у надписи «Метки» (Label) (у нас их нет, поэтому флажок не ставится). Далее введите уровень значимости в поле «Альфа» (Alpha) — 0,01. Поле «Гипотетическая средняя разность» (Hypothesized Mean Difference) оставляют пустым. В разделе «Параметры вывода» (Output Options) поставьте метку около «Выходной интервал» (Output Range), поместите курсор в появившемся поле напротив надписи, щелкните левой кнопкой в ячейке В7. Вывод результата будет осуществляться, начиная с этой ячейки. При нажатии на «ОК», появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличьте ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику (t-stat), критические значения этих статистик и критические уровни значимости <

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >