Критерии Колмогорова—Смирнова

Критерий согласия Колмогорова используется для проверки гипотезы о том, подчиняется ли данное эмпирическое распределение точно известной теоретической модели. Критерий однородности Смирнова предназначен для проверки гипотезы о том, подчиняются ли два эмпирических распределения одному и тому же закону.

Критерий согласия Колмогорова

Гипотезы: Проверяется нулевая гипотеза Но : F(x) = Fq(x) против альтернативной Hi : F(x) ф Fq(x), где Fo(а:) — теоретическая непрерывная функция распределения случайной величины X, известная с точностью до своих параметров в.

Статистика: Рассматривается так называемая статистика Колмогорова, соответствующая максимальному абсолютному отклонению эмпирической функции распределения Fn(x) от теоретической Fo(x)

где sup А — точная верхняя грань или супремум, обобщающий понятие максимума на случай любого упорядоченного множества А.

В теореме Колмогорова доказывается, что при п —> оо случайная величина y/nDn стремится по вероятности к распределению Колмогорова

Если объём выборки п достаточно велик, то а-квантиль распределения Колмогорова Ка можно приблизительно оценить по формуле

Критерий: Если наблюдаемое значение статистики превосходит на заданном уровне значимости а квантиль распределения Колмогорова: , то нулевая гипотеза на уровне значимости а отвергается в пользу альтернативной

. В противном случае говорят, что нулевая гипотеза

Но : F(x) = Fo(x) на уровне значимости а согласуется с выборочными данными.

Пример 3.4. Для центрированной реализации выборки, использованной в предыдущем примере vt = хг-х, с помощью критерия согласия Колмогорова проанализировать зависимость достигаемого уровня значимости ар от числа степеней свободы т = 2, 3, .... 20 для нулевой гипотезы Но '? F(v) = Fq(v) при альтернативной Н : F(v) ф Ф Fo(v), где .Fo(u) —теоретическая функция распределения Стьюден- та с заданным числом степеней свободы т.

Назначение команд в строках 1121 в целом аналогичны ранее указанным в примере 3.1. Отличие состоит в указании дополнительного параметра «dgts=NA» для функции «samplesО», который отключает округление выборочных значений для генерируемой совокупности, поскольку использование критерия согласия Комогорова даёт корректные результаты лишь для непрерывных случайных величин. В строке ?з] задаётся вектор числа степеней свободы «т», вычисляется центрированный вектор значений выборки «v» и проводится его сортировка по возрастанию «w». Далее в строке |Tj с помощью композиции функций «sapply(.. .ks. test О [ [2] ])» для каждого значения числа степеней свободы «т» по критерию согласия Колмогорова вычисляются достигаемые уровни значимости ар для нулевой гипотезы Но : F(v) = Fq(v) при альтернативной Hi : F(v) ф Fq(v), где Fo(v) — теоретическая функция распределения Стьюдента с заданным числом степеней свободы т.

Далее в строках |5-б| с помощью функции «plotО» строится график зависимости ар(т), на котором с помощью функции «ablineO» горизонтальной «h=0.05» штриховой линией «lty=2» отмечается типичный уровень значимости, используемый при проверке гипотез.

В строках 17—81 с помощью композиций «plot(ecdf ()...)», а также «lines(.. .pt())» строятся графики эмпирической функции распределения Fm(v) и теоретической функции ?-распределения Fq(v)

Изменение уровня значимости а от числа степеней свободы т, достигаемого для нулевой гипотезы Но '? Р(*>) = Ро(ь) при альтернативной Н

Рис. 3.7. Изменение уровня значимости ар от числа степеней свободы т, достигаемого для нулевой гипотезы Но '? Р(*>) = Ро(ь) при альтернативной Н : Р(г') ф РоМ

Графики эмпирической Р(а) и наиболее близкой к ней теоретической функции распределения Стьюдента Ро(^) с числом степеней свободы т = 2

Рис. 3.8. Графики эмпирической Рт(а) и наиболее близкой к ней теоретической функции распределения Стьюдента Ро(^) с числом степеней свободы т = 2

с числом степеней свободы т = 2, соответствующим максимально достижимому уровню значимости «т [which, max (alpha) ] ».

Изучение графиков показывает, что с ростом числа степеней свободы т теоретического распределения Стьюдента уровень значимости qp, достигаемый при проверке нулевой гипотезы Но : F(v) = = Fo(v) по критерию согласия Колмогорова падает, что на первый взгляд плохо согласуется со свойствами ?-распределения. Объяснение этого кажущегося несоответствия авторы предлагают читателю найти самостоятельно.

Критерий однородности Смирнова

Гипотезы: Проверяется нулевая гипотеза Но : ^(ж) = против альтернативной Н : ф Р-фх), гАе ^1 (ж) и ^(ж) —

неизвестные теоретические функции распределения, для оценки которых используются построенные по независимым выборкам объёмами пит эмпирические функции распределения Рп(х) и *»(*)•

Статистика: Здесь также используется статистика Колмогорова, соответствующая максимальному абсолютному отклонению эмпирических функций распределения Рп(х) и Рт(х)

В теореме Смирнова доказывается, что при п, т —» оо случайная величина стремится по вероятности к распределению Колмогорова

Критерий: Если наблюдаемое значение статистики превосходит на заданном уровне значимости а квантиль распределения Колмогорова: у/ > Ка, то нулевая гипотеза на данном

уровне значимости а отвергается в пользу альтернативной Н : ^(т) ф ^2(я)- & противном случае говорят, что нулевая гипотеза Но '? И^х) = ^(я) на уровне значимости а согласуется с выборочными данными.

Пример 3.5. Для чётных и нечётных элементов выборки, использованной в примере 3.4: {т,}га = {гд}т и {, где п = т + I — объёмы полной и частичных выборок, с помощью критерия однородности Смирнова на уровне значимости а = 0,05 проверить нулевую гипотезу Но : И! (и) = при альтернативной Н : И^и) ф

В строке [э] вычисляются частичные выборочные векторы, содержащие чётные и нечётные элементы выборки {тг}п = {ы; }т и {щ};, а затем «кз^еэ-ьО» по критерию однородности Смирнова вычисляется достигаемый уровень значимости для нулевой гипотезы Но : (и) = при альтернативной : Я], (и) Ф ДгМВ строке [IJj приведён достигаемый уровень значимости ар и 0,72, сравнение которого с заданным уровнем а = 0,05 позволяет сделать вывод о хорошем согласовании нулевой гипотезы Но с выборочными данными {uj}m и к},..

Графики эмпирических функций распределения Р(и) и К(ь) для выборок {и-} и

Рис. 3.9. Графики эмпирических функций распределения Рт(и) и К(ь) для выборок {и-}т и

В строках 114-151 с помощью композиции «plot (ecdf ())» выполняется построение эмпирических функций распределения Fm(u) и Fi(v), приведённых на рис. 3.9, а с помощью команды «rug ()» — отображение соответствующих этим функциям частей выборки вблизи нижней и верхней границ графика.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >