Точность коэффициентов регрессии. Доверительные интервалы
Оценки коэффициентов регрессии зависят от используемой выборки значений переменных х и у и являются случайными величинами. Для характеристики точности полученных оценок можно использовать стандартные ошибки коэффициентов регрессии.
Под стандартной ошибкой коэффициента регрессии понимается оценка стандартного отклонения функции плотности вероятности данного коэффициента.
Стандартные ошибки коэффициентов регрессии Sh определяются соотношениями
=52„[(Л-Т)ч]й, (5.26)
где S20cm представляет собой несмещенную оценку остаточной дисперсии
SU-z)2
S2„=^-----—, (5.27)
п - р - 1
- диагональный элемент матрицы (Х'Х)-1.
Величину можно вычислить как
<52!)
где Ац - алгебраическое дополнение к элементу и матрицы XX.
Сопоставляя оценки параметров и их стандартные ошибки, можно сделать вывод о надежности (точности) полученных оценок.
Для оценки статистической значимости коэффициентов регрессии применяется /-критерий Стьюдента, основанный на том факте, что отношения
b-bi
tb=^—(i=l,2,...,p) (5.29)
являются /-статистиками, т. е. случайными величинами, распределенными по закону Стьюдента с числом степеней свободы п-р- 1. Через bi обозначены точные значения коэффициентов регрессии.
Согласно /-критерию Стьюдента выдвигается нулевая гипотеза Н(} о статистической незначимости коэффициента уравнения регрессии (т. е. о статистически незначимом отличии величины а или Ь[ от нуля). Эта гипотеза отвергается при выполнении условия / > tKpnT, где Срит определяется по таблицам /-критерия Стьюдента по числу степеней свободы k = п- р - 1 (р - число независимых переменных в уравнении регрессии) и заданному уровню значимости а.
/-критерий Стьюдента применяется в процедуре принятия решения о целесообразности включения фактора в модель. Если коэффициент при факторе в уравнении регрессии оказывается незначимым, то включать данный фактор в модель не рекомендуется. Отметим, что это правило не является абсолютным и встречаются ситуации, когда включение в модель статистически незначимого фактора определяется экономической целесообразностью.
Доверительные интервалы для параметров уравнения линейной регрессии определяются соотношениями:
~h-a,n-p-l^bi ~^i ~^i +tl-a,n-p-^bi- (5.30)
Величина tx_an_2 представляет собой табличное значение /-критерия Стьюдента на уровне значимости а при степени свободы п — 2.
Если в границы доверительного интервала попадает ноль, т. е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается равным нулю, так как он не может одновременно принимать и положительное, и отрицательное значение.
Точность полученного уравнения регрессии можно оценить, анализируя доверительный интервал для функции регрессии, т. е. для среднего значения у0, зависимой переменной у при заданных значениях объясняющих переменных:
Х1 =Х10> х2 = Х20» —» Хр=ХрО- (5.31)
Доверительный интервал для функции регрессии определяется соотношениями:
Л-1^ ^Уо — Уо (5-32)
где у0 - групповая средняя, определяемая по уравнению регрессии при заданных значениях объясняющих переменных Xj =х10, х2=х20,..., хр=хр0; S,=sJxo(XX)Xo - ее стандартная ошибка; у0 - точное значение групповой средней; Хо - вектор, составленный из заданных значений независимых переменных ?^0=0» X10’ Х20’ хРо)-
Доверительный интервал для индивидуальных значений зависимой переменной у0 определяется соотношениями:
Л Уо Уо , (5.33)
где
S.a =5ЙЙ71+Х(*'ад, (5.34)
есть стандартная ошибка индивидуальных значений зависимой переменной у0.