Процедура Ньютона — Рафсона в IRT-оценивании

Цель вычислительного анализа в процессе IRT-моделированы я состоит в поиске наиболее правдоподобных оценок параметров пунктов и измеряемого конструкта 0. Наиболее правдоподобные оценки параметров соответствуют максимуму функции правдоподобия. Нахождение значений этих оценок и составляет цель IRT-ана- лиза. Алгоритм вычислений максимально правдоподобных значений параметров модели основан на известной итерационной процедуре Ньютона — Рафсона. Смысл данной процедуры применительно к IRT состоит в следующем. Функция правдоподобия достигает максимума в точке, где ее первая производная равна 0. Рядом с этой точкой вторая производная функции имеет по сравнению с первой большое значение. Таким образом, если оценка 0 соответствует максимуму функции лог-правдоподобия, то отношение первой производной ко второй производной данной функции будет иметь очень малое значение. Знаки полярности производных будут одинаковыми, если оценка 0 является чрезмерно высокой, и противоположными, если оценка 0 слишком низка. Таким образом, отношение производных может быть использовано для определения, насколько велика оценка 0, и в каком направлении она будет изменяться [15].

На первом шаге итерационного процесса начальная оценка 0 рассчитывается путем лог-трансформации процента ключевых ответов испытуемых, либо она просто принимается как нулевая. Для этого значения 0 находится отношение первой производной ко второй производной функции лог-правдоподобия. После этого данная оценка 0 обновляется путем вычитания из нее значения этого отношения. Если предыдущая оценка 0 была близка к оценочной точке, в которой максимизируется функция, то следующая оценка 0 лишь немного отличается от предыдущей. Затем для новой оценки рассчитываются первая и вторая производные, и цикл расчетов повторяется. Итерационный процесс расчетов проводится до тех пор, пока изменения в оценках 0 пе будут удовлетворять остановочному критерию, который представляет собой установленную минимальную разность между предыдущей и новой оценками 0. В IRT-моделях значение критерия схождения равно 0,01. После достижения остановочного критерия итерационный процесс прекращается, и в качестве оценок 0 берутся последние рассчитанные таким образом оценки [15].

Различные способы оценивания отличаются своими особенностями. В случае Байесова оценивания значение правдоподобия умножается на оценку предшествующего распределения 0. Получившееся постериорное распределение оценок шкалируется таким образом, чтобы его плотность была равна 1. В МАР-оценивании постериорный максимум, соответствующий центру (моде) распределения, находится аналогично итерационному алгоритму метода максимального правдоподобия. В ЕАР-оценивании определяется максимум среднего значения распределения. Для этого используется метод квадратур. Вся площадь под кривой постериорного распределения делится на прямоугольники, ширина которых составляет 0,2 единицы, а высота соответствует значению функции на кривой распределения. Ожидаемое (среднее) значение 0 находится путем расчета взвешенной средней оценки 0. Каждая оценка 0 в постери- орном распределении умножается па вес квадратурной точки (высота соответствующего прямоугольника), полученные значения складываются и их сумма делится на количество оценок 0 [15].

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >