Клиниметрика и психометрика

В последние годы на страницах «Журнала клинической эпидемиологии» (Journal of Clinical Epidemiology) развернулась дискуссия о взаимоотношениях клиниметрики и психометрики. Некоторые авторы противопоставляют эти две области. Как уже отмечалось, клиниметрика включает правила создания и использования клиниметрических индексов. Данные правила в большей степени касаются клинически обоснованных суждений, нежели статистических процедур. Однако следует отметить, что клиниме- трические технологии не имеют теоретического обоснования с позиции научного измерения латентных конструктов. Между тем в психиатрии методы измерения формировались не на основе клиниметрики, а в рамках психометрического подхода [17].

В исследовании Р. Маркс и соавторов (R. Marx et al.) психометрические и клиниметрические стратегии использовались для отбора пунктов в процессе создания шкалы оценки здоровья. Психометрические стратегии включали корреляционный анализ

«пункт — общая оценка» и факторный анализ. Клиниметрическая стратегия основывалась на определении средней оценки субъективного веса каждого пункта шкалы. Результаты исследования показали комплементарность обеих стратегий [37J.

По мнению Г. де Вет, противоречия между клиниметрикой и психометрикой носят надуманный характер. Каждый подход используется для своих целей и задач. Психометрический подход эффективен в конструировании моноразмерных шкал. Клиниме- трический подход в большей степени зарекомендовал себя в создании композитных индексов. Методы оценки валидности и надежности одинаковы для обоих подходов. В последние годы оба подхода существенно сблизились в рамках теории анализа тестовых заданий, модели Раша и часто используются совместно [57].

Попытки решения проблем измерения в медицине

Разрозненность подходов, отсутствие единой концептуальной основы и теории измерения клинических феноменов в медицине стали основанием для организации исследования COSMIN (Consensus-based Standards for the Selection of Health Measurement Instruments — англ.). Исследование COSMIN было инициировано в Нидерландах в рамках международного мультидисциплинарного проекта Delphy, фокусировавшегося на отчетах пациентов о результатах лечения. Цель исследования состояла в достижении консенсуса среди 50 экспертов, специалистов в области психометрики, клинической эпидемиологии, статистики и клинической медицины, в ответах на следующие вопросы:

  • 1. Какие особенности измерения являются важными?
  • 2. Какие термины и определения следует использовать в процессе описания методологии и результатов измерения?
  • 3. Как строить дизайн измерительных исследований?
  • 4. Какие статистические процедуры применять при обработке данных измерения?

В результате был составлен перечень терминов и характеристик измерения, которые включает следующие категории: надежность, внутреннюю согласованность, ошибку измерения, конструктную валидность, критериальную валидность, содержательную валидность, откликаемость и интерпретируемость [14].

В контексте методологии измерения интерес представляет такая категория, как интерпретируемость, которая представляет собой оценку результатов измерения с точки зрения их клинической трактовки. Она характеризуется степенью, в которой числовым оценкам измерений можно придать качественный клинический смысл [14]. Интерпретируемость, наряду с надежностью и валидностью, представляет собой точку приложения методологических измерительных принципов и правил.

Стоит упомянуть и о другой исследовательской инициативе, также направленной на решение измерительных проблем в медицине. Так называемая STARD-инициатива (The Standards for Reporting of Diagnostic Accuracy — англ.) была направлена на совершенствование четкости и полноты отчетов об исследованиях точности диагностических методов. Это дало возможность оценить степень потенциальной ошибки и уровень обобщаемое™ результатов исследований. Инициатива была предложена в 1999 г. на Кохрановском совещании в Риме. В ней были отмечены низкое методологическое качество и несоответствие стандартам исследовательских отчетов о разработке диагностических тестов. Исследовательская группа STARD начала свою работу с изучения публикаций и отчетов диагностических исследований. В результате проведенного анализа был разработан оценочный перечень из 25 пунктов, предназначенный для оценки отчетов об исследовании диагностической точности теста. Среди оценочных пунктов можно выделить, например, описание выборки исследования, критерии оценки полученных результатов, технические методы исследования. Кроме того, группа STARD предложила блок-схемы, представляющие алгоритмы проведения исследований точности диагностических методов [51; 55].

Таким образом, до настоящего времени остаются нерешенными проблемы методологического обоснования и технологического обеспечения измерения латентных клинических и психологических конструктов в медицине. Существующие клиниметрические подходы в основном ориентируются на линейно прикладные и формально описательные способы решения измерительных проблем. Традиционные психометрические подходы не оправдывают своих ожиданий, поскольку нс соответствуют таким требованиям научного измерения, как воспроизводимость, интерпретируемость и аддитивность. Фактически традиционная психометрическая модель не содержит каких-либо обоснованных правил построения научного измерения клинически значимых психологических конструктов. Имеющиеся проблемы обусловливают необходимость поиска новых теоретически обоснованных подходов к измерению психологических и клинических конструктов в медицине. В настоящее время новые теоретические и прикладные подходы к научному измерению данных конструктов в медицине формируются в рамках новой области знаний, получившей название «клиническая нсихометрика».

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >