Программа статистического исследования

Программа статистического исследования, отражая его содержательную часть, последовательно включает в себя программу сбора материала (наблюдения), программу разработки и программу анализа.

Программа сбора материала начинается с определения единицы наблюдения (случая, подлежащего регистрации). Затем составляется перечень учетных признаков, который должен быть формализован в первичный учетный документ - форму (бланк), в котором будет регистрироваться вся необходимая собираемая информация.

Единица наблюдения — каждый первичный элемент статистической совокупности, наделенный элементами сходства (каждый случай изучаемого явления, подлежащий регистрации).

В большинстве клинических исследований единицей наблюдения является больной, хотя это нс всегда правильно. Так, при изучении заболеваемости, один человек может иметь несколько болезней. В этом случае за единицу наблюдения нужно брать каждый случай заболевания. Единица наблюдения обладает множеством признаков, часть из которых может характеризовать изучаемое явление или оказывать на него влияние. Такие признаки в зависимости от цели и задач исследования регистрируются и носят название учетных признаков .По своей сути учетные признаки представляют собой качественные или количественные данные, характеризующие единицу наблюдения. На этапе составления программы исследования уже необходимо определиться, каков будет тип этих данных, поскольку в первичном учетном документе они должны бытьуказаны в определенном формате. Для их последующей разработки должна будет формироваться база данных (также с различными форматами). Статистические методы, которые планируется применить для анализа, зависят от их типа. На рисунке 11 представлена классификация статистических данных (учетных признаков).

Согласно рисунку 11, все данные могут быть разделены на две большие группы: качественные (категориальные, атрибутивные) и количественные (числовые, вариативные). В отдельную группу также могут быть выделены календарные даты, отражающие временные точки исследования. Для всех качественных данных характерно то, что они нс имеют изначально численной характеристики и не обладают таким свойством, как разнообразие (вариабельность). Для всех качественных данных с целью их описания применяют расчет и анализ относительных величин (статистических показателей, статистических коэффициентов).

Даты

  • (категориальные)
  • (числовые)
Классификация статистических данных

Рисунок 11. Классификация статистических данных.

Вес качественные данные в свою очередь могут быть подразделены на номинальные и порядковые. Примером номинальных данных может служить пол. Он может быть либо мужским, либо женским. Между двумя этими выражениями признака не существует множества переходных форм, здесь нельзя сказать кто больше: мужчина или женщина и в зависимости от этого ранжировать собранные данные (выстроить по возрастанию или убыванию). Аналогично место жительства (город или село), профессия, наличие или отсутствие заболевания (да или нет) и т.д. Даже если присвоить численный код каждому из вариантов ответов, проводить числовые операции с данными кодами нельзя и бессмысленно. Так, если мужскому полу присвоен код 1, а женскому - 2, выражение 1 + 2 = 3 не имеет никакого смысла[1]. Порядковые качественные признаки в отличие от номинальных данных могут быть выражены через определенное число и ранжированы по убыванию или возрастанию. Например, группы инвалидности (самая тяжелая I, затем II и III), сте-

пень артериальной гипертонии (самая тяжелая III), функциональный класс стенокардии напряжения, различные балльно-рейтинговые шкалы (степень выраженности болевого синдрома по 10 балльной шкале) и т.д. Однако от того, что вариантам присваивается порядковый номер, данный признак не становится количественным, т.к. в основе присваивания того или иного ранга лежит набор ряда качественных характеристик. При анализе данных такого типа в ряде случаев могут быть использованы методы, применяемые для количественных данных. Так при анализе успеваемости студентов традиционно рассчитывается средний балл в группе, для оценки взаимосвязи между признаками может быть применен метод непараметрического корреляционного анализа Спирмена, кластерный анализ и др. Но и в этом случае исследователи нс должны забывать, что анализируют качественные данные. Все аналитические вычисления должны базироваться на строгом обосновании их проведения и не утрачивать смысловую качественную нагрузку. Так, никакого смысла не будет иметь расчет средней группы инвалидности среди всех инвалидов или средней стадии сердечной недостаточности среди больных.

Количественные признаки могут быть непрерывными и прерывными. Непрерывные признаки имеют между собой множество переходных числовых выражений. Например, рост, масса тела, артериальное давление разных людей может отличаться на сколь угодную величину. При выстраивании значений количественных признаков в порядке возрастания или убывания могут быть построены интервалы, в которых будут находиться значения этих признаков. К непрерывным признакам можно отнести и относительные частоты, полученные при разработке качественных данных. Например, из показателей заболеваемости, рождаемости, инвалидности (выраженных в процентах, промилле или продецемилле) могут быть построены динамические или вариационные ряды, с которыми при определенных условиях могут быть применены методы, применяемые для анализа количественных данных. Прерывные количественные признаки всегда выражены целым числом. Например, частота сердечных сокращений, количество пломбированных зубов и т.д. Вес количественные признаки обладают свойством вариабельности (разнообразия),и их описательный анализ сводится к построению вариационного ряда, расчету и оценке его параметров.

После того, как определена единица наблюдения, сформирован перечень учетных признаков, переходят собственно к составлению бланка учетного документа. При этом необходимо придерживаться следующих правил:

  • ? Документ должен иметь название.
  • ? Четкое и краткое формулирование вопросов (учетных признаков).

В документе не должно быть вопросов, на которые сложно ответить или получить точный ответ, а также «лишних» («на всякий случай») вопросов.

Желательно предусмотреть и внести в документ возможные варианты ответов (система: «вопрос - ответ - шифр»; именно такой вариант наилучшим образом подходит для последующей программной разработки).

Желательно предусмотреть компактное, рациональное расположение учетных признаков в документе.

Нс стоит представлять количественные непрерывные признаки в виде дискретных интервалов (тем самым исследователь изначально урежет возможности анализа количественных данных; если такие интервалы все же понадобятся на этапе анализа, программа создаст их автоматически, по заданным параметрам группировки).

Не стоит вносить в документ вычисления различных индексов (любой программный продукт, используемый для анализа, сделает это автоматически и точнее).

Оптимальность объема информации (не более 40 50 вопросов; если документ большой лучше разбить его на несколько).

Желательно предусмотреть, какие программные средствабудутис-пользованы для последующей разработки (от этого может зависеть способы шифровки собираемых данных, форматы их представления).

Желательно проведение пробного заполнения документа (на 10 15 единицах наблюдения), с последующей его корректировкой.

Могут быть предусмотрены контрольные вопросы («шкала лжи»).

При подготовке документа следует ориентироваться на то, кто его будет заполнять (сам исследователь, врач медицинской организации, больной и т.д.). От этого зависит формулировка вопросов и ответов (применение медицинской терминологии).

Ниже мы приводим фрагменты первичных учетных документов. Первый фрагмент «Карта подростка, прошедшего медицинский осмотр» (рис. 12) Предполагается, что данный документ будет использоваться для изучения заболеваемости подростков по результатам медицинского осмотра и будет заполняться самим исследователем или врачом (медицинской сестрой) в медицинской организации. Второй фрагмент из документа «Анкета изучения заболеваемости ревматическими болезнями» (рис. 13), ориентирован на заполнение респондентами среди взрослого населения. Безусловно, приведенные примеры не претендуют на идеальный образец, т.к. все зависит от цели и задач конкретного исследования. Главная цель любого документа - собрать необходимые сопоставимые данные.

КАРТА ПОДРОСТКА. ПРОШЕДШЕГО ПЕРИОДИЧЕСКИЙ МЕДИЦИНСКИЙ ОСМОТР

1 ФЛО.____________________________________________________I I код

Каждому будет присвоен уникальный номер («ключ»). Необходимо, если информация будет собираться

  • 2. Пол: м -1, ж - 2 "------
  • 3. Возраст:полных лет ________________________________________________
  • 4. Место учебы / работы: школьник - 1. учащийся средних специальных заведений - 2, учащийся высших учебных

заведений - 3, работающий - 4. без определенного занятия - 5.---------

  • 5. Место жительства:адрес
  • 6. Диагноз, установленный на момент осмотра:|I I код по МКБ

по каждому случаю не одномоментно, будет в последующем дополняться, будет использована реляционная база данных, с несколькими связанными по «ключу» таблицами.

7. Сведения о перенесенных заболеваниях:

Диагноз

Код по МКБ

8. Сведения о заболеваниях у кровных родственников:

Количественные данные представлены в виде абсолютного числа, а нс дискретных интервалов

Диагноз

Код по МКБ

9. Определен в группу здоровья: здоровые - 1, практически здоровые - 2, больные хроническими заболеваниями в компенсации-3, больные хроническими заболеваниями в субкомпенсацнн - 4. больные хроническими заболеваниями в декомпенсации - 5.

Качественные данные представлены в виде «Вопрос - ответ - шифр»

Поскольку неизвестно, какой диагноз будет поставлен, в бланке вы-

10. Потребности в определенных профилактических и оздоровительных мероприятиях: требуется контроль состояния 1 раз в год. требуется контроль состояния 2 раза в год - 2. требуется проведение ЛФК - 3. требуется обеспечение корригирующими очками - 4. требуется направление на санаторно-курортное лечение - 5, требуется физиотерапевтическое лечение-6, требуется госпитализация - 7. прочее - 8.

делено место под его запись с возможностью последующего кодирования

Рисунок 12. Пример фрагмента первичного учетного документа, ориентированного на заполнение исследователем.

30

АНКЕТА ИЗУЧЕНИЯ ЗАБОЛЕВАЕМОСТИ РЕВМАТИЧЕСКИМИ БОЛЕЗНЯМИ

Уважаемые Оренбуржцы!

Оренбургская государственная медицинская академия проводит изучение заболеваемости населения области ревматическими болезнями. Планируется использовать полученные результаты для улучшения организации медицинской помощи больным. Анонимность ответов и соблюдение врачебной тайны гарантируется. Просим Вас отметить наиболее

точные варианты ответов на поставленные вопросы.

Благодарим Вас за понимание и потраченное время.

  • 01. Вы являетесь жителем: города ?; села ? __
  • 02. Населенный пункт_______________________________________ _____
  • 03 . Возраст: полных лет ~~~
  • 04. Пол: мужской ?; женский ?
  • 05. Семейное положение: состою в браке . не состою в браке ? : в разводе ?
  • 06. Профессиональная группа: рабочий ?; работник сельского хозяйства п; служащий ?;

предприниматель ?. военный ?; студент ?; пенсионер ?; безработный г

  • 07. Образование, начальное ?; среднее ?; высшее ?; отсутствует ?.
  • 08. Вы занимаете руководящую должность? да ?: нет ?.

Краткое обращение к респондентам, зачем и как их просят заполнить документ

Шифры отсутствуют для упрощения восприятия ответов и будут проставляться на этапе разработки данных. В тексте использовано выделение ответов другим шрифтом. Ответы ориентированы на понимание любым взрослым респондентом

09. Уровень Вашего дохода в месяц: высокий ?; выше среднего ?; средний ?: ниже среднего ?; низкий ?

Рисунок 13. Пример фрагмента первичного учетного документа, ориентированного на анкетирование.

31

Достаточно часто в научных исследованиях используются официальные первичные учетные документы (утвержденные Минздравом России и используемые в практической деятельности медицинских организаций). Однако это не значит, что исследователь может не готовить собственный документ, т.к. практически всегда невозможно обойтись только одним документом; не все данные, имеющиеся в официальном документе, могут пригодиться; данные, собираемые из разных документов, должны быть сопоставимы. Исследователю все же целесообразно составить свой неофициальный документ с четким перечнем необходимой для сбора информации в нужном формате и на этапе сбора информации выкопировывать в него данные из официальной документации.

Программа разрябя/икиклассическивключает в себя подготовку макетов таблиц для последующей статистической сводки и группировки на этапе разработки. Сводка должна обеспечить получение необходимых показателей. Посредством группировки осуществляется расчленение всего материала на качественно однородные части, что позволит изучать их структуру и выстраивать определенные зависимости между различными признаками. В настоящем пособии мы не будем подробно разбирать данный материал, т.к. он имеется в любом руководстве по статистике и учебниках по дисциплине «Общественное здоровье и здравоохранение»[2], а уделим внимание описанию необходимой подготовки для последующего ввода собранных данных для анализа на компьютере на примере программы Statistica 10.0. При первом запуске программы по умолчанию появится таблица данных, которую и необходимо будет подготовить для их последующего ввода (рис. 14). Если в программе до этого работали, откроется последняя сохраненная таблица. Однако всегда можно создать новую, нажав на соответствующую кнопку в панели инструментов. Каждая строка таблицы предназначена для ввода информации, характеризующей одну единицу наблюдения (1 строка - 1 больной) - случай. Каждая графа (столбец) - переменная - учетный признак. В открытой по умолчанию таблице изначально имеется место для ввода 10 случаев и 10 переменных. Их всегда можно добавить при помощи панели инструментов или выпадающего контекстного меню при нажатии правой кнопки мыши. Собственно в программе для элементарного управления данными предусмотрены все средства Windows(KonHpoBaTb, вырезать, вставить и т.д.). Мы не будем подробно на них останавливаться, а далее разберем специфику программы Statistica.

STATIS11CA •

Лейл Пне<в ?*<д В^тмка Фермат Диализ Добыче Дтты* Графим Сераме Денные 2*>о Спреткв

D Е" И <3 Gk )1 & ® М Добавит» в Рабочую отиту • Доблить в Отчет • Добавит» в MS Word • А/ Ч? •

,пI• N) t ”,ю ?*,АХ^ЖДЛ^ЗиАдАйВд!^ 1вcff fe1 <=> '• ---де-ил- TIJ&dta,

Рисунок 14. Таблица данных в Statistica 10.0.

Щелкнув двойным щелчком по заголовку переменной, выведем окно ее спецификации, в котором и будем задавать се характеристики (рис. 15).

Л. STATTSTTCA Таблица данные!^

Файл Правка Вид Вставка Формат Диализ Добыча Дани»» Графика Сервис Данные Окно Справка

Окно спецификации переменной

Рисунок 15. Окно спецификации переменной.

В этом окне можно особо ничего не изменять и ввести только имя переменной (рекомендуем прочитать в руководстве пользователя о форматах отображения данных). Однако здесь имеется ряд полезных функций, которые необходимо знать и которые существенно облегчают работу как по вводу данных, так и последующему анализу. Первое, в поле «Длинная метка» можно ввести формулу для расчета значений переменной на основании других. Например, рассчитать индекс массы тела на основании имеющихся переменных роста и массы тела; рассчитать индекс КПУ по переменным, отражающим число поражённых кариесом зубов, пломбированных зубов, удаленных зубов; получить логарифмы количественных данных, что часто применяется для их нормализации и многое другое. Ввод любой формулы начинается со знака «=», затем без пробелов вводятся необходимые функции и/или операторы (справку о них всегда можно получить здесь же в интерактивной справочной системе) и номера исходных переменных (VI -первая переменная, V2 -вторая, и т.д.). Второе - это реализовать механизм двойной записи значений номинальных или качественных порядковых переменных. Суть его сводится к тому, что вместо текстового значения признака вводится код, которому присваивается текстовая метка. При вводе данных достаточно ввести код, и необходимый текст будет введен автоматически, что экономит время при вводе информации, предотвращает ошибки, связанные с опечатками, дает возможность по кодам проводить анализ порядковых качественных переменных. Продемонстрируем это на примере ввода признака 09 «Уровень Вашего дохода в месяц» из рисунка 13. Для этого назовем первую переменную «Доход» и в окне спецификации нажмем кнопку текстовые метки (см. рис. 15). В открывшемся редакторе текстовых меток введем последовательно варианты ответов, начиная с «низкого дохода» и присвоим им ко-дыпо возрастанию (рис. 16). После нажатия кнопки «ОК» в таблицу можно будет вводить данные, не набивая текст, а используя цифровую клавиатуру. После того, как таблица будет заполнена, данные можно просматривать как в текстовом варианте, так и цифровом (рис. 17), используя кнопку «Пока-зать/Скрыть текстовые метки». Следует также отмстить, что поскольку доступ к лицензионной версии Statistica для большинства аспирантов возможен только на кафедрах, то можно готовить таблицы данных таким же образом в широко распространенномМЗЕхсе! для последующего экспорта (что очень легко) и анализа eStatistica. В этом случае также в таблицу забиваем не текстовые варианты ответов, а их коды. Таблица данных в М8Ехсс1будст выглядеть примерно, как на рисунке 18. После того как будет проведен экспорт, останется только в Statistica присвоить кодам текстовые метки. В результате

получится тот же результат, что и при вводе данных непосредственно в Sta-tistica (рис 18).

Окно редактора текстовых меток

Рисунок 16. Окно редактора текстовых меток.

A STATJSTKA • ?«Йлал Д#*н»а1

К$ТАГВПСА--Лим**т«|

Грге»сэ Ечс Здош »:$ыгт ймл»: Графив Сдое Дани Файл Прдо ?ид Copjjt Амло ДйакаДанма Графта Сдое ?<ио Справа

? О^И® «В& Л й До6з1ип. «Работе онгу- 0(^8® Х&Й'? * й • ^м.ьеОгмет • Кб I

Рисунок 17. Таблица данных с реализованным механизмом двойной записи.

[pl Ж Вырезать Q

—* Копировать ’

Вставить )]

? .У Формат по образцу

_______Буфер обмена_________г» |

Н81

Л-

А |

L 8

с

D

1

возраст

диагноз

ИМТ 1

2

45

1

32

3

45

1

25,5

4

50

1

29,5

5

58

1

32

6

45

1

30

7

45

1

27

8

55

1

30,5

9

48

1

29

10

55

1

30

11

48

1

20

12

56

1

23

13

45

1

25

14

50

1

30

15

47

1

33

16

48

1

22

17

54

2

36

18

54

________1

29.5

1 возраст

2 диагноз

3 ИМТ

1

45

СД средней степени

32

2

45

СД средней степени

25.5

3

50

СД средней степени

29,5

4

58

СД средней степени

32

5

45

СД средней степени

30

6

45

СД средней степени

27

7

55

СД средней степени

30.5

8

48

СД средней степени

29

9

55

СД средней степени

Зо[

10

48

СД средней степени

20Г

11

56

СД средней степени

23

12

45

СД средней степени

25

13

50

СД средней степени

30

14

47

СД средней степени

33

15

48

СД средней степени

22

16

54

СД тяж

36

17

54

СД средней степени

29,5

Рисунок 18. Таблица данных, подготовленная в MSExcel (слева) импортированная в Statistica (справа).

Следует оговориться, что часто начинающие пользователи программы готовят несколько таблиц данных. Например, отдельно по основной ipynne и контрольной. Этого делать не стоит. Если предполагается сопоставление отдельных групп, то все данные должны быть введены в одну таблицу, а для определения групп выделена отдельная переменная.

  • [1] Мы акцентируем внимание на этом аспекте, ввиду того что иногда встречаются работы, в которых авторы ошибочно применяют к номинальным данным расчет средних величин, проводят корреляционный анализ с кодами номинальных признаков. Этого делать ни в коем случае нельзя.
  • [2] Например: Медик В.А., Юрьев В.К. Общественное здоровье и здравоохранение: учебник. - М.: ГЭОТАР-Медиа, 2013.-608 с.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >