Задание для самостоятельной работы

  • 1. На основании собственных данных рассчитайте относительные величины по основным категориальным переменным.
  • 2. Представьте данные в виде таблиц и графического изображения.
  • 3. Охарактеризуйте основные количественные признаки собственных данных с помощью средних величин, предварительно определив соответствие распределения закону нормального распределения. Опишите вариабельность количественных признаков с помощью стандартного отклонения или квартилей.

Обобщаемость статистических данных и оценка статистической значимости различий между группами

Результатом любого статистического исследования является характеристика изучаемой проблемы таким образом, чтобы сделанные выводы и практические рекомендации не только происходили на основании четкого научного обоснования выявленных закономерностей в изучаемой статистической совокупности, но и могли быть обобщены на сходные объекты или генеральную совокупность в целом. Например, выявленные и оцененные факторы риска развития какого - либо заболевания среди населения города в результате проведенного выборочного исследования могли бы быть обобщены на все городское население. Такой подход позволит использовать установленные факторы риска в популяционных программах профилактики заболеваемости. Кроме того, практически всегда при проведении анализа возникает необходимость проведения сопоставления выявленных различий между группами по качественным либо количественным признакам. Определение того, что эти различия не случайны, имеет принципиальный характер, т.к. указываег на наличие связи изучаемого явления с оцениваемым признаком. Например, если в результате исследования установлено, что в различных районах города отмечается разный уровень загрязнения атмосферного воздуха и различный уровень заболеваемости болезнями органов дыхания, возникает вопрос о том, действительно ли повышенная заболеваемость обусловлена этими загрязнениями или это случайное совпадение?

Расчет и анализ доверительных интервалов относительных и средних величин

Для того, чтобы обобщить данные выборочного исследования на генеральную совокупность, можно воспользоваться расчетом доверительных интервалов для относительных или средних величин, исходя из следующего рассуждения. Если выборочная совокупность качественно и количественно репрезентативна генеральной (т.е. отражает основные ее свойства и достаточна по объему), то выводы, полученные по изучению выборочной совокупности, можно обобщить на генеральную. Однако поскольку выборочная совокупность не может быть абсолютно одинакова сгенеральной, то всегда будет иметь место определенная статистическая погрешность. В статистике ее принято называть ошибкой репрезентативности и обозначать буквой ш. Поэтому, выводы, сделанные при изучении выборочной совокупности, могут отличаться в большую либо в меньшую сторону от тех, которые были бы сделаны, если бы исследованию подверглась вся генеральная совокупность. Таким образом, если рассчитать ошибку репрезентативности, отнять и прибавить ее значение к полученной по выборочной совокупности производной величине, то получится некий интервал, в пределах которого с определенной вероятностью может находиться производная величина генеральной совокупности. Данный интервал называют - доверительным интервалом или доверительными границами. Получается, что позначениями относительной или средней величины полученной в выборочной совокупности, мы строим прогноз об истинном значении данного признака с определенной вероятностью безошибочного утверждения. Эта вероятность безошибочного прогноза (доверительная вероятность) может быть задана с помощью критерия достоверности (критерия Стьюдента) t (таблица 9).

Таблица 9

Вероятность безошибочного прогноза при различных значениях критерия достоверности

Значения критерия достоверности t

1

1,98

2,0

2,63

3,0

4,0

Доверительная вероятность

68,3%

95,0%

95,5%

99,0%

99,7%

99,9%

Выбрав необходимое значение t, можно рассчитать необходимый доверительный интервал. Для большинства исследований доверительную вероятность считают достаточной уровню статистической значимости 95,0%, т.е. при t = 1,98, хотя можно рассчитать его и с большим значением критерия достоверности, однако брать t > 4 в общем не имеет смысла, т.к. 100% вероятность никогда не будет получена, а доверительный интервал будет все более и более расширяться. Таким образом, можно привести этапы и необходимые формулы для вычисления доверительных границ для относительных и средних величин.

Таблица К)

Этапы и формулы для расчета доверительных интервалов для относительных и средних величин

Этапы вычислений

Для относительных величин

Для средних величин

1. Расчет ошибки репрезентативности

т = ± 1—

-J п ;

где m - ошибка репрезента-

а т = ± —

где m - ошибка репрезента-

тивности;

Р - значение показателя выборочной совокупности;

q = 100 - Р, если показатель выражен в %; 1000 - Р, если показатель выражен в и т.д.

п - число наблюдений.

тивности;

б - стандартное отклонение;

п - число наблюдений

2. Расчет доверительных интервалов

Р ген—Р выб±1т;

где Рген - значение показателя в генеральной совокупности;

Рвы б - значение показателя выборочной совокупности

t - критерий достоверности;

m - ошибка репрезентативности показателя выборочной совокупности

Мген= Мвыб± tm;

где Мген - значение средней арифметической величины в генеральной совокупности;

Моыб - значение средней арифметической величины выборочной совокупности t - критерий достоверности;

m - ошибка репрезентативности показателя выборочной совокупности

3. Представление результатов

Рекомендуется представлять в виде указания нижней и верхней границы доверительного интервала с приведением уровня доверительной вероятности. В таблицах с целью экономии места допускается формат Р±т для относительных величин и М±т - для средних[1].

Примеры решения задачи:

1) Задача. В результате обследования 200 работников детских садов установлено носительство золотистого стафилококка у 15% работающих. Определить с вероятностью безошибочного прогноза равной 95% минимально и максимально возможный уровень носительства золотистого стафилококка у работников детских садов.

Решение:

1. Рассчитаем ошибку репрезентативности показателя:

[Pq 115 X (100 - 15)

т = ± — = ± ---—---= ±6,4%

  • п ч 200
  • 2. Рассчитаем 95% доверительный интервал:

Р™= Рвыб± tm = 15 ± 1,98 х 6,4% = [2,3 - 27,71%

3. Вывод: Уровень носительства золотистого стафилококка у работников детских садов может находиться в пределах от 2,3% до 27,7% с доверительной вероятностью 95%.

2) Задача. В результатеобследования65 мужчин 45 лет, болеющих сахарным диабегом, установлено среднее систолическое артериальное давление равное 135± 11 мм.рт. ст. В каких пределах может находиться среднее систолическое артериальное давление у данных мужчин при повторном измерении с доверительной вероятностью 95%.

Решение:

1. Рассчитаем ошибку репрезентативности средней величины:

а 11

т = +— = + -= =+1,4 мм.рт.ст.

~Jn “V65

2. Рассчитаем 95% доверительный интервал:

Мгсп= М»ыб± tm = 135 ± 1.98 * 1,4 мм. рт. ст. = [132,2 - 137,8] мм.рт. ст.

3. Вывод: Среднее артериальное давление у мужчин 45 лет, страдающих сахарным диабетом, может находиться в пределах от 132,2 до 137,8 мм.рт.ст. с доверительной вероятностью 95%.

Таким образом, расчет доверительных интервалов позволяет:

  • • наглядно представить интервал, в котором с определенной долей вероятности может находиться значение изучаемого признака в генеральной совокупности или в других выборочных исследованиях, проведенных на той же генеральной совокупности;
  • • кроме того, сопоставить результаты расчетов в сходных исследованиях в различных выборочных совокупностях или группах. Так, в случае если доверительные границы двух сравниваемых групп не пересекаются, можно с определенной долей вероятности говорить о том, что группы статистически значимо различаются в зависимости от группирующего признака.

  • [1] Недопустимо применять формат М±т в качестве характеристики разнообразия количественного признака. В этом случае необходимо указать М±били М (б).
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >