Статистические методы

Отдельную группу методов составляют статистические методы, без которых не обходится ни одно эмпирическое исследование. Информация, получаемая в процессе проведения исследования, требует обработки и оценки. Итогом оценки являются показатели результативности исследования. Эффективность (результативность) исследований в области спорта можно охарактеризовать с двух сторон: качественной и количественной, при этом качественный и количественный анализ должны рационально сочетаться. Вместе с тем тогда, когда это возможно, следует стремиться к получению количественных показателей, так как без количественного анализа вскрыть объективные закономерности невозможно. Количественные оценки часто затруднены из-за большой природной изменчи-

1

См.: Кохановский В. П. Философия для аспирантов : учеб, пособие. Ростов-н/Д. : Феникс, 2003. С. 340.

вости изучаемых объектов, возникновения совершенно непредвиденных результатов. Кратко остановимся на некоторых понятиях математической статистики.

Статистика - наука о массовых явлениях, с помощью которой можно получить обобщенные данные об изучаемых совокупностях, обнаружить закономерности в развитии изучаемых процессов. Статистические методы не подменяют педагогические, они их дополняют, обогащают и расширяют, особенно в вопросах получения доказательных результатов.

Совокупность - объединение какого-либо множества испытуемых по одному или нескольким признакам. Главное требование к выделению совокупности - качественная однородность (по возрасту, полу, оцениваемому качеству и т. п.). При этом обычно не берутся во внимание другие, не интересующие исследователя качества. Так, если его интересует только физическое качество выносливость, он не принимает во внимание вес человека или уровень развития у него силы.

Применение большинства статистических методов основано на идее использования небольшой случайной совокупности испытуемых из общего числа тех, на кого можно было бы распространить (генерализировать) выводы, полученные в результате изучения этой совокупности. Небольшая совокупность называется выборочной совокупностью, или выборкой. Главный принцип формирования выборки - случайный отбор испытуемых из мыслимого множества, называемого генеральной совокупностью. Хотя требование случайной выборки во многих случаях нереализуемо, если речь идет о проведении экспериментальной работы, например, с группами спортсменов. Но если нет возможности отобрать в случайном порядке спортсменов, необходимо в случайном порядке отобрать хотя бы участвующие в эксперименте группы[1].

Явления спортивной деятельности относятся к случайным событиям, а результаты исследования в области спорта представляют собой случайные величины. В теории вероятности событием

называется любое явление, о котором есть смысл говорить, что оно произойдет или не произойдет при некотором комплексе условий. Случайным называют такое событие, которое при испытании может либо произойти, либо не произойти (например, если баскетболист выполняет бросок по кольцу, то может произойти два события: 1) мяч попал в корзину или 2) мяч не попал в корзину). Теория вероятности не может предсказать, произойдет или нет единичное случайное событие, но она помогает изучить и описать закономерности, лежащие в основе массовых случайных событий, т. е. таких, которые могут многократно повторяться при проведении однотипных испытаний.

Величина, которая в результате испытания может принять одно из возможных значений, причем заранее неизвестно, какое именно, называется случайной. При этом различают дискретные случайные величины (величина может принимать лишь отдельные изолированные величины, например, количество подтягиваний) и непрерывные случайные величины (могут принимать все значения из некоторого конечного или бесконечного промежутка, например, длина прыжка).

Арсенал математической статистики огромен: от элементарных приемов анализа статистических распределений до многомерных процедур дисперсионного, дискриминантного, регрессионного и факторного анализов. Выполнение рутинной работы, связанной с вычислениями, существенно облегчает большое количество пакетов компьютерных программ, предназначенных для статистического анализа результатов экспериментальных исследований. Наиболее простым и доступным является пакет анализа данных программы Excel, входящего в пакет программ Microsoft Office; более продвинутые исследователи используют пакеты разных версий программ Statistica и др. В данном подразделе мы рассмотрим наиболее простые методы математической статистики, часто используемые в спортивно-педагогических исследованиях.

1

См.: Масальгин Н. А. Математико-статистические методы в спорте. М. : Физкультура и спорт, 1974. С. 17-23.

Проведение большинства исследований в области спорта связано с измерением, которое в самом широком смысле может быть определено как приписывание чисел к объектам или событиям согласно некоторым правилам. Эти правила должны устанавливать соответствие между свойствами рассматриваемых объектов и чисел, что порождает четыре основных вида шкал измерения: наименований, порядка, интервалов и отношений. Измерения, осуществляемые с помощью двух первых шкал, считаются качественными, двух последних - количественными. В каждой шкале строго определены свойства чисел, которые приписываются объектам. При этом чем выше порядок (мощность) шкалы, тем больше арифметических действий разрешается проводить над числами, приписанными объектам. Выделим свойства четырех основных типов шкал, перечисляя их в порядке убывания мощности.

Шкала отношений - самая мощная шкала. Она позволяет оценивать, во сколько раз один измеряемый объект больше (меньше) другого объекта, принимаемого за эталон, единицу. Для шкал отношений существует естественное начало отсчета (нуль), но нет естественной единицы измерений. Измерение по шкале отношений указывает на полное отсутствие измеряемого свойства. Поэтому шкала отношений позволяет определить не только, на сколько больше (меньше) один объект от другого в отношении измеряемого свойства, но и во сколько раз (в два, три и т. д.) больше (меньше). Для осуществления измерений по шкале отношений используются метрические системы оценок, примерами которых могут быть измерения длины, высоты в принятых единицах (например, измерения роста спортсменов, дальности метания снарядов, длины и высоты прыжков и т. п.), веса (измерение веса спортсменов, снарядов, усилий с помощью динамометров и т. д.), времени выполнения определенных действий (продолжительность бега, продолжительность выполнения гимнастической комбинации, измерение времени двигательной реакции и т. п.), угловые перемещения в градусах, число попаданий в цель, число подтягиваний и т. п.

Шкала интервалов характеризуется тем, что для нее не существует ни естественного начала отсчета, ни естественной единицы измерения. Использование интервальной шкалы возможно в том случае, когда с помощью определенного критерия (эталона измерения) можно определить величину различия признаков не только по типу больше - меньше, но и на сколько единиц один объект или явление отличается от другого. Для такого измерения устанавливается единица измерения. Число, присвоенное объекту исследования, в данном случае представляет собой количество единиц измерения, которое он имеет, что позволяет применять по отношению к этим числам почти все арифметические действия и использовать статистические критерии для количественных измерений. Важная особенность, отличающая интервальное измерение от измерения по шкале отношений, состоит в том, что оцениваемое свойство предмета или явления вовсе не пропадает, когда результат измерения равен нулю. Типичными примерами измерений по шкале интервалов являются измерения календарного времени (летосчисление, счет дней в году, недель, месяцев, текущего времени, температуры по различным шкалам и т. п.). В отличие от естественных и технических наук в социальных науках (в том числе и в спорте) в настоящее время специально разработанных шкал интервального типа почти нет.

Шкала порядка (шкала рангов) - шкала, относительно значений которой уже нельзя говорить ни о том, во сколько раз измеряемая величина больше (меньше) другой, ни на сколько она больше (меньше). Такая шкала только упорядочивает объекты, приписывая им те или иные ранги (места). Пользуясь шкалой порядка, можно выяснить положение изучаемого объекта в рассматриваемом ряду, но нельзя определить величину интервалов, на которые разбит этот ряд. Поэтому с этими числами (баллами, рангами), приписываемыми объектам, нельзя производить арифметические действия (складывать, вычитать, умножать, делить). Типичной ошибкой в данном случае является попытка складывать, выводить среднеарифметические значения по оценкам, выставляемым на основе традиционной пятибалльной системы, или производить арифметические действия с баллами, полученными на соревнованиях по гимнас тике, фигурному катанию и т. д. Эти измерения качественные, а не количественные и представляют шкалу порядка. Эту шкалу целесообразно применять в тех случаях, когда можно установить определенный порядок по типу выше - ниже, больше - меньше, лучше - хуже и т. п. и невозможно при этом измерить величину этой разницы.

Измерения по шкале порядка позволяют использовать ряд статистических критериев, основанных на расчете медианы, представляющей меру центральной тенденции группы объектов, что выгодно отличает шкалу порядка от шкалы наименований. Частным случаем порядковой шкалы является дихотомическая шкала, в которой имеются всего две упорядоченные градации - например, «справился с заданием», «не справился с заданием».

Шкала наименований (номинальная шкала) фактически уже не связана с понятием «величина» и используется только с целью отличить один объект от другого: фамилии спортсменов, номера игроков команды и т. п. Построение этой шкалы основано на группировке объектов, явлений в соответствующие классы в зависимости от проявления у них определенных признаков или свойств. Необходимым и достаточным условием для применения шкалы наименований является наличие такого критерия, пользуясь которым исследователь может однозначно отличить один объект, который имеет необходимый признак или свойство, от другого, который его не имеет. Приписывание чисел в этом случае производится произвольно, и их величина и порядок не имеют никакого значения. Количественная обработка экспериментальных данных проводится не с самими приписываемыми числами, а с числами, характеризующими количество объектов, попавших в каждую группу. Измерения, производимые по шкале наименований, допускают простейшие статистические операции (подсчет числа объектов в каждой группе и выявление простого или процентного отношения этого числа к общему числу рассматриваемых объектов, моду). Несмотря на определенную примитивность шкалы наименований, измерения по этой шкале могут быть использованы для проверки некоторых статистических гипотез и для вычисления показателей корреляции качественных признаков[2].

Как правило, в любом педагогическом эксперименте имеется значительное число (десятки, сотни, а иногда и тысячи) участников - спортсменов, тренеров, спортивных команд, школ и т. д. В результате измерения показателей этих участников получается набор их индивидуальных оценок. Понятно, что сравнивать между собой и анализировать одновременно все индивидуальные оценки невозможно, да и нецелесообразно, так как всегда существует их разброс, обусловленный неконтролируемым различием участников эксперимента (каждый человек неповторим). Поэтому для того, чтобы, во-первых, получить обозримое число характеристик и, во-вторых, для того, чтобы сгладить индивидуальные колебания, используют так называемые агрегированные (коллективные, групповые, производные) оценки. Например, если имелись индивидуальные оценки развития того или иного физического качества спортсменов, то агрегированной оценкой будет оценка этого качества у группы.

При анализе распределения результатов измерений всегда нужно делать предположение о том распределении, которое имела бы выборка, если бы число измерений было очень большим. Распределение представляет собой соотношение элементов совокупности с частотой их появления. Практические распределения могут принимать различные формы, как правило, неправильные, несимметричные.

Математическая статистика предоставляет в распоряжение исследователя теоретические распределения, выраженные языком математики, свойства которой могут быть использованы на практике. Теоретические распределения определяют методы, которые могут использоваться для статистической обработки результатов.

Полученное практически распределение только случайно может точно совпасть с теоретическим. То есть эмпирическое распределение может быть лишь в той или иной мере близким к теоретическому. Если отличие эмпирического распределения лежит в допустимых пределах (определяемых специальными критериями согласия), к нему можно применять процедуры, обоснованные для соответствующего теоретического.

Известно около двадцати теоретических распределений. Самым распространенным, хорошо изученным и практически полезным распределением принято считать нормальное распределение, отражаемое кривой Гаусса и известное как нормальный закон (или закон нормального распределения). Нормальное распределение является самым важным в статистике, т. к. обладает рядом благоприятных математических свойств, во многом обеспечивающих его широкое применение.

Суть нормального распределения в том, что множество единиц совокупности распределяется таким образом, что в центральных классах (интервалах) сконцентрировано наибольшее количество единиц, а по мере удаления от срединной точки вариационного ряда их количество постепенно убывает. Данная закономерность показывает связь между значениями признака и частотой их встречаемости в совокупности. С помощью закона нормального распределения решается множество статистических задач, а ряд статистических методов основан на его свойствах.

Д. А. Новиков на основе анализа педагогических исследований выделил три типовых задачи анализа данных: описание данных (компактное и информативное отражение результатов измерений характеристик исследуемых объектов), установление совпадения характеристик двух групп и установление различия характеристик двух групп. Рассмотрим методы математической статистики, наиболее часто используемые для решения данных задач.

Для решения первой задачи, связанной с описанием данных, применяются методы описательной статистики - описание

1

См.: Новиков Д. А. Статистические методы... С. 35.

результатов с помощью различных агрегированных показателей и графиков. Поскольку в эмпирических исследованиях обычно имеется совокупность наблюдений или измерений индивидуальных характеристик, для их анализа и обобщения возникает задача компактного описания имеющихся данных, кроме того, некоторые показатели описательной статистики используются в статистических критериях при определении достоверности совпадений и/или различий характеристик разных групп. Кроме того, использование статистических методов, кроме решаемой задачи, обусловлено шкалой измерения, в которой представлены результаты, а также характером распределения результатов измерений. Полный спектр характеристик описательной статистики можно использовать только, если результаты представлены в шкале отношений и имеют распределение результатов измерений, близкое к нормальному.

Показатели описательной статистики можно разбить на несколько групп: 1) показатели положения (центральной тенденции) описывают положение экспериментальных данных на числовой оси; 2) показатели разброса (рассеяния) описывают степень разброса данных относительно своего центра; 3) показатели асимметрии; 4) гистограмма и др.

Описательная статистика дает общее представление о значениях, которые принимает переменная, служит для создания одномерного статистического отчета, содержащего информацию о центральной тенденции и изменчивости входных данных, что позволяет провести классификацию первичных данных, представить их в наиболее наглядной форме и получить некоторые обобщающие показатели, которые дают возможность сравнивать между собой различные данные и делать определенные выводы. О центральной тенденции можно судить по характеристикам положения: среднее арифметическое, медиана и мода.

Средняя арифметическая величина (обозначается символом М или X) характеризует средний уровень значений изучаемой случайной величины в наблюдавшихся случаях, вычисляется путем деления суммы всех значений вариант рассматриваемой совокупности на их количество (объем выборки).

Среднее арифметическое может вычисляться, если результаты исследования представлены в шкалах интервалов или отношений. Эта характеристика дает возможность охарактеризовать исследуемую совокупность одним числом, сравнить отдельные величины со средним арифметическим, определить тенденцию развития какого-либо явления, сравнить разные совокупности, вычислить другие статистические показатели, т. к. многие статистические вычисления опираются на среднее арифметическое.

Средняя арифметическая величина является производной, обобщающей количественные признаки ряда однородных показателей (совокупности). Выражая одним числом определенную совокупность, она как бы ослабляет влияние случайных индивидуальных отклонений и акцентирует некую обобщенную количественную характеристику, наиболее типичное свойство изучаемого ряда показателей. Однако одно только среднее арифметическое не дает возможности глубоко анализировать сущность того или иного явления и их взаимные различия. Кроме того, пример «со средней температурой по больнице» указывает на неоднозначность данной характеристики.

Медианой (обозначается символом Me) называется такое значение признака, когда одна половина значений экспериментальных данных меньше ее, а вторая половина больше. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных. Когда имеет место несимметричная форма эмпирического распределения, медиана несколько отличается от среднего арифметического. Для тех случаев, когда эмпирическое распределение оказывается сильно асимметричным, среднее арифметическое теряет свою практическую ценность, поскольку при этом значительно большая часть значений признака оказывается выше или ниже среднего арифметического. В этой ситуации медиана представляет собой лучшую характеристику центра распределения.

Мода (обозначается символом Мо) представляет собой значение признака, встречающееся в выборке наибольшее число раз.

Медиану и моду используют для оценки среднего при измерении в шкалах порядка (а моду также и в номинальных шкалах). Среднее, медиана и мода совпадают в том случае, если распределение унимодальное (с одним максимумом) и симметричное. Чем больше распределение отличается от симметричного, тем сильнее различие между этими характеристиками.

Средние значения не дают полной информации о варьирующем признаке. Нетрудно представить себе два эмпирических распределения, у которых средние одинаковы, но при этом у одного из них значения признака рассеяны в узком диапазоне вокруг среднего, а у другого - в широком. Поэтому наряду со средними значениями вычисляют и характеристики рассеяния выборки. Наиболее употребительные из них размах вариации, дисперсия, стандартное отклонение, коэффициент вариации.

Размах вариации (R) вычисляется как разность между максимальной и минимальной вариантами выборки: R = zmax - xmin. Единственное достоинство данного показателя в простоте вычисления, информативность этого показателя невелика. Размах вариации улавливает только крайние отклонения, но не отражает отклонений всех результатов. Можно привести очень много распределений, очень отличающихся по форме, но имеющих одинаковый размах. Размах вариации используется иногда в практических исследованиях при малых (не более 10) объемах выборки. Например, по размаху вариации легко оценить, насколько различаются лучший и худший результаты в группе спортсменов. При больших объемах выборки к его использованию надо относиться с осторожностью.

Дисперсия - мера вариативности статистической совокупности, она указывает на рассеивание исходных данных относительно средней арифметической величины (выраженной в квадрате). Дисперсия меняется от нуля до бесконечности. Крайнее значение - 0 -означает отсутствие изменчивости, т. е. значения переменной постоянны.

Тот факт, что средняя арифметическая величина получается в тех же единицах, что и исходные измерения, а дисперсия вычисляется в квадрате этих величин, затрудняет сравнение, найденных показателей. Для того чтобы осуществить сравнение, используется следующий показатель рассеяния - среднее квадратическое отклонение (оно называется также стандартным отклонением). С этой целью следует извлечь корень квадратный из дисперсии. Среднее квадратическое отклонение (ст) имеет те же единицы измерения, что и результаты измерения, т. е. характеризуют степень отклонения результатов от среднего значения в абсолютных единицах. Необходимо подчеркнуть, что чем сильнее варьирует признак, тем больше величина этого показателя и, наоборот, чем слабее он варьирует, тем меньше среднее квадратическое отклонение. Чем меньше величина а, тем плотнее результаты около средней, что может говорить как о стабильности показателей одного испытуемого, так и о ровности результатов группы или одинаковой подготовленности спортсменов.

Объединив два основных параметра вариационного ряда (среднее арифметическое и среднее квадратическое отклонение) мы получим интервал в виде: X ± а. Рассматривая данный интервал, можно сделать следующие выводы:

  • - исходный массив чисел без значимой погрешности может быть заменен основным средним показателем (X), отклонение от которого с недостатком представляется -о, а с избытком +с;
  • - интервал представляет типичные, основные для данной совокупности показатели, а варианты, выходящие за пределы, являются нетипичными, нехарактерными, недостаточно показательными.

Средняя арифметическая и среднее квадратическое отклонение отражает величины выборочной совокупности. Для того чтобы данные результаты применить к генеральной совокупности, необходимо определить доверительный интервал - область количественных значений, в пределах которого с заданной доверительной вероятностью расположено значение рассматриваемой генеральной совокупности.

Средняя арифметическая генеральной совокупности (X) определяется на основе показателей выборки и может быть отражена следующим образом:

X—mt < X < X + mt,

где t- критерий достоверности (определяется по таблице по числу степеней свободы к = п - 1).

Если требуется сравнить между собой степень варьирования признаков, выраженных в разных единицах измерения, стандартное отклонение не пригодно. Для этого используется коэффициент вариации. Коэффициент вариации является относительной мерой рассеяния признака и определяется как отношение среднего квадратического отклонения к среднему арифметическому, выраженное в процентах. Коэффициент вариации можно использовать как относительную величину меры рассеяния только в тех случаях, когда значения признака измерены в шкале с абсолютным нулем (шкале отношений).

В спортивной практике колеблемость результатов измерений в зависимости от величины коэффициента вариации считают небольшой (0-10 %), средней (11-20 %) и большой (> 20 %). Считается, что если коэффициент вариации не превышает 10 %, то выборку можно считать однородной, т. е. полученной из одной генеральной совокупности.

Еще одним показателем рассеяния является стандартная ошибка средней арифметической (обозначается символом т). Стандартная ошибка средней арифметической является не ошибкой измерения, а статистической ошибкой. Она характеризует величину различия между средними арифметическими генеральной и выборочной совокупностей.

Большинство экспериментальных исследований в области спорта связано с измерениями, результаты которых могут принимать практически любые значения в заданном интервале, поэтому не всегда распределение этих результатов соответствуют закону нормального распределения. Только соответствие эмпирического распределения закону нормального распределения позволяет применять любые методы математической статистики, а несоответствие ему ограничивает спектр используемых статистических методов.

В практике спорта при работе с эмпирическими рядами возникает проблема сравнения идентичности полученного ряда нор мальному закону. Соответствие нормальному закону на практике решается двумя путями: критериями согласия и правилом трех сигм.

Критерии согласия позволяют определить степень значимости отличия эмпирической совокупности от теоретической, и допустимо ли считать, что рассматриваемая эмпирическая совокупность имеет нормальное распределение. К критериям согласия относят %2, коэффициенты асимметрии и эксцесса.

Асимметрия - отличие эмпирического распределения от нормального. Асимметрия, или коэффициент асимметрии, является мерой несимметричности распределения. Если этот коэффициент значительно отличается от 0, распределение является асимметричным (т. е. несимметричным). Допустимым коэффициентом асимметрии считаются значения, не превышающие величину в 0,5.

Эксцесс - крайнее проявление чего-либо, нарушение нормального хода чего-либо. Эксцесс, или коэффициент эксцесса, измеряет остроту пика распределения. Если этот коэффициент больше 0, то распределение имеет острый пик, если меньше 0 (min -2), то распределение имеет плосковершинную форму по сравнению с нормальным распределением. Допустимым коэффициентом эксцесса считаются значения, не превышающие величину в 1,0.

Коэффициенты асимметрии и эксцесса нормального распределения равны нулю.

Правило трех сигм является еще одним приблизительным способом проверки предположения о соответствии выборки нормальному распределению. Суть данного правила заключается в определении того, превышает ли среднее арифметическое значение выборочной совокупности трехкратную величину стандартного отклонения. Все значения вариант, отличающиеся от X, более чем на За (больше или меньше), рассматриваются в действительности как очень маловероятные, скорее всего, ошибочно попавшие в данную выборку, и их следует отбросить (рис. 2).

Определение достоверности совпадений и различий характеристик исследуемых выборок, выделяемых Д. А. Новиковым как основные типовые задачи анализа данных, имеет общие подходы. Для их решения формулируются статистические гипотезы:

  • - гипотеза об отсутствии различий (так называемая нулевая гипотеза);
  • - гипотеза о значимости различий (так называемая альтернативная гипотеза).

Для принятия решений о том, какую из гипотез (нулевую или альтернативную) следует принять, используют специальные методы - статистические критерии или критерии значимости, с помощью которых на основании информации о результатах наблюдений или измерений (характеристиках членов экспериментальной и контрольной групп) вычисляется число, называемое эмпирическим значением критерия. Это число сравнивается с известным (например, заданным таблично) эталонным числом, называемым критическим значением критерия.

Критические значения приводятся, как правило, для нескольких уровней значимости. Уровнем значимости (обозначается р или а) называется вероятность ошибки, заключающейся в отклонении (не принятии) нулевой гипотезы, т. е. вероятность того, что различия сочтены существенными, а они на самом деле случайны.

Если полученное исследователем эмпирическое значение критерия оказывается меньше или равно критическому, то принимается нулевая гипотеза - считается, что на заданном уровне значимости (т. е. при том значении а, для которого рассчитано критическое значение критерия) характеристики экспериментальной и контрольной групп совпадают. В противном случае, если эмпирическое значение критерия оказывается строго больше критического, то нулевая гипотеза отвергается и принимается альтернативная гипотеза - характеристики экспериментальной и контрольной групп считаются различными с достоверностью различий 1 - а. Например, если ос = 0,05 и принята альтернативная гипотеза, то достоверность различий равна 0,95 или 95 %. Если эмпирическое значение критерия оказывается меньше или равно критическому, то можно сделать вывод, что характеристики экспериментальной и контрольной групп совпадают на уровне значимости 0,05. Если эмпирическое значение критерия оказывается строго больше критического, то можно сделать вывод, что достоверность различий характеристик экспериментальной и контрольной групп равна 95 %[3].

Экспериментатор может выбрать уровень значимости - значение вероятности, при котором различия, наблюдаемые между выборочными показателями, можно считать несущественными, случайными. Самыми распространенными уровнями значимости в спортивных исследованиях являются 0,05 и 0,01, каждому из которых соответствует определенное значение надежности или доверительной вероятности (Р), а именно 0,95 (95 %) и 0,99 (99 %). Уровень значимости 0,05 указывает, на то, что в силу случайности возможна ошибка в 5 % случаев, т. е. не чаще, чем 5 раз в 100 наблюдениях. Если нужна большая доказательность (достоверность) результатов, то уровень значимости должен быть повышен до 0,01. Чем цифра меньше, тем уровень значимости, а следовательно, и достоверность результатов выше. При уровне значимости 0,01 вывод не обоснован только в одном случае из 100.

Другой подход к определению уровня значимости связан с его установлением на основе вычисленного (эмпирического) значения критерия, который сравнивается с критическим значением критерия. Если первоначально исследователь определил уровень значи-

мости 0,05 (считающийся достаточным в педагогических исследованиях, в том числе и в области спорта), а вычисленное значение критерия оказалось больше критического не только для уровня значимости 0,05, но и для 0,01, то уровень значимости должен быть повышен.

Все критерии значимости для оценки статистической достоверности делятся на две группы: параметрические и непараметрические. Параметрическими критерии называют, потому что в расчетах участвует среднее квадратическое отклонение (а), иногда называемое «параметром». То есть данный тип критериев можно использовать только, если результаты измерений представлены в шкалах интервалов и отношений и распределение результатов измерений несущественно отличается от нормального. К параметрическим критериям значимости относятся /-критерий Стьюдента и F-критерий Фишера.

Непараметрические критерии позволяют определять значимость различия любых статистических выборочных совокупностей. Непараметрические критерии основаны на ранговых (порядковых) отличиях между элементами выборки, к ним относятся критерий знаков, Г-критерий Вилкоксона, Г-критерий Уайта, X-критерий Ван дер Вардена. Рассмотрим некоторые из перечисленных критериев подробнее.

В большинстве исследований в области спорта могут решаться задачи на выявление эффективности той или иной методики тренировки с применением определенных средств, методов и способов организации занятий. Решение подобных задач осуществляется путем проведения сравнительного эксперимента с выделением различных групп, результаты которых в теории статистики принято называть независимыми или несвязанными. Для оценки различия в таких случаях (при условии, что результаты представлены в шкале отношений) наиболее востребованным является параметрический критерий - t-критерий Стьюдента (двухвыборочный t-mecm). Критическое значение (Z^) находится по таблице Стьюдента для определенного уровня значимости и числа степеней свободы (к = п - 2, где п - количество результатов измерения в обеих группах). Если ?эмп (эмпирическое значение) меньше t , то различия между сравниваемыми выборочными показателями являются недостоверными и наблюдаемые различия можно рассматривать как случайные, а значит, недостаточно оснований для того, чтобы говорить о том, что одна методика тренировки оказалась эффективнее другой. В этом случае можно предположить не только несущественность различия между совокупностями, но и неправильный подбор выборки, в частности ее недостаточную численность. И, наоборот, если ?эмп больше t , то различия между сравниваемыми выборочными показателями являются достоверными, и можно сделать вывод о том, что одна методика тренировки оказалась эффективнее другой.

Если начальные (до начала эксперимента) состояния экспериментальной и контрольной групп совпадают, а конечные (после окончания эксперимента) различаются, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения. Каков характер изменений (улучшились или ухудшились исследуемые характеристики) с содержательной точки зрения, не имеет отношения к статистическим методам и является педагогической стороной оценки. Педагогический вывод необходимо сделать на основе результатов статистической обработки и особенностей интерпретации каждой конкретной характеристики.

В исследованиях часто на одних и тех же лицах проводятся измерения через некоторое время (до и после тренировочного занятия, этапа подготовки, определенного воздействия экспериментальной методики и т. п.), а также в различных условиях (на уровне моря или в условиях высокогорья) и т. д.). При этом стараются определить произошли ли изменения в состоянии спортсменов. В таких случаях выборки всегда равночисленны, а все измерения могут быть объединены в пары (каждая пара - это результаты измерений на одном человеке в начале и в конце эксперимента). Подобные выборки называют связанными (или коррелированными):

1

См.: Новиков Д. А. Статистические методы... С. 46-47.

между данными первого и второго измерения может быть корреляция. В случаях связанных выборок нельзя использовать методы для несвязанных выборок, в этом случае используется другой способ оценки t-критерия Стьюдента (парный двухвыборочный t-mecm для средних), основанный на сравнении динамики показателей. Критическое значение (t ) находится по таблице Стьюдента для определенного уровня значимости и числа степеней свободы (k = п - 1, где п - число сравниваемых пар).

Для данных, измеренных в шкале отношений, для проверки гипотезы о совпадении характеристик двух групп целесообразно использование непараметрических критериев: либо критерия Крамера - Уэлча (который, по мнению Д. А. Новикова, является более эффективным «заменителем» /-критерия Стьюдента), либо критерия Вилкоксона - Манна - Уитни (для выборок с числом вариант более 50). Критерий Крамера - Уэлча предназначен для проверки гипотезы о равенстве средних двух выборок, критерий Вилкоксона - Манна - Уитни является более «тонким» (но и более трудоемким) - он позволяет проверять гипотезу о том, что две выборки «одинаковы» (в том числе, что совпадают их средние, дисперсии и все другие показатели).

Эмпирическое значение критерия Крамера - Уэлча рассчитывается на основании информации об объемах и N) выборок (х и у), средних арифметических выборок (X и У) и выборочных дисперсиях (Dx и Dy) сравниваемых выборок (эти значения могут быть вычислены с помощью инструмента «Описательная статистика» в компьютерной программе Microsoft Excel для Windows) по следующей формуле:

• A |J - F|

П~ -Dx + N-Dy'

Для определения достоверности совпадений и различий характеристик сравниваемых выборок для экспериментальных данных, измеренных в шкале отношений, с помощью критерия Крамера -Уэлча нужно сравнить вычисленное по формуле значение с критическим значением Tftn. = 1,96. Если t < 1,96, то можно сделать вы-вод, что характеристики сравниваемых выборок совпадают на уровне значимости 0,05; если ?эмп > 1,96, то можно сделать вывод, что достоверность различий характеристик сравниваемых выборок составляет 95 %.

Для данных, измеренных в порядковой шкале, целесообразно использование критерия однородности %2 (хи-квадрат). Критерий хи-квадрат применим при условии, что для любого значения балла в любой из сравниваемых выборок не менее пяти ее членов получили данный балл. Кроме того, желательно, чтобы число градаций было не менее трех[4].

Если число градаций 2, т. е. используется дихотомическая шкала (например, «выполнил» - «не выполнил», «да» - «нет» и т. д.), то можно применять критерий Фишера. Для данных, измеренных в дихотомической шкале, целесообразно использование критерия Фишера. В математической статистике существует несколько критериев Фишера. В данном случае используется один из них - так называемое угловое преобразование.

В природе многие явления и процессы взаимосвязаны между собой. В спорте, в спортивной команде и в организме спортсмена тоже существует много взаимосвязей между различными признаками, при этом значению одного признака соответствует множество значений другого. Например, с повышением количества занимающихся в каком-либо виде спорта повышаются результаты в этом виде; осложнения во взаимоотношениях между игроками одной команды ухудшают ее результативность; с повышением интенсивности нагрузки у спортсмена повышается пульс, увеличивается скорость кровотока в работающих мышцах, уменьшаются в них энергетические ресурсы; регулярность тренировок, оптимально подобранные нагрузки по их виду, объему и интенсивности улучшают результаты спортсмена и т. д. Подобная взаимосвязь назы-

вается статистической (корреляционной) связью или корреляцией. Корреляция (от лат. correlation - соотношение, соответствие, взаимосвязь) - зависимость между явлениями, процессами, факторами, совокупностями событий, исходов. Корреляция заключается в том, что средняя величина одного показателя изменяется в зависимости от значения другого. Абсолютное значение коэффициента корреляции лежит в пределах от 0 до 1 и оценивает количественную меру связи. Если такая связь велика, говорят, что признаки тесно (или сильно) коррелируют, в противном случае они слабо коррелируют.

Некоторые методы математической статистики могут помочь выявить взаимосвязи, раскрыть их особенности. Одним из таких методов является метод корреляционного анализа. Он направлен на то, чтобы на основе статистического материала выявить факт взаимосвязи признаков, установить полезность или вред этой взаимосвязи и оценить уверенность в полученных выводах. Мерой зависимости (теснотой связи) между признаками является коэффициент корреляции, а его вычисление - корреляционным анализом. Корреляционный анализ позволяет исследовать только статистическую взаимосвязь, т. е. только указывает на наличие некоторого соответствия, но не выявляет причинно-следственную связь изменений двух признаков.

Тесноту взаимосвязи принято различать по нескольким уровням. Так, если коэффициент корреляции равен 1, то наблюдается функциональная взаимосвязь, т. к. значению одного показателя соответствует только одно значение другого показателя. Другие значения коэффициента корреляции интерпретируются следующим образом:

  • 0,99 - 0,7 - сильная статистическая взаимосвязь;
  • 0,69 - 0,5 - средняя статистическая взаимосвязь;
  • 0,49 - 0,2 - слабая статистическая взаимосвязь;
  • 0,19 - 0,01 - очень слабая статистическая зависимость.

Если коэффициент корреляции равен 0 - корреляции нет.

Для различия направленности влияния одного признака на другой введены понятия положительной и отрицательной связи. Знак коэффициента корреляции отражает только направленность зависимости между показателями.

Если с увеличением (уменьшением) одного признака в основном увеличиваются (уменьшаются) значения другого, то такая корреляционная связь называется прямой или положительной. Например, повышение силовых показателей мышц нижних конечностей сказывается на росте результата в тройном прыжке с места. Если с увеличением (уменьшением) одного признака в основном уменьшаются (увеличиваются) значения другого, то такая корреляционная связь называется обратной или отрицательной. Обратная корреляция указывает на увеличение первого признака при уменьшении второго или уменьшение первого признака при увеличении второго. Например, повышение силовых показателей мышц нижних конечностей приводит к снижению (улучшению) результата в беге на 100 м.

Для оценки взаимосвязи, когда измерения производят в шкале отношений или интервалов и форма взаимосвязи линейная, используется параметрический коэффициент корреляции Браве - Пирсона (г):

гр я

7?

Вычисленный коэффициент корреляции позволят сделать следующие выводы:

  • 1) статистические: имеется или отсутствует связь между исследуемыми признаками; какова теснота взаимосвязи (сильная, средняя, слабая); какова направленность взаимосвязи (прямая - положительная или обратная - отрицательная;
  • 2) педагогические: первый признак существенно (несущественно) зависит (не зависит) от второго признака.

При вычислении линейного коэффициента корреляции Пирсона следует учесть, что выводы дают корректные результаты в том случае, когда признаки распределяются нормально и когда рассматривается взаимосвязь между большим количеством признаков.

Для получения коэффициентов корреляции, свободных от значительных случайных ошибок, нужно не менее нескольких десятков измерений.

На основании коэффициента корреляции можно определить коэффициент детерминации (D), который вычисляется по формуле:

D = r2- 100%.

Этот коэффициент показывает часть общей вариации одного показателя, которая объясняется вариацией другого показателя. Так, для вычисленного значения коэффициента корреляции г = 0,7 коэффициент детерминации будет равен 49 %. Следовательно, можно предполагать, что только 49 % взаимосвязи двух исследуемых показателей объясняется их взаимным влиянием. Остальная часть вариации (т. е. 51 %) объясняется влиянием других неучтенных факторов.

Определение взаимосвязи показателей, измеренных в шкале порядка, производят с использованием ранговых коэффициентов корреляции. Ранговый коэффициент показывает, что теснота связи определяется не между самими признаками, а между их порядковыми показателями. Таким образом, оценивается связь одной иерархии признаков с другой.

Ранговый коэффициент корреляции позволяет измерить степень сопряженности между признаками независимо от закона распределения. Поэтому он используется для быстрой оценки взаимосвязи, когда показатели или признаки не могут быть измерены точно, но могут быть ранжированы. Во всех этих случаях корреляционную связь между признаками можно оценить при помощи рангового (непараметрического) коэффициента корреляции Спирмена (обозначается буквой р). Его вычисляют по формуле: где d = dx-dy- разность рангов данной пары показателей х и у; п - объем выборки (количество связанных пар).

Р = 1-

6-1?2 п • (и2 1) ’

Ранговый коэффициент корреляции Спирмена также измеряется в пределах от -1 до +1. Достоинством ранговых коэффициентов корреляции является простота вычисления. Поэтому ими следует пользоваться для быстрой оценки взаимосвязи, когда показатели или признаки не могут быть измерены точно, но могут быть ранжированы. Необходимо подчеркнуть, что вычисление рангового коэффициента корреляции рекомендуется проводить в том случае, когда связанных пар больше пяти и когда достаточно получить лишь приблизительную информацию. В тех случаях, когда признаки поддаются количественному учету и есть основание считать, что их распределение подчинено нормальному закону распределения, преимущество должно оставаться за параметрическим коэффициентом Пирсона как более мощным и надежным в практической работе.

Полученные в результате вычислений те или иные коэффициенты корреляции являются выборочными оценками соответствующих показателей генеральной совокупности. Так как показатели формы и тесноты связи в генеральной совокупности бывают неизвестны, необходимо по отношению к ним применить статистическую проверку (т. е. определить, отличается ли данный коэффициент статистически существенно от нуля?).

Для ответа на этот вопрос необходимо сравнить вычисленный коэффициент корреляции с критическим значением для конкретного числа коррелируемых пар по специальной таблице. Если критическое значение меньше, чем рассчитанный коэффициент корреляции, то последний считается достоверным. Если в исследовании принимают участие большее количество испытуемых, то критическое значение значительно меньше. Это говорит о том, что чем больше испытуемых обследовано, тем точнее и достовернее результат.

Более сложные задачи исследования требуют использования более сложных методов математической статистики, например, регрессионный анализ, дисперсионный анализ и др.

В силу ограниченности объема пособия в разделе уделено внимание лишь некоторым наиболее распространенным методам, используемым в научных исследованиях в области спорта. Кроме рассмотренных, часто используются такие методы, как тестирование физической, технической и тактической подготовленности, медико-биологические и физиологические методы оценки физического развития, функционального состояния и физической работоспособности, методы опроса. Для ознакомления с основными характеристиками и особенностями использования перечисленных методов можно обратиться к учебным пособиям Попкова В. Н. «Научно-исследовательская деятельность», Семенова Л. А. «Введение в научно-исследовательскую деятельность в сфере физической культуры и спорта» и другим источникам.

Контрольные вопросы

  • 1. По каким признакам и основаниям классифицируются методы научного исследования и какие группы методов выделяются в рамках этих классификаций?
  • 2. Дайте краткую характеристику наблюдению как методу научного исследования. Какие виды научного наблюдения выделяются?
  • 3. Назовите разновидности экспериментов и дайте их краткую характеристику.
  • 4. Какие факторы выделяются в педагогическом эксперименте? Какую роль каждый из факторов играет в эксперименте?
  • 5. В чем суть моделирования как метода исследования?
  • 6. Назовите основные теоретические методы научного исследования. Какова их роль?
  • 7. Раскройте основные понятия в рамках статистических методов научного исследования: «статистика», «совокупность» (в том числе генеральная и выборочная), «случайное событие», «случайная величина», «шкалы измерений» (в том числе, отношений, интервалов, порядка, наименований), «нормальное распределение».
  • 8. Назовите и дайте краткую характеристику методов описательной статистики. Какова их роль в научном исследовании?
  • 9. Какие методы используются для определения достоверности совпадений и различий характеристик исследуемых выборок?
  • 10. Какие общие подходы используются для решения основных типовых задач педагогического исследования методами математической статистики и для интерпретации статистических результатов?
  • 11. Для решения каких задач исследования используется корреляционный анализ и в чем его суть?

  • [1] См.: Семенов Л. А. Введение в научно-исследовательскую деятельность... С. 141-142.
  • [2] См.: Железняк Ю. Д., Петров П. К. Основы научно-методической деятельности в физической культуре и спорте : учеб, пособие для студ. высш, пед. учеб, заведений. М. : Изд. центр «Академия», 2002. С. 141-145. 2 См.: Новиков Д. А. Статистические методы в педагогических исследованиях (типовые случаи). М. : МЗ-Пресс, 2004. С. 21-22.
  • [3] См.: Новиков Д. А. Статистические методы... С. 43-45.
  • [4] Вычисления с примерами и критические значения см., напр., Новиков Д. А. Статистические методы в педагогических исследованиях (типовые случаи). М., 2004. С. 51-54. 2 Там же. С. 54-57.
 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >