Техника проведения дисперсионного анализа (по Драгавцеву В.В.)

Например, четыре образца семян сосны обыкновенной, интродуцированных в новую местность из разных географических районов, испытали на лабораторную всхожесть. Каждый образец испытывали в семи повторностях на аппарате проращивания. Полученные данные по всхожести приведены в таблице 41.

При рассмотрении этой таблицы видно, что дисперсия имеется как внутри столбцов, так и между столбцами, т.е. по вертикали и по горизонтали (по горизонтали варьируют средние величины столбцов). Столбцы в таблице называются классами.

Минимальное число классов при дисперсионном анализе - 2, минимальное число повторностей - 2.

Дисперсия между классами называется факторной или факториальной (в нашем примере фактором, вызывающим ее, являются образцы семян). Дисперсия внутри классов называется случайной, так как мы не знаем, чем конкретно она вызвана (здесь и различия в механическом и химическом составе почвы делянок, различия в аэрации, водном режиме и т.п.).

Задачей дисперсионного анализа является определение, какая дисперсия выше - факториальная или случайная. Если выше факториальная дисперсия, значит факторы (образцы семян) достоверно различаются между собой по всхожести и являются экотипами разных географических зон. Если выше случайная дисперсия, значит, достоверных различий по всхожести нет, и наши образцы можно рассматривать как выборку из одной однородной совокупности (в данном случае вида). Таким образом, в данном примере общая дисперсия разлагается на две части - факториальную и случайную. А поскольку изучается действие только одного фактора (образцов семян), то дисперсионный анализ называется однофакторным.

Таблица 41 - Испытание на урожайность сосны обыкновенной, интродуцированную в новую местность из разных географических районов

Образцы се-

мян

X

У

Z

X

ПовторностиК делянки

1

2

3

4

1

72

74

78

69

2

69

72

74

67

3

63

70

70

66

4

59

69

58

64

5

59

66

58

62

6

53

58

56

58

7

51

52

56

54

S

426

461

450

440

Средние классов, М, %

Мх = 60.9

Му = 65.9

Mz = 64.3

Мх = 62.9

Рассмотрим технику проведения дисперсионного анализа:

  • 1. Обозначим классы буквами: х, у, z, Л;
  • 2. Определим средние значения в каждом классе обычным путем, т.е. суммируем все варианты в классе и делим сумму на число вариант:

Sv Sv Sv

Sv,

= 62.9

П,

Мл=^ = 60.9- М =^ = 65.9- М. =^ = 64.3- М

пх пух nz

3. Общее среднее по всей таблице определяется по формуле:

Sv. + Svv + Sv. + Sv, M = ^---i (57)

где N определяется по формуле:

N = пх+пу+пг+пл =7 + 7 + 7 + 7 = 28 (58)

Л/= 60.9 + 65.9 + 64.3 + 62.9 =63 5%

  • 4
  • 4. Определим сумму квадратов отклонений от общего среднего между классами (QM.K ):

QMK = пх (мх - м)2 + пуу - М)2 + п2 (Mz - М)2 + плл - М)2 (59)

Qm.k.= 7(60.9-63.5)2 +7(65.9-63.5)2 +7(64.9-63.5)2 +7(62.9-63.5)2 = 94.64=95

  • 5. Найдем дисперсию (среднеквадратическое отклонение) (32к) между классами, г - число классов.
  • 5-‘=^=тл=32
  • 6. Найдем сумму квадратов отклонений от средних внутри классов (Qb.k):

Qe K = Z [(.r - Mx )2 + (y - My )2 + (z - Мя )2 + (Л - M. Y ]

Итак, QBK=S[(72-60.9)2 + [(69-60.9)2 + ... (51-60.9)2] + [(74-65.9)2 + (72-65.9)2 + ... (52-65.9)2 + [(78-64.3)2 + (74-64.3)2 + ... (56-64.3)2 + [(69-62.9)2 + (69-62.9)2 + ... (69-62.9)2] = 1446

7. Найдем дисперсию внутри классов (<52ж_):

= о^=!±!?=60

вк' N-r 28-4

  • (61)
  • (62)
  • 8. Теперь найдем общую сумму квадратов (Q):

Q = QMK. + Qe,. =95 + 1446 = 1541

  • (63)
  • 9. И, наконец, вычислим общую дисперсию (Z>2) по формуле:
  • 82= Q

N-1

  • 1541
  • 28-1

= 57

  • (64)
  • 10. Теперь сводные данные представим в виде таблицы 42.

Таблица 42 - Сводные данные

Изменчивость

Сумма квадратов

Число степеней свободы

Оценка дисперсии

Между классами

Qm.k. = 95

f 1 = г - 1 = 3

82 = 32

Внутри классов

Qb.k.= 1446

f2 = N - г = 24

82к = 60

По всем наблюдениям

Q= 1541

f = N - 1 = 27

82=57

Показатель силы влияния (критерий Фишера) равен отношению факториальной дисперсии к общей. Он определяет ту долю общей дисперсии, которая приходится на факториальную дисперсию или долю влияния изучаемого фактора в общей сумме влияния всех вообще факторов, определяющих величину и разнообразие результативного признака.

8^

F = ~Fst fl = Г "I f2 = П - 1 °e.K.

(65)

где Fst - стандартные (табличные) значения критерия Фишера;

fi, fi - первая и вторая степени свободы, по которым в таблице (42) находятся стандартные значения критерия Фишера;

п - объем комплекса и число градаций.

5L_32

Далее определяем по формуле: г —

дв к 60

Для того чтобы выяснить достоверно или не достоверно влияние фактора, изучаемое в выборочном дисперсионном комплексе, необходимо сравнить эмпирическое значение F со стандартным значением Fst критерия Фишера, найденным в таблицам 41,42 для двух степеней свободы.

Так как F< 3 и 32VK < 82к, то это значит, что различий между классами нет, и семена принадлежат к одной совокупности, а сосна в разных районах не сформировала экотип.

В данном случае можно и не вычислять F-критерий, так как сразу видно, что межклассовая дисперсия меньше внутриклассовой. Это свидетельствует о том, что наши образцы не являются экотипами, а представляют собой выборки из одной гомогенной совокупности. Значит, данный вид не сформировал экотипов в разных географических зонах.

Зная факториальную и общую дисперсии, можно количественно оценить степень влияния фактора на изучаемый признак по сравнению со случайными причинами. Это делается по формуле:

О 95

^,,.,..= "%=|541=О.О6

rf - читается «эта-квадрат» и представляет собой квадрат обычного корреляционного отношения).

Чем сильнее влияние изучаемого фактора на признак, тем показатель силы влияния (rf) будет ближе к значению 1.0.

Полученный критерий Рф - критерий фактический необходимо сравнить с табличными значениями Fst для разных уровней точности опыта. Если Рф st(r.e. табличный), то нулевая гипотеза не отвергается, т.е. между средними нет существенных различий. Если же Рф > Fst, то нулевая гипотеза отвергается.

Рф = 0.53 < Fst =8.6 (вероятностьJ3 >0.95) или Рф = 0.53 < F05 =8.6.

Следует отметить, что F-критерий устанавливает только факт наличия существенных различий между средними, но не указывает между какими средними имеются эти различия.

В биологических исследованиях могут получиться любые показатели достоверности влияния от F-1 до нескольких десятков и даже сотен.

При Рф > FT т. е. когда эмпирический показатель силы влияния равен или больше минимального стандартного значения Fr или того значения Fst, которое соответствует принятому в исследовании порогу вероятности безошибочных прогнозов, влияние может считаться достоверным. Это значит, что при Рф > FT можно ожидать с определенной вероятностью, что влияние, подобное тому, которое обнаружено в выборочном комплексе, свойственно и всем тем генеральным совокупностям которые соответствуют градациям изученного комплекса.

При Рф < FT; т. е. когда эмпирически полученный показатель : верности влияния оказывается меньше нужного в данном случае стандартногозна-чения критерия Фишера, влияние, обнаруженное в выборочном комплексе, считается недостоверным. Это значит, что та мера влияния, которая была найдена при анализе выборочного комплекса, имеет полное значение только для исследованной группы объектов. Перенести эту меру влияния на все генеральные совокупности, соответствующие градациям комплекса, нельзя: недостоверность показателя влияния не дает права ни подтвердить, ни опровергнуть подобное влияние в этих генеральных совокупностях.

Наименьшая существенная разность. Оценить значимость разности между средними можно по НСР (наименьшая существенная разность):

(66)

S2 = 82к S2 = 60 (таблица 34)

п = 7

tos - табличное значение для п-1 (7-1)

tos = 2.45

НСР05 = tos х Sd (67)

НСР05 = t05 xSd = 2.45x4.1 = 10.0

В случае если разности между средними (Мху, Мх- Mz, Мх- Мх и т.д.), больше НСР05, то различия считаются существенными на 5 %-ном уровне значимости; если же разности между средними меньше HCPos - не существенные. Подставив данные получим 72-74 =-2, 72-78=-6, 72-69=3 и т.д., где видно, что все разности меньше НСРо5=1О, соответственно различия между средними не существенные.

Таблицы F-критерия имеются в любом руководстве по биометрии, например В.Ю.Урбах «Биометрические методы», Н.А.Плохинский «Дисперсионный анализ».

Контрольные вопросы:

  • 1. Для каких целей используется дисперсионный анализ?
  • 2. Кем впервые разработан дисперсионный анализ?
  • 3. В каких случаях применяется дисперсионный анализ?
  • 4. Виды дисперсионного анализа?
  • 5. Что входит в задачу дисперсионного анализа?
  • 2. Для чего нужны и какие вопросы решают критерий Фишера и наименьшая существенная разность?

Контрольное задание: Рассчитать изученные показатели дисперсионного анализа (дисперсия внутри классов, дисперсия, между классами, общая дисперсия, критерий Фишера, НСРо$).

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ ОРИГИНАЛ   След >