Дисперсионный анализ эксперимента
Дисперсионный анализ широко используется для планирования эксперимента и статистической обработки его данных. В настоящее время статистическое планирование опыта в соответствии с требованиями дисперсионного анализа и математическая интерпретация результатов - непременные условия успешного получения ответов на вопросы экспериментатора.
При дисперсионном анализе одновременно обрабатывают данные нескольких выборок (вариантов), составляющих единый статистический комплекс, оформленный в виде специальной рабочей таблицы. Структура статистического комплекса и его определяют схемой и методикой эксперимента.
Сущностью дисперсионного анализа является расчленение общей суммы квадратов отклонений и общего числа степеней свободы на части - компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F критерию[6].
При обработке однофакторных статистических комплексов, связанных условием, такая изменчивость результативного признака , измеряемая общей суммой квадратовСу, разлагается на три части: варьирование повторений Ср, вариантов Су и случайное Cz.
Су — Ср 4“ Су + Cz. (2.6.1)
Общее число степеней свободы (и-7)также расчленяется на три части
п - 1 = (m - 1) + (Z + 1) + (т - 1) (Z - 1) (2.6.2)
где т-количество организованных повторений;
I - количество вариантов.
В исходной таблице определяют суммы по повторениям Р, вариантам V и общую сумму наблюдений 2х. Затем вычисляют:
Общее число наблюдений
N = 1т; (2.6.3)
Корректирующий фактор (поправку)
у х.2
С = ^~; (2.6.4)
Общую сумму квадратов
Сг = ?х(2-С; (2.6.5)
Сумму квадратов для повторений
Ср = - С; (2.6.6)
Сумму квадратов для вариантов
у р2
Cv = --C; (2.6.7)
ТП,
Сумму квадратов для ошибки (остаток)
Cz = Су - Ср - Су. (2.6.8)
Приведение к сравниваемому виду - одной степени свободы вариации проводят путем вычисления средних квадратов (дисперсии):
Вариантов
(2.6.9)
Ошибки
Значения, полученные в выражениях 2.6.9 и 2.6.10 используют в дисперсионном анализе для оценки значимости действия изучаемых факторов по критерию Фишера с2
г = (2.6.11)
Таким образом, за базу - единицу сравнения принимают средний квадрат случайной дисперсии, которая определяет случайную ошибку эксперимента. При этом происходит проверка нулевой гипотезы.
s2
Если Гфакт = ^2 < FTeop, т0 нулевая гипотеза не отвергается; между всеми выборочными средними нет существенных различий, на этом проверка заканчивается. Нулевая гипотеза отвергается, ко-s2
гда Гфакт = > FTeop. В этом случае необходима оценка суще
ственности частных различий по НСР.
Наименьшая существенная разность (НСР) - это величина, указывающая границу предельным отклонениям и определяемая отношением [6]
НСР = tSd. (2.6.12)
где t - коэффициент Стьюдента,
Sd - ошибка разности средних.
S«=J? (2.6.13)
Ошибка опыта
= (2.6.14)
Пример. Определена урожайность озимой пшеницы. Провести дисперсионный анализ, определить НСРо,5 и сгруппировать сорта по отношению к стандарту.
Таблица 2.6.1
Урожай озимой пшеницы, ц/га
Варианты (сорта) |
Повторения, х |
|||
I |
II |
III |
IV |
|
1 (стандарт) |
47,8 |
46,9 |
45.4 |
44.1 |
2 |
53,7 |
50,3 |
50,6 |
48,0 |
3 |
46,7 |
42,0 |
43.4 |
40,7 |
4 |
48,0 |
47,0 |
45,9 |
45.7 |
5 |
41,8 |
40,0 |
43,0 |
41,6 |
Ход работы
Дисперсионный анализ целесообразно проводить с использованием табличного процессора Microsoft Excel.
1. Заполните ячейки таблицы значениями эксперимента
Л |
А |
В |
С |
D |
Е |
1 |
Измеренные значения урожайности, X |
||||
2 |
Сорта |
XI |
Х2 |
ХЗ |
Х4 |
3 |
1 (стандарт) |
47,8 |
46,9 |
45,4 |
44,1 |
4 |
2 |
53,7 |
50,3 |
50,6 |
48 |
5 |
3 |
46,7 |
42 |
43,4 |
40,7 |
6 |
4 |
48 |
47 |
45,9 |
45,7 |
7 |
5 |
41,8 |
40 |
43 |
41,6 |
Рис. 2.6.1. Исходные данные результатов эксперимента
2. Вычислите суммарные значения для каждого сорта и измерения Xi, а затем среднее для каждого сорта (рис. 2.6.2).
Л |
А |
в |
С |
D |
Е |
F |
G |
1 |
Сорта |
Измеренные значения урожайности, X |
IV |
Xi |
|||
2 |
XI |
Х2 |
ХЗ |
Х4 |
|||
3 |
1 (стандарт) |
47,8 |
46,9 |
45,4 |
44,1 |
184,2 |
46,05 |
4 |
2 |
53,7 |
50,3 |
50,6 |
48 |
202,6 |
50,65 |
5 |
3 |
46,7 |
42 |
43,4 |
40,7 |
172,8 |
43,2 |
6 |
4 |
48 |
47 |
45,9 |
45,7 |
186,6 |
46,65 |
7 |
5 |
41,8 |
40 |
43 |
41,6 |
166,4 |
41,6 |
8 |
ZP |
238 |
226,2 |
228,3 |
220,1 |
912,6 |
45,63 |
Рис. 2.6.2. Промежуточные вычисления суммы и средних значений
3. Для вычисления сумм квадратов исходные значения целесообразно преобразовать в соответствии с соотношением Х± = X — А, приняв за условное среднее А число 45, близкое к х=45,63 с использованием функции ОКРУГЛВНИЗО (рис. 2.6.3).
В10 - А -ОКРУГЛВНИЗ(О8;0)
А |
В |
С |
||
10 |
Услов ср. А |
45 |
Рис. 2.6.3. Нахождение условного среднего
4. Выполните преобразование значений в соответствии с выражением Х[ = X — 45 (рис. 2.6.4)
F13 - (* ЛI =CyMM(F13:F17)
А |
в |
С |
D |
Е |
F |
G |
|
10 Услов ср. А 45 |
|||||||
11 |
Сорта |
Xt = X - 45 |
IV |
||||
12 |
XI |
Х2 |
ХЗ |
Х4 | |||
13 |
1 |
2,8 |
1,9 |
0,4 |
-0,9 |
4,2 |
|
14 |
2 |
8,7 |
5,3 |
5,6 |
3 |
22,6 |
|
15 |
3 |
1,7 |
-3 |
-1,6 |
-4,3 |
-7,2 | |
16 |
4 |
3 |
2 |
0,9 |
0,7 |
6,6 |
|
17 |
5 |
-3,2 |
-5 |
-2 |
-3,4 |
-13,6 |
|
18 |
IP |
13 |
1,2 |
3,3 |
-4,9 |
12,6 |
ZXi |
Рис. 2.6.4. Таблица преобразованных значений
5. Вычислите сумму квадратов отклонений. Общее число наблюдений по формуле (2.6.3), корректирующий фактор по формуле (2.6.4). _______________________
20 |
N= |
20 |
21 |
С= |
7,94 |
Рис. 2.6.5. Общее число наблюдений и корректирующий фактор
Общую сумму квадратов по формуле (2.6.5) для этого необходимо заполнить таблицу значениями квадратов преобразованных значений (рис. 2.6.6).
Е29__________- ;__Л | =Е28-В21
А |
В |
С |
D |
е! |
|
21 |
С= |
7,94 |
|||
22 |
Сорта |
К |
XI |
xi |
Х5 |
23 |
1 |
7,84 |
3,61 |
0,16 |
0,81 |
24 |
2 |
75,69 |
28,09 |
31,36 |
9 |
25 |
3 |
2,89 |
9 |
2,56 |
18,49 |
26 |
4 |
9 |
4 |
0,81 |
0,49 |
27 |
5 |
10,24 |
25 |
4 |
11,56 |
28 |
м - Х м II |
254,6 |
|||
29 |
Су = |
246,66 |
Рис. 2.6.6. Нахождение общей суммы квадратов
Сумму квадратов для повторений с использованием выражения (2.6.6)
F19 ” А =СУММ(В192Е19)
А |
в |
С |
D |
Е |
F |
|
12 |
Сорта |
XI |
Х2 |
ХЗ |
Х4 |
IV |
13 |
1 |
2,8 |
1,9 |
0,4 |
-0,9 |
4,2 |
14 |
2 |
8,7 |
5,3 |
5,6 |
3 |
22,6 |
15 |
3 |
1,7 |
-3 |
-1,6 |
-4,3 |
-7,2 |
16 |
4 |
3 |
2 |
0,9 |
0,7 |
6,6 |
17 |
5 |
-3,2 |
-5 |
-2 |
-3,4 |
-13,6 |
18 |
2Р = |
13 |
1,2 |
3,3 |
-4,9 |
12,6 |
19 |
ХР2 = |
169 |
1,44 |
10,89 |
24,01 |
205,34 |
Рис. 2.6.7. Промежуточные вычисления для нахождения суммы квадратов повторений
Ср= |
33,13 |
Сумму квадратов для вариантов с использованием выражения (2.6.7)
Н18 -г А =СУММ(Н13:Н17) |
||||||||
А В С D Е F G | Н |
||||||||
11 |
Сорта |
Xi = X - 45 |
IV |
??2 |
||||
12 |
XI |
Х2 |
ХЗ |
Х4 |
||||
13 |
1 |
2,8 |
1,9 |
0,4 |
-0,9 |
4,2 |
17,64 |
|
14 |
2 |
8,7 |
5,3 |
5,6 |
3 |
22,6 |
510,76 |
|
15 |
3 |
1,7 |
-3 |
-1,6 |
-4,3 |
-7,2 |
51,84 |
|
16 |
4 |
3 |
2 |
0,9 |
0,7 |
6,6 |
43,56 |
|
|
5 |
-3,2 |
-5 |
-2 |
-3,4 |
-13,6 |
184,96 |
|
2Р = |
13 |
1,2 |
3,3 |
-4,9 |
12,6 |
SXi |
808,76 |
|
19 |
?Р2 = |
169 |
1,44 |
10,89 |
24,01 |
205,34 |
Рис. 2.6.8. Промежуточные вычисления для нахождения суммы квадратов для вариантов
Е31__________- f* | =H18/4-B21
29 |
С |
D |
Е |
су = |
246,66 |
||
30 |
Ср= |
33,13 |
|
31 |
Cv= |
194,252 |
Рис. 2.6.9. Сумма квадратов для вариантов
Сумму квадратов для ошибки (остаток) по формуле 2.6.8
Cz= |
19,28 |
6. Заполните таблицу дисперсионного анализа
D37 Л |
=В37/С37 |
|||||
А |
В |
С |
D |
Е |
F |
|
34 |
Дисперсия |
Сумма квадратов |
Степени свободы |
Средний квадрат |
Рф |
F05 |
35 |
общая |
246,66 |
19 |
|||
36 |
повторений |
33,13 |
3 |
|||
37 |
вариантов |
194,25 |
4 |
48,56 |
30,23 |
5,90 |
38 |
остаток |
19,28 |
12 |
1,61 |
Рис. 2.6.10. Результаты дисперсионного анализа
Где остаток дисперсии - это разность степеней свободы дисперсии общей, повторений и вариантов.
Средний квадрат вариантов и отклонений (остаток) вычислите воспользовавшись формулами (2.6.9) и (2.6.10). Фактическое значение критерия Фишера (2.6.11) Еф=30,23.
7. Определите табличное значение коэффициента Фишера по примеру в лабораторной работе 2 (стр. 81-84.)
Так как Рф>Ро.5, то в опыте есть существенные различия между сортами (вариантами), нулевая гипотеза отвергается.
8. Для оценки существенности частных различий и группировки сортов вычислите ошибку опыта (2.6.14), ошибку разности (2.6.13), средних и НСРо,5 (2.6.12). При этом коэффициент Стью-дента возьмите из приложения Е для 12 степеней свободы или с использованием функции =СТЬЮДЕНТ.ОБР.2Х(0,05;12)
С42 ? (• А |
=СТЬЮДЕНТ.ОБР.2Х(0,05;12) |
|||||||
В |
С |
D |
Е |
F |
G |
|||
39 |
||||||||
40 |
Sx |
0,63 |
||||||
41 |
Sd |
0,90 |
||||||
42 |
10,05 |
2,18 |
||||||
43 |
НСР 0,05 |
1,95 |
Рис. 2.6.11. Нахождение ошибки опыта, ошибки разности и средних НСР
9. Заполните таблицу результатов
С52 |
? |
Л |
? =С42*С41 |
||
А |
в |
С |
D |
||
45 |
Результаты опыта | ||||
46 |
Варианты |
Урожай |
Отклонен |
Группа |
|
47 |
1(станд) |
46,05 |
ст |
||
48 |
2 |
50,65 |
4,6 |
1 |
|
49 |
3 |
43,2 |
-2,85 |
3 |
|
50 |
4 |
46,65 |
0,6 |
2 |
|
511 |
5 |
41,6 |
-4,45 |
3 |
|
52 |
НСР |
1,95 |
Рис. 2.6.12. Результаты опыта и статистической обработки
В результате проведенного анализа видно, что сорт 2 существенно превышает стандарт, а сорта 3-ий и 5-ый существенно уступают ему по урожаю (относим их в 3-ю группу), а сорт 4 несущественно отличается от контрольного сорта (2-я группа).
Контрольные вопросы и задания
- 1. Для чего проводят дисперсионный анализ?
- 2. Каково назначение коэффициента Фишера?
- 3. Какие показатели влияют на оценку существенных частных различий?
- 4. Оформите работу с использованием текстового процессора и дайте обоснование полученных данных в выводе.