Многофакторый дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) несомненно более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.

Общая схема двухфакторного эксперимента, данные которого обрабатываются дисперсионным анализом имеет вид:

Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.

Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:

А – партия изделий;

B – станок.

В результате получается переход к задаче двухфакторного дисперсионного анализа.

Все данные представлены в таблице 1.2, в которой по строкам - уровни A_i фактора А, по столбцам – уровни B_j фактора В, а в соответствующих ячейках, таблицы находятся значения показателя качества изделий x_ijk (i=1,2,...,m; j=1,2,...,l; k=1,2,...,n).

Таблица 1.2 – Показатели качества изделий

	B₁	B₂	…	B_j	…	B_l
A₁	x_11l,…,x_11k	x_12l,…,x_12k	…	x_1jl,…,x_1jk	…	x_1ll,…,x_1lk
A₂	x₂_1l,…,x₂_1k	x_22l,…,x_22k	…	x_2jl,…,x_2jk	…	x_2ll,…,x_2lk
…	…	…	…	…	…	…
A_i	x_i1l,…,x_i1k	x_i2l,…,x_i2k	…	x_ijl,…,x_ijk	…	x_jll,…,x_jlk
…	…	…	…	…	…	…
A_m	x_m1l,…,x_m1k	x_m2l,…,x_m2k	…	x_mjl,…,x_mjk	…	x_mll,…,x_mlk

Двухфакторная дисперсионная модель имеет вид:

x_ijk=м+F_i+G_j+I_ij+е_ijk,

где x_ijk - значение наблюдения в ячейке ij с номером k;

м - общая средняя;

F_i - эффект, обусловленный влиянием i-го уровня фактора А;

G_j - эффект, обусловленный влиянием j-го уровня фактора В;

I_ij - эффект, обусловленный взаимодействием двух факторов, т.е. отклонение от средней по наблюдениям в ячейке ij от суммы первых трех слагаемых в модели;

е_ijk - возмущение, обусловленное вариацией переменной внутри отдельной ячейки.

Предполагается, что е_ijk имеет нормальный закон распределения N(0; с²), а все математические ожидания F_*, G_*, I_i_*, I_*_j равны нулю.

В таблице представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Базовая таблица дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средние квадраты
Межгруп-повая (фактор А)		m-1
Межгруп-повая (фактор B)		l-1
Взаимодействие		(m-1)(l-1)
Остаточная		mln - ml
Общая		mln - 1

Проверка нулевых гипотез H_A, H_B, H_AB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F – критерия Фишера–Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями – как в модели I.

Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q₃из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.

Отклонение от основных предпосылок дисперсионного анализа – нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) – не сказывается существенно на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы.

Библиография

1. Ермолаев, О.Ю. Математическая статистика для психологов / О.Ю. Ермолаев. - М.: МПСИ: Флинта. - 2002. – 325 с.

2. Наследов, А.Д. Математические методы в психологическом исследовании. Анализ и интерпретация данных / А.Д. Наследов. - СПб.: Речь. - 2004.

3. Бурлачук, Л.Ф., Морозов С.М. Словарь – справочник по психодиагностике / Л.Ф. Бурлачук, С.М. Морозов – СПб: Питер Ком. - 1999. – 528 с.