Введение
Многофакторный дисперсионный анализ – это статистический метод анализа результатов наблюдений, зависящих от различных одновременно действующих факторов, выбор наиболее важных из них и оценка их влияния.
Суть анализа заключается в разложении общей дисперсии случайной величины на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействие.
Факторами обычно называют внешние условия, влияющие на эксперимент (наблюдение). Это, например, температура, тип оборудования, его мощность, давление и т.д. В условиях эксперимента (наблюдения) факторы могут варьировать, благодаря чему можно исследовать влияние рассматриваемого фактора на эксперимент (наблюдение). В этом случае можно сказать, что фактор варьирует на разных уровнях или имеет несколько уровней.
Каждая совокупность состоит из множества варьирующих единиц. Вариация, то есть различие между значениями случайной величины, складывается под влиянием множества факторов. Но степень влияния отдельных факторов на изменение величины того или иного фактора неодинакова. Все они делятся на систематические (постоянно действующие) и случайные. Поэтому различают вариацию систематическую, вызванную действием постоянных факторов, и случайную, обусловленную действием случайных факторов, которые создают вариацию внутри изучаемой совокупности.
При большом числе наблюдений случайные факторы взаимопогашаются, то есть компенсируют друг друга. При небольшом выборочном числе наблюдений взаимное погашение факторов может произойти не полностью и поэтому, в какой-то мере могут искажаться результаты наблюдений. Для статистической оценки зависимости между явлениями при небольшом числе наблюдений используется дисперсионный анализ. Дисперсионный анализ проводится по следующей схеме:
Расчленение общей дисперсии по источникам ее образования
Общая дисперсия расчленяется на межгрупповую, связанную с группировочными признаками, и внутригрупповую (остаточную), связанную с неконтролируемыми признаками.
Взаимосвязь между дисперсиями может быть выражена следующим образом:
σ02=σ12+σ22
Общая дисперсия показывает влияние всех условий на вариацию признака и определяется по формуле
σ02=∑(х-х̄)2/N
Внутригрупповая дисперсия показывает влияние случайных величин, не учитываемых условий на вариацию признака, то есть не зависит от факторного признака.
Она определяет среднюю из частных (групповых) дисперсий и рассчитывается по формуле
σ12=(∑σi2*Ni)/∑Ni,
многофакторный дисперсионный анализ вариация
где σi2 – частные дисперсии.
Межгрупповая дисперсия характеризует дисперсию признака под влиянием определяющих условий, связанных с факторным признаком. Она представляет собой средний квадрат отклонения групповых средних от общей средней и вычисляется по формуле:
σ22=∑(х̄i-x̄)2/N
Определение числа степеней свободы
При дисперсионном анализе имеют дело с выборочными данными. Поэтому для определения дисперсий необходимо установить число степеней свободы. Под степенью свободы понимают число вариант, которые могут принимать произвольные значения, не изменяющие их общей (средней) характеристики.
Для общей дисперсии при N наблюдениях число степеней свободы составит N-1, для межгрупповой дисперсии – оно равно числу групп (или вариант) минус 1, для внутригрупповой дисперсии – (N-1)-(p-1)=N-p.
Вычисление и анализ оценок вариации
Дисперсионный анализ заключается в сопоставлении межгрупповой и внутригрупповой дисперсий. Отношение их получило название F-критерия, разработанного английским ученым Фишером:
F=S12/S22
Фишер установил распределение отношений дисперсий и разработал соответствующие математические таблицы. В них приводится теоретическое значение F-критерия (предельно возможное при двух вероятностях: 0,05 и 0,01 – 5% и 1%). Уровень вероятности 0,05 означает, что значение Fфакт может достигать Fтабл только в 5 случаях из 100, а 0,01 – в 1 случае из 100. Таким образом, Fтабл является критерием фактического отношения дисперсий. Если Fфакт>Fтабл, то с данной степенью вероятности можно утверждать наличие влияния изучаемого фактора. Если Fфакт≤Fтабл, можно утверждать, что различия между дисперсиями обусловлены влиянием случайных факторов.
Результаты дисперсионного анализа могут быть оформлены в виде таблицы:
Таблица 1 Результаты дисперсионного анализа
Компоненты дисперсий | Сумма квадратов | Число степ. свободы | Средний квадрат | Оценка дисперсий |
Межгрупповая | ∑(x̄i-x̄)2=W1 | p-1 | W1/(p-1) | S12 |
Внутригрупповая | ∑(xij-x̄i)2=W2 | N-p | W2/(N-p) | S22 |
Общая | ∑(xij-x̄)2=W | N-1 | W/(N-1) | S2 |
Размещено на
АО «Медицинский университет Астана»
Кафедра информатики, математики с курсом биостатистики
СРС
Тема: Многофакторный дисперсионный анализ
Выполнила: Кенесбаева Г.
ОМ-359
Проверила: Оспанова Г.К.
Астана 2015 г.