Расчет среднего квадратического отклонения можно разбить на шесть этапов, которые необходимо осуществить в определенной последовательности:
1. определить среднюю арифметическую M имеющейся совокупности
2. рассчитать отклонение каждой варианты от средней величины:
3. каждое отклонение возвести в квадрат: (Для получения обобщающей характеристики числового ряда использовать сумму отклонений от среднего нельзя.Это связано с тем, что сумма всех отрицательных и положительных отклонений от среднего всегда равна нулю.)
4. посчитать сумму всех
5. разделить получившуюся сумму на число элементов совокупности n
6. из полученного результата извлечь квадратный корень
Применение среднеквадратического отклонения:
а) для суждения о колеблемости вариационных рядов и сравнительной оценки типичности (представительности) средних арифметических величин. Это необходимо в дифференциальной диагностике при определении устойчивости признаков.
б) для реконструкции вариационного ряда, т.е. восстановления его частотной характеристики на основе правила «трех сигм». В интервале (М±3σ) находится 99,7% всех вариант ряда, в интервале (М±2σ) — 95,5% и в интервале (М±1σ) — 68,3% вариант ряда (рис.1).
в) для выявления «выскакивающих» вариант
г) для определения параметров нормы и патологии с помощью сигмальных оценок
д) для расчета коэффициента вариации
е) для расчета средней ошибки средней арифметической величины.
Для характеристики любой генеральной совокупности, имеющей нормальный тип распределения, достаточно знать два параметра: среднюю арифметическую и среднее квадратическое отклонение.
Рисунок 1. Правило «трех сигм»
Пример.
В педиатрии среднеквадратическое отклонение используется для оценки физического развития детей путем сравнения данных конкретного ребенка с соответствующими стандартными показателями. За стандарт принимаются средние арифметические показатели физического развития здоровых детей. Сравнение показателей со стандартами проводят по специальным таблицам, в которых стандарты приводятся вместе с соответствующими им сигмальными шкалами. Считается, что если показатель физического развития ребенка находится в пределах стандарт (среднее арифметическое)±σ, то физическое развитие ребенка (по этому показателю) соответствует норме. Если показатель находится в пределах стандарт ±2σ, то имеется незначительное отклонение от нормы. Если показатель выходит за эти границы, то физическое развитие ребенка резко отличается от нормы (возможна патология).
Кроме показателей вариации, выраженных в абсолютных величинах, в статистическом исследовании используются показатели вариации, выраженные в относительных величинах. Коэффициент осцилляции -это отношение размаха вариации к средней величине признака. Коэффициент вариации - это отношение среднего квадратического отклонения к средней величине признака. Как правило, эти величины выражаются в процентах.
Формулы расчета относительных показателей вариации:
Из приведенных формул видно, что чем больше коэффициент V приближен к нулю, тем меньше вариация значений признака. Чем больше V, тем более изменчив признак.
В статистической практике наиболее часто применяется коэффициент вариации. Он используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Арифметически отношение σ и средней арифметической нивелирует влияние абсолютной величины этих характеристик, а процентное соотношение делает коэффициент вариации величиной безразмерной (неименованной).
Полученное значение коэффициента вариации оценивается в соответствии с ориентировочными градациями степени разнообразия признака:
- слабое — до 10 %
- среднее — 10 - 20 %
- сильное — более 20 %
Использование коэффициента вариации целесообразно в случаях, когда приходится сравнивать признаки разные по своей величине и размерности.
Отличие коэффициента вариации от других критериев разброса наглядно демонстрирует пример.
Таблица 1
Состав работников промышленного предприятия
Учетный признак | Среднее арифметическое | Среднее квадратическое отклонение σ | Коэффициент вариации, % |
Стаж работы (лет) | 8,7 | 2,8 | 32,1 |
Возраст (лет) | 37,2 | 4,1 | 11,0 |
Образование (классов) | 9,2 | 1,1 | 11,9 |
На основании приведенных в примере статистических характеристик можно сделать вывод об относительной однородности возрастного состава и образовательного уровня работников предприятия при низкой профессиональной устойчивости обследованного контингента. Нетрудно заметить, что попытка судить об этих социальных тенденциях по среднему квадратическому отклонению привела бы к ошибочному заключению, а попытка сравнения учетных признаков «стаж работы» и «возраст» с учетным признаком «образование» вообще была бы некорректной из-за разнородности этих признаков.
Медиана и перцентили
Для порядковых (ранговых) распределений, где критерием середины ряда является медиана, среднеквадратическое отклонение и дисперсия не могут служить характеристиками рассеяния вариант.
То же свойственно и для открытых вариационных рядов. Указанное обстоятельство связано с тем, что отклонения, по которым вычисляются дисперсия и σ, отсчитываются от среднего арифметического, которое не вычисляется в открытых вариационных рядах и в рядах распределений качественных признаков. Поэтому для сжатого описания распределений используется другой параметр разброса – квантиль (синоним - «nерцентиль»), пригодный для описания качественных и количественных признаков при любой форме их распределения. Этот параметр может использоваться и для перевода количественных признаков в качественные. В этом случае такие оценки присваиваются в зависимости от того, какому по порядку квантилю соответствует та или иная конкретная варианта.
В практике медико-биологических исследований наиболее часто используются следующие квантили:
– медиана;
, – квартили (четверти), где – нижний квартиль, – верхний квартиль.
Квантили делят область возможных изменений вариант в вариационном ряду на определенные интервалы. Медиана (квантиль ) – это варианта, которая находится в середине вариационного ряда и делит этот ряд пополам, на две равные части (0,5 и 0,5). Квартиль делит ряд на четыре части: первая часть (нижний квартиль )–это варианта, отделяющая варианты, числовые значения которых не превышают 25% максимально возможного в данном ряду, квартиль отделяет варианты с числовым значением до 50% от максимально возможного. Верхний квартиль () отделяет варианты величиной до 75% от максимально возможных значений.
В случае асимметричности распределения переменной относительно среднего арифметического для его характеристики используются медиана и квартили. В этом случае используется следующая форма отображения средней величины – Ме (; ). Например, исследуемый признак – «срок, в котором ребенок начал самостоятельно ходить» - в исследуемой группе имеет ассиметричное распределение. При этом, нижнему квартилю () соответствует срок начала ходьбы – 9,5 месяцев, медиане – 11 месяцев, верхнему квартилю ()– 12 месяцев. Соответственно, характеристика средней тенденции указанного признака будет представлена, как 11 (9,5; 12) месяцев.