Разнообразные показатели вариации (абсолютные, средние и относительные статистические показатели) можно условно разделить на две части:
· простые;
· требующие более сложных вычислений (основные показатели вариации).
К первой группе можно отнести размах вариации, среднее линейное отклонение, относительное линейное отклонение.
Наиболее простым показателем колеблемости (вариации) признака является размах вариации, который характеризует собой абсолютную величину разности между максимальным и минимальным значением вариант изучаемого признака:
.
Легкость вычисления и достаточная простота истолкования этой характеристики степени вариации обусловили достаточно широкое ее использование. Например, при контроле качества изделий в целях выявления, не изменяется ли процесс изготовления вследствие влияния какой-либо систематически воздействующей причины, через определенные промежуточные отрезки времени отбирается несколько экземпляров и определяется R по основному параметру изделия. Показатель размаха вариации будет характеризовать устойчивость режима производственного процесса.
Размах вариации по своему содержанию может улавливать только крайние отклонения и не отражает отклонений всех вариант в ряду.
Чтобы дать обобщающую характеристику не только размаху (амплитуде), но и распределению отклонений, исчисляют другой показатель вариации - среднее линейное отклонение () или, что то же самое, среднее из отклонений.
В статистике термин “отклонение от средней” означает разность между вариантой и средней арифметической в данной совокупности. При этом всегда предполагается, что среднюю вычитают из варианты, а не наоборот. Отсюда положительное отклонение всегда указывает, что данная варианта больше средней, а отрицательное отклонение показывает, что варианта меньше средней.
При характеристике вариации с учетом отклонений каждого из вариантов от их средней величины нужно иметь в виду, что:
· отклонений при этом получается столько, сколько и самих вариантов;
· сумма всех таких отклонений, по свойству средней арифметической, всегда равняется нулю.
Поэтому для обобщенной характеристики размера этих отклонений условно допускается, что все отклонения имеют одинаковый знак и рассчитывается их средняя величина. Таким образом, среднее арифметическое (линейное) отклонение исчисляется из модулей отклонений (взятых без их знака) по формуле средней арифметической:
,
где - без учета знака.
Среднее линейное отклонение как мера вариации признака в статистической практике применяется редко. Во многих случаях этот показатель не раскрывает полной картины степени рассеивания (вариация) признака.
Рассмотренные показатели вариации (R и ) являются именованными числами, т.е. выражаются в той же единице измерения, в какой выражены варианты и средняя арифметическая данного вариационного ряда. В статистических исследованиях приходится изучать характер рассеивания в различных распределениях: когда ряды представлены различными объемами совокупности для одного и того же признака, при различных значениях средних по одноименным признакам, для сравнения различных совокупностей.
В этих случаях для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Расчет показателей меры относительной вариации осуществляется как отношение абсолютного или среднего показателя вариации к средней арифметической, умножаемое на 100%.
Используя в качестве абсолютного показателя рассеивания размах вариации (R) рассчитывается такой показатель относительного рассеивания как коэффициент осцилляции.
.
Аналогично для среднего линейного отклонения () рассчитывается относительное линейное отклонение.
.
8.8. Основные показатели вариации.
Свойства дисперсии, методы ее расчета
Большинство показателей вариации (колеблемости, рассеивания) исчисляется на основе отклонений признака у отдельных единиц совокупности от средней арифметической, т.к. средняя арифметическая является обобщающей характеристикой свойств ряда (совокупности).
Более объективно меру вариации признака отражает показатель дисперсии (или средний квадрат отклонений). Поэтому на практике наиболее часто используется для характеристики меры вариации этот показатель или показатель, базирующийся на дисперсии (среднее квадратическое отношение, коэффициент вариации). Поэтому условно назовем эту группу показателей вариации как группу основных показателей вариации.
Дисперсия (и соответственно ) используется при организации выборочного наблюдения, при оценке полученных на основе выборки статистических показателей. (Об этом подробно будем говорить в теме “Выборочное наблюдение”). Дисперсия может использоваться для построения показателей тесноты корреляционной связи, анализа влияния различных факторов (сложение дисперсий).
Дисперсия (средний квадрат отклонений) исчисляется средняя из отклонений, возведенных в квадрат:
или .
Итак, чтобы вычислить дисперсию нужно проделать следующие операции:
· найти отклонения каждой варианты ряда от средней арифметической ;
· возвести эти отклонения в квадрат;
· умножить квадрат отклонения на соответствующую частоту и суммировать;
· полученную сумму нужно разделить на сумму частот .
Дисперсия (средний квадрат отклонений) имеет ряд математических свойств (доказываемых в математической статистике), которые позволяют упростить технику ее расчета;
· если из всех значений вариант отнять какое-то постоянное число А, то средний квадрат отклонений от этого не изменится:
;
· если все значения вариант умножить или разделить на какое-то постоянное число А, то дисперсия увеличится или уменьшится от этого в раз:
или .
Другими словами, постоянный множитель вариант выносится за знак дисперсии возведенным в квадрат;
· если исчислить дисперсию от любой величины признака, которая в той или ной степени отличается от средней арифметической , то он всегда будет больше дисперсии, исчисленной от средней арифметической:
.
Это свойство носит название свойство минимальности. При этом больше на определенную величины – на квадрат разности между средней и этой условно взятой величиной:
.
Использование указанных свойств дисперсии позволяет упростить ее расчет, особенно в тех случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы.
Например, пусть . Тогда по 3-му свойству имеем:
.
Отсюда: средний квадрат отклонений равен среднему квадрату индивидуальных значений признака минус квадрат среднего значения признака.
Изложенный способ расчета дисперсии называется способом моментов или способом отсчета от условного нуля.
Пример. Расчет среднего уровня и способом моментов.
Вес урожая, 2 см2 | Варианты X | Число участков (частоты f) | Условные отклонения | Xf | X²f |
90-100 | -4 | -8 | |||
100-110 | -3 | -15 | |||
110-120 | -2 | -26 | |||
120-130 | -1 | -17 | |||
130-140 | 135= | ||||
140-150 | |||||
150-160 | |||||
160-170 | |||||
170-180 | |||||
Сумма | - |
Среднее арифметическое г/м2.
Средний квадрат отклонений (дисперсия)
.
Корень квадратный из дисперсии (среднего квадрата отклонения) представляет собой наиболее широко применяемый в статистических исследованиях показатель вариации – среднее квадратическое отклонение (иногда называют стандартное отклонение).
.
Среднее квадратическое отношение является мерилом надежности средней. Чем меньше , чем лучше среднее арифметическое отражает собой всю изучаемую совокупность.
В приведенном примере г/м2. Среднее квадратическое отклонение всегда выражается в тех именованных числах, в которых выражена и средняя. Оно дает абсолютную меру вариации.
Исходя из сказанного, по своему абсолютному значению среднее квадратическое отклонение () зависит не только от степени вариации признака, но и от абсолютных уровней (или значений) вариаций и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с разными уровнями непосредственно нельзя. Для этих целей исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы совокупности одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей).
Для этой цели в статистических исследованиях широко применяется коэффициент вариации, т.к. средняя величина () отражает тенденцию развития (т.е. действие главных факторов), а среднеквадратическое отклонение () дает обобщенную характеристику колеблемости всех вариантов совокупности (измеряет силу воздействия прочих факторов).
Итак, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом считается, что если ν больше 40%, то имеет место большая колеблемость изучаемого признака.
В нашем примере:
.
Дисперсию и среднюю альтернативного признака можно определить по формулам:
и ,
где p – доля единиц, обладающих признаком;
g - доля единиц, не обладающих признаком;
притом p+g=1, g=1-p.
Среднеквадратическое отклонение .