Систематизация и обобщение данных
Параметры рядов распределений
Виды средних и методы их расчета
Статистический ряд распределения характеризуется несколькими постоянными величинами, которые называются параметрами распределения. Обычно это средние значения случайной величины и дисперсия.
Средние величины — это обобщающие параметры, которые выражают общие, типичные, наиболее характерных свойства изучаемого процесса.
Статистические средние рассчитываются на основе массовых данных правильно статистически организованного наблюдения. Статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Пример не типичной средней хорошо показан в рассказе Глеба Успенского “ Живые цифры “. Там средний доход определялся сложением 1 млн. миллионера Колотушкина и 1 гроша просвирни Кукушкиной, и получалось, что он составил 0,5 млн. руб. Например, если рассчитывать среднюю заработную плату сотрудников банка, частных коммерческих предприятиях и фирм и госпредприятий, и результат распространить на всю совокупность, то средняя фиктивна, т.к. рассчитана по неоднородной совокупности. Такая средняя теряет всякий смысл.
При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.
Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д. Средняя выработка отражает общее свойства всей совокупности.
Средняя отражает то общее, что складывается в каждом отдельном, единичном объекте. Благодаря этому средняя получает большое значение для выявления закономерностей присущих массовым общественным явлениям и незаметных в единичных явлениях.
Отклонение индивидуального от общего – проявление процесса развития. В отдельных единичных случаях могут быть заложены элементы нового, передового. В этом случае именно конкретный фактор, взятый на фоне средних величин, характеризует процесс развития. Поэтому в средней и отражается характерный, типичный, реальный уровень изучаемых явлений. Характеристики этих уровней и их изменений во времени и в пространстве являются одной из главных задач средних величин. Так, через средние проявляется, например, изменение благосостояния населения: в средних показателях заработной платы, доходов семьи в целом и по отдельным социальным группам, уровня потребления продуктов, товаров и услуг.
Однако нельзя (например в маркетинговой деятельности) ограничиваться лишь средними цифрами, т.к. за общими благоприятными средними могут скрываться крупные серьезные недостатки в деятельности отдельных подразделений предприятия, акционерного общества.
В практике статистической обработки материала возникают различные задачи, связанные с особенностями изучаемых явлений, и поэтому для их решения требуется применение различных статистических характеристик.
Средняя, рассчитанная по совокупности в целом называется общей средней. Средние, вычисленные для групп, представляющих качественно однородные совокупности, – групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику размера явления, складывающуюся в конкретных условиях данной группы.
Например, статистическое изучение рождаемости и среднего количества детей в семье на территории бывшего СССР проводилось в региональном аспекте (по союзным республикам). Традиционно более высокая рождаемость была в Средней Азии и Закавказье по сравнению с Центральными районами России. Среднее количество детей в семье, исчисленное по каждому региону – это групповые средние, а соответственно исчисленное по всей территории СССР – общая средняя.
Сравнительный анализ групповых и общих средних используется для характеристики социально-экономических типов изучаемого общественного явления. В частности, при изучении рождаемости большое значение имеет характеристика этого процесса по общественным группам населения региона.
Чаще всего в статистике используют три вида средних характеристик: среднее значение, а также медиана и мода (структурные средние).
Выбор того или иного вида средней производится в зависимости от цели исследования, от конкретного типа усредняемых исходных данных.
Среднее арифметическое (или просто среднее, выборочное среднее) для дискретного рядя распределения представляет собой сумму значений ряда (выборки), деленную на длину ряда:
Если ряд распределения интервальный или дискретный группированный, то применяют формулы для средней взвешенной:
,
или
или ,
где Xi – срединное значение интервала, mi – частота градации (в данном случае – вес), Рi –относительная частота градации, k – число градаций (или число различных значений СВ в дискретном группированном ряду).
Разность между средней и взвешенной средней будет небольшой, если число наблюдений велико.
Свойства средней:
1). Постоянный множитель a можно выносить за знак средней
.
2). Среднее суммы равно сумме средних
.
3). Среднее константы равно самой константе
.
4). .
5). Среднее произведения равно произведению средних, если события независимы
.
Если выборочный ряд состоит из нескольких частей длиной m 1, m2, …, mn, то общая средняя равна средней из частных средних, взвешенной по численности соответствующих частей совокупности:
где
Средняя больше всего чувствительна к экстремальным значениям случайной величины, полученным в результате наблюдения. Поэтому она меньше всего пригодна для случайных величин, экстремальные отклонения которых от типичной (характерной) величины встречаются довольно часто и только в одном направлении.