ТЕМА 5. Статистические показатели: средние ВЕЛИЧИНЫ
Степенные средние.
Средние величины играют исключительно большую роль в статистике. Средние величины представляют собой наиболее распространенную форму сводных величин. Они дают общую количественную характеристику элементов массового процесса. Средние величины являются как бы «представителями» всего ряда наблюдений, поскольку вокруг них концентрируются наблюдаемые значения признака. В сущности, средняя величина характеризует однородную совокупность одним числом. Например: средняя температура воздуха в аудитории.
Средняя обладает тем хорошим свойством, что в ней погашаются отклонения отдельных величин от основного типа.
Средняя величина – обобщающая характеристика изучаемого признака в исследуемой совокупности. Она отражает его типичный уровень в расчете на единицу совокупности в конкретных условиях места и времени.
Условиями применения средних величин являются: наличие качественно однородной совокупности и достаточно большой ее объем.
Пример. Рабочие бригады имеют следующую месячную заработную плату (табл. 5.1):
Таблица 5.1
Заработная плата рабочих
Рабочий | Всего: | ||||||||||
Зарплата, грн. | Всего: |
Требуется определить среднюю месячную зарплату рабочих бригады:
Средняя зарплата рабочего составляет 855 грн.
Существуют две категории средних величин: степенные средние (к ним относятся средняя арифметическая, средняя геометрическая и др.), а также структурные средние (мода и медиана). Выбор того или иного вида средней производится в зависимости от цели исследований, экономической сущности усредняемого показателя и характера имеющихся исходных данных.
Общая формула степенной средней имеет вид:
(5.1)
где – средняя статистического признака, а черта – знак символизирующий
процесс осреденения индивидуальных значений;
х – величина, для которой вычисляется средняя – осредняемый признак;
m – показатель степени средней;
n - количество наблюдений (объем совокупности).
Подставляя различные значения т, получают различные формы средних величин.
Средняя арифметическая (при т = 1) используется для осреднения прямых значений признаков путем их суммирования. Ее логическая формула имеет вид:
(5.2)
Если данные не сгруппированы, применяется средняя арифметическая простая:
, (5.3)
где х – отдельные значения признака;
п – объем совокупности.
По формуле средней арифметической простой вычисляются также средние в хронологическом ряду, если интервалы времени, за которое приводятся значения признаков, равны.
Если в хронологическом ряду приведены моментные показатели, то для вычисления cредней они заменяются полусуммами значений на начало и конец периода. Если моментов более двух и интервалы между ними равны, то средняя вычисляется по формуле средней хронологической простой.
, (5.4)
где п – число моментов времени.
Если данные сгруппированы, то используют среднюю арифметическую взвешенную:
или , (5.5)
где fi – частота, di – частость i -й группы.
При этом а
Осреднению подлежат не только отдельные значения вариант, но и их групповые средние , тогда весом будет частота (частость) каждой группы:
(5.6)
Вычисленная таким способом средняя из групповых средних называется общей.
Весом может быть также абсолютная величина, логически связанная с осредняемым показателем. Выбор весов основывается на логической формуле показателя. Поскольку средняя величина вычисляется из расчета на единицу совокупности, то вес всегда будет находиться в знаменателе логической формулы. Например, при определении средней суммы затрат на одно рекламное объявление весом будет количество рекламных объявлений. При вычислении средней суммы затрат на одного рекламодателя весом будет количество рекламодателей.
Средняя арифметическая имеет определенные математические свойства, раскрывающие ее сущность. Так, сумма отклонений отдельных вариант от средней равна нулю, а сумма квадратов таких отклонений приближается к минимуму. Эти два свойства лежат в основе изучения вариации признаков.
Если отдельные значения вариант увеличить (уменьшить) на одну и ту же величину А или в k раз, то средняя изменится соответственно.
Например, если денежные вклады граждан в сбербанк скорректировать на уровень инфляции, составляющий 1,2, то средний размер вклада увеличится соответственно в 1,2 раза.
Средняя не изменится при пропорциональном изменении всех весов, но ее размер изменится, если произойдут структурные сдвиги.
Например, при неизменной курсовой стоимости акций отдельных эмитентов средняя стоимость акций может увеличиться за счет увеличения доли "дорогих" акций в общем количестве их продажи.
Указанные свойства средней используют в случае осреднения признаков порядковой (ранговой) шкалы. Для 3-х бальной шкалы варианты признака можно оцифровать порядковыми рангами R = 1, 2, 3или центрированными R 0 = - 1, 0, 1.
Средний центрированный балл отклоняется от среднего порядкового на величину :
(5.7)
Аналитические возможности среднего центрированного балла шире, чем среднего порядкового, т.к. может принимать положительные или отрицательные значения и свидетельствует о положительной или отрицательной оценке явления. Кроме того, поскольку средний центрированный балл не зависит от размерности шкалы, его используют для сравнения оценок разных явлений.
Пример. В таблице 5.2 приведены данные об отношении населения к приватизации земли. Определим уровень поддержки приватизации земли населением.
Табл. 5.2
Отношение населения к приватизации земли
Отношение к приватизации | Доля ответов, % | Ранги | |
Rj | R0 | ||
Полностью поддерживаю | |||
Частично поддерживаю | |||
Не поддерживаю | -1 | ||
Итого | – | – |
Следовательно, уровень поддержки приватизации земли положительный, но пока невысокий.
Средняя гармоническая (т = – 1) используется для осреднения индивидуальных значений признаков из обратных величин путем их суммирования. Для несгруппированных данных используется средняя гармоническая простая
(5.8)
Если данные сгруппированы, то используют среднюю гармоническую взвешенную
, (5.9)
где wi – объем значений признака, т.е.
Пример. Определить среднюю цену единицы продукции, если известны
(табл. 5.3) следующие данные:
Таблица 5.3
Данные о стоимости продукции
Продукция | Цена, грн., хi | Сумма реализации, тыс., грн., wi | Частота случаев, fi = wi / xi |
А | |||
Б | |||
В | |||
ИТОГО: |
Средняя цена единицы продукции равна сумме реализации деленной на количество реализованных единиц. Сумма реализации (числитель) – известна, а количество реализованной продукции (знаменатель) – неизвестна. В таком случае, среднюю цену единицы продукции определяют по формуле средней гармонической:
.
Если бы для расчета мы использовали среднюю арифметическую простую, то получили бы неверный результат:
.
Очевидно, что среднюю гармоническую взвешенную целесообразно использовать в тех случаях, когда отсутствует информация о значении знаменателя логической формулы, т.е. отсутствуют веса (когда статистическая информация не содержит конкретных частот по отдельным вариантам совокупности, а представлена только как их произведение).
Рассчитывать среднюю гармоническую взвешенную можно и в том случае, когда отдельные значения вариантов не указаны, а известны только итоги (суммарные значения числителя и знаменателя) логической формулы.
Средняя геометрическая (т = 0) определяется как произведение относительных величин динамики xij, рассчитанных как отношение i -го значения показателя к предыдущему (i – 1).
Формула средней геометрической простой
(5.10)
где - символ произведения;
– число осредняемых величин.
Средняя квадратическая (т = 2) используется для характеристики вариации и будет рассматриваться в следующей лекции (тема 6).
Вопрос о том, какой вид средней необходимо применить, решается в каждом конкретном случае путем анализа изучаемой совокупности, определяется материальным содержанием изучаемого явления, а также исходя из осмысления результатов исследований. В статистике правильную характеристику совокупности можно получить при использовании только определенного вида средней, установить которую помогает анализ. Для правильного выбора вида средней величины необходимо составить логическую схему.
Пример. Имеется цех, в котором работает 100 человек. Необходимо определить среднюю зарплату одного рабочего. Среднюю зарплату определим по логической формуле:
Случаи использования различных средних величин.
1. Средняя арифметическая простая используется в том случае, если числитель и знаменатель исследуемой системы приведен в исходных данных.
2. Средняя арифметическая взвешенная используется в том случае, если знаменатель исследуемой системы (логической схемы) известен, а числитель – нет.
3. Средняя гармоническая используется в том случае, если числитель исследуемой схемы приведен в исходных данных, а знаменатель – нет.
4. Средняя квадратическая используется только лишь при определении показателей вариации.
5. Средняя геометрическая используется только лишь при расчете среденегодового темпа роста.
6. Структурные средние используются, преимущественно при определении спроса и предложения.
Следует учесть, что разные виды средних величин на одном и том же исходном материале имеют неодинаковые значения.
Пример. Бригада из пяти человек выпускает детали. При этом каждый рабочий выпускает в следующем количестве (табл. 5.4):
Таблица 5.4
Выпуск деталей рабочими
Рабочий | Выпуск деталей (хi) |
ВСЕГО: 5 |
Определим средний выпуск деталей одним рабочим, используя различные виды средних.
среднеарифметическая
среднеквадратическая
среднегармоническая
среднегеометрическая
В общем виде соотношения между средними имеет вид:
Структурные средние
К средним величинам, кроме степенных средних, относят также и структурные средние – моду и медиану.
Если для вычисления степенных средних необходимо использовать все имеющиеся значения признака, то мода и медиана определяются лишь структурой распределения. Поэтому их и именуют структурными позиционными средними. Мода и медиана характеризуют величину варианты, занимающей определенное положение ранжированном вариационном ряду. Моду и медиану часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.
Модой называется наиболее часто встречающееся значение признака у единиц данной совокупности.
Мода широко используется в коммерческой практике и применяется в тех случаях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака (например, узнать размер обуви, пользуется наибольшим спросом, цену на рынке, по которой было продано наибольшее количество товара и т.д.).
В дискретном вариационном ряду мода соответствует наибольшей частоте наблюдаемого признака.
Пример. По данным табл. 5.5 о продажах обуви определить модальный размер обуви.
Таблица 5.5
Данные о продажах обуви
Размер обуви | |||||||
Число купленных пар |
Модальный размер обуви 37, т.к. обуви этого размера было продано больше всего – 88 пар (наибольшая частота признака в дискретном вариационном ряду).
В интервальном ряду распределения для вычисления моды необходимо определить, в первую очередь, интервал, в котором она находится, т.е. модальный интервал. Модальным интервалом является интервал, в котором наблюдаемый признак имеет наибольшую частоту.
Для определения моды в рядах с равными интервалами пользуются следующей формулой:
(5.11)
где х0 – нижняя граница модального интервала;
h – величина модального интервала;
fmo – частота модального интервала;
fmo-1 – частота интервала предшествующего модальному;
fmo+1 – частота интервала, следующего за модальным.
Пример. Имеется группа студентов, которая сгруппирована по росту следующим образом (табл. 5.6).
Таблица 5.6
Рост студентов в группе
Группы роста, см.(х) | Кол-во студентов, чел.(f) | Накопленная частота (Sf) |
160-165 | ||
165-170 | ||
170-175 | ||
175-180 | ||
180-185 | ||
185-190 | ||
190-195 | ||
Итого | – |
Необходимо определить модальный рост – наиболее часто встречающийся рост студентов. В качестве модального принимаем интервал, в котором находится рост студентов в пределах 170-175 см., поскольку в этом интервале имеется 16 студентов – большинство. Тогда, модальный рост студентов составит:
Мода – это именно то число, которое наиболее часто встречается и в практике имеет самое широкое применение. Например, с помощью моды определяют наиболее часто встречающийся тип покупателя. Или, например, при изучении спроса населения по определенный размер обуви, представляет интерес определения модального размера, а средний размер обуви, сам по себе, не имеет какого-либо смысла. В этих случаях, при характеристике совокупности, в качестве обобщающего показателя предпочтение отдается моде, а не средней арифметической.
Медианой называется то значение признака, которое находится в середине вариационного ряда и делит его на две равные части.
Если вариационный ряд дискретный и содержит нечетное число вариант, то значение среднего признака в ряду и будет медианой.
Например: имеются следующие данные о стаже работы (в годах) семи продавцов: 1, 2, 2, 3, 5, 7, 10. Это дискретный вариационный ряд с нечетным числом вариант. В данном примере медианой является четвертая варианта – 3 года.
Если дискретный вариационный ряд содержит четное число вариант, то медианой будет средняя арифметическая двух смежных вариант, находящихся в центре ряда.
Например: бригада из шести продавцов распределена по стажу работы (в годах) следующим образом: 1, 3, 4, 5, 7, 9. Этот дискретный вариационный ряд содержит четное число вариант, центральными из которых являются значения 4 и 5. Тогда медиана определяется как (4+5)/2=4,5 года.
Для нахождения медианы в интервальном вариационном ряду необходимо сначала определить медианный интервал, т.е. тот интервал, в котором находится медиана. Медианным называется такой интервал, накопленная (кумулятивная) частота которого равна или превышает половину суммы частот.
Для интервального вариационного ряда медиану определяют по формуле:
(5.12)
где х0 – нижняя граница медианного интервала;
h – величина медианного интервала;
– полусумма частот медианного интервала;
– кумулятивная частота (сумма накопленных частот) перед медианным интервалом;
– частота медианного интервала.
Пример. вернемся к данным предыдущего примера – группировки студентов по росту. Определим медианный рост студентов. В качестве медианного, принимаем интервал, в котором находится рост студентов в пределах 170-175 см., поскольку накопленная частота в нем , т.е. превышает половину суммы частот . Тогда медианный рост студентов составит:
В рассмотренном примере модальный и медианный интервалы совпадают, то это лишь частный случай. Часто модальный и интервальный – разные интервалы.
Медиана также, в отдельных случаях, имеет большие преимущества перед средней арифметической. Если вариационный ряд относительно небольшой, то на численное значение средней арифметической могут оказывать влияния случайные колебания крайних вариант ряда, что никак не скажется на значении медианы. Например, в интервальном вариационном ряду распределения семей по величине дохода, медиана будет наиболее приемлемой для анализа статистической совокупности.
Заметим, что различие между средней арифметической величиной, модой и медианой обычно невелико, если распределение статистических величин по форме приближается к нормальному закону.
При изучении статистической совокупности в некоторых случаях более приемлемы мода и медиана и вот почему. В отличие от алгебраических средних, которые в значительной мере являются абстрактной характеристикой статистического ряда распределения, мода и медиана выступают как конкретные величины, совпадающие с вполне определенными вариантами этого ряда. Это делает их незаменимыми при решении ряда практических задач. Так, при определении объема производства и реализации наиболее ходовых по размерам товаров (обуви, одежды) было бы странным пользоваться средней арифметической. Мода в этом случае наиболее подходящая величина. Медиана удобна в том случае, когда среднее значение ряда должно иметь определенные конкретные характеристики. Например, если ряд распределения семей по количеству членов семьи или ряд распределения предприятий по степени ритмичности их работы, то в этих случаях медиана (как, впрочем, и мода) будет более убедительной для анализа.