1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю.
2. Если каждое индивидуальное значение признака умножить или разделить на постоянное число, то и средняя величина увеличиться или уменьшиться во столько же раз.
3. Если к каждому индивидуальному значению признака прибавить или из каждого индивидуального признака вычесть постоянное число, то средняя величина возрасте или уменьшится на это же число.
4. Если веса средней взвешенной умножить или разделить на постоянное число, то средняя величина не изменится.
5. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа.
Существуют и другие формы средней величины
Средняя квадратическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться средней квадратической величиной (хкв). Её формула такова:
- простая (для негруппированных данных)
- взвешенная (для группированных данных)
Средняя геометрическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то применяют среднюю геометрическую величину. Её формула такова:
Основное применение геометрическая средняя находит при определении средних темпов роста. Геометрическая средняя величина дает наиболее правильный по содержанию результат осреднения, если задача состоит в нахождении такого значения признака, который качественно был бы равно удален как от максимального, так и от минимального значения признака.
Средняя гармоническая величина
Если по условиям задачи необходимо, чтобы неизменной оставалась при осреднении сумма величин, обратных индивидуальным значениям признака, то средняя величина является гармонической средней. Иными словами, если неизвестен знаменатель в определении средней величины, то используют формулу средней гармонической.
Формула гармонической средней такова:
- простая (для негруппированных данных)
- взвешенная (для группированных данных)
Все виды средних можно представить в следующей таблице:
Значение k | Наименование средней | Формула | |
простая | взвешенная | ||
-1 | гармоническая | ||
® 0 | геометрическая | ||
арифметическая | |||
квадратическая |
Вариация признаков.
Ряды распределения, построенные по количественному признаку, называют вариационными.
Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц совокупности в один и тот же период или момент времени.
Причиной вариации являются разные условия существования разных единиц совокупности. При изучении вариации можно выделить две группы факторов, которые формируют различный уровень признака в исследуемой совокупности. Первую группу составляют факторы, общие для всех единиц совокупности. Во вторую группу входят факторы, свойственные конкретным единицам совокупности и определяющие индивидуальные особенности.
Вариация, несомненно, необходимое условие существования и развития массовых явлений.
Первым этапом статистического изучения вариации является построение вариационного ряда - упорядоченного распределения единиц совокупности по возрастающим или по убывающим значениям признака и подсчет числа единиц с тем или иным значением признака.
Существуют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд. Вариационный ряд часто называют рядом распределения. Этот термин используется при изучении вариации как количественных, так и неколичественных признаков. Ряд представляет собой структурную группировку.
Ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.
Если численность единиц совокупности достаточно велика, ранжированный ряд становится громоздким, а его построение требует длительное время. В таких случаях вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.
Если признак принимает небольшое число значений, строится дискретный вариационный ряд. Примером такого ряда может служить таблица распределения футбольных матчей по числу забитых мячей. Дискретный вариационный ряд - это таблица, состоящая из двух строк или граф: конкретных значений варьирующего признака xi и числа единиц совокупности с данным значением признака fi - частот.
Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) - интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал, или долей этого числа от общей численности совокупности.
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервальный признак) и установить величину интервала. Поскольку при анализе вариационного ряда сравнивают частоты в разных интервалах, необходимо, чтобы величина интервала была постоянной. Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажались случайными колебаниями частот. Если групп будет слишком мало не проявиться закономерность вариации.
Число групп в вариационном ряду устанавливают по формуле Стерджесса:
k ≈ 1 + 3,332 ∙ lg n = 1+ 1,441 ln n,
где к число групп, n - численность совокупности.
Определение величины интервала. Зная число групп, рассчитывают величину равных интервалов:
Плотность распределения используется как для расчета обобщающих показателей, так и для графического изображения вариационных рядов с неравными интервалами.