Явления общественной жизни и отражающие их признаки тесно взаимосвязаны. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой.
При построении аналитической группировки необходимо различать результативные и факториальные признаки.
Факториальными называются признаки, под воздействием которых изменяются другие признаки, называемые результативными. Взаимосвязь проявляется в том, что с увеличением значения факториального признака, систематически возрастает или убывает среднее значение признака результативного.
Особенности аналитической группировки:
– группировочнным является факториальный признак;
– каждая группа характеризуется средними значениями результативного признака.
Аналитические группировки позволяют изучить многообразие связей и зависимостей между варьирующими признаками. Преимуществом метода аналитических группировок перед другими методами анализа взаимосвязей (например, корреляционно-регрессионный анализ) является то, что он не требует соблюдения каких-либо условий для своего применения кроме одного – качественной однородности исследуемой совокупности.
Так как группировка производится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
При небольшом объеме совокупности не следует образовывать большое число групп, т.к. группы будут малочисленными, а, следовательно, не позволят получить объективную характеристику исследуемого явления. Часто задачей группировки по количественному признаку является отражение распределения единиц совокупности по этому признаку. Тогда количество групп зависит в первую очередь от колеблемости (вариации): чем больше колеблемость признака, тем больше требуется образовывать групп.
Если в основе группировки лежит непрерывный количественный признак или большое число дискретных признаков, то после определения числа групп следует определить интервалы группировки.
Интервал – это значения варьирующего признака, лежащие в определенных границах. Каждый интервал характеризуется величиной, верхней и нижней границей (при открытых интервалах – одна граница).
Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нем. Величина интервала – разность между верхней и нижней границами. Интервалы группировки в зависимости от их величины могут быть равными и неравными. Неравные интервалы могут быть прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величина такого интервала определяется по следующей формуле:
- это шаг интервала (округляют)
Оптимальное число групп при равных интервалах может определяться по формуле Стерджесса:
Применение этой формулы дает хорошие результаты, если совокупность состоит из большого числа единиц, имеющих нормальное распределение.
Интервалы могут быть открытыми и закрытыми.
Открытые – это те интервалы, у которых указана только одна граница (верхняя – у первого и нижняя – у последнего). Величина открытого интервала принимается равной величине смежного с ним интервала.
Закрытыми называются интервалы, у которых обозначены обе границы.
При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней и нижней границами у двух смежных интервалов. Таким образом верхняя граница i-го интервала равна нижней границе i+1 интервала.
Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1 интервала, увеличенной на единицу.
Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.
Неравные интервалы могут быть прогрессивно возрастающими или убывающими в арифметической или геометрической прогрессии. Величина интервала, изменяющегося в арифметической прогрессии определяется по формуле:
в геометрической прогрессии:
При изучении социально-экономический явлений на макро уровне часто применяют произвольные интервалы. Группировка с произвольными интервалами может быть построена с помощью коэффициента вариации:
, %
При построении группировки с такими интервалами, сначала исходная информация упорядочивается в порядке возрастания или убывания. Затем значения признака, начиная с первого, постепенно объединяются в группу до тех пор, пока окажется, что V>33%. Это будет значить, что первая группа образована. В нее вошли все значения признака до последнего. Таким же образом формируется вторая и т.д. группы и так до тех пор, пока все единицы совокупности не будут объединены в группы.
Пример построения аналитической группировки.
Таблица 1
Среднегодовая стоимость ОППФ и фондоотдача на предприятиях магистрального транспорта газа в ______ году.
№№ объекта | Значение признака | |
Среднегодовая стоимость ОППФ, тыс. руб. | Фондоотдача, м3/руб. | |
А | ||
53,3 | ||
39,1 | ||
27,5 | ||
46,3 | ||
78,7 | ||
108,2 | ||
72,7 | ||
38,8 | ||
81,4 | ||
61,9 | ||
88,1 | ||
51,5 | ||
58,2 | ||
43,0 | ||
83,5 | ||
83,2 | ||
61,3 | ||
47,7 | ||
94,4 | ||
80,1 | ||
73,4 | ||
25,8 | ||
95,4 | ||
33,8 | ||
15,1 | ||
10,0 |
1) Среднегодовая стоимость ОППФ – факториальный признак.
2) Ранжирование факториального признака
Фондоотдача – результативный признак
Таблица 2
Ранжированный ряд значений среднегодовой стоимости ОППФ на предприятиях магистрального транспорта газа.
№ п/п | Значение признака |
А | |
3) Построение вспомогательной таблицы при следующем условии группировки: 5 групп с равными непрерывными интервалами. Величина интервала d=(1151216 – 37710) / 5 = 1113506 / 5 = 222701,2. Величина интервала округляется до 222710
Таблица 3
Группа | № п/п | Количественное значение признака | |
Среднегод. стоимость ОППФ, тыс. руб. | Фондоотдача, тыс. руб. | ||
37710 - | 10,0 | ||
73,4 | |||
72,7 | |||
43,0 | |||
83,2 | |||
108,2 | |||
94,4 | |||
78,7 | |||
83,5 | |||
27,5 | |||
95,4 | |||
15,1 | |||
46,3 | |||
47,7 | |||
Итого: 260420- | 879,1 | ||
81,4 | |||
38,8 | |||
39,1 | |||
80,1 | |||
33,8 | |||
Итого: 483130- | 273,2 | ||
61,9 | |||
88,1 | |||
Итого: 705840- | 150,0 | ||
25,8 | |||
51,5 | |||
Итого: 928550- | 77,3 | ||
58,2 | |||
53,3 | |||
61,3 | |||
Итого: | 172,8 | ||
Итого: | 1552,4 |
4) Построение группировки
Таблица 4
Зависимость фондоотдачи от среднегодовой стоимости ОППФ на предприятиях магистрального транспорта газа.
Интервалы групп | Число предприятий | Среднегодовая стоимость ОППФ, тыс. руб. | Фондоотдача, тыс. руб |
1. 37710 -260420 | 62,8 | ||
2. 260420 - 483130 | 54,6 | ||
3. 483130 - 705840 | 75,0 | ||
4. 705840 - 928550 | 38,6 | ||
5. 928550 - 1151260 | 57,6 | ||
Итого: | 59,7 |
В данном примере величина интервала каждой группы взята одинаковой. Можно в работе задаться постоянным размером интервала, либо назвать число групп для группировки.
Группировка материалов по заданному размеру интервала выполняется следующим образом: по данным ранжированного ряда находится минимальное значение признака, к каждому прибавляется заданная величина интервала, и таким образом получается первая группа. Затем к верхней границе первой группы прибавляется размер прироста интервала, и таким образом получается вторая группа. Аналогично рассчитываются все последующие значения остальных групп. По каждой группе подсчитываются частоты.
Если задается число групп при группировке, то вначале необходимо найти величину интервала.
Величина интервала (d) определяется по формуле:
где xmax – xmin – максимальное и минимальное значения
группировочного признака;
n – число образованных групп.
Далее весь расчет производится по методике группировки с заданным интервалом.
Вторичная группировка может быть выполнена по отдельным статистическим материалам или по данным группировки, полученной ранее в работе, принятой за первичную группировку.
Выполняя эту часть работы, необходимо помнить, что частота интервала вторичной группировки определяется дроблением частот расщепляемых интервалов пропорционально их плотности распределения и суммирования результатов с частотами нерасщепляемых интервалов.
При проведении вторичной группировки рекомендуется пользоваться специальной литературой.
Самостоятельная работа №3
«Выборочное наблюдение и его применение на нефтяной и газовой промышленности»
Цель работы
Научиться отбирать исходную информацию путем выборочного наблюдения и переносить результаты выборки на всю генеральную совокупность.
Порядок выполнения работы
1. Выписать исходную информацию по генеральной совокупности в соответствии с номером варианта. Оформить ее в таблицу вида:
Таблица 1
Исходная информация
(название признака)
Наименование объекта | Значение признака |
1. | |
2. | |
3. | |
и т.д. |
*) Справочник, таблица
2. Определить численность выборки, исходя из заданного условия выборочного наблюдения.
3. Провести выборку по схеме повторного и без повторного отбора, используя все способы отбора:
- собственно-случайный;
- механический;
- типический;
- гнездовой.
4. Для каждого способа и схемы отбора рассчитать:
- среднее значение признака;
- предельную ошибку;
- предельное значение признака.
5. Вспомогательные расчеты оформить в таблицы вида.
Таблица 2
№№ объекта | xi | ||
Итого: |
6. Результаты расчетов по всем способам и схемам выборки обобщить в таблице вида. Обобщить результаты расчетов по всем четырем способам в таблице вида
Таблица 3
Наименование совокупности, способа | Среднее значение | Предельная ошибка | Предельное значение признака | |
Повторный отбор | Бесповторный | |||
Генеральная | х | х | ||
Выборочная | ||||
- | ||||
- | ||||
- |
7. Изобразить графически сопоставление средних расчетных показателей (сравнение 4-х способов отбора). Сделать вывод, какой из примененных способов отбора наиболее приемлем для данной совокупности.