Понятие о группировке и группировочных признаках. Группировка является научной основой сводки. В процессе сводки первичный материал разделяется на группы по каким-то варьирующим признакам.
Группировкой в статистике называется расчленение изучаемой совокупности на части по существенным признакам.
Признаки, положенные в основу группировки, называются группировочными. Критерием их выбора является соответствие экономическим и социальным понятиям и терминам. При этом следует руководствоваться следующими положениями:
1. Необходимо выбирать признаки в соответствии с целями проводимой статистической работы.
2. Группировочные признаки выбираются с учетом конкретных условий места и времени.
3. Для сложных явлений группировку делают не по одному, а по нескольким группировочным признакам.
Задачи и виды группировок. Группировки решают ряд задач, соответственно которым различают отдельные виды группировок. Среди всех задач и видов группировок выделяются следующие четыре:
1) разделение совокупности на качественно однородные группы (выделение социально-экономических типов) – типологические группировки;
2) изучение состава совокупности по тем или иным признакам – структурные группировки;
3) изучение взаимосвязанного изменения варьирующих признаков в пределах той или иной совокупности – аналитические группировки;
4) распределение единиц совокупности по двум взаимосвязанным признакам, взятым в комбинации – корреляционные группировки.
Основные правила образования групп по количественным признакам. При группировке по количественным признакам часто возникают вопросы о числе групп и величине интервала. Эти показатели взаимосвязаны: чем больше групп, тем меньше интервал.
При решении данного вопроса во внимание принимают размах варьирования, т.е. разность между максимальным и минимальным значениями признака. Чем он больше, тем больше можно образовать групп.
Также должна быть принята во внимание численность изучаемой совокупности: если она невелика, то нельзя организовать большое число групп.
Ориентировочное число групп (n) в зависимости от численности единиц совокупности (N) определяется по формуле американского ученого Стерджесса (Sturges):
n = 1 + 3,322 lg N
На основании этой формулы можно составить следующую номограмму:
N | 15–24 | 25–44 | 45–89 | 90–179 | 180–359 | 360–719 | 720–1439 |
n |
Номограмму несложно запомнить, обратив внимание на то, что с третьего интервала начало каждого последующего определяется удвоенным значением начала предыдущего интервала.
Интервал – разница между максимальным и минимальным значением признака в каждой группе.
Интервалы могут быть равными и неравными в зависимости от характера распределения единиц совокупности по данному признаку.
Если распределение носит более или менее равномерный характер, то устанавливают равные интервалы. Так поступают, например, при группировке рабочих по уровню заработной платы или посевов сельскохозяйственных культур по величине урожайности. Величина интервала определяется путем деления размаха вариации на число групп:
Неравные интервалы применяются в случае, если распределение единиц совокупности носит неравномерный характер. Тогда в пределах скопления единиц совокупности применяются более узкие интервалы, а рассеяния – более широкие.
Первый и последний интервалы могут быть открытыми или закрытыми в зависимости от того, имеют ли они соответственно одну обозначенную границу или две.
Часто первоначальный материал делят на большое число групп, чтобы увидеть распределение единиц совокупности. Затем эти группы укрупняют, получая качественно однородные группы.
Следует также иметь в виду, что одинаковая количественная мера группировочного признака может иметь разное качественное значение в различных условиях. Так, многие отрасли промышленности имеют различную энергоемкость. Поэтому, группируя предприятия по уровню энерговооруженности, следует дифференцированно строить группировки по отраслям промышленности.