Вторым этапом статистического исследования является сводка и группировка материалов, полученных в результате статистического наблюдения.
Статистическая сводка – это процесс научной обработки статистических данных, который включает в себя:
1. Группировку материалов.
2. Разработку системы показателей для характеристики групп и подгрупп.
3. Подсчет итогов по группам, подгруппам и совокупности в целом.
4. Изображение сгруппированных данных в виде статистической таблицы и графиков.
Сводка бывает простая и сложная. По способу проведения она подразделяется на ручную и механическую.
Простая сводка – это подсчет общих итогов по совокупности без разделения на группы и подгруппы.
Сложная сводка предусматривает предварительное распределение данных на группы и подгруппы.
Центральный момент сводки – группировка материала.
Статистическая группировка – это распределение единиц изучаемой совокупности на группы и подгруппы по какому-либо признаку, который называется группировочным.
Основные виды группировок
Группировки, образованные по одному признаку, называются простыми.
Если группы, образованные по одному признаку, распределяются на подгруппы по другому признаку, а образованные на основе этого группы – на подгруппы по третьему, то такие группировки называют комбинационными. (Таблица 2.1):
Таблица 2.1 - распределение работников турфирмы по профессиям, квалификации и стажу работы
Профессия | Квалификация | Стаж работы, лет | ||
До 5 | 5–10 | Более 10 | ||
Менеджер | Высокая | |||
Средняя | ||||
Низкая | ||||
Маркетолог | Высокая | |||
Средняя | ||||
Низкая |
Группировки по виду группировочного признака бывают:
1. Типологические.
2. Структурные.
3. Аналитические.
Типологические – это распределение единиц разнородной совокупности на качественно однородные группы. В их основе лежит атрибут или качественный признак. (Пример: распределение работников по профессии).
Структурные – это группировки, образованные по количественному признаку.
Пример:
Таблица 2.2 - Распределение работников по уровню заработной платы.
Заработная плата, руб. | Количество работников, чел. |
До 3000 3000–5000 5000–7000 Свыше 7000 | |
Итого |
Аналитические группировки подразумевают распределение единиц однородной совокупности на группы и подгруппы по двум или нескольким взаимосвязанным признакам. При этом независимый признак называется факторным (Х), а зависимый – результативным (Y). В статистике ониимеют наибольшее значение.
Таблица 2.3 Зависимость между продажами путевок работниками и стажем работы.
Стаж работы, лет (Х) | Продажа путевок в год одним работником, руб. (Y) |
До 5 5–10 10–15 Свыше 15 |
Интервалы группировок
Если изучаемый признак изменяется в широких пределах, возникает вопрос об определении интервала группировки.
Величина интервала – это разница между максимальными и минимальными значениями признака в каждой группе.
Если количество интервалов не задано или неизвестно, то величина интервала находится по формуле
, (2.1)
где h – величина интервала; Xmax, Xmin – максимальное и минимальное значение признака в изучаемой совокупности; N – число единиц совокупности.
Если известно, на сколько групп с равными интервалами нужно разбить совокупность, то применяется формула:
, (2.2)
где n – число групп.
Интервалы бывают равные и неравные.
Равные – это интервалы, величина которых не меняется от группы к группе.
Неравные – это интервалы, величина которых меняется от группы к группе. Они бывают убывающие и возрастающие. Например:
Таблица 2.4 - Убывающие интервалы
Заработная плата, р. | Количество работников |
200–500 500–700 700–800 | |
Итого |
Таблица 2.5 - Возрастающие интервалы
Заработная плата, р. | Количество работников |
До 200 200–300 300–500 500–800 | |
Итого |
При небольшом числе наблюдений для образования интервалов используется принцип равных частот. В этом случае все элементы совокупности располагаются в порядке возрастания и распределяются по группам равномерно так, чтобы в каждую группу попало одинаковое число элементов совокупности.
Пример: имеются данные в рублях о заработной плате 9 работников: 500, 500, 650, 700, 800, 850, 900, 950, 1000. Необходимо разбить совокупность работников на 3 группы так, чтобы в каждой группе их работников было поровну.
Таблица 2.6 – Группы работников по заработной плате
Заработная плата, руб. | Количество работников, чел. |
500–650 700–850 900–1000 | 3 (500, 500, 650) 3 (700, 800, 850) 3 (900, 950, 1000) |
Интервалы различают открытые и закрытые.
Открытые – интервалы, у которых обозначена одна граница, верхняя или нижняя.
Закрытые – интервалы, у которых обозначены обе границы.
Например:
«до 3» – открытый интервал (1–3)
«свыше 9» – открытый интервал (9–11).