Процесс построения группировок состоит из следующих этапов.
1) Определение группировочного признака.
Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, возраст человека и т.д.), а вторые отражают состояние единицы совокупности (пол человека, национальность, и т.д.)
Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки и образуют группу результативных признаков.
2) Определение количества групп.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности. Степени вариации признака.
При построении группировки по качественному признаку групп будет столько, сколько имеется градаций, видов, состояний у этого признака (пол – 2, регионов России – 89 и т.д.).
Если группировка проводится по количественному признаку, то необходимо обратить внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
Чем больше колеблемость группировочного признака, тем больше следует образовать групп.
Если распределение признака условно равномерно, то для определения количества групп используется формула Стерджесса:
Недостаток формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному.
3) Определение интервала группировки.
Интервал – значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей называется наименьшее значение признака в интервале, а верхней – наибольшее значение признака в нем. Величина интервала – разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения (крайние точки).
Полученная величина является шагом интервала.
Открытые интервалы – те, у которых указана только одна граница.
Закрытые интервалы – те, у которых обозначены обе границы.
Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.
Ширина открытого интервала принимается равной ширине соседнего с ним закрытого интервала.
Вторичная группировка
Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа для образования новых групп:
1) способ укрупнения интервалов – объединение первоначальных интервалов – используется в случае перехода от более мелких интервалов к более крупным, а также в случаях, когда границы новых и старых интервалов совпадают.
2) способ долевой перегруппировки – создание новых интервалов на основе закрепления за каждой группой определенной доли единиц совокупности.