Группы предприятий по стоимости ОПФ, млн. р. | Число предприятий, в процентах к итогу | Объем продукции, млн.руб. |
до 20 | 5 + 6,2 + 13,6 = 24,8 | 150,2 + 240,0 + 450,2 = 840,4 |
20-50 | 14,2 + · 18 = 23,2 | 486,2 + · 524 =748,2 |
50-100 | · 18 + 25,4 = 34,4 | · 524 + 650,2 = 912,2 |
100-200 | 10,2 + · 4,4 = 12,4 | 880,4 + · 990 = 1375,4 |
200 и выше | · 4,4 + 3 = 5,2 | · 990 + 895 = 1390 |
Итого | 5266,2 |
После определения группировочного признака следует решить вопрос о количестве групп, на которые следует разбить изучаемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Количественные значения признака, на основе которых исследуемые явления, лежащие в определенных границах, разбиваются на группы и называются в статистике интервалами. Смысл и значение интервалов в группировке зависят от ее конечной цели, от функций группировочного признака и взаимосвязи его с другими признаками, от задач исследования, от особенностей совокупности.
Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называют наименьшее значение признака в интервале; верхней – наибольшее значение признака в нем.
Величина интервала – это разность между верхней и нижней границей интервала.
Интервалы группировок могут быть равные и неравные. Равные интервалы применяются там, где нужно показать, какие существуют количественные различия внутри групп одинакового качества, когда признак изменяется более или менее равномерно в ограниченных пределах. Равные интервалы устанавливаются механически, расчетным путем по следующей формуле:
, или же (1)
(формула Стерджесса) (2)
где х max, х min – максимальное и минимальное значение признака в совокупности;
n – число групп;
N – численность совокупности.
Формула Стерджесса имеет недостаток. Она дает хорошие результаты при большом объеме совокупности, и если распределение единиц по группировочному признаку близко к нормальному.
Равные интервалы используются в тех случаях, когда соотношение максимального и минимального значений группировочного признака не превышает десятикратного значения.
В случае значительной вариации группировочного признака целесообразно применять кратные интервалы (удвоенные интервалы).
Полученную по формуле величину округляют. Она является шагом интервала. Существуют следующие правила определение шага интервала:
1. если величина интервала представляет собой величину, имеющую один знак до запятой (например 7,35), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала (7,4);
2. если величина интервала имеет две значащие цифры до запятой и несколько после запятой (15,671), то это значение нужно округлить до целого числа (16);
3. если величина интервала представляет собой трех-, четырех- и так далее значное число, то эту величину необходимо округлить до ближайшего числа, кратного 100 или 50 (389» 400).
Пример.
Имеются данные о 10 предприятиях по выпуску продукции (млн.руб.): 16,2; 17,9; 15,4; 21,5; 18,1; 12,0; 14,9 13,8; 24,0 19,2. Произвести группировку предприятий по выпуску продукции, выделив 6 групп с равными интервалами.
Определим величину интервала:
i = = 2 млн. руб.
Для определения верхней границы первого интервала к х min прибавляем величину интервала (табл.7):
При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух симметричных интервалов. Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i–1 интервала, увеличенного на единицу.
Таблица 7