Построение рядов распределения является составным элементом сводки данных статистического наблюдения. Они представляют собой группировку, где известна численность единиц в группах или удельный вес группы в общем итоге. По форме это простейшая разновидность структурной группировки по одному признаку в групповой таблице с двумя графами: группы по выделенному признаку и численности групп. Численные значения признака в рядах распределения называются вариантами, а численность каждой группы – частотами (обычно обозначаются буквой f). Сумма всех частот определяет численность всей совокупности, или ее объем (это обычно n). Численности групп, выраженные в долях от общей численности единиц, называются частостями и обозначаются буквой w. Сумма частостей равна 1, если они выражены в ее долях, и 100%, если они выражены в процентах.
Ряды распределения подразделяются на атрибутивные (группировка по атрибутивным признакам) и вариационные (по количественным признакам). По характеру вариации признака различают вариационные ряды распределения прерывные (дискретные) и непрерывные (интервальные). В первом случае признак изменяется прерывно, т.е. через определенное число единиц. Во втором группировочный признак в определенном интервале может принимать любые значения.
Анализ рядов распределения сопровождается их графическим изображением. Именно графики лучше всего позволяют судить о форме распределения. Для отображения вариационных рядов распределения используются следующие графики: полигон, гистограмму и кумуляту. Полигон применяют для графического изображения дискретного вариационного ряда, и этот график является разновидностью статистических ломаных. В прямоугольной системе координат по оси абсцисс откладываются варианты признака, а по оси ординат – частости каждого варианта. На пересечении абсциссы и ординаты фиксируют точки, соответствующие данному ряду распределения. Соединив эти точки прямыми, получим ломаную, которая и является полигоном, или эмпирической кривой распределения. Для замыкания полигона крайние вершины соединяют с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе, или с серединами предыдущего (перед начальным) и последующим (за последним) интервалов.
Рисунок 1. Графическое изображение полигона
Гистограмма применяется для графического изображения непрерывных (интервальных) вариационных рядов. При этом на оси абсцисс откладывают интервалы ряда. На этих отрезках строят прямоугольники, высота которых по оси ординат в принятом масштабе соответствует частотам. При равных интервалах по оси абсцисс откладывают прямоугольники, сомкнутые друг с другом, с равными основаниями и ординатами, пропорциональными весам. Данный ступенчатый многоугольник и называется гистограммой. Его построение аналогично построению столбиковых диаграмм. Гистограмма может быть преобразована в полигон распределения, для чего середины верхних сторон прямоугольников соединяют отрезками прямых. Две крайние точки прямоугольников замыкают по оси абсцисс на середине интервалов аналогично замыканию полигона. В случае неравенства интервалов график строится не по частотам или частостям, а по плотности распределения (отношению частот или частостей к величине интервала), и тогда высоты прямоугольников графика будут соответствовать величинам этой плотности.
Рисунок 2. Графическое изображение гистограммы
Кумулята изображает кумулятивные ряды распределения, где по оси абсцисс откладывают варианты признака, а по оси ординат – накопленные частоты или частости. Полученные точки соединяют прямыми, образующими кумуляту. При построении кумуляты интервального ряда распределения нижней границе первого интервала соответствует частота, равная нулю, а верхней границе – вся частота данного интервала. Верхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов, и т.д. Другой формой кумулятивного ряда распределения является огива, в графике которой накопленные частоты берутся в обратном порядке, т.е. от наибольшего к наименьшему значению изучаемого признака.
Рисунок 3. Графическое изображение кумуляты