Если объем выборки велик (
), и при этом мы имеем дело с одномерной непрерывной величиной (или с одномерной дискретной величиной, число возможных которой достаточно велико), то часто удобнее, с точки зрения упрощения дальнейшей статистической обработки результатов наблюдений, перейти к так называемым «группированным» выборочным данным. Для этого
1. находят наименьшее и наибольшее
значения в выборке:
2. весь диапазон значений разбивается на определенное число
равных интервалов группирования, при этом количество интервалов
должно быть в пределах 7–20. Количество интервалов зависит от объема выборки
и может быть найдено приближенно по формуле
, которую следует воспринимать, скорее, как оценку снизу для
(особенно при больших
);
3. отмечаются крайние точки каждого из интервалов в порядке возрастания, а также их середины
;
4. подсчитываются числа выборочных данных, попавших в каждый из интервалов: (
); выборочные данные, попавшие на границы интервалов, либо равномерно распределяются по двум соседним интервалам, либо уславливаются относить их только к какому-то одному из них, например, левому.
В зависимости от конкретного содержания задачи в данную схему группирования могут быть внесены некоторые изменения (например, в некоторых случаях целесообразно отказаться от требования равной длины интервалов группирования; иногда крайние интервалы целесообразно делать бесконечными слева и справа).