1. Запись данных.
Полученные данные записываются в произвольном порядке. Рекомендуется составить таблицу, записывая по 10 чисел в каждую строчку.
2. Определение размаха.
Размах выборки вычисляется по формуле:
R = Xmax - Xmin , где: Xmax - наибольшее значение; Xmin - наименьшее значение.
Таблица 2-1. Определение числа интервалов | ||||||
Объём выборки n | 10-20 | 20-40 | 40-60 | 60-100 | 100-200 | более200 |
Число интервалов k | 5-6 | 6-8 | 7-10 | 8-12 | 10-15 |
3. Установление числа интервалов.
Вся выборка разбивается на интервалы одинаковой длины. Число интервалов k определяется из таблицы 2-1:
4. Вычисление границ интервалов. Каждый интервал имеет нижнюю и верхнюю границы. Они обозначаются, как правило, Н i и В i, где i - номер интервала. Верхняя граница предыдущего интервала, кроме последнего, равна или меньше нижней границы последующего интервала.
- Вычисляется высота (ширина) h интервала по формуле: h = R / k
- Вычисляются нижние границы интервалов. Их обозначают:
Хн1 - нижняя граница первого интервала,
Хн2 - нижняя граница второго интервала,
Хн3 - нижняя граница третьего интервала и т.д.
Для вычисления нижних границ применяются следующие формулы:
Хн1» Хmin- h/ 2, Хн2 = Хн1+h, Хн3 = Хн2+h … Хнi = Хнi-1+h где: i = 1,2,3...
- Вычисляются верхние границы интервалов. Их обозначают:
Хв1 – верхняя граница первого интервала,,
Хв2 - верхняя граница второго интервала,,
Хв3 - верхняя граница третьего интервала …
Для вычисления верхних границ применяются следующие формулы:
Хв1 = Хн2 - l, где l - точность измерения.(число знаков после запятой обрабатываемых числовых данных). Это может быть: l = 0,1; l =0,01; l = 0,001; …
Хв2 = Хн3 - l, Хв3 = Хн4 - l и т.д.
В некоторых случаях число интервалов может получиться на один больше чем выбранное число k, а именно k+1интервал. Это зависит от ширины интервала, значение которой надо округлять по избытку. В таком случае число интервалов рекомендуется брать фактическое, а не расчетное.
Таблица 2-2. Статистическая (вариационная) таблица | |||||||
Номер интервала, i | Границы интервалов, x1 -xi | Срединное значение интервалов | Распределение данных | Частота, ni | Накопительная частота, mi | Частость, fi | Накопительная частость, Fi |
... | |||||||
k | |||||||
Сумма | S1 = | S2= |
5. Составление таблицы. Вычерчивается таблица по образцу таблицы 2-2. Полученные выше результаты вносятся в таблицу. В дальнейшем таблица заполняется по мере готовности результатов обработки.
6. Вычисление частоты (встречаемость) значений выборки в каждом интервале.
Уславливается число данных, попавших в каждый интервал. Для упрощения такой работы, в столбике 4 делаются отметины (черточка, точка или другой знак) против интервала, куда попадает очередное значение. После окончания перебора всех данных, эти знаки пересчитываются, а в столбике 5 записывается их число. Для контроля суммируется столбик 5 – сумма должна быть равной объему выборки n.
n1 - число данных в первом интервале; n2 - число данных во втором интервале; …
ni - число данных в i-м интервале.
7. Вычисление накопительная частота m.
Определяется путем суммирования частот всех предыдущих интервалов: m1=n1, m2=m1+n2, m3=m2+n3,..., mi=mi-1+ni.
8. Вычисление ч астостей f.
Определяется как число, равное отношению числа данных (частоты, записанной в столбике 5) в рассматриваемом интервале к объему всей выборки (число всех данных). А именно: f1= n1/n, f2=n2/n,..., fi = ni/n. Для контроля суммируется столбик 7 – сумма должна быть равной 1.
9. Вычисление накопительных частностей F.
Определяется путем суммирования частостей всех предыдущих интервалов: F1=f1, F2= F1+ f2 , F3= F2+ f3 и т.д. Значение последней суммы равно 1.
Для повышения наглядности эмпирических распределений используется их графическое представление.
10. Построение г истограммы.
Система прямоугольников, примыкающих друг к другу: ширина их равна ширине интервалов, которая откладывается по одной оси координат. Высота - равна значениям, откладываемым по другой оси.
В прямоугольной системе координат по оси абсцисс (ось ОХ) откладываются интервалы, взятые из таблицы (столбик 2). Значение нижней границы первого интервала можно брать в любом месте оси ОХ. На рисунке это место указано стрелкой. От нее и до начала отсчета масштаб может не устанавливаться. Поэтому эту границу отмечают достаточно близко к точке пресечения осей координат. По оси ординат (ось ОУ) откладываются значения одного из столбиков таблицы (столбики 5-8). Проводятся линии параллельные осям так, чтобы получилась система прямоугольников, т.е. гистограмма
11. Построение полигона.
Это ломаная линия, соединяющая соответствующие точки в системе координат. По оси ОХ откладываются срединные значения интервалов (столбик 3 таблицы 2). По оси ОУ откладываются значения одного из столбиков таблицы (столбики 5-8). Проводятся соответствующие прямые линии до взаимного пресечения в соответствующих точках. Полученные точки соединяются отрезками.