дят среднюю квадратическую ошибку эксцесса:
. (6.56)
Если отклонение > 3, то отклонение от нормального
Распределения считается существенным, в противном случае
Оно признается незначительным и объясняется случайными
Причинами.
Теперь приведем конкретный расчетный пример, в кото-
Ром определим ряд характеристик, приведенных выше, а так-
же затронем вопросы, не разобранные в этой главе. В этом слу-
Чае наряду с вычислениями рассмотрим кратко и некоторые
необходимые теоретические вопросы.
Заметим, что приводимый пример является чисто учеб-
ным, данные для него взяты, как говорится, “с потолка”. Кроме
Того, рассматриваемый ряд наблюдений содержит всего 20 на-
Блюдений для простоты счета, потому что у многих студентов
Появляются сложности даже при расчете средних величин.
В настоящее время имеется большое количество пакетов про-
Грамм для определения статистических характеристик, так
Что вручную уже никто не считает. Необходимо помнить, что
большое значение имеет качество исходных данных: если они
Некачественные то и результат будет таким же, статистика и
Математика в этом случае не помогут.
Пример 6.2
Предположим, что в наше распоряжение поступил ста-
Тистический материал о количестве зарегистрированных ДТП
в районном центре N. Он оформлен в виде таблицы (табл. 6.3),
Данные в ней приводятся на числа текущего года.
Таблица 6.3
Дата Количество ДТП (xi) Дата Количество ДТП (xi)
01.06.2007 87 11.06.2007 94
02.06.2007 85 12.06.2007 77
03.06.2007 91 13.06.2007 82
04.06.2007 94 14.06.2007 95
05.06.2007 102 15.06.2007 104
06.06.2007 80 16.06.2007 87
07.06.2007 75 17.06.2007 93
08.06.2007 85 18.06.2007 92
09.06.2007 93 19.06.2007 88
10.06.2007 102 20.06.2007 97
В данном случае количество ДТП — это случайная вели-
чина Х, а результаты наблюдений, приведенные в табл. 6.3 —
Совокупность значений, принятых этой случайной величиной,
т. е. Х = { х 1, х 2…, х 20}. Данные, приведенные в табл. 6.3, надо упо-
Рядочить, например расположить их по возрастанию значений
изучаемого признака хi (). Если одно и то же значение
Повторяется несколько раз, то его повторим. В результате по-
лучаем статистический ряд распределения (см. табл. 6.4).
По ранжированному ряду (см. табл. 6.4) можно построить,
Например, статистическую функцию распределения, рас-
Смотренную нами в главе 2.
— разрывная ступенчатая функция, непрерывная слева
и имеющая n скачков. (n — количество наблюдений), причем ве-
личина каждого скачка равна 1/ n. Так как некоторые наблюдения
Совпадают, то скачки сливаются и их число будет равно числу на-
блюдаемых значений случайной величины X. В нашем случае
Будет иметь 15 скачков, откуда следует, что строить ее по ранжи-
Рованному ряду нерационально, а делать это надо по группиро-
Ванному ряду, что будет рассмотрено несколько позднее.
Таблица 6.4
№ п/п хi № п/п хi
1 75 11 92
2 77 12 93
3 80 13 93
4 82 14 94
5 85 15 94
6 85 16 95
7 87 17 97
8 87 18 102
9 88 19 102
10 91 20 104
По ранжированному ряду (табл. 6.4) можно определить
Оценки числовых характеристик наблюдаемой случайной ве-
личины Х (количество ДТП), например среднюю арифметичес-
Кую, дисперсию, среднее квадратическое отклонение, размах
Вариации и др.
Вычислим, например, размах вариации и среднее арифме-
тическое:
R = хmax − хmin = 104 − 75 = 29;
.
Все числовые характеристики будем определять до целых,
Так как не бывает десятых и сотых долей ДТП. Можно вычис-
лить и другие числовые характеристики по данным табл. 6.4, но
Мы это сделаем по группированному ряду.
По статистическому ряду распределения построим груп-
Пированный ряд, о котором говорилось в главе 4. Заметим, что
Длины интервалов в нем необязательно должны быть одинако-
Вы, но в каждом из них должны быть наблюдения, т. е. не долж-
Но быть пустых интервалов. В том случае если значение слу-
чайной величины Х попадает ни границу между разрядами, мы
Будем делить его поровну между соседними разрядами, т. е. к
значению каждого их них добавлять по 1/2.
Приближенно найти оптимальное количество групп (разря-
дов) с равными интервалами можно по формуле Стерджесса:
k = 1 + 3,322lg n.
где k — количество разрядов;
n — количество наблюдений.
Но данная формула применима в том случае, если распре-
деление изучаемой случайной величины Х приближается к