1.Полученные статистические данные (значения признаков) берутся из протоколов соревнований или у преподавателя и записываются в произвольном порядке.
2. Последовательно выполняются все пункты теоретической части настоящей работы. Создается вариационная таблица
3. Строится гистограмма для частоты
4. Строятся полигоны для частоты, частости, накопленной частоты и накопленной частости
5. Дается письменный анализ полученных результатов, выдвигаются гипотезы, делаются выводы и обобщения, стоятся прогнозы.
***
Тема 3. Числовые характеристики выборки.
Теоретические сведения.
Представление эмпирических данных в виде вариационных рядов, графиков, гистограмм было рассмотрено в предыдущей работе. Такое представление данных дает наглядное представление об исследуемом признаке. Но при этом не усматриваются числовые характеристики исследуемого признака в данной конкретной выборке.
Для того, что бы исследователь мог сравнивать результаты измерений проведенных при различных состояниях объектов, сопоставлять таковые результаты, устанавливать зависимости между различными признаками, он может воспользоваться средствами таких наук как "Математическая статистика" и "Теория вероятностей". В них для этого разработаны соответствующие понятия, формулы, технологии.
К числовым характеристикам относятся следующие понятия:
1. Ранжирование данных – расположение полученных значений признака в порядке возрастания. Одинаковым числовым данным присваиваются очередные последовательные числа. Ранжированные данные представляются в виде таблицы, в которой первый столбик – номера от 1 до n, второй столбик – значения признака.
2. Среднее арифметическое (среднее, взвешенное среднее). Обозначается среднее арифметическое различными способами: , Хср, хср. Вычисляется этот показатель по формулам, приведенным в предыдущих работах. Напомним одну из них, наиболее понятную и поэтому часто использующуюся:: , где n- число данных, хi –числовые данные
2. Медиана. Ме. В ранжированных данных выбирается номер, находящийся посредине. Если такой номер один, медиана равна значению признака, стоящего под соответствующим номером. Если таковых номеров два, то берется среднее значение признаков, находящихся под этими номерами. Срединный номер можно определить для небольших выборок визуально или вычислить по формуле:
, где n-объем выборки.. Если полученное число N - целое, то и есть срединный номер. Если число N- дробное, то срединных номеров два. Они непосредственно содержат это дробное число
Например:
1. n=55, по указанной формуле N=0,5·(55+1)=28, значит, медиана равна показателю, находящемуся под номером 28
Таблица 3-1. Квадрат отклонения | |||
№ | Значение признака xi | Отклонение Xi-Xср | Квадрат отклонения (Xi-Xср)2 |
… | |||
n | |||
Сумма |
2. n=60, по указанной формуле N=0,5· (60+1)=30,5. Число 30,5 непосредственно находится между натуральными ближайшими числами 30 и 31. За медиану берется половина суммы (среднее арифметическое) данных, находящимися соответственно под этими номерами.
Обращаем внимание на то, что берется не номер, а тот показатель, который значится под этим номером в ранжированном ряду статистических данных.
3. Мода. Мо. Мода значение признака, встречающееся наибольшее число раз. Если несколько признаков встречаются одинаковое число раз, то берется среднее значение этих признаков. Если данные сгруппированы по интервалам, интервал, содержащий Моду, называется модальным интервалом.
Замечания. Вполне вероятно, что все числовые данные окажутся различными, то в этом случае мода равна среднему арифметическому всех значений. Среднее значение, Медиана, Мода в общем случае не совпадают, но в частных случаях они могут совпасть все или попарно. Это дает возможность делать ряд дополнительных выводов и предположений по выборке.
4. Разма х – разница между наибольшем и наименьшим показателем.Обозначается R, d, Δ. Вычисляется размах по формуле R=Хmax - Xmin
5. Дисперсия - уровень рассеивания результатов. Дисперсия – среднее значение квадратов отклонения каждого значения признака и их среднего значения. Обозначается d; D, δ2. Дисперсия вычисляется по формуле:
D = δ 2= ((х1-хср)2+ (х2-хср)2+ (х3-хср)2+….+ (хn-хср)2)/n
Для вычисления дисперсии, к таблице ранжированных значений добавляется третий и четвертый столбики. В третьем столбике записываются отклонения соответствующих значений от среднего, в четвертом столбике – квадраты отклонений. Суммируются значения второго и четвертого столбиков
6. Среднее квадратичное отклонение σ. Вычисляется по формуле:
7. Коэффициент вариации V. Вычисляется по формуле V= ·100%