Для больших выборок (n > 100) вычисляют еще два статистических показателя.
Скошенность кривой называется асимметрией:
(7.12)
Правосторонняя асимметрия – отрицательна, левосторонняя – положительна.
Отклонение крутизны называют эксцессом:
(7.13)
Эксцесс положителен при островершинной кривой, отрицателен при плосковершинной.
Вопросы для самоконтроля
1 Для какой цели вычисляется среднее квадратическое отклонение в совокупности данных?
2 Среднее квадратическое отклонение как мерило изменчивости совокупности. Общая формула для него.
3 Если для группы из n элементов поставлено 3 условия, то каково число степеней свободы в группе?
4 Какую размерность имеет коэффициент вариации?
5 В чем разница между стандартным отклонением и коэффициентом вариации?
6 Как связан размах с лимитами?
7 Как наиболее легким способом определить приближенные значения средней арифметической и сигмы?
8 Что характеризует нормированное отклонение в группе?
9 Дать определение артефакта.
10 Что является критерием выпада значения признака из выборки? В каких случаях определяется средняя и сигма суммарной группы?
11 Принимают ли асимметрия и эксцесс положительные и отрицательные значения. Что это означает?
ТЕМА 8 Графическое представление распределений
8.1 Вариационный ряд
8.2 Гистограмма и вариационная кривая
8.3 Кумулята
8.4 Достоверность различия распределений
Вариационный ряд
По мере увеличения численности изучаемых групп все более и более проявляется та закономерность в разнообразии, которая в малочисленных группах была скрыта случайной формой своего проявления.
В больших группах эта закономерность проявляется уже достаточно ясно в самой форме распределения значений признака в группе.
Если имеется многочисленная группа особей, то различные значения признака встречаются в этой группе неодинаковое число раз: одни значения встречаются чаще, другие реже. Это явление называется распределением признака. Закономерности распределения заключаются в том, что в группе особей наблюдается преимущественное появление определенных значений признака. Обычно на протяжении всего распределения от максимума до минимума бывает одна группа близких значений, которая появляется заметно чаще других значений. Но и в некоторых распределениях наблюдаются две или три такие группы.
В процессе изучения многих совокупностей по различным признакам наметилось несколько типов распределения признака в группе, получивших математическое оформление.
При исследовании биологических объектов наибольшее значение имеют: нормальное распределение, биномиальное распределение и распределение Пуассона.
Изобразить распределение признака можно различными способами: вариационным рядом, гистограммой, вариационной кривой, кумулятой.
Вариационный ряд – это упорядоченное отражение реально существующего распределения значений признака по отдельным особям изученной группы.
Вариационный ряд – это двойной ряд чисел, состоящий из обозначения классов и соответствующих частот.
Для корректной статистической обработки необходимо определить величину класса по формуле:
k=(Xmax–Xmin)/n,
n=1+3,322×lgN,
где N–число наблюдений.
Пример
Распределение 1000 данных по 11 классам (через 20, начиная со 110 до 310) показано в таблице 8.1.
Таблица 8.1 – Вариационный ряд
Средины классов | W | ||||||||||||
Частоты | f | n=1000 |
В этом распределении имеются следующие элементы:
- Классы признака, т. е. выделенные из общей группы части, в которые собраны объекты, сходные по своей величине.
- Вариации или средины классов, обозначаемые символом W: 110 –130 – 150 и т. д. В каждый класс занесены объекты, у которых величина признака близка к средине этого класса.
- Классовые промежутки или величина классов, обозначаемые символом k, одинаковые для всех классов распределения. Классовый промежуток равен разности вариаций соседних классов (в таблице 3.5, k = 20).
- Частоты f – число объектов в классах.
- Объем распределения – общее число объектов в группе, обозначаемое символом n.
Вариационный ряд включает в себя весь первичный материал по измерению одного признака у всех представителей изучаемой группы. Этот материал в вариационном ряду приведен в определенный порядок таким образом, что становится возможным даже для очень многочисленных групп достаточно легко определить все показатели, характеризующие признак, как по среднему уровню развития, так и по различным деталям разнообразия.
Рассмотрение вариационного ряда без вычислений позволяет определить величину основных показателей среднего уровня и разнообразия с таким приближением, которое вполне достаточно для первого ознакомления с признаком. В некоторых случаях внимательное рассмотрение вариационного ряда избавляет от необходимости расчета точных показателей. Но даже и при наличии рассчитанных средней арифметической и среднего стандартного отклонения вариационный ряд не теряет своего значения, так как наглядно показывает все детали распределения признака в данной группе.
Если взять вариационный ряд, приведенный в примере, то без вычислений можно видеть, что:
- средняя арифметическая признака находится между 190 и 210, вероятно, недалеко от 200;
- мода признака (наиболее часто встречающееся значение) равна 190;
- лимиты (минимум и максимум) и размах признака примерно равны 110 – 310;
- стандартное отклонение признака, судя по лимитам, равно 200:6,5 = 31, так как в группе объемом 1000 сигма укладывается в размахе примерно 6,5 раз.
Точный расчет показателей в этом примере дал очень близкие результаты: М = 201 кг, s =30 кг, мода = 198 кг.