Выборка – группа элементов, выбранная для исследования из всей совокупности элементов. Задача выборочного метода состоит в том, чтобы сделать правильные выводы относительно всего собрания объектов, их совокупности. Например, врач делает заключения о составе крови пациента на основе анализа ее нескольких капель.
Среднее значение (М, Хс) – центр выборки, вокруг которого группируются элементы выборки.
Медиана – элемент выборки, число элементов выборки со значениями больше и меньше которого – равно.
Мода – элемент выборки с наиболее часто встречающимся значением.
Дисперсия (D) – параметр, характеризующий степень разброса элементов выборки относительно среднего значения. Чем больше дисперсия, тем дальше отклоняются значения элементов выборки от среднего значения.
Стандартное отклонение (среднее квадратическое отклонение, s) – параметр аналогичный дисперсии, но имеющий ту же размерность, что и среднее значение, а поэтому и более удобный.
Ошибка среднего или стандартная ошибка (m) – параметр, характеризующий степень возможного отклонения среднего значения, полученного на исследуемой ограниченной выборке, от истинного среднего значения, полученного на всей совокупности элементов.
Асимметрия –величина, характеризующая несимметричность распределения элементов выборки относительно среднего значения. Принимает значения от -1 до 1. В случае симметричного распределения равна 0.
Эксцесс – степень выраженности «хвостов» распределения, т.е. частоты появления удаленных от средних значений.
Часто значения асимметрии и эксцесса используют для проверки гипотезы о том, что наблюденные данные (выборка) принадлежат нормальному распределению. Для нормального распределения асимметрия равна нулю, а эксцесс - трем.
Нормальное распределение – совокупность объектов, в которой крайние значения некоторого признака – наименьшее и наибольшее – проявляются редко; чем ближе значение признака к среднему арифметическому, тем чаще оно встречается. Например, распределение пациентов по их чувствительности к воздействию любого фармакологического агента часто приближается к нормальному распределению.
Коэффициент корреляции (r) – параметр, характеризующий степень линейной взаимосвязи между двумя выборками. Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорциональная зависимость). При значении 0 линейной зависимости между двумя выборками нет.
Случайное событие – событие, которое может произойти или не произойти без видимой закономерности.
Случайная величина – величина, принимающая различные значения без видимой закономерности, т. е. случайным образом.
Вероятность (p)- параметр, характеризующий частоту появления случайного события. Вероятность изменяется от 0 до 1, причем вероятность p=0 означает, что случайное событие происходит всегда.
Гистограмма выборки – графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала группировки. Единственной целью построения гистограммы выборки является содействие наглядному восприятию значения статистических величин. Например, можно построить графическое изображение числа случаев смерти от инфаркта миокарда в зависимости от возраста умерших.
Уровень значимости – максимальное значение вероятности появления события, при котором событие считается практически невозможным. В медицине наибольшее распространение получил уровень значимости равный 0,05. Поэтому если вероятность, с которой интересующее событие может произойти случайным образом p < 0,05, то принято считать это событие маловероятным, и если оно все же произошло, то это не было случайным.
Критерий Стьюдента (t) – наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности». Критерий позволяет найти вероятность тот, что оба средних относятся к одной и той же совокупности. Если эта вероятность p ниже уровня значимости (p < 0,05), то принято считать, что выборки относятся к двум разным совокупностям.