ЯГМА
Медицинская физика
Лечебный факультет
Курс
Семестр
Поток
Лекция № 1
«Элементы математической статистики»
Составил: Бабенко Н.И.
Г.
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ЕЕ ОСОБЕННОСТИ, ВИДЫ, ЗАДАЧИ.
Понятие "статистика" происходит от латинского слова "status", которое в переводе означает - положение, состояние, порядок явлений.
Развитие политической арифметики (Англия) и государствоведения
(Германия) привело к появлению науки статистики.
В научный оборот термин "статистика" введен математиками Геттингенского университета в 18 веке.(Готфрид Ахенваль (1719-1772)).
В настоящее время существует около 150 определений статистики как научной дисциплины. Одно из лучших определений статистики дал австрийский математик Абрахам Вальд: «Статистика – это совокупность методов, которые дают нам возможность принимать оптимальные решения в условиях неопределенности».
Из различных определений статистики для практической медицины наиболее применимо следующее:
" Статистика - это наука о сборе, классификации и количественной оценке данных с целью получения достоверных выводов, прогнозов и решений".
Статистика изучает случайные массовые явления. Массовые явления - это явления, которые встречаются в больших количествах, но отличаются друг от друга величиной определенного признака. Чем больше количество объектов взято для исследования, тем достовернее статистические выводы.
Статистика состоит из теоретической (общей) статистики и прикладной
(экономической, социальной, отраслевой) статистики.
К отраслевым статистикам относится метеорологическая (статистика прогноза погоды), транспортная, экономическая, биологическая, медицинская.
Теоретическую статистику делят на описательную (дескриптивную) и аналитическую (индуктивную).
Описательная статистика - это статистика сбора общих данных. Она представляет собой совокупность методов сбора, группировки, классификации исходных данных и представлении их в удобном, для последующей обработки, виде (таблицы, графики).
Аналитическая статистика - это статистика выводов и прогнозов на основе математической обработки результатов, предоставленных описательной статистикой. Она включает в себя методы получения различных статистических заключений и выводов с целью их практического применения.
Медицинская статистика - это отраслевая статистика, комплекс методов прикладной статистики, которые применяются в научной, практической медицине и здравоохранении.
Основные задачи медицинской статистики:
ü статистика рождаемости и смертности;
ü статистика заболеваемости;
ü статистика деятельности учреждений здравоохранения.
Вместе описательная и аналитическая статистики решают следующую задачу:
ü сбор данных и описание их в удобном для статистической обработки виде;
ü обработка результатов методами теоретической (общей) статистики;
ü анализ полученных результатов, прогнозирование, выработка оптимальных решений.
ОСНОВНЫЕ ПОНЯТИЯ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ
И ИХ ХАРАКТЕРИСТИКА.
К основным понятиям описательной статистики относятся:
ü статистическая совокупность (генеральная и выборочная);
ü объем совокупности;
ü статистический вариант;
ü статистический признак;
ü статистическая частота (абсолютная частота);
ü частость (относительная частота).
Статистическая совокупность - это множество объектов, объединенных по какому-либо признаку для статистического изучения.
Виды совокупностей:
1. Генеральная совокупность (конечная или бесконечная).
2. Выборочная совокупность (выборка).
Генеральная совокупность - это совокупность всех объектов выбранного для исследования статистического множества.
Конечная генеральная совокупность – статистическая совокупность, в которой количество изучаемых объектов с данным признаком ограничено.
Пример: количество студентов в академии, жителей в городе, число измерений в опытах.
Бесконечная генеральная совокупность - это статистическая совокупность, в которой число объектов равно бесконечности. Используется в теоретических расчетах как математическая абстракция.
Выборочная совокупность (выборка) - это часть генеральной совокупности, взятая для статического изучения.
Объем совокупности - это количество объектов, входящих в совокупность.
Объем генеральной совокупности обозначается символом N, а выборочной - n.
Статистический вариант - это объект совокупности, отдельное наблюдение или измерение.
Варианты обозначаются латинскими буквами x, y, z c подстрочными индексами, указывающими номер варианты.
Пример: х1 - объект или измерение номер один,
х2 - объект или измерение номер два и т.д.
Вариант без указания номера называется обобщенный вариант и обозначается латинской буквой с подстрочным буквенным индексом, например, xi.
Варианты (объекты) статистической совокупности характеризуются различными признаками, в том числе теми, на основе которых они объединены в совокупность.
Признак, который меняет свое значение от одного объекта к другому, называется варьирующим признаком, а само явление называется вариация.

Качественные признаки - это признаки, не имеющие количественного выражения. Это неизмеряемые признаки.
Пример: цвет, вкус, запах.
Количественные признаки - это измеряемые признаки, выражаемые определенным числом.
Пример: вес, длина, плотность, температура.
Дискретные количественные признаки - это количественные признаки, которые выражаются целыми числами.
Пример: число студентов в группе, пассажиров в автобусе, лепестков на цветке.
Непрерывные количественные признаки – это количественные признаки, которые выражаются как целыми, так и дробными числами.
Пример: вес арбуза 7 кг, вес дыни 1.7 кг.
Интервальный признак - это количественный признак, числовое значение которого лежит в определенных границах, называемых интервалами.
Пример: при измерении роста студентов, можно выделить интервальные группы 160 - 169 см, 170 – 179 см, 180 – 190 см.
Частота встречаемости (абсолютная частота) – число, показывающее, сколько раз объект с данным числовым значением признака встречается в совокупности или ее интервале.
Абсолютною частоту обозначают символом ni (µi).
Сумма всех абсолютных частот равна объему совокупности N, для которой подсчитываются частоты: ∑ni = N
Пример: число лиц мужского и женского пола в группе должно быть равно в сумме количеству студентов в этой группе.
Частость (относительная частота) – число, равное отношению абсолютной частоты к объему совокупности.
Частость обозначают символом f и вычисляют по формуле:
в долях единицы: fi =
,
в процентах: fi =
100%
Здесь ni - абсолютная частота, N - объем совокупности, равный сумме всех абсолютных частот.
Сумма всех относительных частот равна 1: ∑ fi = 1
Пример: в студенческой группе из пятнадцати человек (объем совокупности N =15) 12 студенток (абсолютная частота n1 =12) и 3 студента (абсолютная частота n2 =3). Частость f1 будет равна 12/15, а частость f2 =3/15. При этом сумма частостей или относительных частот равна единице.
В статистике относительные частоты или частости называют весами.
РЯДЫ РАСПРЕДЕЛЕНИЯ, ИХ ВИДЫ И СПОСОБЫ ПРЕДСТАВЛЕНИЯ.
Ряд распределения - это последовательность чисел с указанием качественного или количественного значения признака и частоты его встречаемости.
Виды рядов распределения классифицируются по разным принципам.
По степени упорядоченности ряды делят на:
ü неупорядоченные
ü упорядоченные
Неупорядоченный ряд - это такой ряд, в котором значения признака записаны в порядке поступления вариантов при исследовании.
Пример: При исследовании роста группы студентов были записаны его значения в см (175,170,168,173,179).
Упорядоченный ряд - это ряд, полученный из неупорядоченного в котором значения признака перезаписаны в порядке возрастания или убывания. Упорядоченный ряд называется ранжированным, а процедура ранжирования
(упорядочивания) называется сортировкой.
Пример: (Рост 168,170,173,175,179)
По виду признака ряды распределения делятся на:
ü атрибутивные
ü вариационные.
Атрибутивный ряд - это ряд, составленный на основе качественного признака.
Вариационный ряд - это ряд, составленный на основе количественного признака.
Вариационные ряды подразделяются на дискретные, непрерывные и интервальные.
Вариационные дискретные, непрерывные и интегральные ряды названы по соответствующему признаку, который лежит в основе составления ряда. Например, ряд по размеру обуви является дискретным по массе тела - непрерывным.
Способы представления рядов в практической и научной медицине делятся на три группы:
1. Табличное представление;
2. Аналитическое представление (в виде формулы);
3. Графическое представление.
1. Простейшая таблица представляет собой два столбца или две строки, в одной из которых записаны значения признака xi в упорядоченном виде, а в другой - относительная или абсолютная частота его встречаемости ni, fi.
Пример табличного представления оценок в группе xi и числа их получивших студентов ni.
| xi | ||||
| ni | - |
2. Графическое представление рядов основано на табличных данных. Графики строят в прямоугольной системе координат, где по горизонтали всегда откладывают значения признака хi, а по вертикали абсолютною или относительную частоту ni.
Основные способы представления графиков:
1. Диаграмма в отрезках.
2. Гистограмма
3. Полигон частот.
4. Вариационная (частотная) кривая.
5.
Диаграмма в отрезках - это график представления ряда в виде вертикальных прямых-отрезков, положение которых на горизонтали определяется значением признака, а длина отрезка пропорциональна его абсолютной или относительной частоте.
Пример: диаграмма в отрезках для оценок успеваемости группы.
ni
5 4 3 2 xi
Обычно диаграммы в отрезках строят для дискретно заданных признаков при небольшом числе вариантов.
Гистограмма - это график в виде ступенчатой фигуры из примыкающих друг к другу прямоугольников, основаниями которых являются интервалы значений признаков, а высоты прямоугольников пропорциональны частоте или частости (количеству объектов, попавших в интервал). Площади прямоугольников соответствуют численности групп, в данном интервале.
Гистограммы - это графики интервальных рядов. Их строят преимущественно для больших объемов совокупностей.
Пример: Гистограмма нормального распределения эритроцитов в крови человека. По горизонтали - диаметр клеток хi (мк), по вертикали - частота ni числа клеток в интервале.
ni
2 4 6 8 10 12 xi
Полигон (многоугольник), частот - график ряда, представленный ломаной линией точки - вершины которой соответствуют серединам интервалов, а высота точки над горизонталью пропорциональна частоте или частости.
Полигоны строят для непрерывных и дискретных вариационных рядов в тех случаях, когда в интервалах выделены средние значения признака. Полигоны предпочтительнее гистограмм при непрерывных рядах распределения
Пример: полигон частот на основе гистограммы распределения эритроцитов в крови человека.
ni
2 4 6 8 10 12 xi
Вариационная (частотная) кривая - график ряда, полученный при условии, что объем совокупности, стремится к бесконечности (N→∞), а длина самого интервала стремится к нулю (Δ х→0).
Для практических статистических расчетов в качестве стандартов выделено четыре группы частотных распределений:
1. Прямоугольное распределение.
2. Колоколообразное унимодальное (одновершинное) распределение.
3. Бимодальное (двухвершинное) распределение.
4. Экспоненциальное распределение:
a) нарастающее,
b) убывающее.
![]() |
ni
xi
xi
xi
xi
Прямоугольному распределению подчиняются случайные равновероятные события.
Колоколообразному симметричному распределению подчиняется широкий класс явлений (показатели умственного и физического развития, рост, масса, и др). На практике наиболее часто встречается симметричное унимодальное распределение, поэтому его классическая форма называется нормальным распределением.
Бимодальному распределению соответствует, например успеваемость студентов имеющих и не имеющих большого перерыва в учебе.
Экспоненциально убывающему распределению соответствует распределение доходов в капиталистическом обществе, (частота убывает при возрастании дохода).







