В травматологическом отделении имеется 3 аппарата для осуществления искусственного дыхания при шоке. Больных в состоянии шока доставляют в больницу в среднем 2 раза в течение некоторого периода времени t. Вероятность отказа каждого аппарата в течение этого периода времени составляет P =0,1. Требуется найти вероятность наступления события А, которое заключается в том, что в течение периода времени t из трех имеющихся аппаратов два будут исправны.
Обозначим через U1 U2 и U3 события, состоящие в исправности первого, второго и третьего аппарата; через , и — противоположные события, состоящие в неисправности (отказе в течение времени t) первого, второго и третьего аппарата. По условию задачи вероятности этих событий равны между собой.
P(U1)=P(U2)=P(U3)= 1 – P = 0,9
Р( ) = Р( ) = Р( ) = P = 0,1
Интересующее нас событие может осуществиться тремя способами:
— исправны первый и второй аппараты, неисправен — третий (событие B1);
— исправны первый и третий аппараты, неисправен — второй (событие В2);
— исправны второй и третий аппараты, неисправен — первый (событие В3).
Эти три события являются несовместными, а элементарные события, их составляющие, — независимыми. В этой задаче мы имеем дело со схемой испытаний Бернулли. Рассматриваемые события независимы (вероятность отказа каждого из аппаратов не зависит от того, что произошло с другими двумя). Условия испытаний (функционирование аппаратов в течение времени t) остаются неизменными, так как остаются неизменными вероятности отказа каждого из них. В испытании возможны только 2 исхода: отказ или безотказная работа на протяжении времени t.
Итак, нам нужно определить вероятность появления какого-либо из трех сложных несовместимых событий, каждое из которых заключается в совместном появлении трех элементарных независимых событий. Искомая вероятность может быть определена по теоремам сложения и умножения вероятностей:
Р(В1) = P(U1) х P(U2) х P( )
Р(В2) = P(U1) х P( ) х P(U3)
Р(В3) = P( ) х P(U2) х P(U3)
Р(А) = Р(В1) + Р(В2) + Р(В3) = Р (1-Р)2 + Р (1-Р)2 + Р (1-Р)2 = 3Р (1-Р)2
Обозначим q=1-Р, тогда получим Р(А) = 3Рq2
Коэффициент «3» представляет собой число способов, которыми можно получить интересующее нас событие.
Учитывая, что Р=0,1 а q=0,9, получим значение искомой вероятности:
Р(А) = 3 х 0,1 х 0,92 = 0,243
1. Вопросыпотемезанятия:
1. Понятия вероятности, эксперимента, события, выборочного пространства (полной группы событий) в теории вероятности.
2. Достоверное и невозможное события.
3. Совместные и несовместные события. Понятие противоположных событий.
4. Понятия и примеры зависимых и независимых событий.
5. Равновозможные события. Понятие схемы случаев.
6. Классическая, эмпирическая и субъективная вероятности. Примеры, методы расчета.
7. Закон больших чисел.
8. Понятия суммы и произведения событий. Случаи их использования.
9. Основные теоремы теории вероятности.
10. Понятия априорной и апостериорной вероятностей.
11. Формула Байеса.
12. Схема испытаний Бернулли.
2. Тестовые задания по теме с эталонами ответов:
1. МАТЕМАТИЧЕСКАЯ НАУКА, УСТАНАВЛИВАЮЩАЯ ЗАКОНОМЕРНОСТИ СЛУЧАЙНЫХ ЯВЛЕНИЙ ЭТО
1) медицинская статистика
2) теория вероятностей
3) медицинская демография
4) высшая математика
2. ВОЗМОЖНОСТЬ РЕАЛИЗАЦИИ КАКОГО-ЛИБО СОБЫТИЯ ЭТО
1) эксперимент
2) схема случаев
3) закономерность
4) вероятность
3. ЭКСПЕРИМЕНТ ЭТО
1) процесс накопления эмпирических знаний
2) процесс измерения или наблюдения за действием с целью сбора данных
3) изучение с охватом всей генеральной совокупности единиц наблюдения
4) математическое моделирование процессов реальности
4. ПОД ИСХОДОМ В ТЕОРИИ ВЕРОЯТНОСТИ ПОНИМАЮТ
1) неопределенный результат эксперимента
2) определенный результат эксперимента
3) динамику вероятностного процесса
4) отношение числа единиц наблюдения к генеральной совокупности
5. ВЫБОРОЧНОЕ ПРОСТРАНСТВО В ТЕОРИИ ВЕРОЯТНОСТИ ЭТО
1) структура явления
2) все возможные исходы эксперимента
3) соотношение между двумя самостоятельными совокупностями
4) соотношение между двумя зависимыми совокупнос-тями
6. ФАКТ, КОТОРЫЙ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННОГО КОМП-ЛЕКСА УСЛОВИЙ, МОЖЕТ ПРОИЗОЙТИ ИЛИ НЕ ПРОИЗОЙТИ
1) частота встречаемости
2) вероятность
3) явление
4) событие
7. СОБЫТИЯ, КОТОРЫЕ ПРОИСХОДЯТ С ОДИНАКОВОЙ ЧАСТОТОЙ,И НИ ОДНО ИЗ НИХ НЕ ЯВЛЯЕТСЯ ОБЪЕКТИВНО БОЛЕЕ ВОЗМОЖНЫМ, ЧЕМ ДРУГИЕ
1) случайные
2) равновероятные
3) равнозначные
4) выборочные
8. СОБЫТИЕ, КОТОРОЕ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ ПРОИЗОЙДЕТ НЕПРЕМЕННО, СЧИТАЕТСЯ
1) нужным
2) ожидаемым
3) достоверным
4) приоритетным
9. ПРОТИВОПОЛОЖНОСТЬЮ ПО ОТНОШЕНИЮ К ДОСТОВЕРНОМУ СОБЫТИЮ ЯВЛЯЕТСЯ СОБЫТИЕ
1) ненужное
2) неожиданное
3) невозможное
4) неприоритетное
10. ВЕРОЯТНОСТЬ ПОЯВЛЕНИЯ СЛУЧАЙНОГО СОБЫТИЯ
1) больше нуля и меньше единицы
2) больше единицы
3) меньше нуля
4) представлена целыми числами
11. СОБЫТИЯ ОБРАЗУЮТ ПОЛНУЮ ГРУППУ СОБЫТИЙ, ЕСЛИПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ, ХОТЯ БЫ ОДНО ИЗ НИХ
1) появится непременно
2) появится в 90% экспериментов
3) появится в 95% экспериментов
4) появится в 99% экспериментов
12. ВЕРОЯТНОСТЬ ПОЯВЛЕНИЯ КАКОГО-ЛИБО СОБЫТИЯ ИЗ ПОЛНОЙ ГРУППЫ СОБЫТИЙ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ РАВНА
1) 0
2) 0,95
3) 0,99
4) 1
13. ЕСЛИ НИКАКИЕ ДВА СОБЫТИЯ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ НЕ МОГУТ ПОЯВИТЬСЯ ОДНОВРЕМЕННО, ТО ОНИ НАЗЫВАЮТСЯ
1) достоверными
2) несовместными
3) случайные
4) вероятные
14. ЕСЛИ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ НИ ОДНО ИЗ ОЦЕНИВАЕМЫХ СОБЫТИЙ НЕ ЯВЛЯЕТСЯ ОБЪЕКТИВНО БОЛЕЕ ВОЗМОЖНЫМ, ЧЕМ ДРУГИЕ, ТО ОНИ
1) равноправные
2) совместные
3) равновозможные
4) несовместимые
15. ВЕЛИЧИНА, КОТОРАЯ ПРИ РЕАЛИЗАЦИИ ОПРЕДЕЛЕННЫХ УСЛОВИЙ МОЖЕТ ПРИНИМАТЬ РАЗЛИЧНЫЕ ЗНАЧЕНИЯ, НАЗЫВАЕТСЯ
1) случайной
2) равновозможной
3) выборочной
4) суммарной
16. ЕСЛИ НАМ ИЗВЕСТНО КОЛИЧЕСТВО ВОЗМОЖНЫХ ИСХОДОВ НЕКОТОРОГО СОБЫТИЯ И ОБЩЕЕ КОЛИЧЕСТВО ИСХОДОВ В ВЫБОРОЧНОМ ПРОСТРАНСТВЕ, ТО МОЖНО РАССЧИТАТЬ
1) условную вероятность
2) классическую вероятность
3) эмпирическую вероятность
4) субъективную вероятность
17. КОГДА МЫ НЕ ОБЛАДАЕМ ДОСТАТОЧНОЙ ИНФОРМАЦИЕЙ О ПРОИСХОДЯЩЕМ И НЕ МОЖЕМ ОПРЕДЕЛИТЬ ЧИСЛО ВОЗМОЖНЫХ ИСХОДОВ ИНТЕРЕСУЮЩЕГО НАС СОБЫТИЯ, МЫ МОЖЕМ РАССЧИТАТЬ
1) условную вероятность
2) классическую вероятность
3) эмпирическую вероятность
4) субъективную вероятность
18. ОСНОВЫВАЯСЬ НА ВАШИХ ЛИЧНЫХ НАБЛЮДЕНИЯХ, ВЫ ОПЕРИРУЕТЕ
1) объективной вероятностью
2) классической вероятностью
3) эмпирической вероятностью
4) субъективной вероятностью
19. СУММОЙ ДВУХ СОБЫТИЙ А И В НАЗЫВАЕТСЯ СОБЫТИЕ
1) состоящее в последовательном появлении или события А, или события В, исключая совместное их появление
2) состоящее в появлении или события А, или события В
3) состоящее в появлении или события А, или события В, или событий А и В вместе
4) состоящее в появлении события А и события В совместно
20. ПРОИЗВЕДЕНИЕМ ДВУХ СОБЫТИЙ А И В ЯВЛЯЕТСЯ СОБЫТИЕ, ЗАКЛЮЧАЮЩЕЕСЯ В
1) совместном появлении событий А и В
2) последовательном появлении событий А и В
3) появлении или события А, или события В, или событий А и В вместе
4) появлении или события А, или события В
21. ЕСЛИ СОБЫТИЕ А НЕ ВЛИЯЕТ НА ВЕРОЯТНОСТЬ ПОЯВЛЕНИЯ СОБЫТИЯ В, И НАОБОРОТ, ТО ИХ МОЖНО СЧИТАТЬ
1) независимыми
2) разгруппированными
3) дистанционными
4) разнородными
22. ЕСЛИ СОБЫТИЕ А ВЛИЯЕТ НА ВЕРОЯТНОСТЬ ПОЯВЛЕНИЯ СОБЫТИЯ В, И НАОБОРОТ, ТО ИХ МОЖНО СЧИТАТЬ
1) однородными
2) сгруппированными
3) одномоментными
4) зависимыми
23. ТЕОРЕМА СЛОЖЕНИЯ ВЕРОЯТНОСТЕЙ
1) вероятность суммы двух совместных событий равняется сумме вероятностей этих событий
2) вероятность последовательного появления двух совместных событий равняется сумме вероятностей этих событий
3) вероятность суммы двух несовместных событий равняется сумме вероятностей этих событий
4) вероятность непоявления двух несовместных событий равняется сумме вероятностей этих событий
24. СОГЛАСНО ЗАКОНУ БОЛЬШИХ ЧИСЕЛ, КОГДА ЭКСПЕРИМЕНТ ПРОВОДИТСЯ БОЛЬШОЕ ЧИСЛО РАЗ
1) эмпирическая вероятность стремится к классической
2) эмпирическая вероятность удаляется от классической
3) субъективная вероятность превышает классическую
4) эмпирическая вероятность не меняется по отношению к классической
25. ВЕРОЯТНОСТЬ ПРОИЗВЕДЕНИЯ ДВУХ СОБЫТИЙ А И В РАВНА ПРОИЗВЕДЕНИЮ ВЕРОЯТНОСТИ ОДНОГО ИЗ НИХ (А) НА УСЛОВНУЮ ВЕРОЯТНОСТЬ ДРУГОГО (В), ВЫЧИСЛЕННУЮ ПРИ УСЛОВИИ, ЧТО ПЕРВОЕ ИМЕЛО МЕСТО
1) теорема умножения вероятностей
2) теорема сложения вероятностей
3) теорема Байеса
4) теорема Бернулли
26. ОДНО ИЗ СЛЕДСТВИЙ ТЕОРЕМЫ УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ
1) если событие А зависит от события В, то и событие В зависит от события А
2) если событие Авлияет на событие В, то и событие В влияет на событие А
3) если событие А не зависит от события В, то и событие В не зависит от события А
4) если событие Ане влияет на событие В, то и событие В не влияет на событие А
27. ОДНО ИЗ СЛЕДСТВИЙ ТЕОРЕМЫ УМНОЖЕНИЯ ВЕРОЯТНОСТЕЙ
1) если событие А зависит от события В, то и событие В зависит от события А
2) вероятность произведения независимых событий равна произведению вероятностей этих событий
3) вероятность произведения независимых событий равна сумме вероятностей этих событий
4) вероятность произведения зависимых событий равна произведению вероятностей этих событий
28. ПЕРВОНАЧАЛЬНЫЕ ВЕРОЯТНОСТИ ГИПОТЕЗ ДО ПОЛУЧЕНИЯ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ, НАЗЫВАЮТСЯ
1) априорными
2) апостериорными
3) предварительными
4) начальными
29. ВЕРОЯТНОСТИ, ПЕРЕСМОТРЕННЫЕ ПОСЛЕ ПОЛУЧЕНИЯ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ, НАЗЫВАЮТСЯ
1) априорными
2) апостериорными
3) предварительными
4) окончательными
30. КАКАЯ ТЕОРЕМА ТЕОРИИ ВЕРОЯТНОСТИ МОЖЕТ ПРИМЕНЯТЬСЯ ПРИ ПОСТАНОВКЕ ДИАГНОЗА
1) Бернулли
2) Байеса
3) Чебышева
4) Пуассона
Эталоны ответов к тестовым заданиям:
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ |
Занятие №3
Тема: «Описательная статистика. Средние величины»
О назначении описательной статистики можно судить по ее названию: она имеет дело с числами, характеризующими ту или иную интересующую нас ситуацию. Вот примеры статистической информации: число несчастных случаев за год; средняя продолжительность жизни; уровень заболеваемости гриппом. Ценность описательной статистики заключается прежде всего в том, что она дает сжатую и концентрированную характеристику изучаемого явления.
Статистика имеет следующие основные функции: информационную, прогностическую и аналитическую.
Информационная функция статистики состоит из сбора, обобщения и представления достоверной, своевременной информации об исследуемом явлении. Часто исследованию подлежат тысячи объектов, в этом случае сплошное изучение становится невозможным и необходимо провести выборочное исследование. Поэтому важное значение приобретают технологии сбора, обработки и анализа данных.
Прогностическая функция статистики состоит в оценивании вероятностей тех или иных случайных событий, которые происходят в изучаемом процессе, показателей тех или иных случайных величин, связанных с этим процессом. Эта функция служит основой для принятия управленческих решений. С помощью этой функции можно получить сигнал о возможности появления кризисных явлений в изучаемом процессе, если не внести каких-то изменений в управление им.
Аналитическая функция статистики состоит, во-первых, в количественном исследовании тенденций развития процесса; во-вторых, в изучении этого процесса в динамике; в-третьих, в измерении связей между разными факторами, влияющими на процесс, и его результатами.
То есть, владея методами статистики, мы можем с одной стороны проанализировать имеющиеся данные, с другой – предвидеть дальнейшее развитие ситуации, учесть влияние возможных факторов и выбрать оптимальное решение, влияющее на развитие ситуации.
Объектом наблюдения описательной статистики является статистическая совокупность, состоящая из отдельных предметов или явлений – единиц наблюдения, взятых в определённых границах времени и пространства. Они объединены общей связью, но различаются по ряду варьирующихся признаков.
Единица наблюдения – первичный элемент статистической совокупности, являющийся носителем признаков, подлежащих изучению.
Статистическая совокупность, подлежащая исследованию, называется генеральной совокупностью. Теоретически генеральная совокупность может быть безгранична.
Выборочная совокупность (выборка) – подмножество (часть) генеральной совокупности, получаемое посредством случайного отбора. Смысл выборочного метода состоит в том, что извлечение из некоторой весьма пространной (или вообще беспредельной) генеральной совокупности несравненно меньших по объему выборок резко экономит время обработки данных. Процесс случайного отбора данных называется процессом рандомизации (random – «случайный»).
Важность принципа рандомизации (случайного отбора) можно проиллюстрировать следующим образом. Представим, что необходимо собрать образцы определенного вида растений с какой-то гигантской площадки (поля) с целью описать некие их свойства. Например, подсчитать среднее число зерен в колосе какого-то злака. Совокупность экземпляров данного вида, произрастающая на данном поле, и будет составлять генеральную совокупность. Понятно, что, если поле действительно очень большое, то в разных его частях система природных факторов, влияющих на рост и развитие растений, будет складываться несколько иначе: будет сказываться разница в структуре почвы, рельефе, глубине подпочвенных вод, осадках, удаленность от дороги или лесной опушки и т.д. В результате, как это действительно и происходит на практике, в разных местах поля колосья заведомо будут различны, поэтому если вы будете собирать образцы лишь с одного чем-то лично вам понравившегося участка (например, «далеко ходить не надо» или другие личные мотивы), то практически гарантированно вы получите искаженные сведения о генеральной совокупности. Действительно, ведь вам будут, как правило, попадаться объекты, у которых интересующее вас свойство будет содержаться либо «в избытке», либо «в недостатке». Иными словами, вы внесете в данные некую нарочитую тенденцию, вольно или невольно вызовите их смещение в сторону относительно высоких ли низких значений по отношению к их действительному состоянию в генеральной совокупности. Понятно, что такой подход, независимо от того, какие объекты вас действительно интересуют (растения, животные, люди), может привести к неверным заключениям и прогнозам со всеми вытекающими последствиями. При этом совершенно неважно, внесены ли такие ошибки сознательно или непроизвольно, из самых лучших побуждений («чтобы было как лучше») или, наоборот, из желания «навредить». Рандомизация же (возвращаясь к примеру с растениями на поле) действует как механизм, позволяющий вам независимо от вашего желания-нежелания более или менее равновероятно «выдергивать» образцы из самых разных участков генеральной совокупности. Это обеспечивает нивелирование действия специфических локальных факторов на изучаемые объекты («избытки» в одном месте компенсируются «недостатками» в другом), благодаря чему свойства рандомизированной выборки приближаются к реальным свойствам генеральной совокупности.
Репрезентативность выборочной совокупности – свойство выборки корректно отражать генеральную совокупность.
Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей. Например, выборка, целиком состоящая из пациентов, больных сахарным диабетом, не репрезентирует всех пациентов больницы, но может отлично отображать пациентов-диабетиков.
Выделяют репрезентативность количественную и качественную (структурную). Количественная репрезентативность определяется числом наблюдений, гарантирующим получение статистически достоверных данных. В общем, здесь действует основной постулат закона больших чисел — «чем больше наблюдений — тем результаты достоверней» или «чем больше число наблюдений, тем больше значения характеристик выборки приближаются к соответствующим характеристикам генеральной совокупности».
Качественная репрезентативность — обозначает структурное соответствие выборочной и генеральной совокупностей. Например: если в составе генеральной совокупности 50% — лица мужского пола, то и в выборочной группе их должно быть 50%.
В силу закона больших чисел выборка будет качественно репрезентативной только в том случае, если ее осуществить случайно. Проводить отбор случайно – значит обеспечить выполнение условия, что каждый объект выборки отбирается случайно из генеральной совокупности.
Для каждого объекта (единицы наблюдения) регистрируют один и тот же признак или признаки. Например, регистрируется рост и масса людей; численность населения, уровень рождаемости и смертности для городов; объем памяти и т.д. Признак, который регистрируется для каждого из объектов, называют переменной.
Наборы данных классифицируют по следующим признакам:
· по количеству переменных (одномерные, двумерные или многомерные наборы данных);
· по типу данных (количественные или качественные);
· по тому, важна ли упорядоченность данных во времени или нет.
Одномерные наборы данных содержат только один признак для каждого объекта. Эти данные позволяют определить типичное значение признака – то, насколько значения отличаются друг от друга, требуют ли отдельные данные особого внимания. Примером одномерных данных является информация о средней рождаемости в стране по регионам. Она позволяет назвать регионы с самым высоким и с самым низким уровнем рождаемости.
Двумерные наборы данных содержат информацию о двух признаках для каждого из объектов. Кроме того, что они дают возможность получить два набора одномерных данных. Двумерные данные также позволяют установить, существует ли связь между двумя переменными, насколько сильно связаны переменные, можно ли предсказать значение одной переменной по значению другой и если да, то с какой надежностью. Например, данные опроса студентов о том, удовлетворены ли они уровнем теоретической и практической подготовки, получаемой в вузе (значения обеих переменных записываются в виде да/нет или 1/0), позволяют установить, есть ли связь между уровнями теоретической и практической подготовки.
Многомерные данные содержат информацию о трех или более признаках для каждого объекта. В дополнение к той информации, которую можно извлечь из одномерных и двумерных наборов, многомерные данные можно использовать для получения информации о том, существует ли простая зависимость между этими признаками, насколько они взаимосвязаны (речь идет не только о попарной взаимосвязи признаков, но и о зависимости в совокупности), можно ли предсказать значение одной переменной на основании значений остальных.
Признаки, или переменные, могут принимать различные конкретные значения. Различают следующие виды признаков:
Качественные или номинальные – признаки, не поддающиеся непосредственному измерению (номинальная шкала). Состоит из взаимоисключающих категорий. Например, характеристики пациента: диагноз, пол, профессия, семейное положение. Пример: семейный статус – холост, женат, разведен, вдовец; вид заболевания – астма, бронхит, пневмония.
Качественные данные, которые могут быть отнесены только к двум противоположным категориям «да» – «нет», принимающие одно из двух значений (выжил – умер; курит – не курит), называются дихотомическими (бинарными). Даже если значениям качества можно приписать числа (например, полу человека приписать соответственно числа 0 и 1), то обрабатывать эти числа как количественные данные нельзя.
Порядковые или ранжируемые – признаки, которые можно расположить в естественном порядке (ранжировать), но при этом отсутствует количественная мера расстояния между величинами. Примером являются оценка тяжести состояния пациента, стадия болезни, самооценка состояния здоровья. При этом допускается, что тяжелое течение заболевания «хуже», чем среднетяжелое, а очень тяжелое – «еще хуже», однако нельзя сказать во сколько или на сколько хуже. Можно сказать, что порядковые данные занимают промежуточное положение между количественными и качественными типами. Их можно упорядочить как количественные данные, но над ними нельзя производить арифметические действия, как и над качественными данными.
Количественные или интервальные – признаки, количественная мера которых четко определена. Это наиболее удобный для статистического анализа тип данных.
Количественные признаки могут быть:
- непрерывными – принимающими любое значение на непрерывной шкале; например: масса тела, температура, биохимические показатели крови;
- дискретными – принимающими значения лишь из некоторого списка определенных чисел, обычно целых; например: число рецидивов, число детей в семье, число заболеваний у одного больного, число выкуриваемых сигарет, число вызовов "скорой помощи", поступающих в больницу.
По роли в статистической совокупности учетные признаки можно подразделить на факторные (факториальные) и результативные (результирующие) признаки.
Результативный признак — зависимый, изменяющий свое значение под влиянием другого, связанного с ним и действующего на него факторного признака. Например: количество выкуренных сигарет – факторный признак, вероятность возникновения заболевания легких и сердца – результативный признак. Ролевая значимость этих признаков иногда может меняться. Например: концентрация инсулина в крови и концентрация сахара крови. Высокий уровень сахара крови вызывает усиленный выброс инсулина в кровь. В то же время повышение концентрации инсулина ведет к снижению сахара крови. Так же как реализация скрининг исследований инфекционных заболеваний влияет на своевременность выявления, снижение риска инфицирования и числа зараженных (это впоследствии уменьшает эффективность скрининга и целесообразность его проведения).
Все единицы наблюдения, относящиеся к одной статистической совокупности, имеют некоторое число общих учетных признаков, свидетельствующих о принадлежности конкретной единицы наблюдения к этой совокупности. Такие признаки называются признаками сходства (место работы, время работы на предприятии, место жительства и т.п.). Эти признаки описывают обязательное условие статистического наблюдения: единство места и времени исследования.
Признаки различия представляют индивидуальные особенности (характеристики) каждой единицы наблюдения. В медицинских исследованиях это могут быть пол, возраст, производственный или профессиональный стаж, заболеваемость и т.п. Строго говоря, признаки различия и являются конечным объектом статистического исследования.
Многие статистические данные получают в процессе измерений. Целью измерений является получение информации о признаках объектов, организмов, событий. Измеряется не сам объект, а только свойства или отличительные признаки объекта. Например, измеряется не ребенок, а его рост и масса. Измерения осуществляются путем установления соответствия между числами и объектами, которые являются носителями подлежащих измерению свойств. Измерения могут проводиться на разных уровнях. Различным уровням измерений соответствуют различные шкалы:
1) номинальная шкала;
2) порядковая, или ранговая, шкала;
3) шкала интервалов;
4) шкала отношений, или шкала пропорций;
5) логарифмическая шкала.
Номинальная шкала используется для регистрации самого низшего уровня измерений, предполагающего наличие минимальных предпосылок для измерения. При измерениях на данном уровне практически не используются числа. Здесь важно установить подобие или различие объектов по некоторому признаку. Например, распределение жителей по половому признаку. С помощью подсчета можно установить число мужчин и женщин в каждом регионе.
Порядковая, или ранговая, шкала указывает лишь последовательность носителей признака или направление степени выраженности признака.
Например, учащихся можно ранжировать по количеству правильно выполненных тестовых заданий. Пусть учащиеся А, Б, В, Г, Д правильно выполнили соответственно 21, 16, 12, 9 и 3 задания. Графически это можно изобразить так:
Эта порядковая шкала имеет величины от 1 до 5, и учащиеся на ней размещены в зависимости от количества правильно выполненных заданий: А – первый, Д – пятый. Из рисунка видно, что интервалы, разделяющие места в ряду, различны по величине. По этой причине нецелесообразно складывать, вычитать, умножать и делить порядковые места.
Шкала оценок по одному предмету является порядковой шкалой, так как интервалы между отдельными баллами не отражают разрыва между реальными результатами. Мы знаем только, что ученик, получивший оценку "5" по какому-то предмету, знает этот предмет лучше того, кто получил "4". Но нельзя утверждать, что различие в знаниях этих учащихся такое же, как и в знаниях тех, кто получил "4" и "3". Так как шкала оценок является порядковой шкалой, то некорректно выставлять итоговую оценку как среднюю арифметическую текущих оценок.
На шкале интервалов равные интервалы отображают одинаковую меру величины измеряемого признака. Например, 1оС между 23оС и 24оС на шкале Цельсия имеет такой же смысл, как и 1оС между 11оС и 12оС. Другими словами, на шкале интервалов расстояния между соседними делениями равны. На интервальной шкале вполне осмысленным является вопрос "на сколько?". Но, пользуясь интервальной шкалой, нельзя сформулировать вопрос "во сколько раз?". Дело в том, что на шкале интервалов устанавливаются произвольно начало отсчета (нуль шкалы), единица измерения и направление отсчета. Примером интервальной шкалы является температурная шкала по Цельсию. Разность между температурами воздуха +30 и +20°С столь же велика, как и между -10 и -20°С. Однако, нельзя утверждать, что при температуре воздуха +30°С в полтора раза теплее, чем при температуре +20°С. Даже если температура воздуха равна 0°С, нельзя утверждать, что тепла нет совсем: ведь начало отсчета выбрано произвольно.
Также шкалой интервалов является шкала коэффициента интеллекта IQ.
Шкала интервалов является метрической, с ее помощью можно выполнять сложение и вычитание. Она имеет значительные преимущества по сравнению с номинальной и порядковой шкалами.
Шкала отношений, или шкала пропорций, кроме равенства интервалов между соседними делениями шкалы, также дает возможность устанавливать отношения значений измеряемого признака. Это возможно благодаря тому, что значению шкалы "0" соответствует величина, для которой измеряемый признак отсутствует. Другими словами, начало отсчета на этих шкалах выбирают непроизвольно. Примерами шкалы отношений являются меры длины (м, см и т.д.) и массы (кг, г и т.д.). Предмет длиной 100 см вдвое длиннее предмета длиной 50 см.
Важно упомянуть о логарифмической шкале. Иногда данные нуждаются в преобразованиях. В частности, потребность в этом возникает, когда в ряду данных одно или несколько значений существенно превышают остальные. Если данные явно несимметричны, то каждое значение приведенного набора данных заменяют логарифмом этого значения с целью упростить статистический анализ. Логарифмирование преобразует "скошенные" (асимметричные) данные в более симметричные, так как происходит "растягивание" шкалы возле нуля. При этом малые значения, сгруппированные вместе, распределяются вдоль шкалы. В то же время логарифмирование собирает вместе большие значения на правом конце шкалы. Наиболее часто применяют десятичные и натуральные логарифмы. Равным расстояниям на логарифмической шкале соответствует равные процентные увеличения на исходной шкале, а не равные увеличения значений.
Пример
В таблице представлена численность населения (в тыс. чел.) в республиках бывшего СССР в 1976 г.
Россия | Украина | Белоруссия | Узбекистан | Казахстан |
Грузия | Азербайджан | Литва | Молдавия | Латвия |
Киргизия | Таджикистан | Армения | Туркмения | Эстония |
Заменим все значения их десятичными логарифмами. В нижеприведенной таблице вместо численности населения представлены их десятичные логарифмы.
Россия | Украина | Белоруссия | Узбекистан | Казахстан |
8,13 | 7,69 | 6,97 | 7,15 | 7,16 |
Грузия | Азербайджан | Литва | Молдавия | Латвия |
6,69 | 6,76 | 6,52 | 6,59 | 6,40 |
Киргизия | Таджикистан | Армения | Туркмения | Эстония |
6,53 | 6,54 | 6,45 | 6,41 | 6,16 |
Эти данные симметрично группируются вокруг среднего значения 6,81.
Вариационный ряд – ряд числовых измерений какого-либо признака, отличающихся друг от друга по своей величине и расположенных в определенном порядке (возрастания или убывания).
Каждое числовое значение в вариационном ряду называют вариантой ().При большой численности наблюдений некоторые варианты повторяются. В связи с этим в вариационном ряду принято выделять частоты (р). Частота данной варианты – это количество элементов совокупности, имеющих одинаковое числовое значение. Отношение частоты варианты к объему совокупности (или общему числу наблюдений n) назвали относительной частотой варианты и обозначили через , при этом выполняется условие v 1 + v 2 +... + vk = 1.
Виды вариационных рядов:
1. В зависимости от вида случайной величины:
- дискретный;
- непрерывный.
2. В зависимости от группировки вариант:
- несгруппированный;
- сгруппированный (интервальный):
3. В зависимости от частоты, с которой каждая варианта встречается в вариационном ряду:
- простой (р =1);
- взвешенный (р>1).
Вариационный ряд можно разбивать на отдельные (по возможности равные) части, которые называются квантилями. Наиболее часто употребляемые квантили представлены в таблице:
Средняя величина – это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
В зависимости от характера задачи пользуются тем или иным видом средней величины. К ним принадлежат среднее арифметическое, мода, медиана, степенные средние (среднее гармоническое, среднее геометрическое и т.п.).
Пусть имеется n объектов, для которых измерена некоторая характеристика, и получены значения , ,..., . Среднее арифметическое этих n значений обозначают через М и определяют как
это также может быть записано следующим образом:
Медиана, или средняя точка, может быть вычислена как для порядковых, так и для количественных данных. Если все элементы совокупности размещены в порядке возрастания или убывания числовых значений признака, то медиана – это такое значение признака, которое делит всю совокупность пополам.
Итак, количество элементов совокупности, имеющих значение признака, меньшее медианы, равно количеству элементов со значением признака, большим медианы. Будем обозначать медиану символом Ме.
При нахождении медианы дискретного вариационного ряда следует различать два случая:
1) объем совокупности нечетный;
2) объем совокупности четный.
Если объем совокупности нечетный и равен (2 n +1), и варианты размещены в порядке возрастания их значений:
то .
Если же количество элементов четное и равно 2 n, то нет варианты, которая бы делила совокупность на две равные по объему части:
поэтому в качестве медианы условно берется полусумма вариант, находящихся в середине вариационного ряда:
Медиана обладает важными свойствами, которые в некоторых случаях дают ей преимущество перед другими средними величинами. Например, если при упорядоченном размещении некоторого признака "крайние" значения сомнительные и к тому же резко отличаются от основной массы данных, то в качестве меры центральной тенденции целесообразно использовать медиану. Это связано с тем, что на ее величину эти "крайние" значения никакого влияния не оказывают, а в то же время они могут существенным образом повлиять на значение среднего арифметического.
Среднее арифметическое является хорошей мерой центральной тенденции для количественных данных, не имеющих выбросов; медиана - для порядковых данных и для количественных данных, в том числе и при наличии выбросов. Подобная характеристика нужна и для номинальных данных. Такой характеристикой является мода. Она применяется как для неупорядоченных категорий, так и для упорядоченных, и для количественных данных.
Мода – это такое значение признака, которое встречается наиболее часто. В случае дискретных рядов вычислить моду нетрудно. Достаточно найти варианту, которая имеет наибольшую частоту или относительную частоту, это и будет мода. Будем обозначать моду символом Мо.
Если все значения в вариационном ряде встречаются одинаково часто, то считают, что этот ряд не имеет моды.
Если два соседних значения вариационного ряда имеют одинаковую частоту, и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих значений.
Если два не соседних значения вариационного ряда имеют одинаковую частоту, и она больше частоты любого другого значения, то считают, что вариационный ряд имеет две моды, а соответствующее распределение называют бимодальным .
Пример использования моды в медицинских исследованиях: требуется определить среднюю длительность госпитализации рабочих промышленных предприятий в связи с производственным травматизмом.
Число дней госпитализации | Итого | ||||||||
Число рабочих |
При визуальном анализе графического изображения распределения видно, что ряд распределения несимметричен: вершина распределения сдвинута в начало ряда. Если определять среднюю величину на основе среднего арифметического (М), то средняя длительность одной госпитализации составит 4,2 дня. Однако, чаще всего (Мо) длительность госпитализации составляла 3 дня.
Для правильного выбора пути статистического анализа необходимо знать вид распределения изучаемого признака.
Под видом распределения случайной величины понимают соответствие, устанавливаемое между всеми возможными числовыми значениями случайной величины и вероятностями их появления в совокупности. Вид (закон) распределения может быть представлен:
- аналитической зависимостью в виде формулы;
- в виде графического изображения;
- в виде таблицы.
Виды распределений
Если выйти на улицу любого города и случайным образом выбранных прохожих спросить о том, какой у них рост, вес, возраст, доход и т.п., а потом построить график любой из этих величин, то получится функция распределения данной величины. В зависимости от исследуемого признака получаемые графики могут быть различны.
Посмотрим, как можно построить такой график на примере данных роста. Сначала, просто запишем результаты исследования. Потом, отсортируем всех людей по группам, так чтобы каждый попал в свой диапазон роста, например, "от 180 до 181 включительно". После этого необходимо посчитать количество людей в каждой подгруппе (диапазоне) –это будет частота попадания роста жителей города в данный диапазон. Если затем эти частоты построить по оси у, а диапазоны отложить по оси х, можно получить гистограмму – упорядоченный набор столбиков, ширина которых равна, в данном случае, одному сантиметру, а высота будет равна той частоте, которая соответствует каждому диапазону роста. Если зарегистрированных данных было достаточно много, то полученный график будет выглядеть примерно так:
Дальше можно уточнить задачу. Каждый диапазон разбить на десять, жителей рассортировать по росту с точностью до миллиметра. Диаграмма станет глаже, но уменьшится по высоте, т.к. в каждом маленьком диапазоне количество жителей уменьшается. Если гипотетически повторить эту процедуру несколько раз, будет вырисовываться колоколообразная фигура, которая характерна для нормального (или Гауссова) распределения:
Стандартизированные кривые нормального распределения, значения функций которых приводятся в таблицах книг по статистике, всегда имеют суммарную площадь под кривой равную единице. Это связано с тем, что вероятность достоверного события всегда равна 100% (или единице), а для любого человека иметь хоть какое-то значение роста – достоверное событие.
Выделяют большое количество видов распределения признака в статистической совокупности. Остановимся на их краткой характеристике:
1) нормальное распределение
2) асимметричное распределение
- правостороннее
- левостороннее
- бимодальное
3) альтернативное распределение
Нормальное (Гауссово, симметричное, колоколообразное) распределение – одно из самых важных распределений в статистике. Оно характеризуется тем, что наибольшее число наблюдений имеет значение, близкое к среднему, и чем больше значения отличаются от среднего, тем меньше таких наблюдений. Примерами характеристик, подчиняющихся нормальному распределению, являются показатели роста, веса, какие-либо биохимические показатели крови.
Гауссово распределение характеризует распределение непрерывных случайных величин и встречается в природе наиболее часто, за что и получило название «нормального».
Кривая нормального распределения имеет следующие свойства:
· колоколообразна (унимодальна);
· симметрична относительно среднего;
· сдвигается вправо, если среднее увеличивается, и влево, если среднее уменьшается (при постоянной дисперсии).
Среднее арифметическое, мода и медиана при нормальном распределении равны и соответствуют вершине распределения:
Нормальное распределение описывает явления, которые носят вероятностный, слу чайный характер, а также совместное воздействие на изучаемое явление небольшого числа случайно сочетающихся факторов. Однако, если какой-либо фактор играет преобладающую роль, то распределение не будет подчиняться Гауссову закону. Например, при исследовании показателя сахара крови для больных сахарным диабетом кривая распределения, имеющая симметричную форму для совокупности здоровых пациентов, станет несимметричной, и ее максимум сместится вправо (левостороннее асимметричное распределение).
При асимметричном распределении данных наиболее полезной мерой центральной тенденции становится медиана. Это связано с тем, что на простую среднюю арифметическую сильно влияют экстремальные (очень высокие или очень низкие) значения, из-за чего она может стать причиной неверной интерпретации результатов. Медиана же менее подвержена влиянию экстремальных величин.
Если график распределения имеет правостороннюю асимметрию ("хвост" вправо, в вариационном ряду преобладают варианты меньших значений), то в этом случае мода размещена левее, а среднее арифметическое (на рисунке обозначено как ) – правее медианы:
Обратное расположение имеет место при левосторонней асимметрии графика. При этом, чем больше асимметричен график, тем больше расстояние между его средними точками.
Проиллюстрируем важность выбора медианы, а не среднего арифметического значения на следующем примере. График заработной платы для жителей России имеет правостороннее асимметричное распределение (большинство людей имеет небольшую заработную плату). В силу того, что разброс минимальной и максимальной величин заработной платы очень велик, экстремальные значения сильно сказываются на значении среднего арифметического М (на рисунке обозначено как ). В связи с этим М сильно сдвигается в сторону «хвоста» распределения (вправо) и не может характеризовать заработную плату, соответствующую большей части населения.
Бимодальное (двугорбое) распределение наблюдается тогда, когда исследуемый признак анализируется вне однородной совокупности и, следовательно, необходимо учитывать два средних значения признака для достоверного анализа. Пример: при оценке физического развития детей подростков распределение роста будет иметь две моды (соответствующие девочкам и мальчикам).
Альтернативное распределение наблюдается в том случае, когда значения исследуемого признака распределяются по принципу: «да/нет», т.е. взаимоисключают друг друга. Подобное распределение характерно для описания качественных признаков (пример: мужской, женский пол).
Использование средних величин в медицине и здравоохранении:
а) для оценки состояния здоровья — например, параметров физического развития (средний рост, средний вес, средний объем жизненной емкости легких и др.), соматических показателей (средний уровень сахара в крови, средний пульс, средняя СОЭ и др.);
б) для оценки организации работы лечебно-профилактических и санитарно-противоэпидемических учреждений, а также деятельности отдельных врачей и других медицинских работников (средняя длительность пребывания больного на койке, среднее число посещений за 1 ч. приема в поликлинике и др.);
в) для оценки состояния окружающей среды.
В медицинских исследованиях из средних величин наиболее часто используется среднее арифметическое. В то же время, у больных людей значения многих физиологических параметров имеют асимметричное распределение, ввиду того, что изменяются в сторону увеличения или уменьшения под влиянием заболевания. Поэтому для характеристики центральной тенденции их распределения, во многих случаях, более обоснованным является как раз использование медианы, а не средней арифметической.
1. Вопросыпотемезанятия:
1. Понятия генеральной и выборочной совокупностей.
2. Репрезентативность выборочной совокупности, качественная и количественная репрезентативность.
3. Одномерные, двумерные и многомерные наборы данных, понятия и примеры.
4. Виды признаков: качественные, порядковые, количественные. Их характеристика, примеры.
5. Факторные и результативные признаки.
6. Понятие временного ряда, медико-биологические примеры.
7. Шкалы измерения признаков.
8. Понятие вариационного ряда, его характеристики.
9. Виды вариационных рядов.
10. Понятия среднего арифметического, моды и медианы для вариационного ряда. Расчет этих характеристик.
11. Примеры использования среднего арифметического, моды и медианы в медицинских исследованиях.
12. Виды распределения случайной величины.
13. Мода, медиана и среднее арифметическое для нормального и ассиметричного распределений.
2. Тестовые задания по теме с эталонами ответов:
1. СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ – ЭТО
1) группа определенных признаков
2) группа объектов, обладающих признаками сходства и различия
3) группа относительно однородных элементов (единиц наблюдения), взятых в единых границах времени и пространства
4) группа явлений, объединенных в соответствии с целью исследования
2. ПЕРВИЧНЫМ ЭЛЕМЕНТОМ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ ЯВЛЯЕТСЯ
1) объект наблюдения
2) признак
3) единица наблюдения
4) группа признаков
3. ЕДИНИЦА НАБЛЮДЕНИЯ В СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ – ЭТО
1) признак
2) первичный элемент совокупности, обладающий учитываемыми признаками
3) группа признаков
4) заболевание
4. ЕДИНИЦА СОВОКУПНОСТИ – ЭТО
1) описка по рассеянности или невнимательности
2) первичный элемент объекта статистического наблюдения, являющийся носителем признаков, подлежащих регистрации
3) разметка бланков по условным знакам
4) первичный элемент, из которых состоит вся наблюдаемая статистическая совокупность
5. ПРИЗНАК – ЭТО
1) объект статистического исследования
2) первичный элемент статистическойсовокупности
3) свойство, проявлением которого один предмет отличается от другого
4) характеристика статистической совокупности
6. К КАЧЕСТВЕННЫМ ПРИЗНАКАМ ОТНОСЯТСЯ
1) рост
2) пол
3) масса тела
4) жизненная емкость легких
7. К КОЛИЧЕСТВЕННЫМ ПРИЗНАКАМ ОТНОСЯТСЯ
1) рост
2) пол
3) исход заболевания
4) вид заболевания
8. ВЫБОРОЧНАЯ СОВОКУПНОСТЬ ЭТО
1) группа, состоящая из относительно однородных элементов, взятых в единых границах времени и пространства
2) совокупность, состоящая из всех единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования
3) часть генеральной совокупности, отобранная специальными методами и предназначенная дляеехарактерис-тики
4) совокупность всех единиц наблюдения, которые могут быть отнесены к ней в соответствии с целью исследования
9. РЕПРЕЗЕНТАТИВНОСТЬ – ЭТО
1) достаточный объем генеральной совокупности
2) достаточный объем выборочной совокупности
3) непохожесть выборочной совокупности на генеральную
4) способность выборочной совокупности наиболее полно представлять генеральную
10. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРОЧНОЙ СОВОКУПНОСТИ ПО ОТНОШЕНИЮ К ГЕНЕРАЛЬНОЙ ОБЕСПЕЧИВАЕТ
1) обязательное соблюдение временных границ
2) достаточный объем наблюдений
3) оценка показателей в динамике
4) обязательное соблюдение пространственных границ
11. ДОСТОИНСТВА СРЕДНЕЙ ВЕЛИЧИНЫ СОСТОЯТ В ТОМ, ЧТО ОНА
1) позволяет анализировать большое число наблюдений
2) позволяет выявить закономерности при малом числе наблюдений и большом разбросе показателей
3) позволяет с помощью одного числа получить представления о совокупности массовых явлений
4) позволяет с помощью одного числа получить представления о распространенности массовых явлений
12. ЕДИНИЦА НАБЛЮДЕНИЯ ОПРЕДЕЛЯЕТСЯ В ЗАВИСИМОСТИ ОТ
1) программы исследования
2) плана исследования
3) цели и задач исследования
4) количества наблюдений
13. ВАРИАЦИОННЫЙ РЯД – ЭТО
1) ряд числовых измерений признака, расположенных в ранговом порядке и характеризующихся определенной частотой
2) ряд цифровых значений различных признаков
3) генеральная совокупность
4) ряд чисел, отражающих частоту (повторяемость) цифровых значений изучаемого признака
14. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ – ЭТО
1) варианта с наибольшей частотой
2) разность между наибольшей и наименьшей величиной
3) обобщающая величина, характеризующая размер варьи-рующего признака совокупности
4) варианта, находящаяся в середине ряда
15. МЕДИАНА – ЭТО
1) варианта с наибольшей частотой
2) разность между наибольшей и наименьшей величиной
3) обобщающая величина, характеризующая размер варьи-рующего признака совокупности
4) варианта, находящаяся в середине ряда
16. МОДА – ЭТО
1) варианта с наибольшей частотой
2) разность между наибольшей и наименьшей величиной
3) обобщающая величина, характеризующая размер варьи-рующего признака совокупности
4) варианта, находящаяся в середине ряда
17. ПРОЦЕСС СЛУЧАЙНОГО ОТБОРА ДАННЫХ НАЗЫВАЕТСЯ
1) рандомизацией
2) выборкой
3) репрезентативностью
4) экспликацией
18. ПРИЗНАК: «НАЛИЧИЕ ИЛИ ОТСУТСТВИЕ БОЛЕЗНИ» ЯВЛЯЕТСЯ
1) количественным
2) непрерывным
3) дискретным
4) дихотомическим
19. ЗАВИСИМЫЙ ПРИЗНАК, ИЗМЕНЯЮЩИЙ СВОЕ ЗНАЧЕНИЕ ПОД ВЛИЯНИЕМ ДРУГОГО, НАЗЫВАЕТСЯ
1) факторный
2) результативный
3) дискретный
4) непрерывный
20. ШКАЛА, УКАЗЫВАЮЩАЯ СТЕПЕНЬ ВЫРАЖЕННОСТИ ПРИЗНАКА
1) номинальная
2) интервальная
3) порядковая
4) логарифмическая
21. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ СОСТОИТ ИЗ
1) отдельных единиц наблюдения, взятых в известных границах времени и пространства
2) всех единиц наблюдения, которые могут быть отнесены к ней в соответствии с целью исследования
3) всех единиц наблюдения, которые могут быть отнесены к ней независимо от цели исследования
4) всех единиц наблюдения, обладающих определенным признаком
22. ОДНОЙ ИЗ СРЕДНИХ ВЕЛИЧИН ЯВЛЯЕТСЯ
1) показатель соотношения
2) медиана
3) среднее квадратическое отклонение
4) интенсивный показатель
23. ОТНОШЕНИЕ СУММЫ ЗНАЧЕНИЙ ВСЕХ ВАРИАНТ К ОБЩЕМУ ИХ КОЛИЧЕСТВУ – ЭТО
1) медиана
2) средняя арифметическая
3) мода
4) среднее квадратическое отклонение
24. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ ВЕЛИЧИНА ПРИМЕНЯЕТСЯ В ЦЕЛЯХ
1) обобщения числовых характеристик варьирующего явления при разработке или сводке материала
2) обобщения качественных характеристик
3) сравнения и сопоставления явлений
4) разработки нормативов
25. ИЗ ПРИВЕДЕННЫХ СРЕДНИХ НАИБОЛЕЕ ЧАСТО В МЕДИЦИНСКИХ ИССЛЕДОВАНИЯХ ИСПОЛЬЗУЮТСЯ
1) средняя геометрическая
2) средняя арифметическая
3) средняя гармоническая
4) средняя алгебраическая
26. ВЕЛИЧИНЫ, РАЗБИВАЮЩИЕ ВАРИАЦИОННЫЙ РЯД НА ОТДЕЛЬНЫЕ (ПО ВОЗМОЖНОСТИ РАВНЫЕ) ЧАСТИ, ЭТО
1) квантили
2) варианты
3) ошибки средних величин
4) уровни ряда
27. НА ЧЕТЫРЕ РАВНЫЕ ЧАСТИ ВАРИАЦИОННЫЙ РЯД РАЗДЕЛЯЮТ
1) медиана
2) терцили
3) квартили
4) процентили
28. ЕСЛИ ДВА СОСЕДНИХ ЗНАЧЕНИЯ ВАРИАЦИОННОГО РЯДА ИМЕЮТ ОДИНАКОВУЮ ЧАСТОТУ, ТО
1) ряд не имеет моды
2) мода равняется среднему арифметическому этих значений
3) вариационный ряд имеет две моды
4) модой является число, стоящее ближе к середине ряда
29. ЕСЛИ ДВА ЗНАЧЕНИЯ ВАРИАЦИОННОГО РЯДА, НЕ ЯВЛЯЮЩИЕСЯ СОСЕДНИМИ, ИМЕЮТ ОДИНАКОВУЮ ЧАСТОТУ, ТО
1) ряд не имеет моды
2) мода равняется среднему арифметическому этих значений
3) вариационный ряд имеет две моды
4) модой является число, стоящее ближе к середине ряда
30. В ЗАВИСИМОСТИ ОТ ВИДА СЛУЧАЙНОЙ ВЕЛИЧИНЫ РАЗЛИЧАЮТ СЛЕДУЮЩИЕ ВИДЫ ВАРИАЦИОННЫХ РЯДОВ
1) несгруппированный и сгруппированный
2) моментный и интервальный
3) дискретный и непрерывный
4) простой и сложный
31. КАЧЕСТВЕННЫЕ ДАННЫЕ, КОТОРЫЕ МОГУТ БЫТЬ ОТНЕСЕНЫ ТОЛЬКО К ДВУМ ПРОТИВОПОЛОЖНЫМ КАТЕГОРИЯМ, ПРИНИМАЮЩИЕ ОДНО ИЗ ДВУХ ЗНАЧЕНИЙ, НАЗЫВАЮТСЯ
1) дискретные
2) дихотомическими
3) количественными
4) непрерывные
32. КОЛИЧЕСТВЕННЫЕ ПРИЗНАКИ, ПРИНИМАЮЩИЕ ЗНАЧЕНИЯ ЛИШЬ ИЗ НЕКОТОРОГО СПИСКА ОПРЕДЕЛЕННЫХ ЧИСЕЛ, ОБЫЧНО ЦЕЛЫХ, НАЗЫВАЮТСЯ
1) непрерывными
2) дихотомическими
3) случайными
4) дискретными
33. РЯД ПОСЛЕДОВАТЕЛЬНЫХ ЗНАЧЕНИЙ, ХАРАКТЕРИЗУЮЩИХ ИЗМЕНЕНИЕ ПОКАЗАТЕЛЯ ВО ВРЕМЕНИ, И ИМЕЮЩИЙ СОДЕРЖАТЕЛЬНЫЙ СМЫСЛ, ЭТО
1) временной срез
2) временной ряд
3) произвольный ряд
4) вариационный ряд
34. ДАННЫЕ, СОДЕРЖАЩИЕ ИНФОРМАЦИЮ О ТРЕХ ИЛИ БОЛЕЕ ПРИЗНАКАХ ДЛЯ КАЖДОГО ОБЪЕКТА, НАЗЫВАЮТСЯ
1) одномерные
2) двумерные
3) многомерные
4) множественные
35. КАЖДОЕ ЧИСЛОВОЕ ЗНАЧЕНИЕ В ВАРИАЦИОННОМ РЯДУ НАЗЫВАЮТ
1) вариантой
2) случаем
3) медианой
4) модой
36. ПРИ ПРАВОСТОРОННЕЙ АСИММЕТРИИ СЛЕВА НАПРАВО РАСПОЛОЖЕНЫ
1) мода, медиана и среднее арифметическое совпадают
2) мода, далее медиана, затем среднее арифметическое
3) среднее арифметическое, далее медиана, потом мода
4) среднее арифметическое, мода, медиана
37. ЕСЛИ ГРАФИК РАСПРЕДЕЛЕНИЯ ИМЕЕТ СИММЕТРИЧНУЮ ФОРМУ, ТО
1) левее расположена мода, затем медиана и среднее арифметическое
2) левее расположена среднее арифметическое, затем медиана и мода
3) левее расположено среднее арифметическое, затем мода и медиана
4) мода, медиана и среднее арифметическое совпадают
38. ЕСЛИ ВСЕ ЗНАЧЕНИЯ В ВАРИАЦИОННОМ РЯДУ ВСТРЕЧАЮТСЯ ОДИНАКОВО ЧАСТО, СЧИТАЕТСЯ, ЧТО ЭТОТ РЯД
1) не имеет моды
2) имеет две моды
3) имеет одну моду
4) имеет три моды
39. КОЛИЧЕСТВЕННЫЕ ПРИЗНАКИ, ПРИНИМАЮЩИЕ ЛЮБОЕ ЗНАЧЕНИЕ НА НЕПРЕРЫВНОЙ ШКАЛЕ, НАЗЫВАЮТСЯ
1) дискретные
2) случайные
3) непрерывные
4) порядковые
40. РЕПРЕЗЕНТАТИВНОСТЬ, ОБОЗНАЧАЮЩАЯ СТРУКТУРНОЕ СООТВЕТСТВИЕ ВЫБОРОЧНОЙ И ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЕЙ, НАЗЫВАЕТСЯ
1) количественной
2) качественной
3) выборочной
4) случайной
Эталоны ответов к тестовым заданиям:
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ |
Занятие №4
Тема: «Описательная статистика. Показатели разнообразия признака в совокупности»
Основными критериями разнообразия признака в статистической совокупности являются: лимит, амплитуда, среднее квадратическое отклонение, коэффициент осцилляции и коэффициент вариации. На предыдущем занятии обсуждалось,