Лабораторная работа№2
Определение основных статистических характеристик и дисперсионный анализ в MS Excel
Теоретические сведения
Раздел математики, посвященный методам сбора, анализа и обработки статистических данных для научных и практических целей, называется математической статистикой.
Данный раздел математики имеет дело с массовыми явлениями и тесно связан с теорией вероятностей, так как базируется на ее математическом аппарате.
Цель статистического исследования – исследование соотношений между статистическим данными (описательная статистика) и использование результатов данных исследований для прогнозирования и принятия решений (аналитическая статистика).
Статистические данные представляют собой данные, полученные в результате обследования большого числа объектов или явлений.
По охвату статистической совокупности исследование может быть сплошное или не сплошное. При сплошном исследовании группа формируется из всех единиц изучаемого явления (генеральная совокупность), а при не сплошном – только группа этих единиц (выборка).
Конечной же целью изучения выборочной совокупности (выборки) является получение информации не о ней самой как таковой, а о генеральной совокупности. Поэтому обычно стремятся сделать так, чтобы выборка наилучшим образом представляла генеральную совокупность, т. е. была репрезентативной и представительной.
Например, если мы хотим получить данные о поступающих во все вузы города, то абитуриенты данного университета есть выборка из более широкой генеральной совокупности – всех абитуриентов вузов города, и тем не менее эта выборка не обязательно будет являться представительной. В тех же случаях, когда генеральная совокупность недостаточно известна, обычно не удается предложить более лучшего способа чем случайный выбор элементов для выборки.
Возможности MS Excel для анализа данных
В мастере функций Excel имеется ряд специальных функций, предназначенных для вычисления выборочных характеристик. Функция СРЗНАЧ вычисляет среднее арифметическое из нескольких массивов (аргументов) чисел. Аргументы число1, число2,... — это от 1 до 30 массивов для которых вычисляется среднее.
Функция МЕДИАНА позволяет получать медиану заданной выборки.
Функция МОДА вычисляет наиболее часто встречающееся значение в выборке.
Функция ДИСП позволяет оценить дисперсию по выборочным данным.
Функция СТАНДОТКЛОН вычисляет стандартное отклонение.
Определение основных статистических характеристик
Пример 1. Провести статистический анализ методом описательной статистики доходов населения в регионе 1(выборка 1) и регионе 2 (выборка 2), рисунок 1.
Рисунок 1. Определение основных статистических характеристик
Статистические формулы вычислений для выборки 1:
1. Дисперсия =ДИСП(B3:B12)
2. Стандартное отклонение =СТАНДОТКЛОН(B3:B12)
3. Медиана =МЕДИАНА(B3:B12)
4. Мода =МОДА(B3:B12)
Самостоятельная работа
1. Найти среднее значение, медиану, моду, стандартное отклонение результатов бега на дистанцию 100 м у группы студентов (с): 12,8; 13,2; 13,0; 12,9; 13,5; 13,1.
2. Определите основные статистические характеристики для данных измерений роста групп студенток: 164, 160, 157, 166, 162, 160, 161, 159, 160, 163, 170, 171.
3. Найти наиболее популярный туристический маршрут из четырех реализуемых фирмой, если за неделю последовательно были реализованы следующие маршруты: 1, 3, 3, 2, 1, 1, 4, 4, 2, 4, 1, 3, 2, 4, 1, 4, 4, 3, 1, 2, 3, 4, 1, 1, 3.