ОК-10, ПК-2,ПК-9,ПК-11.
Корреляция, факторный анализ и регрессия. Понятие корреляционной зависимости. Характеристика корреляционной связи по тесноте и форме. Изучение корреляционных зависимостей табличным, графическим и аналитическими методами. Парная корреляция. Последовательность вычислительных операций, примеры. Значимость коэффициента корреляции. Использование корреляционной связи для сравнения выборок.
Литература раздел 7 [1-3, 13]
Лекция 4. Стохастические модели
План лекции
1. Экспериментально-статистические методы математического описания.
2. Основные понятия теории случайных величин.
3. Построение и исследование регрессионных моделей.
4. Регрессионный анализ при пассивном и активном эксперименте.
Экспериментально-статистические методы математического описания
Наиболее распространенными экспериментально-статистическими методами математического описания являются регрессионный анализ (применительно к активному и пассивному эксперименту), динамический корреляционный анализ (анализ случайных процессов), идентификация и оценивание параметров. Они нашли широкое применение при построении прогнозирующих моделей металлургических процессов.
Все процессы, происходящие в природе, являются результатом взаимодействия многих факторов. Для того чтобы изучить эти процессы и в дальнейшем ими управлять, необходимо выяснить, какую роль в рассматриваемом процессе играет каждый фактор в отдельности. Таким образом, математические методы изучения взаимодействующих факторов требуют умения выражать действия различных факторов количественно. Однако даже самый тщательно подготовленный эксперимент не позволяет выделить интересующий нас фактор в чистом виде, т.к. всегда присутствует элемент случайности, например изменение температуры воздуха.
В основе методологии построения математических моделей стохастических процессов и зависимостей, отражающих взаимосвязи между экспериментальными данными, лежит теория случайных величин и регрессионный
анализ.
Основные понятия теории случайных величин
Случайной называется величина, которая в результате одного и того же опыта может принять то или иное заранее неизвестное значение. Случайные величины могут быть дискретными (прерывными) и непрерывными. Дискретные случайные величины принимают изолированные числовые значения, отделенные друг от друга конечными интервалами (например, число попаданий при нескольких выстрелах, число появлений герба при нескольких подбрасываниях монеты). Значения непрерывных случайных величин не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток (например, ошибка измерения, дальность полета снаряда).
Всякое соответствие между возможными значениями случайной величины и вероятностями, с которыми эти значения принимаются, называется законом распределения случайной величины. Закон распределения количественно может выражаться в следующих формах: табличной, графической и аналитической.
При количественном описании закона распределения вероятностей можно воспользоваться вероятностью события X < x, где x – текущая переменная. Вероятность этого события называется функцией распределения случайной величины X и обозначается F (x):
F (x) = P (X < x).
Одной из форм закона распределения непрерывной случайной величины является плотность распределения вероятностей f (x). Она связана с функцией распределения формулой
f (x) = F' (x).
Наиболее важную роль среди законов распределения непрерывных случайных величин играет нормальный закон. Случайная величина X называется распределенной по нормальному закону, если ее плотность распределения вероятности имеет вид (рис. 4.1)
где m − математическое ожидание величины X; σ − ее среднее квадратическое отклонение.
При решении большинства практических задач закон распределения, т.е. полная характеристика случайной величины, неудобен для использования. Поэтому чаще применяют числовые характеристики случайной величины, наиболее распространенными из которых являются математическое ожидание, дисперсия и среднее квадратическое отклонение. Математическое ожидание непрерывной случайной величины находится следующим образом:
Дисперсия D [ X ] и среднее квадратическое отклонение определяют
рассеяние случайной величины около её математического ожидания и вычисляются по формулам
При практическом применении теории вероятностей очень часто приходится сталкиваться с задачами, в которых результат опыта описывается не одной, а двумя и более случайными величинами, образующими комплекс, или систему. Свойства системы нескольких случайных величин не исчерпываются свойствами отдельных величин, ее составляющих, они включают также взаимные связи (зависимости) между случайными величинами, называемые корреляцией.
Корреляция – это связь между двумя или несколькими величинами или исследуемыми объектами. Корреляция бывает двух видов: детерминированная (определяется строгими закономерностями и обычно описывается физико-химическими формулами) и стохастическая (случайная, вероятностная – проявляется в том, что одна из величин влияет на изменение другой изменениями своего закона распределения).
Характеристикой системы двух случайных величин, описывающей тесноту связи между ними, является коэффициент корреляции