Статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации R2 еще не гарантируют высокого качества уравнения регрессии. Оценивая линейное уравнение регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами. Если эти предположения не выполняются, то анализ значимости коэффициентов регрессии будет неточным. Причинами могут быть либо нелинейный характер зависимости между рассматриваемыми переменными, либо наличие неучтенного в уравнении существенного фактора. Действительно, при нелинейной зависимости между переменными отклонения от прямой регрессии не случайно распределены вокруг нее, а обладают определенными закономерностями, которые зачастую выражаются в существенном преобладании числа пар соседних отклонений с совпадающими знаками над числом пар с противоположными знаками. Отсутствие в уравнении регрессии какого-либо существенного фактора может также служить причиной устойчивых отклонений зависимой переменной от линии регрессии в ту или иную сторону. Добиться выполнимости предпосылок МНК можно либо путем использования какой-то другой нелинейной формулы, либо включением в уравнение регрессии новой объясняющей переменной.
При статистическом анализе уравнения регрессии на начальном этапе чаще других проверяют выполнимость одной предпосылки, а именно, условия статистической независимости отклонений между собой. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин ei.
Суть статистики Дарбина-Уотсона DW можно осмыслить следующим образом. Если каждое следующее отклонение приблизительно равно предыдущему, то каждое слагаемое в числителе дроби последней формулы близко нулю и, следовательно, статистика DW окажется близкой к нулю. В этом случае коэффициент автокорреляциидолжен быть близок к единице, что будет подтверждать наличие положительной автокорреляции остатков первого порядка (линейной зависимости между остатками).
Пошаговая регрессия
Цель пошаговой регрессии состоит в отборе из большого количества предикатов небольшой подгруппы переменных, которые вносят наибольший вклад в вариацию зависимой переменной. Обычно этот процесс выполняет автоматизированная процедура, которая вводит или выводит предикаты из уравнения регрессии по очереди, основываясь на серии F-тестов, t-тестов или других подходах.
- прямое включение (прямая пошаговая регрессия)
Вначале уравнение регрессии не содержит предикатов. Они вводятся по одному, если удовлетворяют определенному критерию. В основе порядка введения включаемых переменных лежит вклад переменной в объясняемую вариацию.
- исключение переменной (обратная пошаговая регрессия)
Вначале все предикаты входят в уравнение регрессии. Затем по очереди выводятся из уравнения исходя из их соответствия критерию.
- пошаговый подход
На каждой стадии прямое включение осуществляют одновременно с исключением переменных, которые больше не удовлетворяют конкретному критерию.
Динамический ряд.
Ряды динамики – статистические данные, отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами, временными рядами. Динамический ряд представляет собой таблицу, в которой указаны значения показателя за последовательные периоды или на моменты времени. Каждое значение показателя называется уровнем ряда. Важнейшим условием построения динамического ряда является сопоставимость его уровней. Ряд, в котором время задано в виде конкретных дат (моментов времени), называется моментным динамическим рядом. Ряд, в котором время задано в виде промежутков – лет, месяцев, суток, называется интервальным динамическим рядом.
Основные виды ДР.
Ряды динамики – статистические данные, отображающие развитие во времени изучаемого явления. Их также называют динамическими рядами, временными рядами. Динамический ряд представляет собой таблицу, в которой указаны значения показателя за последовательные периоды или на моменты времени. Каждое значение показателя называется уровнем ряда. Важнейшим условием построения динамического ряда является сопоставимость его уровней. Ряд, в котором время задано в виде конкретных дат (моментов времени), называется моментным динамическим рядом. Ряд, в котором время задано в виде промежутков – лет, месяцев, суток, называется интервальным динамическим рядом.