Приведем комментарии к каждому из вопросов курсовой работы.
1. В первом задании необходимо найти провести отбор двух факторов из пяти предложенных. При этом предлагается руководствоваться следующими соображениями:
· связь выбранных факторов с результирующей переменной должна быть как можно сильнее;
· связь выбранных факторов между собой должна быть как можно слабее.
Для исследования взаимосвязей факторов с результирующей переменной и между собой рекомендуется использовать матрицу парных коэффициентов корреляции. Для ее построения можно использовать инструмент «Корреляция» пакета «Анализ данных» в MS Excel.
Обратите внимание, что переименовывать переменные нельзя.
2. Для выполнения второго и последующих заданий рекомендуется использовать инструмент «Регрессия» пакета «Анализ данных» в MS Excel. Его результаты необходимо поместить в курсовую работу.
Данный вопрос посвящен построению множественной линейной регрессионной модели вида
где - уравнение множественной линейной регрессии с двумя независимым переменным.
Интерпретация параметров уравнения проводится исходя из следующих соображений: параметры и показывают на сколько единиц в среднем изменяется результирующая переменная за счет изменения соответствующего фактора на единицу при неизменных значениях второго фактора, закрепленного на среднем уровне. Также обращайте внимание на диапазон значений, допустимых для выбранного фактора. Например, удельный вес рабочих изменяется в диапазоне от 0 до 1 и его увеличение на 1 единицу невозможно. В таких случаях рассматривайте увеличение на 0,1 и т.д.
3-4. Вопросы 3 и 4 посвящены проверке качества построенной эконометрической модели. При ответах на них обязательно ссылайтесь на результаты «Анализа данных», а также на теоретические выкладки, при оформлении которых для удобства ссылок желательно пронумеровать соответствующие формулы. После вычисления указанных показателей обязательно необходимо дать их развернутую интерпретацию, подходящую именно для выбранных Вами переменных.
При проверке любых статистических гипотез рекомендуется придерживаться следующей схемы:
· Формулировка основной (нулевой) гипотезы;
· Формулировка альтернативной (конкурирующей) гипотезы;
· Указание уровня значимости (который принимаем равным 0,05, если не указано иное)
· Выбор критерия проверки и вычисление его критического (теоретического) значения (с указанием функции MS Excel, используемой для его вычисления)
· Вычисление наблюдаемого (фактического) значения критерия можно не проводить, а взять его результат из «Анализа данных», если таковой имеется (но необходимо предъявить формулу, по которой предполагается его вычисление)
· Сравнение критического и фактического значений критерия
· Вывод и экономическая интерпретация (если таковая имеется)
Если необходимый показатель отсутствует в «Анализе данных» (например, средняя относительная ошибка аппроксимации), то его необходимо рассчитать по рабочей формуле с помощью MS Excel.
Доверительные интервалы (интервальные оценки параметров регрессии) можно взять также из «Анализа данных», сделать необходимую интерпретацию, сопоставить их с выводами о значимости параметров.
5. Вопросы 5 посвящены приложениям регрессионного анализа. Точечный прогноз осуществляется простой подстановкой предложенных значений выбранных факторов в построенное уравнение регрессии. Обязательно нужно дать экономическую интерпретацию результатов прогнозирования.
При ответе на вопрос 5.2. обязательно нужно предъявить частные коэффициенты эластичности для каждого отдельного наблюдения, рассчитанные для каждого фактора. Сделать выводы о влиянии выбранных факторов на результирующую переменную. Также необходимо вычислить два средних частных коэффициента эластичности, дать развернутую интерпретацию результатов.
6. При ответе на вопрос об однородности выборки необходимо упорядочить данные по возрастанию значений фактора, наиболее тесно связанного с результирующей переменной и в соответствии с этим разделить выборку на две части.
Для каждой группы с помощью инструмента «Регрессия» пакета «Анализ данных» построим множественную регрессию . Для простоты анализа результаты представим в виде сводной таблицы (ESS –остаточная сумма квадратов):
Федеральный округ | Уравнение регрессии | Объем выборки | |||
Первая подвыборка | |||||
Вторая подвыборка | |||||
Исходная выборка |
Сравнивая значения остаточных сумм квадратов трех выборок по критерию Грегори-Чоу необходимо сделать вывод о целесообразности разделения выборки на две. Дать экономическую интерпретацию данного решения.
Вывод: Как видно из сводной таблицы наилучшим качеством среди построенной модели обладает модель для объединенной выборки остальных областей ( и выше тех же показателей для Северо-Западного округа и исходной выборки). Следовательно, действительно следует рассмотреть вопрос о возможности объединения имеющихся данных в одну выборку с помощью теста Грегори Чоу.
Итак, имеется выборка 1 объема n1=10 и выборка 2 объема n2=38. Используя пакет Анализ данных – Регрессия (Excel), находим параметры и строим уравнения регрессии:
№ выборки | Уравнение регрессии | Объем выборки | ESS | Число параметров уравнения (k) |
47705,2823 | ||||
34318,5527 | ||||
86538,1861 |
7. Завершает работу анализ остатков построенной модели (т.е. проверка предпосылок теоремы Гаусса-Маркова)Вычислим сумму . Найдем разность . Теперь найдем
Найденное значение сравнивается с . Итак, , следовательно, выборки можно объединить
Напомним, что остатки находятся по формуле:
С помощью визуального анализа графика остатков выдвигается предположении о гомоскедастичности или гетероскедастичности остатков модели.
Например, на графике остатков видно, что остатки равномерно располагаются внутри горизонтальной полосы, симметричной оси абсцисс:
Таким образом, дисперсия остатков постоянна (остатки гомоскедастичны).
Для остатков также необходимо найти точечную (числовую) оценку дисперсии остатков :
и интервальную оценки дисперсии остатков:
,где - критическое значение распределения Пирсона, найденное по таблице по числу степеней свободы и уровням значимости и .
Исследование автокорреляции в остатках производится с помощью критерия Дарбина-Уотсона:
где .
Далее, находятся числовые значения теоретических значений критерия Дарбина-Уотсона dU и dL находятся по таблице критических значений по объему выборки n, df = pm (mp - число параметров уравнения при объясняющих переменных) и уровню значимости α. С помощью критических значений числовой промежуток (0; 4) разбивается на пять отрезков и на основе правила принятия решения о зависимости остатков делается вывод об автокорреляции остатков.
После проверки указанных позиций необходимо сделать общий вывод о выполнении предпосылок теоремы Гаусса-Маркова и их влиянии на качество модели
Эконометрический анализ построенной модели заключается в оценке качества модели c помощью множественного коэффициента корреляции и множественного коэффициента детерминации, оценке математического точности модели с помощью средней относительной ошибки аппроксимации ().
Например, при =81,64% модель считается неточной. Фактические значения У отличаются от расчетных в среднем на 81,64%.
Далее, с помощью статистических критериев проверяется значимость коэффициентов уравнения и уравнения в целом.
Завершается данный раздел анализом остатков модели.
Напомним, что остатки находятся по формуле:
С помощью визуального анализа графика остатков выдвигается предположении о гомоскедастичности или гетероскедастичности остатков модели.
Например, на графике остатков видно, что остатки равномерно располагаются внутри горизонтальной полосы, симметричной оси абсцисс:
Таким образом, дисперсия остатков постоянна (остатки гомоскедастичны).
Для остатков также необходимо найти точечную (числовую) оценку дисперсии остатков :
и интервальную оценки дисперсии остатков:
,где - критическое значение распределения Пирсона, найденное по таблице по числу степеней свободы и уровням значимости и .
Исследование автокорреляции в остатках производится с помощью критерия Дарбина-Уотсона:
где .
Далее, находятся числовые значения теоретических значений критерия Дарбина-Уотсона dU и dL находятся по таблице критических значений по объему выборки n, df = m (m - число параметров уравнения при объясняющих переменных) и уровню значимости α. С помощью критических значений числовой промежуток (0; 4) разбивается на пять отрезков и на основе правила принятия решения о зависимости остатков делается вывод об автокорреляции остатков.