Делаем оценку параметров модели МНК
Создадим объект Equation. Для этого вводим команду ls zp_sredn c place, где salary – зависимая переменная, c – константа, и остальные – независимые переменные.
В результате оценки появится окно Equation (рис.3.1)
Рис 3.1
Проанализируем полученную модель.
Из рис3.1 видно, что:
Dop_rab(prob=0.7978<0.8%, следовательно не значимая ошибка)
M_educ2(prob=0.0000<0.01%, следовательно значимая ошибка)
S_d(prob=0.7520<0.8%, следовательно не значимая ошибка)
sex(prob=0.0000<0.01%, следовательно значимая ошибка)
stag(prob=0.8160<0.82%, следовательно не значимая ошибка)
stastus(prob=0.0010<0.01%, следовательно значимая ошибка)
udovl(prob=0.0005<0.01%, следовательно значимая ошибка)
Удалим из модели незначимые ошибки(s_d,dop_rab,stag),получим рис3.2
Рис3.2
Проанализируем полученную модель.
Заметим, что коэф. Детерминации увеличился.
Из рис3.1 видно, что:
M_educ2(prob=0.0000<0.01%, следовательно значимая ошибка)
sex(prob=0.0000<0.01%, следовательно значимая ошибка)
stastus(prob=0.0001<0.01%, следовательно значимая ошибка)
udovl(prob=0.0005<0.01%, следовательно значимая ошибка)
В итоговой модели все коэффициенты при факторах значимы, между факторами нет высокой корреляции. Что позволяет сделать вывод об отсутствии мультиколлинеарности в полученной модели.
Построим доверительные интервалы.
Константа:
доверительный интервал для 1% =[16473.3-2318.79*2.58;16473.3+2318.79*2.58] = [10492,37; 22454,23]
доверительный интервал для 5% =[16473.3-2318.79*1,96;16473.3+2318.79*1,96] = [11929.65;21016.95]
доверительный интервал для 10% =[16473.3-2318.79*1,65;16473.3+2318.79*1,65] = [12648.29;20298.31]
Образование:
доверительный интервал для 1%=[1239,422;3000.492]
доверительный интервал для 5%=[1451.024;2788.89]
доверительный интервал для 10% =[1556.824;2683.09]
Пол:
доверительный интервал для 1%=[-7073;-3334.12]
доверительный интервал для 5%=[-6624.32;-3783.44]
доверительный интервал для 10% =[-6399.66;-4008.1]
Тип населенного пункта:
доверительный интервал для 1%=[-2145.62;-481.774]
доверительный интервал для 5%=[-1945.7;-681.693]
доверительный интервал для 10% =[-1845.74;-781.653]
Удовлетворенность материальным положением:
доверительный интервал для 1%=[-1651.52;-246.244]
доверительный интервал для 5%=[-1482.66;-415.095]
доверительный интервал для 10% =[-1398.24;-499.52]
Проверка на гетероскедастичность.
Для проверки ошибок на гетероскедастичность тестом Уайта в окне Equation выбирается View / Residual Tests / White Heteroskedasticity (no cross terms). Т.к P -значение теста (Prob.) меньше 0,05, то гипотеза о гомоскедастичности отвергается (принимается гетероскедастичность) на уровне значимости 0,05 (рис. 4.1).
Рис4.1
Делаем корреляцию на гетероскедастичность: В окне Equation выбираем Estimate, в появившемся окне выбираем вкладку Options, ставим галочки в нужных полях и выбираем правильную форму записи ошибок.Рис4.2
Рис4.2.
Выводы:
После удаления из модели незначимых ошибок, в уравнении остались переменные образование, пол, удовлетворенность материальным положением, тип населенного пункта.
Сделаем по ним экономическую интерпретацию:
При увеличении числа лет обучения на 1 год, с вероятностью 0,95 уровень заработанной платы будет изменяться не более, чем на 2683,09$ и не менее чем на 1556,82$