Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ќценка качества построенной модели (адекватности эмпирическим данным).




2.6.1  оэффициент детерминации. ƒл€ оценки качества построенной модели регрессии можно использовать коэффициент детерминации .  оэффициент детерминации может быть вычислен по формуле:

.

— другой стороны, дл€ парной линейной регрессии верно равенство:

.

ѕри близости значени€ коэффициента детерминации к 1 говор€т, что уравнение регрессии статистически значимо и фактор оказывает сильное воздействие на результирующий признак .

ѕри анализе модели парной линейной регрессии по значению коэффициента детерминации можно сделать следующие предварительные выводы о качестве модели:

¾ ≈сли , то будем считать, что использование регрессионной модели дл€ аппроксимации зависимости между переменными и статистически необоснованно.

¾ ≈сли , то использование регрессионной модели возможно, но после оценивани€ параметров модель подлежит дальнейшему многостороннему статистическому анализу.

¾ ≈сли , то будем. считать, что у нас есть основани€ дл€ использовани€ регрессионной модели при анализе поведени€ переменной .

 

—редн€€ ошибка аппроксимации.

ƒругой показатель качества построенной модели ЦЦ среднее относительное отклонение расчетных значений от фактических или средн€€ ошибка аппроксимации:

.

ѕостроенное уравнение регрессии считаетс€ удовлетворительным, если значение не превышает 10% Ц 12%.

 

ѕример.

ѕо 21 региону страны изучаетс€ зависимость розничной продажи телевизоров () от среднедушевого денежного дохода в мес€ц ().

 

Ќомер региона —реднедушевой денежный доход в мес€ц, тыс. руб., ќбъем розничной продажи телевизоров, тыс. шт.,
     
  2,4 21,3
  2,1  
  2,6 23,3
  1,7 15,8
  2,5 21,9
  2,4  
  2,6  
  2,8 23,9
  2,6  
  2,6 24,6
  2,5  
  2,9  
  2,6  
  2,2  
  2,6  
  3,3 31,9
  3,9  
    35,4
  3,7  
  3,4  

 

Ќеобходимо найти зависимость, наилучшим образом отражающую св€зь между переменными и .

–ассмотрим вопрос применени€ модели линейной регрессии в этой задаче.

ѕостроим поле коррел€ции, т.е. нанесем исходные данные на координатную плоскость. ƒл€ этого воспользуемс€, например, возможност€ми MS Excel 2003.

ѕодготовим таблицу исходных данных.

 

 

 

Ќанесем на координатную плоскость исходные данные:

 

’арактер расположени€ точек на графике дает нам основание предположить, что искома€ функци€ регрессии линейна€: . ƒл€ оценки коэффициентов уравнени€ регрессии необходимо составить и решить систему нормальных уравнений ().

 

ѕо исходным данным рассчитываем необходимые суммы:

Ќомер региона
           
  2,4 21,3 51,12 5,76 453,69
  2,1   44,1 4,41  
  2,6 23,3 60,58 6,76 542,89
  1,7 15,8 26,86 2,89 249,64
  2,5 21,9 54,75 6,25 479,61
  2,4     5,76  
  2,6   57,2 6,76  
  2,8 23,9 66,92 7,84 571,21
  2,6   67,6 6,76  
  2,6 24,6 63,96 6,76 605,16
  2,5   52,5 6,25  
  2,9   78,3 8,41  
  2,6   54,6 6,76  
  2,2   52,8 4,84  
  2,6   62,4 6,76  
  3,3 31,9 105,27 10,89 1017,61
  3,9   128,7 15,21  
    35,4 141,6   1253,16
  3,7   125,8 13,69  
  3,4   105,4 11,56  
—умма 57,4 530,1 1504,46 164,32 13926,97

 

—оставл€ем систему уравнений:

»меем систему линейных алгебраических уравнений, котора€ может быть решена, например, по формулам  рамера. ƒл€ этого вычислим следующие определители:

“огда, согласно теореме  рамера,

ѕолучаем уравнение регрессии:

¬еличина коэффициента регрессии означает, что увеличение среднедушевого мес€чного дохода на 1 тыс. руб. приведет к увеличение объема розничной продажи в среднем на 7 540 телевизоров.  оэффициент в данном случае не имеет содержательной интерпретации.

 

ќценим тесноту линейной св€зи между переменными и качество построенной модели в целом.

ƒл€ оценки тесноты линейной зависимости рассчитаем коэффициент детерминации. ƒл€ этого необходимо провести р€д дополнительных вычислений.

 

ѕрежде всего, найдем выборочное среднее по формуле:

.

ƒл€ рассматриваемого примера имеем:

“еперь произведем расчет остальных вспомогательных величин:

 

Ќомер региона
      19,76 8,24 67,89 2,76 7,60
  2,4 21,3 22,75 -1,45 2,11 -3,94 15,55
  2,1   20,51 0,49 0,24 -4,24 18,00
  2,6 23,3 24,25 -0,95 0,90 -1,94 3,77
  1,7 15,8 17,52 -1,72 2,95 -9,44 89,17
  2,5 21,9 23,50 -1,60 2,56 -3,34 11,17
  2,4   22,75 -2,75 7,57 -5,24 27,49
  2,6   24,25 -2,25 5,04 -3,24 10,52
  2,8 23,9 25,74 -1,84 3,39 -1,34 1,80
  2,6   24,25 1,75 3,08 0,76 0,57
  2,6 24,6 24,25 0,35 0,13 -0,64 0,41
  2,5   23,50 -2,50 6,24 -4,24 18,00
  2,9   26,49 0,51 0,26 1,76 3,09
  2,6   24,25 -3,25 10,54 -4,24 18,00
  2,2   21,26 2,74 7,53 -1,24 1,54
  2,6   24,25 -0,25 0,06 -1,24 1,54
  3,3 31,9 29,48 2,42 5,86 6,66 44,32
  3,9   33,96 -0,96 0,93 7,76 60,17
    35,4 34,71 0,69 0,47 10,16 103,17
  3,7   32,47 1,53 2,34 8,76 76,69
  3,4   30,23 0,77 0,60 5,76 33,14
—умма 57,4 530,1     130,68   545,73

 

«десь столбец Ђї Ц это значени€ , рассчитанные с помощью построенного уравнени€ регрессии, столбцы Ђї и Ц это столбцы, так называемых, Ђостатковї: разностей между исходными значени€ми , и рассчитанными с помощью уравнени€ регрессии , а также их квадратов, а в последних двух столбцах Ц разности между исходными значени€ми , выборочным средним , а также их квадраты.

ƒл€ вычислени€ коэффициента детерминации воспользуемс€ формулой ():

«начение коэффициента детерминации позвол€ет сделать предварительный вывод о том, что у нас имеютс€ основани€ использовать модель линейной регрессии в данной задаче, поскольку .

ѕостроим линию регрессии на коррел€ционном поле, дл€ чего добавим на координатной плоскости точки, соответствующие уравнению регрессии ().

 

 

Ќанесем теперь уравнение регрессии на диаграмму, использу€ специальные средства Excel. ƒл€ этого необходимо выделить правой кнопкой мыши исходные точки и выбрать опцию ƒобавить линию тренда.

¬ открывшемс€ меню ѕараметры линии тренда выбрать Ћинейную аппроксимацию. ƒалее поставить флажок напротив полей ѕоказывать уравнение на диаграмме и ѕоместить на диаграмму величину достоверности аппроксимации .

 

Ќажав на ќ , получаем еще одну пр€мую на диаграмме, котора€ совпадает с построенными ранее точками линии регрессии:

 

—плошна€ черна€ лини€ на диаграмме Ц это лини€ регрессии, рассчитанна€ средствами Excel. Ћини€ регрессии, построенна€ нами ранее, совпала с данной линией регрессии. Ќетрудно убедитьс€, что уравнение регрессии и коэффициент детерминации тоже совпадают с полученными ранее вручную.

 

Ќайдем теперь среднюю ошибку аппроксимации дл€ оценки погрешности модели. ƒл€ этого нам потребуетс€ вычислить еще р€д промежуточных величин:

 

Ќомер региона
      19,76 8,24 0,29
  2,4 21,3 22,75 -1,45 0,07
  2,1   20,51 0,49 0,02
  2,6 23,3 24,25 -0,95 0,04
  1,7 15,8 17,52 -1,72 0,11
  2,5 21,9 23,50 -1,60 0,07
  2,4   22,75 -2,75 0,14
  2,6   24,25 -2,25 0,10
  2,8 23,9 25,74 -1,84 0,08
  2,6   24,25 1,75 0,07
  2,6 24,6 24,25 0,35 0,01
  2,5   23,50 -2,50 0,12
  2,9   26,49 0,51 0,02
  2,6   24,25 -3,25 0,15
  2,2   21,26 2,74 0,11
  2,6   24,25 -0,25 0,01
  3,3 31,9 29,48 2,42 0,08
  3,9   33,96 -0,97 0,03
    35,4 34,71 0,69 0,02
  3,7   32,47 1,53 0,05
  3,4   30,23 0,77 0,02

 

«десь столбец Ђї Ц это значени€ , рассчитанные с помощью построенного уравнени€ регрессии, столбец Ђї Ц это столбец так называемых Ђостатковї: разностей между исходными значени€ми , и рассчитанными с помощью уравнени€ регрессии , и, наконец, последний столбец Ђї Ц это вспомогательный столбец дл€ вычислени€ элементов суммы по формуле (). ѕросуммируем теперь элементы последнего столбца и разделим полученную сумму на 21 Ц общее количество исходных данных:

.

ѕереведем это число в проценты и запишем окончательное выражение дл€ средней ошибки аппроксимации:

.

»так, средн€€ ошибка аппроксимации оказалась около 8%, что говорит о небольшой погрешности построенной модели. ƒанную модель, с учетом неплохих характеристик ее качества, вполне можно использовать дл€ прогноза Ц одной из основных целей эконометрического анализа. ѕредположим, что среднедушевой мес€чный доход в одном из регионов составит 4,1 тыс. руб. ќценим, каков будет уровень продаж телевизоров в этом регионе согласно построенной модели? ƒл€ этого необходимо выбранное значение фактора подставить в уравнение регрессии ():

(тыс. руб.),

т.е. при таком уровне дохода, рознична€ продажа телевизоров составит, в среднем, 35 480 телевизоров.






ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-12-05; ћы поможем в написании ваших работ!; просмотров: 655 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќаука Ч это организованные знани€, мудрость Ч это организованна€ жизнь. © »ммануил  ант
==> читать все изречени€...

517 - | 446 -


© 2015-2023 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.034 с.