Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


Ћабораторна робота: Dummy-зм≥нн≥




ќсвоњти загальну методику введенн€ dummy-зм≥нних дл€ обл≥ку в регрес≥йн≥й модел≥ €к≥сних фактор≥в.

Dummy у переклад≥ Ц макет, ≥ де€к≥ автори вживають словосполученн€ Умакетн≥ зм≥нн≥Ф, але част≥ше використовуЇтьс€ неправильна терм≥нолог≥€ Уф≥ктивн≥ зм≥нн≥Ф. ‘≥ктивною Ї Узм≥ннаФ ’0 º 1, €ку ввод€ть, щоб у матричн≥й форм≥ врахувати в модел≥ на€вн≥сть в≥льного члена. Ќа в≥дм≥ну в≥д ’0, dummy-зм≥нн≥ д≥йсно вар≥юють ≥ тому не повинн≥ називатис€ Уф≥ктивнимиФ. Ќайб≥льш близьким за зм≥стом Ї назва У≥ндикаторн≥ зм≥нн≥Ф.

Dummy-зм≥нн≥ призначен≥ дл€ обл≥ку в модел≥ €к≥сних ознак, €к≥ вим≥рюютьс€ в так зван≥й шкал≥ ≥мен ≥ не можуть бути охарактеризован≥ одним числом. –≥зн≥ р≥вн≥ €к≥сноњ ознаки прийн€то називати Укатегор≥€миФ. ѕриклади: стать Ц чолов≥ча або ж≥ноча, стан економ≥ки Ц до нафтовоњ кризи або п≥зн≥ше, сезон Ц зимовий, весн€ний, л≥тн≥й, ос≥нн≥й, тощо.

”€вимо, треба врахувати €к≥сну ознаку, що маЇ к≥лька р≥зних категор≥й. ¬водимо таку ж к≥льк≥сть dummy-зм≥нних, кожна з €ких дор≥внюЇ одиниц≥ дл€ спостережень конкретноњ категор≥њ ≥ нулю Ц дл€ вс≥х ≥нших категор≥й. ” сум≥ вс≥ dummy-зм≥нн≥ утвор€ть ’0 º 1, тому не можна включати в модель одразу вс≥ dummy-зм≥нн≥ (або ж не треба включати в модель в≥льний член). «вичайно одну з категор≥й вибирають €к еталон ≥ у модель не включають еталонну dummy-зм≥нну. ” результат≥ одержують модель дл€ еталонноњ категор≥њ з виправленн€ми на ус≥ ≥нш≥ категор≥њ. «начимост≥ цих виправлень за критер≥Їм —тТюдента Ї значимост€ми в≥дм≥нностей кожноњ категор≥њ в≥д еталонноњ.

¬ розгл€нутому нижче приклад≥ (витрати на газ ≥ електроенерг≥ю в —Ўј за 1977Ц1982 р.) вивчаЇтьс€ типова ситуац≥€, коли, бажаючи зб≥льшити обс€г виб≥рки, зам≥сть середньор≥чних використали квартальн≥ дан≥. ’оча виб≥рка при цьому зб≥льшилас€ в чотири рази, значим≥сть модел≥ р≥зко знизилас€, а коеф≥ц≥Їнт детерм≥нац≥њ впав майже до нул€. ѕричина ви€вилас€ в тому, що при переход≥ до квартальних даних були привнесен≥ сезонн≥ коливанн€, на ≥нтенсивному фон≥ €ких зовс≥м втративс€ досл≥джуваний ефект Ц часовий л≥н≥йний тренд. “ому дл€ обл≥ку р≥зниц≥ за кварталами варто ввести чотири додатков≥ У≥ндикаторн≥Ф зм≥нн≥: Z1 = 1 Ц дл€ 1-го кварталу ≥ Z1 = 0 Ц дл€ вс≥х ≥нших квартал≥в; Z2 = 1 Ц дл€ 2-го кварталу ≥ Z2 = 0 Ц дл€ вс≥х ≥нших квартал≥в; Z3 = 1 Ц дл€ 3-го кварталу ≥ Z3 = 0 Ц дл€ вс≥х ≥нших квартал≥в; Z4 = 1 Ц дл€ 4-го кварталу ≥ Z4 = 0 Ц дл€ вс≥х ≥нших квартал≥в. якщо за еталон прийн€ти 1-й квартал, то зм≥нну Z1 не сл≥д включати в модель. ” результат≥ розрахунк≥в буде отримане р≥вн€нн€ регрес≥њ дл€ еталонноњ категор≥њ з виправленн€ми до в≥льного члена дл€ ≥нших категор≥й. ћожна п≥дключити в модель одразу вс≥ dummy-зм≥нн≥, але тод≥ з модел≥ треба виключити в≥льний член. ” результат≥ таких розрахунк≥в будуть отриман≥ р≥вн€нн€ регрес≥њ дл€ кожноњ категор≥њ окремо, будуть правильно п≥драхован≥ вс≥ статистичн≥ характеристики, за вин€тком статистики ‘≥шера, €ка буде занижена в (m+1)/m = 5/4 раз≥в. ѕри цих р≥зних п≥дходах за критер≥Їм —тТюдента оц≥нюютьс€ р≥зн≥ ефекти €к≥сного фактору. «а другою методикою оц≥нюЇтьс€ значим≥сть ефекту кожноњ категор≥њ, а по першою (що рекомендуЇтьс€) Ц значим≥сть розходжень кожноњ категор≥њ в≥д еталонноњ.

«араз не€вно передбачаЇтьс€, що дл€ кожноњ сукупност≥ даних (дл€ кожноњ категор≥њ) збер≥гаютьс€ незм≥нними ус≥ законом≥рност≥ в залежност€х в≥д к≥льк≥сних зм≥нних, а вплив €к≥сноњ ознаки про€вл€Їтьс€ т≥льки у виправленн€х дов≥льного члена. Ѕувають ≥ б≥льш складн≥ ситуац≥њ, коли дл€ р≥зних категор≥й ви€вл€ютьс€ р≥зними ефекти к≥льк≥сних фактор≥в. “од≥ в модел≥ сл≥д враховувати також члени ≥з взаЇмод≥Їю.

–оботу виконуЇмо в наступному пор€дку.

а) до таблиц≥ вих≥дних даних (стовпц≥ “ та Y) додаЇмо стовпц≥ ≥ндикаторних зм≥нних Z1, Z2, Z3, Z4;

б) за допомогою функц≥њ Ћ»Ќ≈…Ќ розраховуЇмо параметри л≥н≥йноњ модел≥

Yp = (b0 + b2*Z2 + b3*Z3 + b4*Z4) + b5*T (1-й квартал Ц еталон);

г) обчислюЇмо розрахунков≥ значенн€ (стовпець Yp);

д) будуЇмо граф≥ки залежност≥ спостережуваних ≥ розрахункових значень;

е) в≥дб≥раЇмо з таблиц≥ виб≥рки, що в≥днос€тьс€ до р≥зних квартал≥в;

ж) додаЇмо на граф≥ку л≥н≥њ регрес≥њ дл€ кожного кварталу.

  A B C D E F G H I J K
  –обота є 9. Dummy Ц зм≥нн≥ 1            
  T - Ќомер кварталу, починаючи з 1977 по 1982 включно      
  Y - витрати на газ ≥ електроенерг≥ю в —Ўј, млрд долар≥в      
  Z1=1 дл€ кварталу I, ≥ Z1=0 дл€ ≥нших квартал≥в (еталон)      
  Z2=1 дл€ кварталу II, ≥ Z2=0 дл€ ≥нших квартал≥в        
  Z3=1 дл€ кварталу III, ≥ Z3=0 дл€ ≥нших квартал≥в        
  Z4=1 дл€ кварталу IV, ≥ Z4=0 дл€ ≥нших квартал≥в  ритер≥њ в≥дбору
  Z1 Z2 Z3 Z4 T Y Yp Z1 Z2 Z3 Z4
            7,33 7,5141        
            4,7 4,7691        
            5,1 4,9991 1-й квартал 2-й квартал
            5,46 5,4158 T Yp T Yp
            7,65 7,6405   7,5141   4,7691
            4,92 4,8955   7,6405   4,8955
            5,15 5,1255   7,7668   5,0218
            5,55 5,5421   7,8932   5,1482
            7,96 7,7668   8,0195   5,2745
            5,01 5,0218   8,1459   5,4009
            5,05 5,2518 3-й квартал 4-й квартал
            5,59 5,6685 T Yp T Yp
            7,74 7,8932   4,9991   5,4158
            5,1 5,1482   5,1255   5,5421
            5,67 5,3782   5,2518   5,6685
            5,92 5,7948   5,3782   5,7948
            8,04 8,0195   5,5045   5,9212
            5,27 5,2745   5,6309   6,0476
            5,51 5,5045        
            6,04 5,9212        
            8,26 8,1459        
            5,51 5,4009        
            5,41 5,6309        
            5,83 6,0476        
  b0 b2 b3 b4 b5            
  7,4825 -2,777 -2,578 -2,193 0,0316            
                       
  b5 b4 b3 b2 b0   T Z4 Z3 Z2  
  7,2975 -25,91 -30,66 -33,15 98,546   tb4 tb3 tb2 tb1 tb0
  0,0316 -2,193 -2,578 -2,777 7,4825   b4 b3 b2 b1 b0
  0,0043 0,0846 0,0841 0,0838 0,0759   Sb4 Sb3 Sb2 Sb1 Sb0
  0,9867 0,1449 #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ   R2 Se      
  351,16   #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ   F df      
  29,480 0,3988 #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ   SSR SSE      

–ис. 35. «в≥т до лабораторноњ роботи є 10

”с≥ розрахунки зроблен≥ за допомогою функц≥њ Ћ»Ќ≈…Ќ, блок результат≥в €коњ доповнений зверху р€дком статистик —тТюдента ≥ р€дком заголовк≥в. ѕоруч у блоц≥ такого ж розм≥ру наведен≥ по€сненн€ до результат≥в функц≥њ Ћ»Ќ≈…Ќ. ѕ≥д таблицею даних розташований р€док заголовк≥в b0, b2, b3, b4, b5 у потр≥бному пор€дку ≥ нижче функц≥Їю √ѕ– наведен≥ в≥дпов≥дн≥ коеф≥ц≥Їнти регрес≥њ. “ак, у кл≥тинц≥ ј34 записана формула =√ѕ–(A33;$A$36:$E$39;3;0), €ка дал≥ скоп≥йована у сус≥дн≥ кл≥тинки B34, C34, D34, E34. “ут $A$36:$E$39 Ц блок результат≥в функц≥њ Ћ»Ќ≈…Ќ, з €кого вит€гуЇтьс€ значенн€ коеф≥ц≥Їнта регрес≥њ з ≥м'€м, записаним в ј33; у д≥апазон цього блоку необх≥дно обов'€зково включати р€док заголовк≥в; адреси д≥апазону повинн≥ бути абсолютними (F4), щоб ц≥ адреси не зм≥нювалис€ при коп≥юванн≥; числове значенн€ вит€гуЇтьс€ з 3-го р€дка блоку (1-й р€док Ц заголовки, 2-й р€док Ц статистики —тТюдента, 3-й р€док Ц коеф≥ц≥Їнти регрес≥њ, 4-й р€док Ц стандартн≥ похибки коеф≥ц≥Їнт≥в регрес≥њ); нарешт≥, останн≥й операнд формули √ѕ– прийн€тий р≥вним нулю (Ќ≈ѕ–ј¬ƒј), що означаЇ вимогу точноњ в≥дпов≥дност≥ чисел зазначеному заголовку.

–озрахунков≥ значенн€ Yp обчислен≥ за допомогою функц≥њ —”ћћѕ–ќ»«¬. “ак, дл€ 1-го спостереженн€ у кл≥тинц≥ G9 записана формула:

=$A$34+—”ћћѕ–ќ»«¬($B$34:$E$34;B9:E9).

ѕраворуч в≥д таблиц≥ даних зроблен≥ виб≥рки розрахункових значень витрат на газ ≥ електроенерг≥ю за кожним кварталом. ¬иб≥рки з таблиц≥ можна зробити р≥зними способами, наприклад, за допомогою розширеного ф≥льтру. ѕершим р€дком бази даних (таблиц≥, з €коњ вит€гаютьс€ дан≥) завжди повинен бути р€док заголовк≥в стовпц≥в. ” блоц≥ критер≥њв в≥дбору (у нас таких чотири блоки з адресами H8:H9, I8:I9, J8:J9, K8:K9) у першому р€дку повинен бути заголовок хоча б одного стовпц€ бази даних, у наступних р€дках блоку критер≥њв записуютьс€ умови в≥дбору (в 1-му блоц≥ задана умова Z1=1).

ƒ≥апазон обраних запис≥в повинен також починатис€ р€дком заголовк≥в стовпц≥в таблиц≥, що нас ц≥кавл€ть. ”с≥ чотири д≥апазони в≥дбору запис≥в (H12:I18, J12:K18, H20:I26, J20:K26) м≥ст€ть однаков≥ заголовки T ≥ Yp. ¬становлюЇмо табличний курсор у будь-€ке м≥сце таблиц≥ ≥ через меню ƒанные, ‘ильтр, –асширенный фильтр викликаЇмо панель розширеного ф≥льтра, на €к≥й поле »сходный диапазон вже заповнено за замовчуванн€м.

¬ключаЇмо умову скопировать результат на другое место, заповнюЇмо пол€ ƒиапазон условийѕоместить результат в д≥апазон;нарешт≥ натискуЇмо кнопку ќ .  

ѕопередженн€: ” кожний ≥з цих д≥апазон≥в маЇ бути включений р€док заголовк≥в. Ќе припустим≥ н≥€к≥ помилки при завданн≥ д≥апазону умов (блоку критер≥њв). якщо вид≥лити д≥апазон ≥з зайвим р€дком (порожн≥м), буде обрана вс€ таблиц€, а €кщо захопити зайвий стовпець Ц не буде обраний жодний запис. —права в тому, що умови в дек≥лькох р€дках поЇднуютьс€ лог≥чною операц≥Їю јЅќ, а в дек≥лькох стовпц€х Ц операц≥Їю I.

ƒал≥ будуЇмо д≥аграму ≥з граф≥ками досл≥джуваноњ залежност≥. «а допомогою граф≥чних опц≥й ƒобавить тренд, ѕоказать уравнениеR2 додаЇмо на граф≥ку л≥н≥йний тренд, його р≥вн€нн€ ≥ коеф≥ц≥Їнт детерм≥нац≥њ.

–ис. 37. ѕом≥с€чна динам≥ка витрат

¬арто вид≥лити в таблиц≥ стовпц≥ “, Y, Yp разом ≥з заголовками ≥ викликати ћайстер ƒ≥аграм, тод≥ в легенд≥ автоматично будуть зазначен≥ назви р€д≥в Y ≥ Yp. ѕ≥сл€ цього можна додати граф≥ки дл€ кожного кварталу наступним чином.  лацаЇмо правою кнопкою по област≥ д≥аграми ≥ у контекстному меню вибираЇмо »сходные данные, –€д, ƒобавить.

” поле »м€ заносимо I (1-й квартал); це ≥м'€ автоматично зам≥нюЇтьс€ на ="I". ” поле «начени€ ’ указуЇмо д≥апазон “ ≥ в поле «начени€ Y Ц д≥апазон Yр дл€ 1-го кварталу.

—аме так додаЇмо граф≥ки дл€ 2-го, 3-го ≥ 4-го квартал≥в. Ќарешт≥, на д≥аграм≥ до р€ду Y додаЇмо л≥н≥йний тренд, його р≥вн€нн€ ≥ коеф≥ц≥Їнт детерм≥нац≥њ R2.

Ќа фон≥ ≥нтенсивних сезонних коливань значим≥сть досл≥джуваного л≥н≥йного тренда ви€вилас€ заниженою практично до нул€ (R2 = 0,0086), оц≥нка кутового коеф≥ц≥Їнта занижена б≥льш н≥ж у два рази.

 онтрольне запитанн€: ј €коњ величини були коеф≥ц≥Їнт регрес≥њ ≥ коеф≥ц≥Їнт детерм≥нац≥њ за 6-ю середнЇр≥чними спостереженн€ми?

«а допомогою всього трьох додаткових dummy-зм≥нних Z2, Z3, Z4 дуже добре описана вс€ залежн≥сть разом ≥з сезонними коливанн€ми. ѕом≥тимо, що спроби описати ц≥ коливанн€ анал≥тичним вираженн€м у вигл€д≥ трьох гармон≥к (з пер≥одами р≥к, п≥вроку, квартал) будуть неощадливими ≥ зажадають 6-и додаткових параметр≥в (по два параметра на кожну гармон≥ку).

« блоку результат≥в функц≥њ Ћ»Ќ≈…Ќ виписуЇмо р≥вн€нн€ регрес≥њ:

Yp = 7,4825 Ц 2,777*Z2 Ц 2,278*Z3 Ц 2,193*Z4 + 0,0316*T

(tb) (98,5) (33,2) (30,7) (25,9) (7,3).

¬с≥ члени ц≥Їњ модел≥ значим≥ за критер≥Їм —тТюдента (вс≥ tb > t01 = 2,9), модель значима в ц≥лому за критер≥Їм ‘≥шера F = 351,2 (F > F01 = 4,5); коеф≥ц≥Їнт детерм≥нац≥њ дор≥внюЇ R2 = 0,9867, тобто модель ≥з dummy-зм≥нними по€снюЇ практично всю м≥нлив≥сть даних.

«начимост≥ коеф≥ц≥Їнт≥в регрес≥њ перед Z2, Z3, Z4 у ц≥й модел≥ показують, що витрати на газ ≥ електроенерг≥ю в еталонному 1-му квартал≥ ≥стотно в≥др≥зн€ютьс€ в≥д витрат в ≥нших кварталах.

Ќаводимо р≥вн€нн€ регрес≥њ дл€ кожного кварталу:

Yp(I) = 7,4825 + 0,0316*T (Z1 = 1),

Yp(II) = 7,4825 Ц 2,777 + 0,0316*T = 4,7059 + 0,0316*T (Z2 = 1),

Yp(III) = 7,4825 Ц 2,278 + 0,0316*T = 4,9034 + 0,0316*T (Z3 = 1),

Yp(IV) = 7,4825 Ц 2,193 + 0,0316*T = 5,2894 + 0,0316*T (Z4 = 1).

¬ище вже вказувалос€, що можна в модель включити одразу вс≥ dummy-зм≥нн≥, але тод≥ модель не повинна м≥стити в≥льного члена. «а допомогою функ≠ц≥њ Ћ»Ќ≈…Ќ розраховуЇмо параметри л≥н≥йноњ модел≥ (рис. 39):

Yp = (b1*Z1 + b2*Z2 + b3*Z3 + b4*Z4) + b5*T ( онстанта Ц в≥дсутн€).

T Z4 Z3 Z2 Z1
7,2975 62,464 60,075 59,784 98,546
0,0316 5,2894 4,9043 4,7059 7,4825
0,0043 0,0847 0,0816 0,0787 0,0759
0,9867 0,1449 #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ
280,93   #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ
29,4795 0,3988 #Ќ/ƒ #Ќ/ƒ #Ќ/ƒ
–ис. 39. Ѕлок функц≥њ Ћ»Ќ≈…Ќ

¬ результат≥ будуть отриман≥ одразу вс≥ р≥вн€нн€ дл€ кожного кварталу Ц не потр≥бно перераховувати в≥льний член (див. блок висновк≥в функц≥њ Ћ»Ќ≈…Ќ на рис. 39). јле тепер статистики —тТюдента будуть оц≥нювати в≥дхиленн€ середнього р≥вн€ витрат у кожному квартал≥ в≥д нул€, а не в≥д обраного еталона. ¬с≥ характеристики (кр≥м F) вийдуть тими ж самими, лише статистику ‘≥шера треба буде зб≥льшити в (m+1)/m = 5/4 раз≥в: F = 280,93*5/4 = 351,16.

 онтрольн≥ запитанн€

1. ўо таке "dummy-зм≥нн≥"? « €кою метою вони застосовуютьс€? як≥ Ї пропоз≥ц≥њ щодо найближчого перекладу назви цих зм≥нних на украњнську мову?

2. ¬ "ковар≥ац≥йному анал≥з≥", €кий Ї подальшою мод≥ф≥кац≥Їю дисперс≥йного анал≥зу, кр≥м середн≥х за групами спостережень оц≥нюЇтьс€ також л≥н≥йний ефект к≥льк≥сноњ зм≥нноњ. „и не можна вважати модель ковар≥ац≥ного анал≥зу Їкв≥валентним частинним випадком регрес≥йного анал≥зу з dummy-зм≥нними? ƒл€ €ких умов?

3. яку роль в≥д≥грають члени взаЇмод≥й к≥льк≥сних зм≥нних з dummy-зм≥нними?

4. ¬ €кому випадку анл≥з з dummy-зм≥нними буде екв≥валеним сер≥њ звичайних регрес≥йних анал≥з≥в окремо дл€ кожноњ категор≥њ €к≥сноњ зм≥нноњ?

5. як оц≥н≥ти значущ≥сть член≥в модел≥ з dummy-зм≥нними?





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-03-26; ћы поможем в написании ваших работ!; просмотров: 368 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

80% успеха - это по€витьс€ в нужном месте в нужное врем€. © ¬уди јллен
==> читать все изречени€...

1249 - | 1142 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.034 с.