Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ћетоды анализа больших систем, факторный анализ




 

ƒанный параграф €вл€етс€ заключительным и более не будет возможности осветить еще одну особенность методов системного анализа, показать вам еще один путь к достижению профессионального уровн€ в области управлени€ экономическими системами.

”же €сно, что “——ј большей частью основывает свои практические методы на платформе математической статистики. Ќесколько упрежда€ ваш рабочий учебный план (курс математической статистики Ч предмет нашего сотрудничества в следующем семестре), обратимс€ к современным постулатам этой науки.

ќбщепризнанно, что в наши дни можно выделить три подхода к решению задач, в которых используютс€ статистические данные.

Ј јлгоритмический подход, при котором мы имеем статистические данные о некотором процессе и по причине слабой изученности процесса его основна€ характеристика (например, эффективность экономической системы) мы вынуждены сами строить УразумныеФ правила обработки данных, базиру€сь на своих собственных представлени€х об интересующем нас показателе.

Ј јппроксимационный подход, когда у нас есть полное представление о св€зи данного показател€ с имеющимис€ у нас данными, но не€сна природа возникающих ошибок Ч отклонений от этих представлений.

Ј “еоретико-веро€тностный подход, когда требуетс€ глубокое проникновение в суть процесса дл€ вы€снени€ св€зи показател€ со статистическими данными.

¬ насто€щее врем€ все эти подходы достаточно строго обоснованы научно и УснабженыФ апробированными методами практических действий.

Ќо существуют ситуации, когда нас интересует не один, а несколько показателей процесса и, кроме того, мы подозреваем наличие нескольких, вли€ющих на процесс, воздействий Ч факторов, которые€вл€ютс€ не наблюдаемыми, скрытыми или латентными.

Ќаиболее интересным и полезным в плане понимани€ сущности факторного анализа Ч метода решени€ задач в этих ситуаци€х, €вл€етс€ пример использовани€ наблюдений при эксперименте, который ведет природа, Ќи о каком планировании здесь не может идти речи Ч нам приходитс€ довольствоватьс€ пассивным экспериментом.

”дивительно, но и в этих Ут€желыхФ услови€х “——ј предлагает методы вы€влени€ таких факторов, отсеивани€ слабо про€вл€ющих себ€, оценки значимости полученных зависимостей показателей работы системы от этих факторов.

ѕусть мы провели по n наблюдений за каждым из k измер€емых показателей эффективности некоторой экономической системы и данные этих наблюдений представили в виде матрицы (таблицы).

 

 

ћатрица исходных данных E [nЈk]{3-26}

E 11 E12 Е E1i Е E1k
E 21 E22 Е E2i Е E2k
Е Е Е Е Е Е
E j1 Ej2 Е Eji Е Ejk
Е Е Е Е Е Е
E n1 En2 Е Eni Е Enk

 

ѕусть мы предполагаем, что на эффективность системы вли€ют и другие Ч ненаблюдаемые, но легко интерпретируемые (объ€снимые по смыслу, причине и механизму вли€ни€) величины Ч факторы.

—разу же сообразим, что чем больше n и чем меньше таких число факторов m (а может их и нет вообще!), тем больше надежда оценить их вли€ние на интересующий нас показатель E.

—толь же легко пон€ть необходимость услови€ m < k, объ€снимогона простом примере аналогии Ч если мы исследуем некоторые предметы с использованием всех 5 человеческих чувств, то наивно наде€тьс€ на обнаружение более п€ти УновыхФ, легко объ€снимых, но неизмер€емых признаков у таких предметов, даже если мы УиспытаемФ очень большое их количество.

¬ернемс€ к исходной матрице наблюдений E[n Ј k] и отметим, что перед нами, по сути дела, совокупности по n наблюдений над каждой из k случайными величинами E1, E2, Е E k. »менно эти величины Уподозреваютс€Ф в св€з€х друг с другом Ч или во взаимной коррелированности.

»з рассмотренного ранее метода оценок таких св€зей следует, что мерой разброса случайной величины E iслужит ее дисперси€, определ€ема€ суммой квадратов всех зарегистрированных значений этой величины S( Eij )2 и ее средним значением (суммирование ведетс€ по столбцу).

≈сли мы применим замену переменных в исходной матрице наблюдений, т.е. вместо Ei j будем использовать случайные величины

 

Xij = , {3-27}

 

то мы преобразуем исходную матрицу в новую

 

X[nЈk] {3-28}

X 11 X12 Е X1i Е X1k
X 21 X22 Е X2i Е X2k
Е Е Е Е Е Е
X j1 Xj2 Е Xji Е Xjk
Е Е Е Е Е Е
X n1 Xn2 Е Xni Е Xnk

 

 

ќтметим, что все элементы новой матрицы X[nЈk] окажутс€ безразмерными, нормированными величинами и, если некоторое значение Xij составит, к примеру, +2, то это будет означать только одно - в строке j наблюдаетс€ отклонение от среднего по столбцу i на два среднеквадратичных отклонени€ (в большую сторону).

¬ыполнимтеперь следующие операции.

Ј ѕросуммируем квадраты всех значений столбца 1 и разделим результат на (n - 1) Ч мы получим дисперсию (меру разброса) случайной величины X1, т.е. D1. ѕовтор€€ эту операцию, мы найдем таким же образом дисперсии всех наблюдаемых (но уже нормированных) величин.

Ј ѕросуммируем произведени€ соответствующих строк (от j =1 до j = n) дл€ столбцов 1,2 и также разделим на (n -1). “о, что мы теперь получим, называетс€ ковариацией C12 случайных величин X1 , X2 и служит мерой их статистической св€зи.

Ј ≈сли мы повторим предыдущую процедуру дл€ всех пар столбцов, то в результате получим еще одну, квадратную матрицу C[k Ј k], которую прин€то называть ковариационной.

Ётаматрица имеет на главной диагонали дисперсии случайных величин X i, а в качестве остальных элементов Ч ковариации этих величин (i =1Еk).

 овариационна€ матрица C [kЈk] {3-29}

D1 C12 C13 Е Е C1k
C21 D2 C23 Е Е C2k
Е Е Е Е Е Е
Cj1 Cj2 Е Cji Е Cjk
Е Е Е Е Е Е
Cn1 Cn2 Е Cni Е Dk

 

≈сли вспомнить, что св€зи случайных величин можно описывать не только ковариаци€ми, но и коэффициентами коррел€ции, то в соответствие матрице {3-29} можно поставить матрицу парных коэффициентов коррел€ции или коррел€ционную матрицу

 

R [kЈk] {3-30}

 

  R12 R13 Е Е R1k
R21   R23 Е Е R2k
Е Е Е Е Е Е
Rj1 Rj2 Е Rji Е Rjk
Е Е Е Е Е Е
Rn1 Rn2 Е Rni Е  

в которой на диагонали наход€тс€ 1, а внедиагональные элементы €вл€ютс€ обычными коэффициентами парной коррел€ции.

“ак вот, пусть мы полагали наблюдаемые переменные E iнезавис€щими друг от друга, т.е. ожидалиувидеть матрицу R [kЈk]диагональной, с единицамив главной диагонали и нул€ми в остальных местах. ≈сли теперь это не так, то наши догадки о наличии латентных факторов в какой-то мере получили подтверждение.

Ќо как убедитьс€ в своей правоте, оценить достоверность нашей гипотезы Ч о наличии хот€ бы одного латентного фактора, как оценить степень его вли€ни€ на основные (наблюдаемые) переменные? ј если, тем более, таких факторов несколько Ч то как их проранжировать по степени вли€ни€?

ќтветы на такие практические вопросы призван давать факторный анализ. ¬ его основе лежит все тот же УвездесущийФ метод статистического моделировани€ (по образному выражению ¬.¬.Ќалимова Ч модель вместо теории).

ƒальнейший ход анализа при вы€снению таких вопросов зависит от того, какой из матриц мы будем пользоватьс€. ≈сли матрицей ковариаций C [kЈk], то мы имеем дело с методом главных компонент, если же мы пользуемс€ только матрицей R [kЈk], то мы используем метод факторного анализа в его УчистомФ виде.

ќстаетс€ разобратьс€ в главном Ч что позвол€ют оба эти метода, в чем их различие и как ими пользоватьс€. Ќазначение обоих методов одно и то же Ч установить сам факт наличи€ латентных переменных (факторов), и если они обнаружены, то получить количественное описание их вли€ни€ на основные переменные Ei.

’од рассуждений при выполнении поиска главных компонент заключаетс€ в следующем. ћы предполагаем наличие некоррели-рованных переменных Zj (j=1Еk), кажда€ из которых представл€етс€ нам комбинацией основных переменных (суммирование по i =1Еk):

Z j = S A j i Ј X i{3-31}

и, кроме того, обладает дисперсией, такой что

D(Z 1 ) ³ D(Z 2 ) ³ Е ³ D(Z k ).

ѕоиск коэффициентов A j i(их называют весом j -й компонеты в содержании i -й переменной ) сводитс€ к решению матричных уравнений и не представл€ет особой сложности при использовании компьютерных программ. Ќо суть метода весьма интересна и на ней стоит задержатьс€.

 ак известно из векторной алгебры, диагональна€ матрица [2Ј2] может рассматриватьс€ как описание 2-х точек (точнее Ч вектора) в двумерном пространстве, а така€ же матрица размером [kЈk] Ч как описание k точек k -мерного пространства.

“ак вот, замена реальных, хот€ и нормированных переменных X iна точно такое же количество переменных Z jозначает не что иное, как поворот k осей многомерного пространства.

Уѕеребира€Ф поочередно оси, мы находим вначале ту из них, где дисперси€ вдоль оси наибольша€. «атемделаем пересчет дисперсий дл€ оставшихс€ k-1 осей и снова находим Уось-чемпионФ по дисперсии и т.д.

ќбразно говор€, мы загл€дываем в куб (3-х мерное пространство) по очереди по трем ос€м и вначале ищем то направление, где видим наибольший УтуманФ (наибольша€ дисперси€ говорит о наибольшем вли€нии чего-то постороннего); затем Уусредн€емФ картинку по оставшимс€ двум ос€м и сравниваем разброс данных по каждой из них Ч находим Усередн€чкаФ и УаутсайдераФ. “еперь остаетс€ решить систему уравнений Ч в нашем примере дл€ 9 переменных, чтобы отыскать матрицу коэффициентов (весов) A [kЈk].

≈сли коэффициенты A j i найдены, то можно вернутьс€ к основным переменным, поскольку доказано, что они однозначно выражаютс€ в виде (суммирование по j=1Еk)

X i = S A jiЈ Z j. {3-32}

ќтыскание матрицы весов A[kЈk] требует использовани€ ковариационной матрицы и коррел€ционной матрицы.

“аким образом, метод главных компонент отличаетс€ прежде все тем, что дает всегда единственное решение задачи. ѕравда, трактовка этого решени€ своеобразна.

Ј ћы решаем задачу о наличии ровно стольких факторов, сколько у нас наблюдаемых переменных, т.е. вопрос о нашем согласии на меньшее число латентных факторов невозможно поставить;

Ј ¬ результате решени€, теоретически всегда единственного, а практически св€занного с громадными вычислительными трудност€ми при разных физических размерност€х основных величин, мы получим ответ примерно такого вида Ч фактор такой-то (например, привлекательность продавцов при анализе дневной выручки магазинов) занимает третье место по степени вли€ни€ на основные переменные.

Ётот ответ обоснован Ч дисперси€ этого фактора оказалась третьей по крупности среди всех прочих. ¬сЄЕ Ѕольше ничего получить в этом случае нельз€. ƒругое дело, что этот вывод оказалс€ нам полезным или мы его игнорируем Ч это наше право решать, как использовать системный подход!

 

Ќесколько иначе осуществл€етс€ исследование латентных переменных в случае применени€ собственно факторного анализа. «десь кажда€ реальна€ переменна€ рассматриваетс€ также как линейна€ комбинаци€ р€да факторов F j, но в несколько необычной форме

X i = S B ji Ј Fj + D i. {3-33} причем суммирование ведетс€ по j=1Еm, т.е. по каждому фактору.

«десь коэффициент B jiприн€то называть нагрузкой на j -й фактор со стороны i -й переменной, а последнее слагаемое в {3-33} рассматривать как помеху, случайное отклонение дл€ Xi. „исло факторов m вполне может быть меньше числа реальных переменных n и ситуации, когда мы хотим оценить вли€ние всего одного фактора (ту же вежливость продавцов), здесь вполне допустимы.

ќбратим внимание на само пон€тие УлатентныйФ, скрытый, непосредственно не измеримый фактор.  онечно же, нет прибора и нет эталона вежливости, образованности, выносливости и т.п. Ќо это не мешает нам самим УизмеритьФ их Ч применив соответствующую шкалу дл€ таких признаков, разработав тесты дл€ оценки таких свойств по этой шкале и применив эти тесты к тем же продавцам. “ак в чем же тогда УненаблюдаемостьФ? ј в том, что в процессе эксперимента (об€зательно) массового мы не можем непрерывно сравнивать все эти признаки с эталонами и нам приходитс€ брать предварительные, усредненные, полученные совсем не в УрабочихФ услови€х данные.

ћожно отойти от экономики и обратитьс€ к спорту.  то будет спорить, что результат спортсмена при прыжках в высоту зависит от фактора Ч Усила толчковой ногиФ. ƒа, это фактор можно измерить и в обычных физических единицах (ньютонах или бытовых килограммах), но когда?! Ќе во врем€ же прыжка на соревновани€х!

ј ведь именно в это, рабочее врем€ фиксируютс€ статистические данные, накапливаетс€ материал дл€ исходной матрицы.

Ќесколько более сложно объ€снить сущность самих процедур факторного анализа простыми, элементарными пон€ти€ми (по мнению некоторых специалистов в области факторного анализа Ч вообще невозможно). ѕоэтому постараемс€ разобратьс€ в этом, использу€ достаточно сложный, но, к счастью, доведенный в практическом смысле до полного совершенства, аппарат векторной или матричной алгебры.

ƒо того как станет пон€тной необходимость в таком аппарате, рассмотрим так называемую основную теорему факторного анализа. —уть ее основана на представлении модели факторного анализа {3-33} в матричном виде

X [kЈ1] = B [kЈm] Ј F [mЈ1] + D [kЈ1] {3-34}

и на последующем доказательстве истинности выражени€

R [kЈk] = B [kЈm] Ј B* [mЈk], {3-35}

дл€ УидеальногоФ случа€, когда нев€зки D пренебрежимо малы.

«десь B*[m Ј k] это та же матрица B [k Ј m], но преобразованна€ особым образом (транспонированна€).

“рудность задачи отыскани€ матрицы нагрузок на факторы очевидна Ч еще в школьной алгебре указываетс€ на бесчисленное множество решений системы уравнений, если число уравнений больше числа неизвестных. √рубый подсчет говорит нам, что нам понадобитс€ найти k Ј m неизвестных элементов матрицы нагрузок, в то врем€ как только около k2 / 2 известных коэффициентов коррел€ции. Ќекоторую УпомощьФ оказывает доказанное в теории факторного анализа соотношение между данным коэффициентом парной коррел€ции (например R 12) и набором соответствующих нагрузок факторов:

R 12 = B 11 Ј B 21 + B 12 Ј B 22 + Е + B 1m Ј B 2m . {3-36}

“аким образом, нет ничего удивительного в том утверждении, что факторный анализ (а, значит, и системный анализ в современных услови€х) Ч больше искусство, чем наука. «десь менее важно владеть УнавыкамиФ и крайне важно понимать как мощность, так и ограниченные возможности этого метода.

≈сть и еще одно обсто€тельство, затрудн€ющее профессиональную подготовку в области факторного анализа Ч необходимость быть профессионалом в УтехнологическомФ плане, в нашем случае это, конечно же, экономика.

Ќо, с другой стороны, стать экономистом высокого уровн€ вр€д ли возможно, не име€ хот€ бы представлений о возможност€х анализировать и эффективно управл€ть экономическими системами на базе решений, найденных с помощью факторного анализа.

Ќе следует обольщатьс€ вульгарными обещани€ми попул€ризаторов факторного анализа, не следует верить мифам о его всемогущности и универсальности. Ётот метод Уна вершинеФ только по одному показателю Ч своей сложности, как по сущности, так и по сложности практической реализации даже при УповальномФ использовании компьютерных программ.   примеру, есть утверждени€ о преимуществах метода главных компонент Ч дескать, этот метод точнее расчета нагрузок на факторы. ѕо этому поводу имеетс€ одна острота известного италь€нского статистика  арло ƒжинни, она в вольном пересказе звучит примерно так: У ћне надо ехать в ћилан, и € куплю билет на миланский поезд, хот€ поезда на Ќеаполь ход€т точнее и это подтверждено надежными статистическими данными. ѕочему? ƒа потому, что мне надо в ћиланЕФ.

 





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-05-08; ћы поможем в написании ваших работ!; просмотров: 441 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ћучша€ месть Ц огромный успех. © ‘рэнк —инатра
==> читать все изречени€...

2046 - | 1927 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.084 с.