Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Анализ многомерный статистический





выборочной табл. сопряженности макс, правдоподобных оценок:

G2 = -2 ^ пщ Щтт ■ пш)

имеет асимптотическое χ2-распределе­ние. На этом основана стат. проверка гипотезы о взаимосвязях.

Опыт обработки данных с помощью А.л. показал его эффективность как спо­соба целенаправленного анализа много­мерной табл. сопряженности, содержа­щей (в случае содержательно разумного выбора переменных) огромный, по срав­нению с двухмерными табл., объем ин­тересующей социолога информации. Метод позволяет сжато описать эту табл. (в виде гипотезы о связях) и в то же вре­мя детально проанализировать конкр. взаимосвязь. Ал. обычно применяется многоэтапно, в форме диалога социо­лог—ЭВМ. Т.о., А.л. обладает значитель­ной гибкостью, представляет возмож­ность формулировать разнообразного вида предположения о взаимосвязях, включать опыт социолога в процедуру формального анализа данных.

Лит.: Аптоп Г. Анализ табл. сопря­женности. М., 1982; Типология и клас­сификация в социол. иссл-ях. М., 1982; Bishop Y.M.M. et ai. Discrete Multivariate Analysis. N.Y., 1975; Agresti A. An Introduction to Categorical Data Analysis. N.Y., 1966.

А.А. Мирзоев

АНАЛИЗ МНОГОМЕРНЫЙ СТАТИ­СТИЧЕСКИЙ — разд. статистики ма­тематической, посвященный матем. ме­тодам, направленным на выявление ха­рактера и структуры взаимосвязей между компонентами исследуемого признака многомерного и предназначенным для получения науч. и практических выво­дов. Исходным массивом многомерных данных для проведения А.м.с. обычно служат рез-ты измерения компонент многомерного признака для каждого из объектов исследуемой совокупности, т.е. последовательность многомерных на­блюдений (см. Наблюдение в статисти­ке). Многомерный признак чаще всего интерпретируется как многомерная вели-


чина случайная, а последовательность многомерных наблюдений — как выбор­ка из генеральной совокупности. В этом случае выбор метода обработки исход­ных стат. данных производится на осно­ве тех или иных допущений относитель­но природы закона распределения изучае­мого многомерного признака (см. Рас­пределение вероятностей).

По содержанию А.м.с. может быть условно разбит на три осн. подразд.

1. А.м.с. многомерных распределений и их осн. характеристик охватывает си­туации, когда обрабатываемые наблюде­ния имеют вероятностную природу, т.е. интерпретируются как выборка из соотв. генеральной совокупности. К осн. зада­чам этого подраздела относятся; оцени­вание статистическое исследуемых мно­гомерных распределений и их осн. пара­метров; иссл-е свойств используемых стат. оценок; иссл-е распределений веро­ятностей для ряда статистик, с помощью к-рых строятся стат. критерии проверки разл. гипотез о вероятностной природе анализируемых многомерных данных (см. Проверка статистических гипотез).

2. А.м.с. характера и структуры взаи­мосвязей компонент исследуемого мно­гомерного признака объединяет понятия и рез-ты, присущие таким методам и моделям, как анализ регрессионный, ана­лиз дисперсионный, анализ ковариацион­ный, анализ факторный, анализ латентно-структурный, анализ логяшейный, поиск взаимодействий. Методы, принадлежа­щие к этой гр., включают как алгорит­мы, осн. на предположении о вероятно­стной природе данных, так и методы, не укладывающиеся в рамки к.-л. вероят­ностной модели (последние чаще отно­сят к методам анализа данных).

3. А.м.с. геометрической структуры исследуемой совокупности многомерных наблюдений объединяет понятия и рез-ты, свойственные таким моделям и методам, как анализ дискриминантиый, анализ кластерный (см. Методы класси­фикации, Шкала). Узловым для этих мо­делей явл. понятие расстояния либо ме­ры близости между анализируемыми элементами как точками нек-рого про-



АНАЛИЗ ПРИЧИННЫЙ


странства. При этом анализироваться могут как объекты (как точки, задавае­мые в признаковом пространстве), так и признаки (как точки, задаваемые в «объ­ектном» пространстве).

Прикладное значение А.м.с. состоит в осн. в обслуживании след. трех про­блем: стат. иссл-я зависимостей между рассматриваемыми показателями; клас­сификации элементов (объектов) или признаков; снижения размерности рас­сматриваемого признакового простран­ства и отбора наиб, информативных признаков.

Лит.: Стат. методы анализа социол. информации. М., 1979; Типология и клас­сификация в социол. иссл-ях. М., 1982; Интерпретация и анализ данных в соци­ол, иссл-ях. М., 1987; Айвазян С.А., Мхи-тарян В. С. Прикладная статистика и ос­новы эконометрики: Учеб. М., 1998; Сош-никова Л.А. и др. Многомерный стат. ана­лиз в экономике. М., 1999; Дубров А.М., Мхитарян В. С, Трошин Л.И. Многомер­ные стат. методы для экономистов и ме­неджеров. М., 2000; Ростовцев B.C., Кова­лева Т.Д. Анализ социол. данных с приме­нением стат. пакета SPSS. Новосибирск, 2001; Тюрин Ю.Н., Макаров А. А. Анализ данных на компьютере. Ы., 2003; Крыш-тановский А. О. Анализ социол. данных с помощью пакета SPSS. Μ., 2006.

ЮН. Толстова

АНАЛИЗ ПРИЧИННЫЙ - методы мо­делирования причинных отношений меж­ду признаками с помощью систем стат. уравнений, чаще всего регрессионных (см. Анализ регрессионный). Существуют и др. названия этой довольно обширной и постоянно изменяющейся области ме­тодов: путевой анализ, как впервые на­звал его основоположник С. Райт; мето­ды структурных эконометрических урав­нений, как принято в эконометрике, и др. Осн. понятиями А.п. явл.: путевая (структурная, причинная) диаграмма, причинный (путевой) коэффициент, прямые, косвенные и мнимые компо­ненты связи между признаками. Ис­пользуемое в А.п. понятие «причинное отношение* не затрагивает сложных фи-


лос. проблем, связанных с понятием «причинность». Причинный коэффици­ент опред. вполне операционально. Ма-тем. аппарат дает возможность проверки наличия прямых и косвенных причин­ных связей между признаками, а также выявления тех компонент корреляцион­ных коэффициентов (см. Корреляция), к-рые связаны с прямыми, косвенными и мнимыми связями.

Путевая диаграмма отражает графи­чески гипотетически предполагаемые причинные, направленные связи между признаками. Система признаков с одно­направленными связями называется ре­курсивной. Нерекурсивные причинные системы учитывают также и обратные связи, напр., два признака системы мо­гут быть одновременно и причиной, и следствием по отношению друг к другу. Все признаки делятся на признаки-след­ствия (зависимые, эндогенные) и при­знаки-причины (независимые, экзоген­ные). Однако в системе уравнений эндо­генные признаки одного из уравнений могут быть экзогенными признаками др. уравнений. В случае четырех признаков рекурсивная диаграмма всех возможных связей между признаками имеет вид:

 

 

 

  х2  
/         N
*1     К
   
      г    
  к S

Построение диаграммы связей явл. необходимой предпосылкой матем. фор­мулирования системы стат. уравнений, отражающей влияния, представленные на диаграмме. Осн. принципы построе­ния системы регрессионных уравнений проиллюстрируем на примере тех же че­тырех признаков. Идя по ходу стрелок, начиная с Хи находим первый эндоген-



АНАЛИЗ ПРИЧИННЫЙ


ный признак и отмечаем те признаки, к-рые на него влияют как прямо (непо­средственно), так и косвенно (опосредо­ванно) и через др. признаки. Первое стан­дартизированное регрессионное уравне­ние соответствует первому эндогенному признаку Xj и выражает зависимость Χι от тех признаков, к-рые на него влияют, т.е. от Χγ. Т.о., первое уравнение имеет вид: Χι = bi\X\.

Затем выявляем второй эндогенный признак, к-рый имеет направленные на него связи. Это признак Aj, ему соответ­ствуют экзогенные переменные Х\ и Χι, поэтому второе регрессионное уравнение в стандартизированном виде формулиру­ется так: Aj = ЬцХ\ + ЬпХг и т.д. С учетом ошибок измерения U система стандарти­зованных регрессионных моделей для нашей конкретной причинной диа­граммы имеет вид: Х\ = Ui, А? =

Ь->\Х\ + Ui, Хт, = 631ΑΊ + byiXi + Uy, Χα —

baXi + binXi + Й43А3 + Щ. Чтобы оце­нить коэффициенты b,s, необходимо ее решить. Решение существует при усло­вии, что данные удовлетворяют нек-рым естеств. стат. требованиям. Ь$ называют­ся причинными коэффициентами и час­то обозначаются как Ру. Т.о., Р# показы­вает ту долю изменения вариации эндо­генного признака;, к-рая происходит при изменении экзогенного признака j на единицу стандартного отклонения этого признака при условии, что влия­ние остальных признаков уравнения ис­ключается (см. Анализ регрессионный). Иначе говоря, Р,у есть прямой эффект признака j на признак г. Косвенный эф­фект признака j на;) вычисляется на ос­нове учета всех путей влияния j на i за исключением прямого.

На диаграмме прямое влияние перво­го признака на четвертый схематически представление прямой стрелой, непо­средственно идущей от Χι к Xt, символи­чески изображаемое как 1->4; оно равно коэффициенту причинного влияния Р[4. Компоненты прямого, косвенного и мнимого влияний явл. слагаемыми кор­реляционного коэффициента гд между признаками Xj и AJ-, к-рые можно вычис-


лить на основе формулы разложения Райта:

Г9 ~ "f + 2^ "lkrjki I

где к пробегает номера переменных, имеющих прямое влияние на признак/ Компонента прямого влияния есть пер­вое слагаемое правой ч. формулы, под знаком суммы содержатся две компо­ненты косвенного и мнимого (ложного) влияний. Косвенное влияние всегда представимо в виде произведения пря­мых влияний. Напр., косвенное влияние Х\ на АЯ, схематически представленное тремя путями опосредственного влияния Χι на АЯ: 1-^2^4, 1-»3-И и 1-»•2->3->4, вычисляется как сумма трех косвенных влияний Ραί Рц, Раз Рзи До Рн Ри- Мни­мое влияние вычисляется как остаток от вычитания из величины корреляционно­го коэффициента суммы прямого и кос­венного влияний.

Величины прямых и косвенных эф­фектов дают возможность проверять на эмпирическом материале гипотезы о си­ле тех или иных влияний и правильно­сти содержательных гипотез о причин­ных связях между признаками. Обычно проверяется значимость отличия коэф­фициентов bij = Pij от нуля, равенство нулю регрессионных коэффициентов равносильно отсутствию соотв. коэффи­циентов прямого влияния.

Качество модели А.п. или ее адекват­ность эмпирическим данным оценивает­ся как степень совпадения коэффици­ентов корреляции, полученных по фор­муле Райта на основе рассчитанных па­раметров системы, с коэффициентами корреляции, вычисленными обычным путем по эмпирическим данным. А.п. не может служить окончательным средст­вом для построения теории о причин­ных связях. Скорее имеет смысл исполь­зовать его для проверок, подтверждения или опровержения соотв. гипотез.

Трудами Г. Волда, К. Ерескога и др. развита теория нерекурсивных систем. Применению метода в соц-и мешает за­ложенное в традиционных моделях предположение о том, что рассматривае­мые признаки измерены, по крайней



АНАЛИЗ РЕГРЕССИОННЫЙ


мере, по интервальной шкале. В соц-и модели причинного анализа развивались в работах X. Блейлока, X, Саймона, П. Лазарсфельда, Р. Будона, О. Дункана. Информационный подход к разработке причинных моделей для номинальных признаков разрабатывал И.Н. Таганов. Одно из направлений А.п. для номи­нальных признаков развивается в рамках анализа логлинейного Л. Гудмэном, И. Би­шопом и др. Оно основано на анализе разл. функций от перекрестных отноше­ний табл. сопряженности, предложен­ных впервые Г. Юлом. Др. развиваю­щееся направление опирается на кон­цепцию К. Пирсона, в соответствии с к-рой в основе перекрестной классифи­кации лежит двух- или многомерное нормальное распределение признаков. Но оценка параметров такой модели очень сложна.

Совр. развитие А.п. в соц-и идет по пути синтеза классических эконометри-ческих и факторно-аналитических под­ходов, определяемых спецификой социол. данных, наличием латентных признаков, прямых и обратных связей между пере­менными (Водд, Ереског, Гудмэн, Блей-лок).

Лит.: Маленво Э. Стат. методы эконо­метрии. М., 1975; Математика в соц-и: моделирование и обработка информа­ции. Μ., 1977; Матем. моделирование в соц-и. Новосибирск, 1977; Математи-ко-стат. методы в социол. иссл-ях. М., 1981; Елисеева И.И., Рукавишников В.О. Логика прикладного стат. анализа. М,, 1982; Mosbaek £., Wold Η. Interdependent Systems: Strukture and Estimation. L., 1969; Goldberger A.S. On Boudon's Method of Linear Cauzal Analysis // American Sociology. Rewiew. 1970. V. 35. No. I; Hauser R.M., Goiderger A.S. The Treatment of an Observebles in Path Analysis // Sociological Methodology. 1971; Good­man L.A. The Analysis of Maltidimentional Contingency Tables when Some Variables are Posterior to Others: A Modified Path Analysis Approach // Biometrica. 1973. V.60.

К.Д. Аргунова, Ю.Н. Телешова


АНАЛИЗ РЕГРЕССИОННЫЙ - стат. метод иссл-я зависимости (регрессии) между зависимым признаком Υ и неза­висимыми (регрессорами, предиктора­ми) X], Х2,..., ХР. Строго регрессионную зависимость можно определить след. об­разом.

Пусть У, Х\, Хг,..., Хр случайные
величины с заданным совместным рас­
пределением вероятностей.
Если для каж­
дого набора значений Χλ =х\, Х2 = хг,...,
Хр = хр определено условное матем. ожи­
дание Υ(χ\, Х2,..., Хр) — E(Y/(X] = xj,
Χι = Х2,..., Хр = Хр)), то функция Υ(Χ],
Х2,
..., Хр) называется регрессией величи­
ны У по величинам Х\, Хг,..., Хр, а ее
график — линией регрессии У по Х\, Хг,
..., Хр,
или уравнением регрессии. Зави­
симость У от ΛΊ, Хг....... Хр проявляется в

изменении средних значений Упри из­
менении Х\, Хг........ Хр. Хотя при каждом

фиксированном наборе значений X] - xj, Хг = хг,»•, Хр ~ Хр величина Τ остается случайной величиной с опред. рассеяни­ем. Для выяснения вопр., насколько точно регрессия оценивает изменение У при изменении ΑΊ, Хг,..., Хр, использует­ся средняя величина дисперсии У при разных наборах значений Х\, Хг,..., Хр (фактически речь идет о мере рассеяния зависимой переменной вокруг линии регрессии).

На практике линия регрессии чаще всего ищется в виде линейной функции У = Ьй + biXi + ЬгХг + - + ЬрХр (линейная регрессия), наилучшим образом прибли­жающей искомую кривую. Делается это с помощью метода наименьших квадра­тов, когда минимизируется сумма квад­ратов отклонений реально наблюдаемых У от их оценок У (имеются в виду оцен­ки с помощью прямой линии, претен­дующей на то, чтобы представлять ис­комую регрессионную зависимость): w

У (У -У) => min (Ν — объем выборки), ы

Этот подход основан на том известном факте, что фигурирующая в приведен­ном выражении сумма принимает ми-ним. значение именно для того случая, когда У= Υ(χ\, хг, •--, хР). Применение







Поделиться с друзьями:


Дата добавления: 2016-12-04; Мы поможем в написании ваших работ!; просмотров: 943 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Стремитесь не к успеху, а к ценностям, которые он дает © Альберт Эйнштейн
==> читать все изречения...

2176 - | 2136 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.01 с.