Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


Ќазначение коррел€ционного анализа




«адача коррел€ционного анализа состоит в количественном определении тесноты св€зи между двум€ признаками и статистической оценке надежности установленной св€зи.

”слови€ применени€ анализа.

1.  оррел€ционный анализ можно примен€ть только в том случае, когда данные наблюдени€ или эксперимента можно считать случайными и выбранными из нормальной совокупности.

2. ¬ыборки из изучаемых генеральных совокупностей должны быть достаточно большого объема, так как дл€ статистической методологии важное значение имеет закон больших чисел. ≈го содержание сводитс€ к следующему: в массе индивидуальных €влений обща€ закономерность про€вл€етс€ тем полнее и точнее, чем больше их охвачено наблюдением, только в этом случае происходит взаимопогашение индивидуальных значений признака от средней величины.

3. ќтдельные наблюдени€ должны быть независимыми, то есть результаты, полученные в отдельном наблюдении, не должны содержать информацию о последующих наблюдени€х и не должны быть св€заны с будущими.

јлгоритм применени€ коррел€ционного анализа.

ќсновной оценкой дл€ тесноты св€зи между переменными и служит выборочный коэффициент коррел€ции r, который определ€етс€ по формуле

—войства выборочного коэффициента коррел€ции:

 

1.  оэффициент коррел€ции принимает значени€ на отрезке [-1; 1], то есть .

¬ зависимости от того насколько приближаетс€ к 1, различают слабую, умеренную и сильную св€зь, то есть чем ближе к 1, тем теснее св€зь.

2. ≈сли , то коррел€ционна€ св€зь между и представл€ет собой линейную зависимость.

«апишем более подробно формулу дл€ вычислени€ коэффициента коррел€ции: .

«амечание. ѕриведена формула дл€ не сгруппированных данных.

“ак как r вычисл€етс€ по данным выборки, то в отличие от генерального коэффициента коррел€ции, €вл€етс€ величиной случайной. ≈сли , то возникает вопрос, объ€сн€етс€ ли это действительно существующей линейной св€зью между и или вызвано случайными факторами. ƒл€ вы€снени€ этого вопроса проведем проверку статистической гипотезы.

: коррел€ционна€ св€зь отсутствует между переменными и , то есть .

¬ычислим эмпирическое значение критери€ . находим в таблице распределени€ —тьюдента критическое значение , определенное на уровне значимости и числом степеней свободы . ≈сли , то гипотеза отвергаетс€.

ѕример. ‘ирма провела рекламную компанию. „ерез 10 недель фирма решила проанализировать эффективность этого вида рекламы, сопоставл€€ недельные объемы продаж с расходами на рекламу .

 

x                    
y                    

 

ƒл€ данных, приведенных в таблице найти выборочный коэффициент коррел€ции, проверить его значимость на уровне значимости .

 

ѕростейший способ задани€ статистических данных Ц набор пар чисел , где Ц выборка значений переменной , Ц выборка значений переменной .

ќднако очень часто экспериментальные данные задаютс€ в виде коррел€ционной таблицы.

 

Yi Xi 12,5 147,5 22,5 27,5 nj
20-21 20,5   - - -  
21-22 21,5 -   - -  
22-23 22,5 -     -  
23-24 23,5 - -      
24-25 24,5 - - -    
ni         n=20

¬ первой строке Ц значени€ , в первом столбце интервалы изменени€ , во втором Ц середина интервала. ÷ентральна€ часть таблицы Ц частоты , соответствующие xi и yj. ¬ последней строке , где в последнем столбце -, где Ц число значений , Ц число значений . „исло всех значений .

‘ормула вычислени€ коэффициента коррел€ции дл€ данных, заданных коррел€ционной таблицей

ѕример. ƒл€ данных таблицы найти выборочный коэффициент коррел€ции, проверить его значимость на уровне α = 0,05.

–ешение. Ќаходим суммы:

 

 

¬ычислим:

ѕодставл€€ полученные суммы в (), найдем выборочный коэффициент коррел€ции

ѕроверим значимость r на уровне α = 0,05.

ƒл€ этого вычислим

 

по таблице распределени€ —тьюдента при k = n-2 = 18, находим 2,1. “ак как > , то считаем значение r статистически значимым.

 

–егрессионный анализ.

 

 оррел€ционно-регрессионный анализ находит широкое применение в социологических исследовани€х дл€ прогнозировани€ уровн€ результативного признака путЄм подстановки в уравнение регрессии ожидаемых или планируемых значений факторного признака.

 ак было отмечено в 7.1. при коррел€ционной зависимости между случайными коррел€ционными X и Y условное математическое одной из них зависит от значений другой.

 оррел€ционна€ зависимость может быть представлена в виде

Y1(x) = Mx(Y); Y2(y) = My(x).

Ёти уравнени€ называютс€ уравнени€ми регрессии, а их графики лини€ми регрессии.

ѕри изучении статистической зависимости в социологии одним из главных моментов €вл€етс€ установление формы зависимости, вида функции регрессии и еЄ параметров, что €вл€етс€ задачами регрессионного анализа.

–ассмотрим простейший случай линейной регрессии, когда функци€ Y линейна по X, то есть Yx = a+bx.

ѕроведем случайную выборку. ѕри значени€х х1, х2, - xn, мы наблюдаем значени€ y1, y2, - yn. ќтметим на плоскости Oxy точки с координатами (x1, y1), (x2, y2) Ц (xn, yn). ≈сли св€зь между X и Y линейна, то точки группируютс€ вокруг некоторой пр€мой линии y=a+bx. “очки не наход€тс€ пр€мо на линии, что неудивительно. ¬едь помимо x на поведение y оказывают вли€ние и другие факторы.

≈сли в уравнение y= ax+b подставить значени€ x1, x2, xn случайной выборки, то будут получены значени€ , которые будут отличатьс€ от y1, y2, yn.

–азница называетс€ ошибкой. «начени€ коэффициентов a и b в уравнении y=a+bx необходимо подобрать так, чтобы минимизировать сумму . ƒл€ этого используетс€ метод наименьших квадратов (ћЌ ).

—огласно ћЌ  неизвестные параметры a и b выбираютс€ так, чтобы сумма квадратов отклонений выборочных значений yi от их значений, вычисленных по формуле, была минимальной, то есть

 

Ќа основании необходимого услови€ экстремума функции S(a,b) приравниваем к нулю еЄ частные производные.

ѕолучим систему:

ѕосле преобразований получим:

Ёто система двух уравнений с двум€ неизвестными a и b. –еша€ еЄ, находим:

 

 

 

”читыва€, что , , , , получим:

,

 оэффициент в уравнении регрессии Y по X называетс€ коэффициентом регрессии и обозначаетс€ bxy. »з определени€ выборочного коэффициента коррел€ции r следует, что .

»з полученных выражений дл€ a и b можно получить формулы: , , поэтому линейное уравнение регрессии можно записать в обычной форме, прин€той в математической статистике:

, или

.

јналогичным образом, уравнение регрессии X на Y имеет вид:

.

ѕример. ƒл€ зависимости Y от X, заданной в примере 8.1, записать уравнение линейной регрессии yx=a+bx.

–ешение:

1.¬оспользуемс€ данными из предыдущего примера (см. 8.1)

 

 

 

,

ѕримеры дл€ самосто€тельного решени€.

ѕо результатам наблюдений найти оценки коэффициентов линейной регрессии.

 

 
                      0,95
                      0,99
                      0,95
                      0,99
                      0,95

 

–ангова€ коррел€ци€.

 

»зложенный выше метод линейной коррел€ции €вл€етс€ параметрическим, а значит, требует нормального закона распределени€ дл€ X и Y, а также больших объемов выборок, что предполагает компьютерную обработку данных.

јльтернативой этому методу может служить метод ранговой коррел€ции —пирмена. ќснованием дл€ выбора метода ранговой коррел€ции служит его универсальность и простота. ћетод применим к любым количественно измеренным или ранжированным данным, и позвол€ет подсчитывать коррел€цию Ђвручнуюї.

Ќазначение метода ранговой коррел€ции —пирмена.

ћетод ранговой коррел€ции —пирмена позвол€ет определить тесноту (силу) и направление коррел€ционной св€зи между двум€ признаками.

ќграничени€.

1. ѕо каждой переменной должно быть представлено не менее 5 наблюдений.

2. ѕри большом количестве одинаковых рангов по одной или обеим переменным метод дает огрубленные результаты.

 

√ипотезы.

Ќо:  оррел€ци€ между двум€ переменными X и Y не отличаетс€ от нул€.

Ќ1:  оррел€ци€ между переменными X и Y статистически достоверно отличаетс€ от нул€.

ќписание метода.

ƒл€ подсчета ранговой коррел€ции необходимо располагать двум€ р€дами значений, которые могут быть проранжированы. ƒл€ подсчета ранговой коррел€ции —пирмена необходимо вычислить квадрат разности рангов

d2= (ранг ј- ранг B)2.

 оэффициент ранговой коррел€ции —пирмена подсчитываетс€ по формуле

N ― количество ранжируемых значений.

ѕри заданном уровне значимости α и объеме выборок N в таблице 15 находим rкрит. ― критическое значение критери€ —пирмена.

≈сли rэмп.< rкрит., Ќо принимаетс€.

ѕример. —в€заны ли между собой коррел€ционной зависимостью X и Y, выборочные значени€ которых представлены в таблице в 1 и 3 столбцах соответственно. ѕрин€ть α =0,05.

X RX Y RY d= (Rx-Ry) d2
           
      5,5 4,5 20,25
           
        -1  
        -4  
           
        -4  
        -2  
      5,5 -4,5 20,25
           

–ешение.

, rэмп < r крит

ќтвет: Ќо принимаетс€.

ѕримеры дл€ самосто€тельного решени€:

¬ы€снить, существует ли коррел€ционна€ зависимость между выборками.

 
                      0,99
                      0,95
                      0,99
                      0,95
                      0,99

 

 

«ј Ћё„≈Ќ»≈





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-11-05; ћы поможем в написании ваших работ!; просмотров: 3162 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќасто€ща€ ответственность бывает только личной. © ‘азиль »скандер
==> читать все изречени€...

1388 - | 1232 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.064 с.