Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Корреляционной зависимости




КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Виды зависимостей

 

Признаки, которыми обладают элементы совокупности, существуют неизолированно, они взаимосвязаны между собой. Так, производительность труда на предприятиях зависит от уровня механизации и электрификации производства, стажа и квалификации рабочих и ряда других признаков (факторов). Например, урожайность зерновых зависит от количества внесенных удобрений, срока посева, различных погодно-климатических факторов.

Зависимость между признаками будет функциональной, если каждому значению одного признака соответствует вполне определенное значение другого признака. Подобная зависимость в основном встречается в естественных науках. В экономических же науках между признаками существует статистическая зависимость, при которой каждому значению одного признака соответствует целый ряд распределения другого признака. Так, при одной и той же электровооруженности производительность труда рабочих на различных предприятиях одной отрасли будет разной. Это можно объяснить тем, что производительность труда зависит не только от электровооруженности, но и от ряда других факторов, которые в данный момент не учитываются.

Зависимую переменную принято называть результативным признаком (фактором) и обозначать У. Признаки (факторы), влияющие на результативный признак У, называют факторными признаками и обозначают Х 1, Х 2, ..., Хn.

Статистическая зависимость между двумя признаками Х и У называется парной. Она задается следующей таблицей:

xi х1 х2 ... хn  
yi y1 y2 ... yn ,

если данные наблюдений не сгруппированы, или корреляционной таблицей:

У \ Х х 1 х 2 ... ...  
... ...  
... ...  
... ... ... ... ... ... ... ...  
... ...  
... ... ... ... ... ... ... ...  
... ...  
... ... n ,

если данные сгруппированы,

.

Частота показывает, сколько раз встречается пара во всех наблюдениях.

В корреляционной таблице наглядно видны ряды распределения одного признака, соответствующие каждому значению другого признака, которые называются условными распределениями. Так, значению х 1 признака Х соответствует следующий ряд распределения признака У:

y1 y2 ... yi ... ys  
... ... ,

значению хj:

y1 y2 ... yi ... ys  
... ... .

Аналогично для признака У значению уi соответствует следующий ряд распределения признака Х:

х1 х2 ... хj ... хk  
... ... .

По каждому условному ряду распределения можно найти среднюю величину, называемую условной средней и вычисляемую по формуле . В результате получим соответствие между значениями одного признака и условнымисредними другого признака, то есть:

 

xj х1 х2 ... хk  
... .

Если каждому значению одного признака соответствует вполне определенная условная средняя другого признака, то есть между значениями одного признака и условными средними другого признака наблюдается функциональная связь, то зависимость между этими признаками будем называть корреляционной.

Если с увеличением признака Х условная средняя признака У растет, то корреляционная зависимость называется положительной (прямой). Корреляционная зависимость будет отрицательной (обратной), если с ростом признака Х условная средняя признака У убывает. Если же условная средняя не изменяется, то корреляционная зависимость между признаками отсутствует.

Пример 1. Данные о себестоимости единицы продукции (р.) и производительности труда (тыс. шт.) 50 предприятий представлены в виде следующей корреляционной таблицы:

Себестоимость единицы продукции Производительность труда
          Итого
             
Итого            

Определить, существует ли между этими признаками корреляционная зависимость.

Решение. Пусть признак У - себестоимость единицы продукции, р.; Х - месячная производительность труда, тыс. шт. В этой таблице наглядно представлены условные распределения каждой случайной величины. Так, для х1 = 11 условное распределение признака У имеет следующий вид:

yi      
    ,

для у 4=13:

хj          
        .

Найдем условные средние признака У для каждого значения признака Х.

Результаты вычислений представим в виде таблицы:

хj            
13,8 12,2   9,73 7,67 .

Итак, себестоимость единицы продукции (У) и производительность труда (Х) связаны между собой корреляционной зависимостью.

 

Определение формы парной

корреляционной зависимости

 

С помощью корреляционного анализа изучается теснота взаимосвязи между признаками. Регрессионный анализ позволяет приближенно представить корреляционную зависимость между признаками в виде некоторого уравнения, называемого уравнением регрессии.

Пусть Х и У - признаки, связанные между собой корреляционной зависимостью, которая может быть линейной, гиперболической, параболической или какой-то другой. Поэтому необходимо предварительно выяснить форму корреляционной зависимости. Данные задачи можно решить графически. Для этого строятся точки с координатами (хi, ), если данные сгруппированы в корреляционную таблицу, или (хi, уi), если данные не сгруппированы. По расположению построенных точек подбирается линия (прямая, гипербола, парабола), уравнение которой известно (рис. 1, 2, 3).

Рис. 1

Рис. 2

Рис. 3

Так, расположение точек на рис. 1 позволяет сделать вывод, что зависимость между признаками линейная, уравнение прямой у = а01х принимается за уравнение регрессии. По рис. 2, 3 делаем вывод, что за уравнение регрессии следует принимать, соответственно, уравнение гиперболы и уравнение параболы у = а01х+а2х2.

Далее необходимо найти неизвестные числа а0, а1, а2, называемые параметрами уравнений регрессии. Их определяют, например, методом наименьших квадратов, сущность которого заключается в следующем: находятся такие параметры уравнения регрессии, чтобы была минимальной сумма квадратов отклонений эмпирических значений признака У от теоретических, вычисленных по уравнению регрессии, то есть .

 

 

Регрессионный анализ





Поделиться с друзьями:


Дата добавления: 2016-11-12; Мы поможем в написании ваших работ!; просмотров: 707 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Наука — это организованные знания, мудрость — это организованная жизнь. © Иммануил Кант
==> читать все изречения...

2280 - | 2077 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.011 с.