Нелинейная регрессия
1) Парабола 2-го порядка .
Для определения параметров a,b,c можно воспользоваться МНК.
2) Гипербола .
С помощью замены переменной преобразуем эту формулу к линейному виду.
Замена: X=1/x;
Для нахождения параметров a и b можно воспользоваться формулами:
a=Da/D, b=Db/D, заменив xi ->Xi.
i | |||||||
… n | … | … | 1/ 1/ … 1/ | ||||
- |
3) Показательная функция или экспонента (e=2,718281828459045…)
y=eax+b=(ea)xeb=AxB {A=ea, B=eb} => y=axb
ln y= ln (axb)= ln ax+ln b=x ln a+ ln b.
ln y= x ln a+ ln b
Замена: Y=ln y, A=ln a, B=ln b => a=eA, b=eB.
Y=Ax+B, A=DA/D, B=DB/D, yi -> Yi=ln yi.
Для нелинейных форм регрессии в качестве характеристики силы связи между факторным и результативным признаком следует использовать корреляционное отношение (а не коэффициент прямолинейной корреляции Пирсона!).
Общая дисперсия результирующего признака:
. Отражает общую вариацию результирующего признака у в зависимости от всех факторов.
Факторная дисперсия (аналог межгрупповой дисперсии):
. Характеризует влияние факторного признака х на вариацию у.
Остаточная дисперсия:
. Объясняет вариацию у от всех прочих (кроме х) факторов (аналог средней из внутригрупповых дисперсий).
На основании правила сложения дисперсий, получим: s2=sф2+se2.
Лучшей является регрессионная модель с наибольшим значением корреляционного отношения.
Свойства корреляционного отношения.
1. 0 £ h £ 1.
2. hx,y ¹ hy,x.
3. При прямолинейной зависимости hx,y = hy,x = rx,y.
Значения корреляционного отношения (так же, как и коэффициентов прямой корреляции Пирсона) можно использовать при работе со шкалой Чеддока:
hxy | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 |
Характеристика силы связи | слабая | умеренная | заметная | высокая | весьма высокая |
Квадрат корреляционного отношения (h2) называется коэффициентом или индексом детерминации. h2 показывает, какая доля вариации Y объясняется влиянием факторного признака X.
Коэффициент корреляции знаков Фехнера
Может быть использован при анализе тесноты связи количественных и порядковых величин, прост в вычислении, но менее точен, чем корреляционное отношение. Основан на совпадении знаков отклонений от средней величины и подсчете числа случаев совпадения и несовпадения знаков.
, -1 £ i £ 1
u- число пар с одинаковыми знаками отклонений (+,+),(-,-),(0,0)
v- число пар с разными знаками отклонений x, y от .
Фирма | Стоимость основных фондов (X) (млрд. руб.) | Выпуск продукции (Y) (млрд.руб.) | Знак отклонения от средней арифметической | |
2,4 3,6 4,5 4,6 5,6 6,5 7,0 5,0 | - - - - - + + + + + | - - - - - - + + + + |
u=9, v=1,
rxy=0,854
Измерение силы связи порядковых величин.
Коэффициент ранговой корреляции Спирмена (Spearman) (или коэффициент корреляции рангов):
(ранги не связаны)
n- число наблюдений (число пар рангов).
В случае повторяющихся (связанных рангов) использовать данную формулу нельзя. Можно использовать коэффициент Кендэлла (t) (Kendall). Или формулу коэффициентов Спирмена для связанных рангов.
S - фактическая сумма рангов.
n - объем выборки.
Сначала упорядочивают ранги rx по возрастанию. Для каждого ранга ry вычисляется число следующих рангов выше данного минус ниже данного. Так для всех рангов. Результат суммируется, получается S. Для нашего примера:
S=(8-1) + (7-1) + (7-0) + (6-0) + (5-0) + (3-1) + (3-0) + (2-0) + (1-0) = 39.