(Елисеева, Кремер, Бигильдеева).
Соотношения между социально-экономическими явлениями не всегда можно выразить линейно, хоть такая модель и проще. Нелинейные модели регрессии позволяют избежать неоправданно больших ошибок, которые могут возникнуть при использовании линейной модели регрессии.
Так, например, нелинейными оказываются производственные функции (зависимости между объемом произведеннойпродукции и основными факторами производства — трудом,капиталом и т. п.), функции спроса (зависимость между спросомна товары или услуги и их ценами или доходом) и другие.
Нелинейные соотношения между экономическими явлениями выражаются с помощью соответствующих нелинейных функций: например, равносторонней гиперболы у = а + b/x + ε, параболы второй степени у = а + b*x + c*x2 + ε.
Различают 2 класса нелинейных регрессий:
1) регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам;
2) регрессии, нелинейные по оцениваемым параметрам.
Для первого класса примером могут послужить:
- полиномы разных степеней: у = а + b*x + c*x2+ ε; у = а + b*x + c*x2 + d*x3 + ε;
- равносторонняя гипербола у = а + b/x + ε.
Ко второму классу относятся функции:
-степенная у = а*xb*ε;
-показательная у = а*bx*ε;
-экспоненциальная у = ea + bx*ε.
Нелинейная регрессия по включенным переменным не имеет никаких сложностей для оценки ее параметров. Они определяются, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в параболе 2 степени
у = а0 + а1*х + а2*х2 + ε,
заменив переменные х = х1, х2 = х2, получим двухфакторное уравнение линейной регрессии:
у = а0 + а1*х1 + а2*х2 + ε,
для оценки параметров которого используется МНК.
Соответственно для полинома 3 порядка
у = а0 + а1*х + а2*х2 + а3*х3 + ε
при замене х = х1, х2 = х2, х3 = х3 получим трехфакторную модель линейной регрессии
у = а0 + а1*х1 + а2*х2 + а3*х3 + ε,
а для полинома k-го порядка
у = а0 + а1*х1 + а2*х2 +... + аk*хk + ε
получим линейную модель множественной регрессии с k объясняющими переменными:
у = а0 + а1*х1 + а2*х2 +... + аk*хk + ε.
Т.е. полином любого порядка сводится к линейной регрессии с ее методами оценивания параметров и проверки гипотез. Как показывают исследования, чаще всего используется парабола второй степени., в отдельных случаях - полином 3 порядка. Полиномы более высоких степеней практически не используют, т.к. исследуемая совокупность должна быть однородной (чем выше порядок полинома, тем больше изгибов имеет кривая, тем меньше однородность совокупности по результативному признаку). Парабола 2 степени целесообразна, если характер связи меняется с прямой на обратную или с обратной на прямую.
Для построения парной нелинейной зависимости необходимо выполнить следующую последовательность действий:
1. Собрать данные о переменных регрессии:
(x,y),t 1,2,...,n t t =.
2. Построить поле корреляции и выполнить его анализ. Определить вид зависимости (линейная, экспоненциальная, гиперболическая, логарифмическая, степенная или показательная).
3. Определить значения новых вспомогательных переменных
(например, для логарифмической зависимости необходимо рассчитать значения X ln x, t 1,2,...,n t = t = для каждого наблюдения).
4. Рассчитать параметры парной линейной регрессии для новых переменных.
5. Оценить значимость параметров регрессии.
6. Построить доверительные интервалы для параметров регрессии.
7. Вычислить коэффициент детерминации и индекс корреляции.
Замечание. Коэффициент детерминации, описанный выше, можно рассчитывать только в том случае, когда зависимая переменная в результате преобразований не изменилась. Если же в левой части, например, вместо переменной у оказалась переменная ln y, то коэффициент детерминации будет сравнивать не фактические и расчетные значения переменной у, а их логарифмы.
Сравнение коэффициентов детерминации для разных уравнений регрессии (например, для линейного и степенного уравнений регрессии с целью выбора более точного уравнения) будет некорректным. В этом случае вычисляют так называемый quasi-R2 (читается «квази эр квадрат») по формуле, где используются значения исходных, а не преобразованных переменных.
Индекс корреляции ρxy, определяющий тесноту связи, определяется по формуле ρxy = корень из R2. Индекс корреляции изменяется от нуля до единицы (0 ≤ ρxy ≤ 1). Чем ближе его значение к единице, тем теснее связь переменных в предположении, что эта связь описывается выбранной зависимостью. Это позволяет сравнивать уравнения регрессии между собой: чем выше quasi-R2 для уравнения (индекс корреляции), тем выше качество подгонки, тем точнее выбранное уравнение регрессии описывает существующую связь. Важно отметить, что этот способ проверки достаточно формальный и при выборе уравнения в первую очередь надо опираться на предписанные теорией зависимости (если они есть), а также на экономическое содержание построенного уравнения (оно должно соответствовать здравому смыслу, опыту и экономической интуиции).