Нелинейная регрессия и корреляция
Подбор функции регрессии должен производиться с применением теории конкретной науки, на базе которой формулируется задача измерения связи между явлениями. При этом следует использовать методы выявления наличия связи. Односторонняя стохастическая зависимость может быть выражена и при помощи нелинейных функций. Различают два класса нелинейных регрессий. К первому классу относятся функции, нелинейные относительно факторного признака, но линейные относительно параметров, входящих в данные функции.
Для оценок параметров таких функций применяется метод наименьших квадратов, следовательно, остаются в силе все исходные предпосылки линейного регрессионного анализа. Второй класс регрессий характеризуется нелинейностью факторного признака, входящего в уравнение регрессии.


Функции, наиболее часто встречающиеся в однофакторных регрессионных моделях, представлены в табл. 1.2 (квазилинейные функции) и 1.3 (нелинейные функции второго класса), где даны также нормальные уравнения для определения входящих в них параметров и преобразованные функции (для нелинейных функций второго класса).

В табл. 1.2 и 1.3 указаны классы регрессий, характеризующихся нелинейностью относительно переменной или относительно оцениваемых параметров. Квазилинейные функции (см. табл. 1.2) линейны относительно искомых параметров, т.е. их можно представить в виде

где — функции переменной
. Они не содержат параметров. Например,
или
и т.д. Поэтому к функции (1.3) можно применить метод наименьших квадратов. Получим систему нормальных уравнений:

Правило составления нормальных уравнений системы состоит в следующем: первое уравнение системы получается суммированием функций по
из уравнения (1.3), остальные уравнения — последовательным умножением функции регрессии (1.3) соответственно на
,… и последующим суммированием полученных результатов по
.
Для получения оценок параметров функций из табл. 1.3 их предварительно подвергают преобразованиям, главное назначение которых -линеаризация рассматриваемых зависимостей по оцениваемым параметрам. Параметры регрессии исходных функций находят путем обратных преобразований. Например, путем логарифмического преобразования можно перейти от зависимости показательного типа к линейной

Применяя метод наименьших квадратов к функции

где

получаем значения

Потенцируя полученные значения, находим оценки параметров исходной функции.
Вычислив дисперсию результативного признака и воспользовавшись отклонениями величины
от средней величины
, получим показатель общей дисперсии
, характеризующей вариацию признака
. Вычислив дисперсию
для каждого отдельного значения
признака
и воспользовавшись отклонениями данных значений
от значений, рассчитанных по уравнению линии регрессии, получим условную дисперсию
. Она меньше дисперсии
. В качестве показателя интенсивности связи примем нормированное выражение разности этих дисперсий и получим корреляционное отношение, которое применяется для опенки интенсивности нелинейной связи:

Корреляционное отношение удовлетворяет свойствам:
• Величина корреляционного отношения не зависит от выбора единиц измерения случайных величин и
;
• Корреляционное отношение не превосходит единицы, т.е. ;
• Корреляционное отношение тогда и только тогда, когда между случайными величинами
и
существует функциональная зависимость;
• Если между случайными величинами и
отсутствует хотя бы одна из корреляционных связей, то корреляционное отношение равно нулю;
• Условие является необходимым и достаточным условием линейной регрессионной связи;
• Корреляционное отношение не меньше коэффициента корреляции
Из свойств корреляционного отношения следует, что чем больше значение корреляционного отношения приближается к единице (т. е. чем ближе нормированная разность к единице), тем сильнее наблюдаемая связь, а если
, то связь ослабевает. При функциональной зависимости все значения
лежали бы на линии регрессии.
Для оценки интенсивности нелинейной связи используется также индекс корреляции , который вычисляется по формуле:

Индекс корреляции принимает значения в интервале

Если , т.е.
, для всех
, то мы располагаем функциональной зависимостью. Если же
, т.е.
для всех
, то связь в этом случае отсутствует. Чем больше значение индекса корреляции приближается к единице, тем сильнее наблюдаемая связь. Средняя квадратичная ошибка корреляционного отношения

Различные уравнения регрессии, служащие для оценки уровня величин исследуемых зависимых переменных, представляют большей практический интерес, например в планировании. Оценки, полученные в уравнении регрессии, достаточно точно воспроизводят линию реальной эволюции явлений, если не слишком отдаляться от эмпирических данных. Экстраполяция допускается только тогда, когда доказана полная аналогия условий, места, времени и однородности явлений, к которым относятся оценки.
Эта лекция взята со страницы предмета «Эконометрика»
Предмет эконометрика: полный курс лекций
Эти страницы возможно вам будут полезны: