Оглавление:
Прогнозирование взаимосвязей экономических явлений на основе факторных регрессионных моделей
После построения регрессионной модели, оценки существенности ее параметров и проверки адекватности, модель используется для предсказания значений зависимой переменной при определенных значениях независимых переменных
Отметим, что действительные значения зависимой переменной не будут совпадать с расчетными (прогнозными), так как регрессия описывает взаимосвязь лишь в среднем. Надежность получаемых по уравнению регрессии прогностических оценок, определяется отклонением эмпирических данных от расчетных по уравнению регрессии. В качестве меры отклонения используется дисперсия. Оценка дисперсии отклонений от регрессии определяется по формуле
Важное значение, при нахождении прогноза, имеет определение доверительных интервалов для значений , т.е. границ, в пределах которых с заданной доверительной вероятностью будет находиться значение . Вследствие того, что оценивание параметров осуществляется по выборочным данным, оценки параметров регрессии содержат некоторую погрешность.
Построим вначале доверительный интервал для парной регрессии. Дисперсию переменной определим как сумму дисперсий слагаемых уравнения . Тогда
Вычислив дисперсию , определим доверительный интервал для расчетного значения :
где — квантиль распределения Стьюдента для уровня значимости и степеней свободы.
Построенные таким образом доверительные интервалы определяют местоположение линии регрессии, т.е. средних значений , но не отдельных возможных значений переменной , которые отклоняются от средней.
Если же мы хотим определить доверительные интервалы для отдельных значений зависимой переменной, то при определении дисперсии необходимо учитывать еще рассеяние вокруг линии регрессии, т.е. нужно включить величину в суммарную дисперсию:
Тогда доверительные интервалы для прогнозов индивидуальных значений будут равны
В параграфе 1.10 было построено уравнение регрессии
Определим среднее значение выпуска валовой продукции на одного среднегодового работника сельского хозяйства при фондовооруженности, равной 20,541. Получим
Для построения доверительного интервала прогноза вычислим дисперсию:
Таким образом, доверительный интервал прогнозируемого выпуска валовой продукции для фондовооруженности, равной 20,541, будет иметь вид (13683-2,05-1778,633; 13683+2,05 • 1778,633), или (10 036,802; 17 329,198).
Пусть прогнозируемое значение определяется по уравнению регрессии с оцененными параметрами
Так как — несмещенные оценки некоторых неизвестных параметров соответствующей взаимосвязи, то — одно из возможных значений прогнозируемой величины при заданных значениях . Поскольку -случайная величина, то и оценка также случайная и имеет дисперсию. Определим ее значение:
Использовав теорему о дисперсии суммы зависимых величин (см. [2, § 4-3]),
или в матричной записи:
где
вектор заданных значений независимых переменных. Так как
то
Поскольку значение нам неизвестно, то, подставив ее оценку получим
Таким образом, «истинное» среднее значение лежит в пределах
Доверительный интервал для при более точно можно трактовать следующим образом: в 95 % случаев оценивания параметров регрессии одного уравнения (по выборкам с тем же числом данных) доверительные интервалы будут содержать истинные средние значения , для заданных . Под прогностическим значением можно понимать его математическое ожидание, т.е. . Однако более естественно в прогностическое значение включить отклонение, т.е. рассматривать . В этом случае к дисперсии необходимо добавить и дисперсию т.е. .
Таким образом, получим
Соответственно доверительные интервалы для индивидуальной прогностической оценки равны
Пример 3.1.
Валовая продукция на одного среднегодового работника сельского хозяйства (ден. ед.) по 15 колхозам зависит от двух переменных и , где — энерговооруженность (л.е.); — фондовооруженность одного работника, занятого в сельскохозяйственном производстве (тыс. ден. ед./чел.). Взаимосвязь характеризуется данными, указанными в табл. 3.1.
Предположим, что между рассматриваемыми величинами теоретически существует линейная зависимость:
Для оценки параметров воспользуемся методом наименьших квадратов, применив который, будем иметь соответствующую систему нормальных уравнений (2.5), решив которую, получим
Таким образом,
Естественно, что оценки параметров найденного уравнения регрессии будут отклоняться от истинных значений. Дисперсия уравнения регрессии зависит от дисперсии оценки каждого параметра уравнения. Для того чтобы измерить дисперсии оценок параметров, необходимо найти дисперсию ошибок:
а также матрицу :
Обратную матрицу найдем как произведение обратного значения определителя на матрицу алгебраических дополнений:
Теперь определим значения дисперсий оценок :
(здесь ) — диагональный элемент матрицы );
Средние квадратичные ошибки коэффициентов частной регрессии в этом случае будут равны:
Оценим значимость коэффициентов частной регрессии. Для проверки гипотезы , воспользуемся статистикой
Подставив соответствующие значения, получим значения статистики для :
По таблице -распределения, для уровня значимости и числа степеней свободы
при двусторонней критической области находим критическое значение
Поскольку
для всех значений , то коэффициенты регрессии статистически надежны. Далее определим :
Найдем теперь 95 %-й доверительный интервал. Для уровня значимости и числа степеней свободы
квантиль . Тогда доверительный интервал имеет вид
или
Проверим адекватность регрессионной модели. Для этого вычислим:
• средний квадрат ошибок регрессионной модели:
коэффициент аппроксимации:
Данная модель имеет хорошую точность, т.к. . -критерий Фишера:
Матрица состоит из остатков уравнения регрессии . А произведение . Таким образом, знаменатель равен
Матрица состоит из значений , вычисленных по уравнению регрессии:
По таблице -распределения при заданном уровне значимости и числе
степенях свободы находим
Так как , то адекватность в целом подтверждается.
Таким образом, все критерии подтверждают адекватность построенной регрессионной модели эмпирическим данным.
Эта лекция взята со страницы предмета «Эконометрика»
Предмет эконометрика: полный курс лекций
Эти страницы возможно вам будут полезны: