Оглавление:
Общий случай
- Общий случай В предыдущем примере были только две категории качественных изменений Ной: первенец и первенец. Учитывая высоту Значимость коэффициента фиктивной переменной, Есть желание разработать модель и посмотреть, влияет ли это на вес новорожденного Количество рождений его матери в прошлом. Один из способов сделать это, конечно, использовать.
- Модель: y = a + pxx + p2z + u, (9.17) Где z — предыдущее количество рождений. Тем не менее, эта модель внутренне Тот факт, что вес новорожденного увеличивается как линейная функция от z, т.е. Инкрементальный прирост для каждого дополнительного дородового рождения. И это вообще не очевидно само по себе. По физиологическим причинам Вторые и последующие роды Относительно небольшой дополнительный эффект.
В этой ситуации может быть лучше использовать пустышку. Людмила Фирмаль
Переменные для более точного изучения влияния числа рождений Например, измените классификацию следующих условий: Прошлое (Продолжить отмечать это как категория 0) \ Рождение Отстой (категория 7), последние 2 рождения (категория 2), 3 или более ро Дов прошлое (категория 3), (достаточно для 964 образцов Количество случаев с 4 или более преждевременными родами Рой может оправдать дальнейшую идентификацию отдельных категорий. )
Затем выберите и определите одну из этих категорий в качестве ссылки. Остальные фиктивные переменные. Как выбрать справочную категорию Как объясняется ниже, было бы естественно использовать в этом контексте Используйте категорию ft. Определить фиктивные переменные /) 1, Ш и D3 Для других категорий, таких как: Категория O Z) 1 = Z) 2 = Z> 3 = 0; Категория 1 Z) l = l; Z) 2 = /) 3 = 0; Категория 2 D2 = 1; D 1 = D3 = 0; Категория. Z) 3 = 1; Z) 1 = Z) 2 = 0
Напишите модель следующим образом: y = a + Px + 5, /> 1 + b2D2 + 53 /> 3 + u, (9,18) Где b, 82 и 63 — коэффициенты фиктивной переменной. И 8 При сохранении разница в весе между новорожденными 1 и 0 категории Действие х на определенном уровне, 52- разница в весе новорожденного Разница в весе между категориями 2 и 0 и 53 категориями J и футами В таблице. 9.3 показывает значение, соответствующее предыдущему числу рождений.
Первые 20 вымышленных переменных 964 родов. Оценка регрессионной зависимости веса новорожденных Страсть будущей мамы от этих фиктивных переменных для курения Образцы из всех 964 случаев), получить следующее: коэффициент для каждой фиктивной переменной является оценкой Различия в весе новорожденного между соответствующей и контрольной категориями Рии с определенным уровнем воздействия воздействия курения.
Отсюда Делаем вывод, что у нас новорожденный из категории / вес в среднем 127 грамм По сравнению с новорожденными новорожденных категории 0 Более 102 г по сравнению с новорожденными категории 2 категории Более 105 г по сравнению с 0 и 3-й категорией новорожденных-новогор Из категории 0. Я поддерживаю гипотезу, что результаты важны.
Фактором является не количество предыдущих родов, а рождение матери Будь то шлам. При необходимости используйте фиктивные определения переменных (9.19) Получается из четырех отношений. По одному на каждого Категория. Например, для категории 0 извлекаются все фиктивные переменные Равно нулю и дает уравнение: у = 3373-7,8 *. (9,20) Для категории 7 (D \ = 1, Dl = D3 = 0): у = 3373-7,8 * + 127 = * 3500-7,8х. (9,21)
Аналогично, форма уравнений для категорий 2 и 3 выглядит следующим образом: 9-3475-7,8х; (9,22) 9 = 3478-7,8х. (9.23) Проверка гипотез / При проверке гипотез с использованием критериев все коэффициенты Фиктивная переменная ввода равна нулю, очень отличается от других слоев Вы знаете средний вес каждого новорожденного ребенка в каждой категории Гораздо выше, чем когда женщина впервые родила.
Это может быть Интересно рассмотреть, изменяется ли включение фиктивных групп Значительное увеличение объяснительной силы уравнений регрессии Они. Сумма квадратов невязок без фиктивных переменных Поле составляет 158,6 млн., В общей сложности 155,3 млн. Как упоминалось в разделе 5.6, Соответствующий ^ статистический формат:
P _ Улучшение качества используемого уравнения / степени свободы _ Необъяснимая дисперсия / количество оставшихся степеней свободы ~~ , ft3xl *) / 3 (155,3 xU6) / 959 K ‘ Распространяется с 3 степенями свободы и 959 степенями свободы и превышает критическое значение Значение F равно 5,42 с уровнем значимости 0,1%.
Пожалуйста, выберите справочную категорию Выбор эталонной категории не влияет на сущность уравнения Регрессия, однако, вам решать, какие тесты вы можете Это соображение при откорме, как правило, должно служить ориентиром. но Сам выбор определяет представление коэффициентов регрессии. Только вне проблемы. Это Не влияет Выражение, соответствующее определенной категории, выведенной из основ Уравнение.
Это может быть официально доказано, но мы ограничены иллюстрациями. до В качестве примера приведем вес новорожденного, выбранного в качестве стандарта Категория 7. В прошлом это означало, что мать родила только один раз. Оценить регрессию. Далее нам нужно ввести новую фиктивную переменную (2) 0). 1 для категории 0, ноль в противном случае.
Опус Поправка 7) 1, поскольку она не включена в фиктивную переменную справочной категории Это. Переменные D2 и 7) 3 включены в уравнение с таким же определением. Так же, как и раньше. Результаты построения регрессии: 9 = 3500-7,8 * + 127ZX) -257X2-22Z) 3; R2 = 0,033. (9,25) (Совместный) (26) (2,1) (30) (52) (64) Фиктивный коэффициент, потому что категория 7 стала эталонной.
Переменная дает оценку дополнительного веса младенца относительно другого Категория по сравнению с категорией 7 новорожденных. коэффициент 7) Конечно, новорожденные в этой категории отрицательны, поэтому 0 отрицательно. Тест 0 обычно легче, чем у детей 7 категории. Coeff Соотношение в D 2 и 7) 3 мало и отрицательно.
- Это показывает, что вес новорожденного действительно уменьшается с увеличением числа Предыдущее рождение, но не обязательно. Установите DO = 1, чтобы получить версию уравнения категории 0 7) 2 = 7) 3 = 0. Для категории 7 все фиктивные переменные принимают значения 0. Для категории 2 переменная 7) 2 = 1, DO = 7) 3 = 0. Для категории 3 переменная Переменная Z> 3 = 1, Z> 0 = Z) 2 = 0.
Вы можете видеть, что уравнение получено. (9.20) — (9.23), как и прежде. Интерпретация гипотезы проверки коэффициентов с помощью манекена Тем не менее, изменения разные. Например, коэффициент для D2 уже Не разница в весе между новорожденными в категориях 2 и 7, У категории 2 и 0 вес ребенка.
Поэтому выбор эталонной категории определяется набором Проверка гипотезы, которую вы хотите выполнить. Людмила Фирмаль
В этом случае при необходимости Вес новорожденного категории 0 Другая категория должна затем использоваться в качестве справочной категории Начальная версия категории 0. Если вы уже знаете цель результата Категория 0 намного ниже и, вероятно, будет более сложной. Я заинтересован в тесте, чтобы показать, будет ли он увеличиваться (или уменьшаться) xa) Вес новорожденных в категориях выше, чем в категории 7.
В этом случае его следует использовать в качестве справочной категории для второго Категория 7 вариант. Коэффициент статистики в уравнении (9.25) / -732 и 7) 3 указывает, что они незначительно отличаются от нуля до значимых уровней 5%. Отсюда вес новорожденных в категории и Нет существенной разницы между случаем 7 и новорожденными более высокой категории.
Ловушка при применении фиктивных переменных Что произойдет, если я включу фиктивную переменную в это Общественная категория? Происходят две вещи. Во-первых, если это возможно Но для расчета коэффициентов регрессии им нельзя дать интерпретацию Станция. Коэффициент является оценкой базовой величины постоянного члена В уравнении регрессии коэффициент фиктивной переменной равен Оцените прирост постоянных членов по сравнению с этим базовым уровнем Ему.
Но теперь, чего не хватает в «базе», Станция не принимается. На самом деле это невозможный процесс Глупость расчета коэффициента регрессии. Компьютер просто раздает Заявления об ошибках или в некоторых случаях (в более продвинутых регрессионных пакетах), Отбросьте одну из фиктивных переменных.
Использование сезонных фиктивных переменных Исследователи, использующие данные временных рядов, обычно предлагают Читайте ежеквартальные данные о погоде по простым причинам Из-за этого они получают в четыре раза больше наблюдений во время исследования Период. Тем не менее, зависимости могут оказать заметное влияние Зональный фактор.
В этом случае рекомендуется рассмотреть непосредственно 273 Mania. Если этот эффект не принимается во внимание, это способствует Условия и «шум». В результате ненужно Эффективность других коэффициентов оценки. В таблице. На рисунке 9.4 показаны расходы потребителей газа и электроэнергии в США. По фиксированной цене с первого квартала 1977 года по четвертый квартал 1982 года.
Обратите внимание, что римские цифры используются для обозначения квартала года Я — IV. Эта серия характеризуется небольшим восходящим трендом и силой. Зона вибрации. Как и следовало ожидать, такие расходы всегда Зима значительно выше, чем лето. Первый квартал года произвольно устанавливается в качестве контрольной категории, и Используйте фиктивные переменные dem и Другие кварталы.
Напишите модель следующим образом y = a + p / + b2D2 + 53Z> 3 + b4D4 + u, (9,26) Где D2, D3 и D4 — фиктивные переменные Определено на следующем изображении zom: b2 равно 1 и нулю, если наблюдение во II квартале В противном случае; /) 3 равно 1 в III квартале, а остальные равны 0 Случай; D4 равен 1 в IV квартале и нулю в противном случае.
Значения 52, 53 и 84 являются коэффициентами. Они дают цифры Эффекты, вызванные сезонными изменениями. Фактор 52 указывает на сложение Фактическое потребление газа и электроэнергии во втором квартале по сравнению с первым кварталом Треска с сезонными изменениями. Похоже на это 53 и 84 показа Соответствующая дополнительная сумма за 3 квартал и 4 квартал.
Первый квартал Все эти «сдвиги» приведены по сравнению с первым кварталом, Выбран в качестве справочной категории. 274 Полный набор наблюдений о стоимости газа и электроэнергии дан. Время и фиктивные переменные перечислены в таблице. 9.5. Оценить регистрацию Стоимость и временная зависимость фиктивных переменных, А излучение: y = 7,50 + 0,030 /-2,78 D2 -2,58 Z) 3-2,19 Z> 4, R2 = 0,98. (9,27) (Co.) (0,09) (0,005) (0,09) (0,10) (0,10)
Из этого результата для каждого квартала выводится отдельное уравнение. у = 7,50 + 0,030 / (I квартал) у = 4,72 + 0,030 / (II квартал) (9,28) у = 4,92 + 0,030 / (III квартал) Можно построить уравнение y = 5,31 + 0,030 / (IV квартал) (9,28) (рис. 9.4). (Ниже Обратите внимание, что в данном конкретном случае, тенденция времени не Важно, чтобы линия была почти горизонтальной. )
При необходимости вы можете использовать оценочную регрессию, чтобы получить оценку Ки сезонные колебания для каждого квартала. Дайте четыре из формулы (9.28) Эффективная линия регрессии. Когда они усредняются: j> = 5,61 + 0,030 /. (9,29) Расстояние между одной линией регрессии и средним для любой четверти.
Пунктирная линия, представляющая собой разницу между значениями постоянных членов в уравнении регрессии, показывает предполагаемое сезонное отклонение для этого квартала. Она Это: Для I квартала: 7,50-5,61 = 1,89; II квартал: 4,72-5,61 = -0,89; За III квартал: 4,92-5,61 = -0,69; За IV квартал: 5,31-5,61 = –0,30. {Проверка: общее сезонное отклонение должно быть нулевым. Действительно так. )
Все G тесты связаны с коэффициентом фиктивной переменной, Высокая значимость, как совместное объяснение F тест Возможность. Сумма квадратов невязок для регрессии с использованием манекена Если переменных нет и они равны 0,51 и 29,76 соответственно. Поэтому ^^ Палка (29,25 / 3) / (0,51 / 19) = 363,2. Критический уровень F 3 и 19 градусов Штраф свободы составляет 5,01 с 1% важности. упражнения 9.4.
В следующей таблице приведены квартальные данные по жилью. США г-н Строительство в 1977 году (исключая сельские районы) 1982 год (миллиарды долларов, цена 1972 года). Регрессионный балл Зависимость этой тенденции от временных трендов и сезонных изменений Переменные, определенные в II, III и IV кварталах, дали следующие результаты:
(Стандартная ошибка показана в скобках): 9 = 13,69 + 3,022) 2 + 4,08 ID3 + 3,00 D4 -0,3If; R2 = 0,83. (0,65) (0,73) (0,73) (0,73) (0,04) Обеспечивает полную интерпретацию регрессии. 9.5. Оцените уравнение регрессии так же, как и упражнение Мнение 9.4, используя один из видов потребительских расходов (Таблица B.Z.) и компьютерные данные.
Дайте результаты и вашу интерпретацию Пройдите соответствующий статистический тест. Оцените регрессию снова Без фиктивных переменных запустите ‘/ test, чтобы проверить эти соединения Важно. 9.6. Предположим, вы оцениваете регрессионную зависимость затрат Мороженое из личного дохода с использованием наблюдения syatsam. Объясните, как представить набор фиктивных переменных для оценки Ци сезонные колебания.
Смотрите также:
Инструментальные переменные | Множественные совокупности фиктивных переменных |
Иллюстрация использования фиктивной переменной | Фиктивные переменные для коэффициента наклона |
Если вам потребуется помощь по эконометрике вы всегда можете написать мне в whatsapp.