Модель панельных данных с фиксированными эффектами
Материал из MachineLearning.
 (Новая: == Литература ==  == См. также ==  == Ссылки ==  {{Stub|}}  Категория: Прикладная статистика)  | 
				|||
| Строка 1: | Строка 1: | ||
| + | '''Модель панельных данных с фиксированными эффектами ''' (''''' fixed effect model''''') опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются '''эффектами'''. В данной модели эффекты интерпретируются как мешающий параметр, и оценивание направлено на то, чтобы их исключить.  | ||
| + | |||
| + | == Обозначения ==  | ||
| + | Введем обозначения:  | ||
| + | * <tex> i = 1,...,n</tex> – номера объектов, <tex>t = 1,...,T</tex>  – моменты времени, <tex>k </tex> – число признаков.  | ||
| + | * <tex> x_{it}</tex>  – набор независимых переменных (вектор размерности <tex>k </tex>)  | ||
| + | * <tex> y_{it}</tex>  – зависимая переменная для экономической единицы <tex>i</tex> в момент времени <tex>t</tex>  | ||
| + | * <tex> \varepsilon_{it}</tex>  – соответствующая ошибка.  | ||
| + | * Обозначим также:  | ||
| + | ::<tex> \begin{equation*} y_i= \left[y_{i1} \\ ...\\  y_{iT} \right] \text{,} \quad X_i= \left[ x'_{i1} \\ ...\\ x'_{iT}  \right] \text{,} \quad \varepsilon_i= \left[ \varepsilon_{i1} \\ ...\\ \varepsilon_{iT} \right]. \end{equation*} </tex>  | ||
| + | *Введем также «объединенные» наблюдения и ошибки:  | ||
| + | ::<tex> \begin{equation*} y= \left[ y_1 \\ ...\\ y_n \right] \text{,} \quad X= \left[  X_1 \\ ...\\ X_n \right] \text{,} \quad \varepsilon= \left[  \varepsilon_1 \\ ...\\ \varepsilon_n  \right]. \end{equation*}</tex>  | ||
| + | |||
| + | Здесь <tex>y, \varepsilon</tex>  – <tex>nT \times 1</tex> векторы, <tex>X</tex>  – <tex>nT \times k</tex> матрица.  | ||
| + | |||
| + | == Описание модели панельных данных с фиксированными эффектами ==  | ||
| + | В введенных обозначениях  (см. также [[Объединённая модель панельных данных]]) '''модель панельных данных с фиксированными эффектами ''' описывается уравнением  | ||
| + | {{eqno|1}}  | ||
| + | ::<tex>y_{it} = \alpha_i + x'_{it} \cdot \beta + \varepsilon_{it}</tex>.  | ||
| + | Величина <tex>\alpha_i</tex> выражает индивидуальный эффект объекта <tex> i</tex>, не зависящий от времени <tex>t </tex>, ''при этом регрессоры <tex> x_{it}  </tex> не содержат константу ''.  | ||
| + | |||
| + | '''Параметры модели''': <tex>\beta \in \mathbb{R}^k, \alpha_i \in \mathbb{R} (i=1,...,n) </tex>.   | ||
| + | |||
| + | === Основные предположения ===  | ||
| + | Предположим, что выполнены следующие условия:  | ||
| + | # ошибки <tex>\varepsilon_{it}</tex> некоррелированы между собой по <tex> i</tex> и <tex>t </tex>, <tex>\mathbb{E}(\varepsilon_{it}) = 0</tex>, <tex>\mathbb{V}(\varepsilon_{it}) = \sigma_{\varepsilon }^2</tex>;  | ||
| + | # ошибки <tex>\varepsilon_{it}</tex> некоррелированы с регрессорами <tex> x_{js}</tex> при всех <tex>i, j, t, s</tex>.  | ||
| + | |||
| + | === Понижение размерности. Исключение эффектов. ===  | ||
| + | Для панельных данных типична ситуация, когда число объектов <tex> n</tex> достаточно велико. Поэтому, применяя непосредственно [[метод наименьших квадратов]] к уравнению {{eqref|1}}, при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты <tex>\alpha_i</tex>. При этом мы ''понижаем размерность задачи с <tex>(n+k)</tex>  до <tex> k</tex> ''.  | ||
| + | |||
| + | Наиболее простой способ – переход в уравнении {{eqref|1}} к средним по времени величинам:  | ||
| + | {{eqno|2}}  | ||
| + | ::<tex>\overline{y_i}= \alpha_i + \overline{x'_i} \cdot \beta + \overline{\varepsilon_i}</tex>,  | ||
| + | где <tex>\overline{y_i} = \frac{1}{T} \sum_{t=1}^T y_{it},\;  \overline{x_i} = \frac{1}{T} \sum_{t=1}^T x_{it},\;  \overline{\varepsilon _i} = \frac{1}{T} \sum_{t=1}^T \varepsilon _{it}</tex>.  | ||
| + | |||
| + | Вычитая почленно {{eqref|2}} из {{eqref|1}}, получаем:  | ||
| + | {{eqno|3}}  | ||
| + | ::<tex> y_{it} - \overline{y_i}= (x_{it} - \overline{x_i})' \cdot \beta + \varepsilon_{it} - \overline{\varepsilon_i}</tex>.  | ||
| + | Данная модель уже не зависит от эффектов <tex>\alpha_i</tex>. По существу, это уравнение {{eqref|1}}, записанное в отклонениях от индивидуальных средних по времени.  | ||
| + | |||
| + | === Оценка параметров модели ===  | ||
| + | Применяя обычный [[метод наименьших квадратов]] к уравнению {{eqref|3}}, мы получим оценки  | ||
| + | {{eqno|4}}  | ||
| + | ::<tex>\widehat{\beta} = \left(\sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (x_{it} - \overline{x_i})'\right)^{-1} \cdot \sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (y_{it} - \overline{y_i})</tex>.  | ||
| + | |||
| + | Эти оценки называются ''' внутригрупповыми оценками''' (''' within estimator''') или ''' оценками с фиксированным эффектом''' (''' fixed effect estimator''').  | ||
| + | |||
| + | Условия 1)-2), наложенные на модель, гарантируют ''[[несмещённость]] '' и ''[[состоятельность]] '' оценок с фиксированным эффектом.  | ||
| + | |||
| + | В качестве оценок индивидуальных эффектов можно взять  | ||
| + | ::<tex>\widehat{\alpha_i} = \overline{y_i} - \overline{x'_i} \cdot \widehat{\beta},\;  i  = 1,...,n</tex>.  | ||
| + | Эти оценки являются ''[[несмещённость| несмещёнными]] '' и ''[[состоятельность| состоятельными]] '' для фиксированного <tex> n</tex> при <tex> t \rightarrow \infty</tex>.  | ||
| + | |||
| + | Из формулы {{eqref|4}} вытекает выражение для [[матрица ковариации| матрицы ковариации]] оценки <tex>\widehat{\beta}</tex>:  | ||
| + | ::<tex>V(\widehat{\beta}) = \sigma_{\varepsilon }^2 \left(\sum_{i=1}^n \sum_{t=1}^T (x_{it} - \overline{x_i}) \cdot (x_{it} - \overline{x_i})'\right)^{-1}</tex>.  | ||
| + | |||
| + | Как и в обычной линейной модели, в качестве оценки дисперсии <tex>\sigma_{\varepsilon }^2</tex> можно взять [[Остаточная сумма квадратов| сумму квадратов остатков регрессии]], деленную на число степеней свободы:  | ||
| + | ::<tex>\widehat{\sigma_{\varepsilon }}^2 = \frac {\sum_{i=1}^n \sum_{t=1}^T (y_{it} - \overline{y_i} - (x_{it} - \overline{x_i})' \widehat{\beta})^2}{nT-n-k}</tex>.  | ||
| + | |||
| + | При достаточно слабых условиях регулярности оценки с фиксированным эффектом являются ''асимптотически нормальными'' (при <tex> n \rightarrow \infty</tex> или при <tex> T \rightarrow \infty</tex>), поэтому можно пользоваться стандартными процедурами (<tex>t</tex>-тесты, <tex>F</tex>-тесты) для проверки гипотез относительно параметров <tex>\beta</tex>.  | ||
| + | |||
| + | == Недостатки модели панельных данных с фиксированными эффектами ==  | ||
| + | В панельных данных среди независимых переменных <tex>x_{it}</tex> могут быть такие, которые не меняются во времени для каждого объекта. Например, при анализе зарабатной платы в число факторов часто включают пол или расовую принадлежность. Модель с фиксированным эффектом не позволяет идентифицировать соответствующие таким переменным коэффициенты. Формально это объясняется тем, что в уравнении {{eqref|3}} один или несколько регрессоров равны нулю, и, следовательно, [[метод наименьших квадратов]] применять нельзя.  | ||
| + | |||
== Литература ==  | == Литература ==  | ||
| + | # {{книга  | ||
| + | |автор        = Магнус Я. Р., Катышев П. К., Пересецкий А. А.  | ||
| + | |заглавие     = Эконометрика. Начальный курс  | ||
| + | |издательство = М.: Дело  | ||
| + | |год          = 2004  | ||
| + | |страниц      = 576  | ||
| + | }}  | ||
| + | |||
| + | # {{книга  | ||
| + | |автор        =Коленков С.О.  | ||
| + | | заглавие  = Прикладной эконометрический анализ в статистическом пакете Stata  | ||
| + | |год          = 2003  | ||
| + | |ссылка       = http://www.komkon.org/~tacik/Stata6Ec.pdf   | ||
| + | }}  | ||
== См. также ==  | == См. также ==  | ||
| + | * [[Объединённая модель панельных данных]]   | ||
| + | * [[Модель панельных данных со случайными эффектами]]  | ||
| + | * [[Модель панельных данных с временны́ми эффектами]]  | ||
| + | * [[Ротационная панель]]  | ||
== Ссылки ==  | == Ссылки ==  | ||
| - | + | * [http://en.wikipedia.org/wiki/Panel_data  Panel data] (Wikipedia)  | |
| - | + | * [http://en.wikipedia.org/wiki/Panel_analysis  Panel analysis] (Wikipedia)  | |
| + | * [http://en.wikipedia.org/wiki/Random_effects_model Random effects model] (Wikipedia)  | ||
| + | * [http://en.wikipedia.org/wiki/Fixed_effects_estimator Fixed effects estimation] (Wikipedia)  | ||
| + | * [http://teaching.sociology.ul.ie/DCW/confront/node45.html Fixed and random effects models]  | ||
[[Категория: Прикладная статистика]]  | [[Категория: Прикладная статистика]]  | ||
Версия 18:09, 8 января 2009
Модель панельных данных с фиксированными эффектами ( fixed effect model) опирается на структуру панельных данных, что позволяет учитывать неизмеримые индивидуальные различия объектов. Эти отличия называются эффектами. В данной модели эффекты интерпретируются как мешающий параметр, и оценивание направлено на то, чтобы их исключить.
Содержание | 
Обозначения
Введем обозначения:
-  
– номера объектов,
– моменты времени,
– число признаков.
 -  
– набор независимых переменных (вектор размерности
)
 -  
– зависимая переменная для экономической единицы
в момент времени
 -  
– соответствующая ошибка.
 - Обозначим также:
 
- Введем также «объединенные» наблюдения и ошибки:
 
Здесь   – 
 векторы, 
  – 
 матрица.
Описание модели панельных данных с фиксированными эффектами
В введенных обозначениях (см. также Объединённая модель панельных данных) модель панельных данных с фиксированными эффектами описывается уравнением
.
Величина  выражает индивидуальный эффект объекта 
, не зависящий от времени 
, при этом регрессоры 
 не содержат константу .
Параметры модели: . 
Основные предположения
Предположим, что выполнены следующие условия:
-  ошибки 
некоррелированы между собой по
и
,
,
;
 -  ошибки 
некоррелированы с регрессорами
при всех
.
 
Понижение размерности. Исключение эффектов.
Для панельных данных типична ситуация, когда число объектов  достаточно велико. Поэтому, применяя непосредственно метод наименьших квадратов к уравнению (1), при оценивании параметров можно столкнуться с вычислительными проблемами. Их можно преодолеть, исключая из рассмотрения индивидуальные эффекты 
. При этом мы понижаем размерность задачи с 
  до 
 .
Наиболее простой способ – переход в уравнении (1) к средним по времени величинам:
,
где .
Вычитая почленно (2) из (1), получаем:
.
Данная модель уже не зависит от эффектов . По существу, это уравнение (1), записанное в отклонениях от индивидуальных средних по времени.
Оценка параметров модели
Применяя обычный метод наименьших квадратов к уравнению (3), мы получим оценки
.
Эти оценки называются внутригрупповыми оценками ( within estimator) или оценками с фиксированным эффектом ( fixed effect estimator).
Условия 1)-2), наложенные на модель, гарантируют несмещённость и состоятельность оценок с фиксированным эффектом.
В качестве оценок индивидуальных эффектов можно взять
.
Эти оценки являются  несмещёнными  и  состоятельными  для фиксированного  при 
.
Из формулы (4) вытекает выражение для  матрицы ковариации оценки :
.
Как и в обычной линейной модели, в качестве оценки дисперсии  можно взять  сумму квадратов остатков регрессии, деленную на число степеней свободы:
.
При достаточно слабых условиях регулярности оценки с фиксированным эффектом являются асимптотически нормальными (при  или при 
), поэтому можно пользоваться стандартными процедурами (
-тесты, 
-тесты) для проверки гипотез относительно параметров 
.
Недостатки модели панельных данных с фиксированными эффектами
В панельных данных среди независимых переменных  могут быть такие, которые не меняются во времени для каждого объекта. Например, при анализе зарабатной платы в число факторов часто включают пол или расовую принадлежность. Модель с фиксированным эффектом не позволяет идентифицировать соответствующие таким переменным коэффициенты. Формально это объясняется тем, что в уравнении (3) один или несколько регрессоров равны нулю, и, следовательно, метод наименьших квадратов применять нельзя.
Литература
- Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс. — М.: Дело, 2004. — 576 с.
 
- Коленков С.О. Прикладной эконометрический анализ в статистическом пакете Stata. — 2003.
 
См. также
- Объединённая модель панельных данных
 - Модель панельных данных со случайными эффектами
 - Модель панельных данных с временны́ми эффектами
 - Ротационная панель
 
Ссылки
- Panel data (Wikipedia)
 - Panel analysis (Wikipedia)
 - Random effects model (Wikipedia)
 - Fixed effects estimation (Wikipedia)
 - Fixed and random effects models
 

