Синтетический контроль

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
Сравнение реального благосостояния жителей ФРГ после объединения с ГДР в 1990 и гипотетического, если бы объединения не состоялось, с опорой на данные других стран ОЭСР[1].

Синтетический контроль (англ. Synthetic control method, SCM) — эконометрический метод анализа данных в рамках причинно-следственной модели Рубина[англ.], позволяющий проводить каузальную инференцию[англ.] в сравнительных кейс-стади. Метод направлен на оценку эффектов исследуемого воздействия (например, экономической реформы) на примере небольшого числа кейсов с помощью моделирования их количественных показателей в гипотетической ситуации, где воздействие не было оказано, на основе ограниченного круга похожих контрольных наблюдений посредством присвоения этим переменным определённых весов.

Формальный вывод[править | править код]

Рассмотрим -й регион, или какой-то другой объект наблюдения, причём , где — число регионов, среди которых 1 испытал на себе исследуемое воздействие, а остальные — нет, являясь контрольной группой (их совокупность называется «пулом доноров», англ. donor pool), в период времени , где .

Пусть исследуемое воздействие будет оказано в период , где , и тогда — число периодов до воздействия. Обозначим отклик показателя в регионе в период времени в отсутствие исследуемого воздействия через , а в его присутствие — . Сделаем допущение о том, что при , : до наступления исследуемого воздействия, оно не оказывает эффекта на отклик в выбранном регионе. Также допустим, что воздействие, имевшее место в рассматриваемом регионе, не оказывает влияния на регионы из контрольной группы. Эффект исследуемого воздействия обозначим как . Поскольку воздействие имеет место только в и , целью SCM является определение , где — собственно, наблюдаемый в рассматриваемом регионе показатель, а — ненаблюдаемый отклик, который можно представить в качестве следующей факторной модели:

где — общий для всех регионов фактор, — вектор наблюдаемых, независимых от воздействия ковариат, — вектор их оценённых для данной выборки регионов коэффициентов, — вектор ненаблюдаемых латентных факторов, — вектор соответствующих им факторных нагрузок и — специфичности, или шум. Эту модель можно переписать в виде:

где — это -тое значение вектора , такого, что . Метод синтетического контроля заключается в подборе такого набора весов , что при , (то есть до воздействия веса сохраняют наблюдаемое значения отклика неизменным) и (и при этом эти веса позволяют точно моделировать ковариаты рассматриваемого региона через ковариаты регионов контрольной группы).

В литературе было показано, что если отклонения специфичностей незначительны при данном , размере периода до воздействия, , то есть разница между моделируемым, ненаблюдаемым откликом в отсутствие воздействия и взвешенным, но наблюдаемым в его присутствии, в таких условиях ничтожно. Соответственно, предлагается такая оценка эффекта воздействия ()[2]:494-495:

Оптимизация алгоритма[править | править код]

С вычислительной точки зрения, расчёт искомых весов связан с минимизацией по вектору весов нормы , где — вектор значений ковариатов для исследуемого региона до момента , а — матрица значений ковариатов для контрольных регионов. Вне зависимости от выбора исследователем положительно определённой матрицы , оптимизируемая норма раскрывается как [2]:496.

Для того, чтобы получить конечное значение , проводят внешнюю оптимизацию по параметру с использованием коэффициентом дисконтирования , повышающим вес недавних наблюдений. Эту оптимизацию можно описать следующим образом: , где — вектор минимальных весов, полученный на предыдущем этапе[3]:616.

Статистическая значимость результатов[править | править код]

Определение статистической значимости полученных оценок может быть проведено посредством различных техник. В статье 2003 года, оценивающей влияние терроризма и прочих проявлений политического насилия на экономику Страны Басков, рассчитанный эффект был подвергнут т. н. плацебо-тесту (placebo test), заключавшемуся в осуществлении идентичного алгоритма синтетического контроля к Каталонии, также известной своим значительным сепаратистским движением, но не испытывавшей проблем с террористическими проявлениями этого движения[4].

Плацебо-тесты в литературе, использующей метод синтетического контроля, являются примером непараметрических пермутационных тестов. Моделирование синтетического отклика для всех контрольных кейсов в выборке позволяет в явном виде работать с вероятностным распределением и проверять нулевую гипотезу об отсутствии казуальных эффектов в рассматриваемом кейсе. При этом нет необходимости асимптотически приближать распределение этих эффектов у контрольных кейсов к тому или иному распределению, что и делает тесты подобного типа пермутационными[5].

Синтетический контроль как метод предсказания[править | править код]

В литературе было предложено использовать SCM не только для оценки причинно-следственных связей, но и построения прогнозов. В рамках пилотного исследования была предпринята попытка спрогнозировать экономический рост в Соединённых Штатах Америки, однако использующийся для получения весов «пул доноров» состоял уже не из стран с похожими характеристиками, но из показателей экономического роста с определённым временным лагом[3]:616.

Синтетический контроль и другие методы[править | править код]

Синтетический контроль совмещает элементы других каузальных статистических методов: разности разностей[англ.] и мэтчинга[англ.].

По сравнению с разностью разностей синтетический контроль предлагает более упорядоченную процедуру подбора весов для наблюдений из контрольной группы, использует больший временной промежуток перед воздействием и требует максимально возможного приближения характеристик контрольной группы к характеристикам исследуемого объекта в ходе подбора весов.

Метод синтетического контроля обладает набором сходств с линейной регрессией. Так и синтетический контроль, и регрессионный анализ предполагают линейную комбинацию весов и переменных (в последнем веса, как правило, называются регрессионными коэффициентами), причём сумма весов равняется 1. Основным различием является то, что в SCM значения этих весов заключены в , тогда как в регрессионном анализе такого ограничения нет и коэффициенты практически не интерпретируются как веса[1]:498-499 Так контрфактуальная Германия из исследования 2015 года[1] была «синтезирована» на основании подушного ВВП, уровня инвестиций, торговой открытости, количества школ и доли промышленности в прибавочном продукте Австрии (42%), США (22%), Японии (16%), Швейцарии (11%) и Нидерландов (9%)[6].

Симуляции показали, что панельный метод Сяо (фиксированные эффекты с эффектами взаимодействия) для исследования каузальных эффектов является менее робастным к изменению в пуле доноров, нежели синтетический контроль, хотя использование обоих подходов приводит к удовлетворительным результатам. Отмечалось, что синтетический контроль является более предпочтительным, если у исследователя есть данные по дополнительным временным периодам[7]:1001[8].

Применение[править | править код]

Область применения метода синтетического контроля охватывает исследования политики в сфере здравоохранения[9], криминологию[10], политическую науку[1], различные разделы экономики.

В политологии SCM рассматривается как компромисс между конвенциональными количественными и качественными методами, позволяющий совмещать фокус на одном или нескольких кейсах со строгими критериями их подбора. Посредством этого метода изучались: экономический эффект от объединения Германии для собственно ФРГ[1], последствия федеративной реформы в Бельгии[англ.] для расходов на социальное обеспечение[11].

В географии SCM используется в исследованиях антропогенных ландшафтов (в рамках land systems science)[12]:513.

В статистических пакетах[править | править код]

Существуют пакеты для анализа данных посредством метода синтетического контроля в статистическом программном обеспечением. Для языка R был разработан пакет Synth[13].

См. также[править | править код]

Примечания[править | править код]

  1. 1 2 3 4 5 Abadie A., Diamond A., Hainmueller J. Comparative Politics and the Synthetic Control Method // American Journal of Political Science. — 2015. — Vol. 59, № 2. — P. 495–510. — doi:10.1111/ajps.12116.
  2. 1 2 Abadie A., Diamond A., Hainmueller J. Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program // Journal of the American Statistical Association. — 2010. — Vol. 105, № 490. — P. 493-505. — doi:10.1198/jasa.2009.ap08746.
  3. 1 2 Klößner S.,Pfeifer G. Outside the box: using synthetic control methods as a forecasting technique // Applied Economics Letters. — 2017. — Vol. 25, № 9. — P. 615-618. — doi:10.1080/13504851.2017.1352071.
  4. Abadie A., Gardeazabal J. The Economic Costs of Conflict: A Case Study of the Basque Country // American Economic Review. — 2003. — Vol. 93, № 1. — P. 112–132. — doi:10.1257/000282803321455188.
  5. Hahn J., Shi R. Synthetic Control and Inference // Econometrics. — 2017. — Vol. 5, № 4. — P. 52. — doi:10.3390/econometrics5040052. Архивировано 28 марта 2018 года.
  6. Klößner S., Kaul A., Pfeifer G., Schieler M. Comparative politics and the synthetic control method revisited: a note on Abadie et al. (2015) // Swiss Journal of Economics and Statistics. — 2018. — Vol. 154, № 1. — doi:10.1186/s41937-017-0004-9.
  7. Gardeazabal J., Vega‐Bayo A. An Empirical Comparison Between the Synthetic Control Method and HSIAO et al.'s Panel Data Approach to Program Evaluation // Journal of Applied Econometrics. — 2017. — Vol. 32, № 5. — P. 983-1002. — doi:10.1002/jae.2557.
  8. Gobillon L., Magnac T. Regional Policy Evaluation: Interactive Fixed Effects and Synthetic Controls // The Review of Economics and Statistics. — 2016. — Vol. 98, № 3. — P. 535-551. — doi:10.1162/rest_a_00537.
  9. Kreif N., Grieve R., Hangartner D., Turner A.J., Nikolova S., Sutton M. Examination of the Synthetic Control Method for Evaluating Health Policies with Multiple Treated Units // Health Economics. — 2016. — Vol. 25, № 12. — P. 1514–1528. — doi:10.1002/hec.3258.
  10. Saunders J., Lundberg R., Braga A.A., Ridgeway G., Miles J. A Synthetic Control Approach to Evaluating Place-Based Crime Interventions // Journal of Quantitative Criminology. — 2014. — Vol. 31, № 3. — P. 413–434. — doi:10.1007/s10940-014-9226-5.
  11. Arnold T., Stadelmann‐Steffen I. How federalism influences welfare spending: Belgium federalism reform through the perspective of the synthetic control method // European Journal of Political Research. — 2017. — № 56. — P. 680-702. — doi:10.1111/1475-6765.12196.
  12. Meyfroidt P. Approaches and terminology for causal analysis in land systems science // Journal of Land Use Science. — 2015. — Vol. 11, № 5. — P. 501-522. — doi:10.1080/1747423X.2015.1117530.
  13. Abadie A., Diamond A., Hainmueller J. Synth: An R Package for Synthetic Control Methods in Comparative Case Studies // Journal of Statistical Software. — 2011. — Vol. 42, № 13. — doi:10.18637/jss.v042.i13.