Outliers in semi-parametric Estimation of Treatment Effects

Fecha

2017-10-30

Autores

Ugarte Ontiveros, Darwin
Canavire-Bacarreza, Gustavo
Castro PeƱarrieta, Luis

TĆ­tulo de la revista

ISSN de la revista

TĆ­tulo del volumen

Editor

Universidad EAFIT

Resumen

Average treatment effects estimands can present significant bias under the presence of outliers. Moreover, outliers can be particularly hard to detect, creating bias and inconsistency in the semi-parametric ATE estimads. In this paper, we use Monte Carlo simulations to demonstrate that semi-parametric methods, such as matching, are biased in the presence of outliers. Bad and good leverage points outliers are considered. The bias arises because bad leverage points completely change the distribution of the metrics used to define counterfactuals. Whereas good leverage points increase the chance of breaking the common support condition and distort the balance of the covariates and which may push practitioners to misspecify the propensity score. We provide some clues to diagnose the presence of outliers and propose a reweighting estimator that is robust against outliers based on the Stahel-Donoho multivariate estimator of scale and location. An application of this estimator to LaLonde (1986) data allows us to explain the Dehejia and Wahba (2002) and Smith and Todd (2005) debate on the inability of matching estimators to deal with the evaluation problem.
Los estimados de efectos de tratamiento promedio pueden presentar un sesgo significativo bajo presencia de valores atĆ­picos. AdemĆ”s, los valores atĆ­picos pueden ser particularmente difĆ­ciles de detectar, creando sesgo e inconsistencia en las estimaciones semi-paramĆ©tricas de ATE. En este documento, nosotros utilizamos simulaciones de Monte Carlo para demostrar que los mĆ©todos semiparamĆ©tricos, tales como coincidencia, estĆ”n sesgados en presencia de valores atĆ­picos. Puntos de apalancamiento malos y Buenos se consideran. El sesgo surge porque los puntos de apalancamiento malo completamente cambian la distribuciĆ³n de las mĆ©tricas utilizadas para definir contrafactuales. Mientras buenos puntos de apalancamiento aumentan las posibilidades de romper la condiciĆ³n de soporte comĆŗn y distorsionar el equilibrio de las covariables y que puede empujar a los practicantes a no especifique adecuadamente la puntuaciĆ³n de propensiĆ³n. Proporcionamos algunas pistas para diagnosticar la presencia de valores atĆ­picos y proponemos un estimador de reponderaciĆ³n que es robusto frente a valores atĆ­picos basado en el estimador de escala y ubicaciĆ³n Stavar-Donoho multivariado. Una aplicaciĆ³n de este estimador a los datos de LaLonde (1986) nos permite explicar el Dehejia y Wahba (2002) y Smith y Todd (2005) debaten sobre la incapacidad de estimadores coincidentes para tratar el problema de evaluaciĆ³n.

DescripciĆ³n

Palabras clave

CitaciĆ³n