Detecting Outliers with a Non-parametric estimation of the Mahalanobis distance
dc.contributor.advisor | Laniado Rodas, Henry | spa |
dc.contributor.advisor | Saldarriaga Aristizábal, Pablo Andrés | spa |
dc.contributor.author | Piedrahita Jaramillo, Catalina | |
dc.coverage.spatial | Medellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degrees | eng |
dc.creator.degree | Magíster en Ciencias de Datos y Analítica | spa |
dc.creator.email | cpiedrahij@eafit.edu.co | spa |
dc.date.accessioned | 2024-03-01T23:04:19Z | |
dc.date.available | 2024-03-01T23:04:19Z | |
dc.date.issued | 2023 | |
dc.description | Este artículo propone la creación de una versión robusta de la distancia de Mahalanobis para el problema de identificación de valores atípicos, utilizando estimaciones robustas y no paramétricas para la matriz de covarianza, como la Tau de Kendall y la Desviación Absoluta Mediana (MAD), así como técnicas que mejoran la Propiedades numéricas de la matriz de covarianza para reducir el error durante cálculos numéricos como el Shrinkage de Ledoit y Wolf. El rendimiento de los métodos se evalúa mediante la simulación de datos normales independientes, datos normales correlacionados y conjuntos de datos reales y se compara con algunos métodos de la literatura. Los métodos propuestos logran un alto porcentaje de identificación correcta de valores atípicos y tienen una baja tasa de falsos positivos para ambos tipos de datos, particularmente en el caso de datos normales correlacionados. | spa |
dc.description.abstract | This paper proposes the creation of a robust version of the Mahalanobis distance for the outlier’s identification problem, using robust and non-parametric estimations for the covariance matrix, such as Kendall’s Tau and Median Absolute Deviation (MAD), as well as techniques that enhance the numerical properties of the covariance matrix to reduce error during numerical calculations like Ledoit and Wolf’s Shrinkage. The performance of the methods is evaluated through simulation of independent normal data, correlated normal data, and real data sets and compared with some methods from the literature. The proposed methods achieve a high percentage of correct identification of outliers and have a low false positive rate for both data types, particularly in the case of correlated normal data. | spa |
dc.identifier.ddc | 519.5 P613 | |
dc.identifier.uri | https://hdl.handle.net/10784/33514 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad EAFIT | |
dc.publisher.department | Escuela de Ciencias Aplicadas e Ingeniería. Área Computación y Analítica | spa |
dc.publisher.place | Medellín | spa |
dc.publisher.program | Maestría en Ciencias de los Datos y Analítica | spa |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) | spa |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | eng |
dc.rights.local | Acceso abierto | spa |
dc.rights.uri | http://creativecommons.org/licenses/by/4.0/deed.es | |
dc.subject | Mahalanobis | |
dc.subject | Atípicos | |
dc.subject | No paramétrico | |
dc.subject | Covarianza | |
dc.subject.keyword | Mahalanobis | spa |
dc.subject.keyword | Outliers | spa |
dc.subject.keyword | Non-parametric | spa |
dc.subject.keyword | Covariance | spa |
dc.subject.keyword | Kendall’s Tau | spa |
dc.subject.keyword | MAD | spa |
dc.subject.keyword | Shrinkage | spa |
dc.subject.lemb | CIENCIA DE LA INFORMACIÓN | |
dc.title | Detecting Outliers with a Non-parametric estimation of the Mahalanobis distance | spa |
dc.type | masterThesis | eng |
dc.type | info:eu-repo/semantics/masterThesis | eng |
dc.type.hasVersion | acceptedVersion | eng |
dc.type.local | Tesis de Maestría | spa |
dc.type.spa | Artículo | spa |
Archivos
Bloque original
1 - 3 de 3
No hay miniatura disponible
- Nombre:
- Catalina_PiedrahitaJaramillo_2023.pdf
- Tamaño:
- 2.09 MB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Trabajo de grado
No hay miniatura disponible
- Nombre:
- formulario_autorizacion_publicacion_obras.pdf
- Tamaño:
- 384.44 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Formulario autorización publicación obras
No hay miniatura disponible
- Nombre:
- carta_aprobacion_trabajo_grado_eafit.pdf
- Tamaño:
- 108.44 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Carta aprobación trabajo de grado
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 2.5 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: