Time-Frequency Energy Features for Articulator Position Inference on Stop Consonants

dc.citation.epage56
dc.citation.issue16
dc.citation.journalAbbreviatedTitleing.cienc.eng
dc.citation.journalTitleIngeniería y Cienciaeng
dc.citation.spage37
dc.citation.volume8
dc.contributor.affiliationUniversidad Nacional de Colombiaspa
dc.contributor.authorSepulveda-Sepulveda, Alexanderspa
dc.contributor.authorCastellanos-Domínguez, Germanspa
dc.coverage.spatialMedellín de: Lat: 06 15 00 N degrees minutes Lat: 6.2500 decimal degrees Long: 075 36 00 W degrees minutes Long: -75.6000 decimal degreeseng
dc.date2012-12-01
dc.date.accessioned2019-11-22T18:49:13Z
dc.date.available2019-11-22T18:49:13Z
dc.date.issued2012-12-01
dc.descriptionAcoustic-to-Articulatory inversion offers new perspectives and interesting applicationsin the speech processing field; however, it remains an open issue. This paper presents a method to estimate the distribution of the articulatory informationcontained in the stop consonants’ acoustics, whose parametrizationis achieved by using the wavelet packet transform. The main focus is on measuringthe relevant acoustic information, in terms of statistical association, forthe inference of the position of critical articulators involved in stop consonantsproduction. The rank correlation Kendall coefficient is used as the relevance measure. The maps of relevant time–frequency features are calculated for theMOCHA–TIMIT database; from which, stop consonants are extracted andanalysed. The proposed method obtains a set of time–frequency components closely related to articulatory phenemenon, which offers a deeper understanding into the relationship between the articulatory and acoustical phenomena.The relevant maps are tested into an acoustic–to–articulatory mapping systembased on Gaussian mixture models, where it is shown they are suitable for improvingthe performance of such a systems over stop consonants. The method could be extended to other manner of articulation categories, e.g. fricatives,in order to adapt present method to acoustic-to-articulatory mapping systemsover whole speech.eng
dc.descriptionLa inversión acústica a articulación ofrece nuevas perspectivas y aplicaciones interesantes en el campo del procesamiento del habla; Sin embargo, sigue siendo un tema abierto. Este artículo presenta un método para estimar la distribución de la información articulatoria contenida en la acústica de las consonantes de parada, cuya parametrización se logra utilizando la transformación del paquete wavelet. El enfoque principal está en medir la información acústica relevante, en términos de asociación estadística, para la inferencia de la posición de los articuladores críticos involucrados en la producción de consonantes de parada. El coeficiente de Kendall de correlación de rango se utiliza como medida de relevancia. Los mapas de las características relevantes de tiempo-frecuencia se calculan para la base de datos MOCHA-TIMIT; de donde se extraen las consonantes y se analizan. El método propuesto obtiene un conjunto de componentes de frecuencia de tiempo estrechamente relacionados con el fenómeno de articulación, que ofrece una comprensión más profunda de la relación entre los fenómenos articulatorio y acústico. Los mapas relevantes se prueban en un sistema de mapeo acústico-articulatorio basado en modelos de mezcla gaussiana , donde se muestra que son adecuados para mejorar el rendimiento de tales sistemas sobre las consonantes de parada. El método podría extenderse a otro tipo de categorías de articulación, p. Ej. fricativas, con el fin de adaptar el método actual al sistema de mapeo acústico a articulatorio en todo el discurso.spa
dc.formatapplication/pdf
dc.identifier.doi10.17230/ingciencia.8.16.2
dc.identifier.issn2256-4314
dc.identifier.issn1794-9165
dc.identifier.urihttp://hdl.handle.net/10784/14448
dc.language.isoengeng
dc.publisherUniversidad EAFITspa
dc.relation.isversionofhttp://publicaciones.eafit.edu.co/index.php/ingciencia/article/view/1705
dc.relation.urihttp://publicaciones.eafit.edu.co/index.php/ingciencia/article/view/1705
dc.rightsCopyright (c) 2012 Alexander Sepulveda-Sepulveda, German Castellanos-Domínguezeng
dc.rights.accessrightsinfo:eu-repo/semantics/openAccesseng
dc.rights.localAcceso abiertospa
dc.sourceinstname:Universidad EAFIT
dc.sourcereponame:Repositorio Institucional Universidad EAFIT
dc.sourceIngeniería y Ciencia; Vol 8, No 16 (2012)spa
dc.subject.keywordAcoustic-To-Articulatory Inversioneng
dc.subject.keywordGaussian Mixture Modelseng
dc.subject.keywordArticulatory Phoneticseng
dc.subject.keywordTime-Frequency Featureseng
dc.subject.keywordInversión Acústica A Articulaciónspa
dc.subject.keywordModelos De Mezcla Gaussianaspa
dc.subject.keywordFonética Articulatoriaspa
dc.subject.keywordCaracterísticas De Frecuencia De Tiempospa
dc.titleTime-Frequency Energy Features for Articulator Position Inference on Stop Consonantseng
dc.titleCaracterísticas de tiempo-frecuencia para la estimación de la posición de los órganos articuladores en consonantes explosivasspa
dc.typearticleeng
dc.typeinfo:eu-repo/semantics/articleeng
dc.typepublishedVersioneng
dc.typeinfo:eu-repo/semantics/publishedVersioneng
dc.type.localArtículospa

Archivos

Bloque original
Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
2.pdf
Tamaño:
354.33 KB
Formato:
Adobe Portable Document Format
Descripción:
Texto completo PDF
No hay miniatura disponible
Nombre:
articulo.html
Tamaño:
374 B
Formato:
Hypertext Markup Language
Descripción:
Texto completo HTML