Show simple item record

dc.coverage.spatialMX
dc.date.accessioned2018-06-28T05:05:03Z
dc.date.available2018-06-28T05:05:03Z
dc.date.issued2011-07-01
dc.identifier.urihttps://ru.tic.unam.mx/handle/123456789/1908
dc.descriptionTema del mes
dc.description.abstractLos corpus lingüísticos constituyen uno de los tipos más prominentes de recursos digitales de uso en las humanidades. En la tradición lingüística los corpus se conocen como muestras textuales de diversas naturalezas, escritos u orales, representativos de alguna lengua, área temática, género literario, registro sociolingüístico, lenguaje de especialidad, etcétera. Hoy en día, los corpus lingüísticos son irremediablemente electrónicos. En México, la compilación de corpus electrónicos se inició en los años setenta, antes de la era de Internet. El primer corpus electrónico en español, el Corpus del Español Mexicano Contemporáneo de El Colegio de México, se constituyó como la base estadística de la nomenclatura del Diccionario del Español en México. Luego, con el advenimiento de Internet se han hecho disponibles al mundo los corpus de la Real Academia Española (CORDE y CREA), el Corpus del Español de Mark Davies y El Corpus Histórico del Español en México (CHEM). Este último, desarrollado en el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la Universidad Nacional Autónoma de México, es el foco del presente artículo. Los corpus son un recurso fundamental en las investigaciones lingüísticas, en el desarrollo de herramientas de procesamiento de lenguaje natural y en la construcción de otros recursos lingüísticos como son los diccionarios, lexicones, etcétera. Por todo esto, en el GIL se han desarrollado herramientas computacionales de extracción automática de términos y definiciones (para la lexicografía y terminología computacionales), con el afán de apoyar de forma decisiva la labor de lexicógrafos y terminólogos. En este contexto, en el GIL se han abierto proyectos para elaborar corpus de diversas áreas, como la Ingeniería, los Contextos Definitorios (fragmentos textuales que incluyen en su interior un término y su definición) y las Sexualidades en México, lo que permitirá el estudio de documentos sobre las áreas de sexualidad y sexología y la futura creación automática de diccionarios electrónicoses_MX
dc.formathtml
dc.formatapplication/pdf
dc.format.extent339.4 KB
dc.format.extent1.45 MB
dc.languagespa
dc.publisherUniversidad Nacional Autónoma de México. Dirección General de Cómputo y de Tecnologías de Información y Comunicación. Revista Digital Universitaria
dc.relation.isformatofhttp://www.revista.unam.mx/vol.12/num7/art64/art64.pdf
dc.relation.ispartofhttp://www.revista.unam.mx/index_jul11.htm
dc.rightsopenAccess
dc.sourceRevista Digital Universitaria (1607 - 6079). Vol. 12, No. 7 (2011)
dc.subjectEspañol -- Estudio y enseñanza -- Tecnologia -- Innovaciones
dc.titleEl Corpus Histórico del Español en Méxicoes_MX
dc.typearticleen
dc.subject.keywordsCorpus lingüistico, Corpus diacrónico, Español en México, Arquitectura de computo, Estadisticas asociadas a palabras
dc.identifier.urlhttp://www.revista.unam.mx/vol.12/num7/art64
dc.creatorALFONSO MEDINA URREA
dc.creatorCARLOS FRANCISCO MENDEZ CRUZ
dc.rights.urlhttp://creativecommons.org/licenses/by-nc-sa/4.0


Files in this item

   
Thumbnail

This item appears in the following Collection(s)

Show simple item record

COMPARTE



Escriba el texto a buscar en DSpace

El Repositorio Universitario de la DGTIC se edita en la Dirección General de Cómputo y
de Tecnologías de Información y Comunicación (DGTIC), de la Universidad Nacional Autónoma de México (UNAM)
Circuito Exterior s/n, Ciudad Universitaria, Coyoacán, C.P. 04510, México, D.F
Tel: +(52) (55) 56228166 Email: rutic@unam.mx