dc.coverage.spatial | MX | |
dc.date.accessioned | 2018-06-28T05:05:03Z | |
dc.date.available | 2018-06-28T05:05:03Z | |
dc.date.issued | 2011-07-01 | |
dc.identifier.uri | https://ru.tic.unam.mx/handle/123456789/1908 | |
dc.description | Tema del mes | |
dc.description.abstract | Los corpus lingüísticos constituyen uno de los tipos más prominentes de recursos digitales de uso en las humanidades. En la tradición lingüística los corpus se conocen como muestras textuales de diversas naturalezas, escritos u orales, representativos de alguna lengua, área temática, género literario, registro sociolingüístico, lenguaje de especialidad, etcétera. Hoy en día, los corpus lingüísticos son irremediablemente electrónicos. En México, la compilación de corpus electrónicos se inició en los años setenta, antes de la era de Internet. El primer corpus electrónico en español, el Corpus del Español Mexicano Contemporáneo de El Colegio de México, se constituyó como la base estadística de la nomenclatura del Diccionario del Español en México. Luego, con el advenimiento de Internet se han hecho disponibles al mundo los corpus de la Real Academia Española (CORDE y CREA), el Corpus del Español de Mark Davies y El Corpus Histórico del Español en México (CHEM). Este último, desarrollado en el Grupo de Ingeniería Lingüística (GIL) del Instituto de Ingeniería de la Universidad Nacional Autónoma de México, es el foco del presente artículo. Los corpus son un recurso fundamental en las investigaciones lingüísticas, en el desarrollo de herramientas de procesamiento de lenguaje natural y en la construcción de otros recursos lingüísticos como son los diccionarios, lexicones, etcétera. Por todo esto, en el GIL se han desarrollado herramientas computacionales de extracción automática de términos y definiciones (para la lexicografía y terminología computacionales), con el afán de apoyar de forma decisiva la labor de lexicógrafos y terminólogos. En este contexto, en el GIL se han abierto proyectos para elaborar corpus de diversas áreas, como la Ingeniería, los Contextos Definitorios (fragmentos textuales que incluyen en su interior un término y su definición) y las Sexualidades en México, lo que permitirá el estudio de documentos sobre las áreas de sexualidad y sexología y la futura creación automática de diccionarios electrónicos | es_MX |
dc.format | html | |
dc.format | application/pdf | |
dc.format.extent | 339.4 KB | |
dc.format.extent | 1.45 MB | |
dc.language | spa | |
dc.publisher | Universidad Nacional Autónoma de México. Dirección General de Cómputo y de Tecnologías de Información y Comunicación. Revista Digital Universitaria | |
dc.relation.isformatof | http://www.revista.unam.mx/vol.12/num7/art64/art64.pdf | |
dc.relation.ispartof | http://www.revista.unam.mx/index_jul11.htm | |
dc.rights | openAccess | |
dc.source | Revista Digital Universitaria (1607 - 6079). Vol. 12, No. 7 (2011) | |
dc.subject | Español -- Estudio y enseñanza -- Tecnologia -- Innovaciones | |
dc.title | El Corpus Histórico del Español en México | es_MX |
dc.type | article | en |
dc.subject.keywords | Corpus lingüistico, Corpus diacrónico, Español en México, Arquitectura de computo, Estadisticas asociadas a palabras | |
dc.identifier.url | http://www.revista.unam.mx/vol.12/num7/art64 | |
dc.creator | ALFONSO MEDINA URREA | |
dc.creator | CARLOS FRANCISCO MENDEZ CRUZ | |
dc.rights.url | http://creativecommons.org/licenses/by-nc-sa/4.0 |
Files in this item
This item appears in the following Collection(s)
COMPARTE
BÚSQUEDA
Escriba el texto a buscar en DSpace
CONTACTO
El Repositorio Universitario de la DGTIC se edita en la Dirección General de Cómputo y
de Tecnologías de Información y Comunicación (DGTIC), de la Universidad Nacional Autónoma de México (UNAM)
Circuito Exterior s/n, Ciudad Universitaria, Coyoacán, C.P. 04510, México, D.F
Tel: +(52) (55) 56228166 Email: rutic@unam.mx