Destacados

Corpus del español del siglo XXI

Es un proyecto que tiene como objetivo reunir un conjunto textual de millones de formas, correspondientes a los años 2001 a 2012 procedentes únicamente de textos producidos en español. El Corpus del español del siglo XXI es una iniciativa de la RAE y en la que colabora de forma activa el Centro Universitario CIESE-Comillas.

Publicada: 17 de diciembre de 2015

¿Por qué es importante esta iniciativa? Pues porque sirve para preservar y permitir la recuperación selectiva de todos los casos de un determinado fenómeno lingüístico. El Corpus del español del siglo XXI también conocido como Corpes agrupa ya más de 300 millones de formas un 70% aproximadamente de América y un 30% de España, con una codificación y tipología textual extremadamente detalladas. Además su aplicación de consulta es muy flexible. Este Corpes es la continuación de otros proyectos llevados a cabo por la RAE como los corpus CREA y CORDE.

Actualmente está disponible en la red la versión 0.82 de este inmenso archivo que se puede consultar por todo el mundo. Aún en fase de pruebas  ya recoge más de 215 millones de formas. 

En esta iniciativa de la Real Academia de la Lengua colaboran diferentes grupos editoriales y autores, universidades como la de Santiago de Compostela, Alcalá de HenaresSalamanca. En el Centro Universitario CIESE-Comillas  además de colaboradores también acogemos reuniones periódicas de los equipos de trabajo del proyecto. Este proyecto está financiado por el Banco Santander.

« Volver a actualidad