La Fundación Comillas y LIS Data Solutions han firmado un convenio de colaboración para la creación y aplicación del primer corpus lingüístico del español de los negocios, que cubrirá las necesidades comunicativas que surgen diariamente en la didáctica del Español de los Negocios e impulsará la propuesta de soluciones empresariales en este ámbito.

Actualmente, cualquier aplicación que se desarrolle relacionada con la inteligencia artificial, como los chatbot, necesita como base un corpus lingüístico. Sin embargo, casi la totalidad de los corpus de los negocios están desarrollados en inglés y creados con fuentes de datos elaboradas en esa misma lengua. Esto provoca que muchas de estas aplicaciones, como por ejemplo el chat GPT, fallen en su versión en español. De ahí la importancia de este proyecto de creación y aplicación del primer corpus lingüístico del español de los negocios.

Mediante la firma de este convenio las dos entidades se comprometen a colaborar en el desarrollo de herramientas de computación orientadas a la optimización del proceso de codificación de este corpus del español de los negocios y a las posibles aplicaciones que puedan derivar de este corpus lingüístico.

¿QUÉ ES UN CORPUS?

Explicado de una manera sencilla, se puede decir que un corpus es una gran base de datos codificados, clasificados y estructurados de acuerdo con macrogéneros lingüísticos. En este caso, esta gran base de datos se nutre de todos aquellos documentos que se usan en el día a día de una empresa: formularios, cartas, contratos, protocolos, actas, acuerdos, etc. Es fundamental que estos documentos sean de calidad para garantizar la representación y evitar sesgos.

El corpus es la base lingüística para que las máquinas aprendan a comunicarse en español. Para crear este corpus se han identificado las principales fuentes que se manejan en el ámbito de los negocios, mediante una investigación cualitativa realizada por los investigadores de la Fundación Comillas y dirigidos por la doctora Inmaculada Martínez, profesora del CIESE-Fundación Comillas y coordinadora del área de Lingüística. En este corpus colaboran también investigadores de la Universidad de León y Université Grenoble Alpes (Francia). En función de esta investigación, se está procediendo a la recopilación, clasificación y filtrado de un gran volumen de documentos relacionados con el mundo de los negocios, que alimentarán esta gran base de datos.

Por último, LIS Data Solutions, empresa de ingeniería especializada en análisis de datos e inteligencia artificial, ha desarrollado las herramientas apropiadas para el proceso previo de desarrollo del corpus, así como de crear aplicaciones tecnológicas posteriores que permitan convertir todo ese conocimiento en soluciones de gran utilidad para las empresas y mejorar el desarrollo de las aplicaciones basadas en inteligencia artificial. Al frente del equipo de investigadores que lideran la parte técnica está el ingeniero David López.

APLICACIÓN EN LA EMPRESA

Por tanto, este acuerdo entre la Fundación Comillas y LIS Data Solutions permitirá a miles de corporaciones empresariales que utilizan el español en su día a día solucionar -mediante la aplicación del PNL (procesamiento natural del lenguaje) y el software adecuado- las dificultades que encuentran en las aplicaciones actuales.

Se da la peculiaridad de que el español es hablado en muchos países con diferentes variedades. Este aspecto ha sido tenido en cuenta para desarrollar una versión global que funcione tanto en España como en todos los países de habla hispana.

Además de su aplicación en el mundo empresa -gracias a la participación de LIS Data Solutions-este corpus también supone un hito desde el punto de vista de la investigación universitaria, ya que se trata del primer corpus lingüístico especializado en el español de los negocios.

PERTE DE LA LENGUA

La firma de este convenio se enmarca en el PERTE de la Nueva Economía de la Lengua. Una iniciativa del Gobierno de España, que tiene como objetivo aprovechar el potencial del español como factor de crecimiento económico y competitividad. Este proyecto estratégico se vertebra en 14 proyectos tractores, mediante la acción coordinada de las administraciones públicas, las universidades, los centros de investigación, las empresas e industrias.

El proyecto impulsado por la Fundación Comillas y LIS Data Solutions está vinculado al proyecto tractor 1 de “Creación de nuevos corpus amplios para la nueva economía de la lengua” y al proyecto tractor 5 de “Impulso de la industria de IA en español”.

FUNDACIÓN COMILLAS

La Fundación Comillas del Español y la Cultura Hispánica nace en diciembre del 2005 con la vocación de convertirse en una institución de referencia internacional en la formación, investigación y difusión de la lengua española y la cultura hispánica. Tiene como objetivo hacer de la cultura en español un motor para el desarrollo social y económico sostenible de la región de Cantabria, enfrentando el reto de la despoblación y asumiendo para ello un pacto por la educación, el conocimiento, la formación continua, la ciencia y la innovación.

LIS DATA SOLUTIONS

La empresa de ingeniería LIS Data Solutions nace en 2013, con la idea de hacer más rentables y sostenibles a las empresas mediante la implantación de tecnología puntera, y el uso de big data e inteligencia artificial para la mejora de procesos. A través de herramientas de Business Intelligence y Data Science, ayudan a las corporaciones a conocerse mejor, y a mejorar sus procesos y resultados de manera intuitiva.

Pie de foto: Eva M. González, directora de la Fundación Comillas, y Manuel Coterillo, CEO de LIS Data Solutions.