La Real Academia Española (RAE) y Amazon Web Services (AWS) han presentado la herramienta de análisis del español que han creado conjuntamente. Permite examinar, en muy poco tiempo y mediante sistemas de inteligencia artificial, decenas de miles de documentos de Internet a la vez con el fin de valorar el estado del español en el mundo.
Este sistema, desarrollado a partir de las tecnologías nativas de la nube de AWS y con el asesoramiento de la RAE, servirá como barómetro de distintos parámetros y será la base para la recopilación de datos masivos.
La presentación se ha llevado a cabo en la sede de la Academia y ha contado con las intervenciones del director de la RAE y presidente de la ASALE, Santiago Muñoz Machado; el director general de Amazon Web Services en España y Portugal, Miguel Álava, y el director de Tecnología de AWS en Iberia, Carlos Carús.
El acto, cuya bienvenida ha estado a cargo del director de la RAE, ha sido clausurado por la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas.
La herramienta RAE-AWS
En su primera versión beta, la herramienta contiene 8.745.563 documentos de España y todos los países hispanohablantes de América. Por el momento, sus fuentes se centran en el español digital espontáneo actual, especialmente el propio de textos informales obtenidos de redes sociales, foros o plataformas de venta en línea, pero también se ha incluido una representación de textos periodísticos para poder observar las diferencias entre un tipo de lenguaje y otro. Actualmente, está dividida en tres grandes bloques que incluyen el estudio de extranjerismos, detectando su proporción en los textos; el análisis de la riqueza léxica, midiendo la diversidad de palabras a través del sistema MTLD (del inglés measure of textual lexical diversity ‘medida de la diversidad léxica textual’), y un radar de errores lingüísticos que los identifica y clasifica como ortográficos, gramaticales, léxicos, de estilo y tipográficos. Se han integrado reglas extraídas de obras normativas de la RAE.
Descubre cómo evolucionará la nube pública y la nube híbrida
El desarrollo de esta herramienta permitirá, entre otras acciones futuras, el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de IA.
La colaboración entre la RAE y AWS se enmarca en el proyecto Lengua Española e Inteligencia Artificial (LEIA). La acción busca aplicar la IA a nuestro idioma para hacer un análisis de su situación actual, cuidar su uso y velar por la unidad de nuestra lengua en todos los ámbitos, especialmente en el digital.