La Subdirección General de Innovación e Información Urbana presenta Prototipo Cibeles+, su último proyecto que incorpora Inteligencia Artificial. Basado en Prototipo Cibeles, que ya fue protagonista hace unos meses en Computing, supone una importante mejora en el acceso a la información urbanística al contar con la habilidad de leer textos normativos.
Desarrollado por Saturno Labs bajo la dirección de José María Boyano Sánchez, Subdirector General de Innovación e Información Urbana, y Jesús Cerezo Arillo, Jefe de Servicio de Integración de Procesos, Prototipo Cibeles+ ha sido dotado de la habilidad para leer textos normativos y responder utilizando voz o escritura mediante procesamiento del lenguaje natural, con la intención de completar ese proceso de ruptura de las barreras en el acceso a la información urbanística que había iniciado su antecesor, Prototipo Cibeles.
La alta tecnología empleada en Cibeles+ garantiza total accesibilidad a las normas, ofrece un completo servicio de información urbanística las 24 horas del día, los 7 días de la semana y los 365 días al año y mejora la comodidad y eficiencia de la interacción con la Administración apoyándose en un lenguaje natural y sencillo.
Índice de temas
¿Cómo actúa?
Aunque el proceso de definición de Cibeles+ es complejo, su funcionamiento es bien sencillo. Interactúa con la persona interesada en localizar cierta información urbanística y, mediante los recursos que ofrecen ramas de la Inteligencia Artificial como el procesamiento del lenguaje natural y el machine learning, el sistema consigue responder a cuestiones tan complejas como las urbanísticas.
Ofrece un completo servicio de información urbanística las 24 horas del día, los 7 días de la semana y los 365 días al año
Básicamente, se apoya en Alexa y Twitter como canales para recibir la pregunta sobre la normativa urbanística y responder los datos extraídos de los textos normativos del Plan General. Detecta qué le están preguntando y para qué localización; en función de esa posición, localiza la información dentro del articulado y elabora una respuesta que incluye tanto el dato concreto solicitado como el número y epígrafe del artículo de las Normas Urbanísticas en que se encuentra. Además, invita a su interlocutor a que reciba en su correo electrónico un resumen con enlaces a la documentación.
Punto de partida
La primera barrera en la definición del proceso de Cibeles+ se encuentra en el idioma, pues no existen grandes proyectos globales de investigación para potenciar el procesamiento del lenguaje natural en lengua castellana. De hecho, es la primera vez que se realiza un proyecto de esta complejidad en español. La falta de conjuntos de datos bien estructurados en esta lengua no permite el entrenamiento de modelos similares, lo que convierte al proyecto en todo un reto a la hora de combinar el uso de la voz y el procesamiento del lenguaje natural con los servicios municipales y con el objetivo de localizar la información en tiempo real y mediante cualquier dispositivo.
El proyecto es todo un reto a la hora de combinar el uso de la voz y el procesamiento del lenguaje natural con los servicios municipales y con el objetivo de localizar la información en tiempo real y mediante cualquier dispositivo
Como texto de partida se toman las Normas Urbanísticas del Plan General de 1997 en su edición consolidada actual, se someten a un proceso de extracción y limpieza para obtener de forma automatizada un documento en formato CSV. A continuación, se atomiza de forma automática este documento con el fin de integrar subestructuras más pequeñas y fáciles de indexar, eliminando extractos de textos no útiles, como las notas a pie de página. Una vez extraído, limpiado e indexado el texto de forma automática, se obtiene un dataset con el que ya puede trabajar el resto del sistema.
Dada la volatilidad de las normas urbanísticas, con constantes actualizaciones, una de las máximas del prototipado ha sido conseguir que el uso de la herramienta de acceso a la normativa sea universal, sin programar reglas o contemplar casuísticas específicas, permitiendo así su uso inmediato sobre cualquier otro texto normativo, sin más labor que una nueva ingesta del texto.
¿En qué consiste?
El proyecto consiste en la realización de un servicio de consulta único, automático e inteligente que puede ser utilizado en diversas plataformas. Como se ha apuntado, se define con la indexación múltiple entre los textos de manera interna y la creación de un modelo de Inteligencia Artificial propio, utilizando el dataset creado a partir de las normas urbanísticas.
Las búsquedas se realizan mediante ElasticSearch, un software open source basado en Lucene que provee de un motor de búsqueda de texto completo, distribuido y con capacidad de multitenencia con interfaz web RESTfull y formato JSON, similar a otras soluciones, pero con una arquitectura propia de una base de datos dinámica, facilitando enormemente la implementación del sistema final.
¡CONTENIDO BLOQUEADO!
Aquí hay un vídeo que no puedes ver debido a tu configuración de cookies.
Puedes ver nuestra política de cookies o abrir el vídeo en youtube.com
El uso de ElasticSearch ha resultado totalmente satisfactorio, consiguiendo un porcentaje del 100% de acierto en las pruebas realizadas para la detección del artículo concreto al que se refiere una pregunta.
Obtenido ese dato, el sistema debe ser capaz de generar una respuesta con la información pedida. Para ello se han probado y analizado los ocho modelos de inteligencia artificial más potentes en el ámbito de la Question Answering, obteniendo resultados desiguales. La estrategia planteada ha consistido en medir el desempeño de cada modelo para un tipo de respuesta a través de una puntuación numérica y elegir la mejor opción para cada caso.
La integración con una skill de Alexa y con Twitter mediante DialogFlow ha permitido añadir el acceso a las normas urbanísticas como una intención más dentro de las que ya estaban presentes en el proyecto anterior, Prototipo Cibeles.
Objetivo cumplido
Cibeles+, aquel proyecto soñado hace meses por la Subdirección General de Innovación e Información Urbana se ha convertido hoy en una realidad. Su habilidad mostrada para leer los textos normativos supone un gran paso en la innovación para brindar a la ciudadanía una información urbanística fácil y prestar unos servicios públicos de calidad y con un alineamiento tecnológico pleno con la sociedad.