Índice de temas
IA generativa y gobierno del dato
En el panorama empresarial actual, donde la gestión del dato y su gobierno se ha vuelto un requisito indispensable, la IA Generativa ha llegado a nuestras vidas para revolucionar el acceso y el consumo de información. Si pensamos en las posibilidades que los motores de IA Generativa pueden ofrecernos, nunca hemos estado tan cerca del deseado paradigma de Auto-servicio. La posibilidad de que los usuarios de negocio puedan acceder a la información de una forma sencilla, utilizando lenguaje natural, sin requerir ningún tipo de soporte por parte de los equipos de IT, es ahora una realidad.
En muchas ocasiones las consultas implican acceder a datos de distintas fuentes de información y realizar combinaciones complejas entre los mismos para generar los resultados
ANASTASIO MOLANO, DENODO
Pero, para llegar a ese punto, en primer lugar, los motores de IA Generativa han de saber responder a cuestiones relativas a nuestro negocio. Si consultamos en un servicio de IA Generativa, como ChatGPT, por cualquier cuestión sobre nuestra empresa, con mucha probabilidad, no obtendremos ningún resultado válido, ya que el motor de ChatGPT no ha sido entrenado con los datos propios de la compañía. Ahí es donde entra en juego la arquitectura RAG (Retrieval Augmented Generation).
Acceso a la información
En segundo lugar, el acceso a la información por parte de los motores de IA Generativa ha de respetar los criterios de gobierno y seguridad que hayan sido dictados en la organización. Por ejemplo, hemos de garantizar que no se comparta información sensible con el motor de IA Generativa, como pueden ser los datos de nuestros clientes.
Los motores de IA Generativa se basan en redes neuronales que han sido entrenadas con grandes cantidades de documentos (de ahí su acepción común como “Modelos Grandes de Lenguaje” o “Large Language Models”) y consiguen identificar, en su funcionamiento más básico, la palabra más probable que continúa a un texto dado, pudiendo responder a multitud de tareas a modo de asistente personal.
En este sentido, la arquitectura RAG permite compartir con el motor de IA Generativa datos relativos a nuestra empresa, facilitándole el acceso tanto a documentos como a datos de los sistemas de información. Esta es la forma en la que podemos particularizar el uso del motor de IA Generativa para nuestra compañía, siendo el patrón más utilizado en la industria.
En el caso de datos estructurados, procedentes de los sistemas de información de la organización, los motores LLM generan consultas en lenguaje SQL que pueden lanzarse, por ejemplo, sobre una base de datos empresarial, para recuperar los datos que han resultado de la consulta formulada por el usuario. Cuanto mejor sea la traducción de texto a la consulta SQL por parte del motor de LLM, mejor será la precisión y calidad de la respuesta obtenida.
Pero la realidad de las empresas es mucho más compleja porque, en la mayor parte de los casos, los datos se encuentran fragmentados en multitud sistemas de información, tanto en sistemas operacionales (ERP, CRM, etc.) como en informacionales (data warehouses, lagos de datos, etc.), tanto on-prem como en la nube, añadiendo complejidad a las tareas que el motor de LLM ha de realizar para resolver las consultas. En muchas ocasiones las consultas implican acceder a datos de distintas fuentes de información y realizar combinaciones complejas entre los mismos para generar los resultados.
Gestión lógica de datos
Aquí es donde entra en juego la gestión lógica de datos, permitiendo la construcción de una capa semántica que proporciona acceso unificado a diferentes fuentes de información para establecer un Data Fabric a través de las diversas fuentes de datos. Esto facilita al motor de IA Generativa acceder a un único sistema en donde puede disponer de información pre-integrada de una forma lógica, en base a vistas de datos lógicas, con semántica y contexto de negocio, reduciendo las combinaciones que el motor deba realizar y mejorando por tanto la calidad de las respuestas.
La tecnología de Data Fabric habilitado por Denodo, comparte mucha información con el motor de IA Generativa, desde vistas lógicas con significado de negocio, descripciones de campos, relaciones entre vistas, linaje, etiquetado semántico, datos de muestra e incluso información sobre la sintaxis de consulta SQL, con el objetivo de optimizar al máximo el proceso de traducción de texto a SQL que el motor de IA Generativa ha de realizar. De esta manera es como Denodo consigue mejorar la precisión de las respuestas de un motor de IA Generativa de forma significativa. De hecho, al utilizar benchmarks estandarizados de traducción de texto a SQL, se mejora la precisión de las consultas desde un 20% hasta un 87% (en Bird y Spider).
Un Data Fabric permite, asimismo, gestionar en un único punto el gobierno y la seguridad en el acceso a los datos, lo que garantiza que el motor de IA Generativa sólo accederá a los datos a los cuáles los usuarios tengan acceso, en función de las políticas de gobierno definidas en la empresa.
En definitiva, un Data Fabric ofrece una base sólida de gestión de datos que permite alimentar a los motores de IA Generativa con el necesario contexto de negocio de la empresa y respetar los parámetros de gobierno y seguridad establecidos. Esto facilita que los usuarios corporativos puedan beneficiarse de las grandes capacidades de esta nueva tecnología.