ENTREVISTAS

Federica Citterio (SAS): “La falta de calidad de datos en las aplicaciones analíticas es un reto”



Dirección copiada

Los principales desafíos en analítica de datos e IA incluyen la calidad de los datos, la colaboración entre equipos diversos y la gestión de costos en la nube

Publicado el 30 may 2024

Rufino Contreras

Redactor Jefe



Federica citterio

En SAS, como Senior Data Scientist, Federica Citterio lleva más de cinco años ayudando a organizaciones a tomar decisiones basadas en datos fiables y respaldadas por inteligencia artificial. Trabaja con tecnologías avanzadas como IA generativa, procesamiento del lenguaje natural y visión por computadora. DisfrutA resolviendo problemas del mundo real, como evaluar imágenes biomédicas para trasplantes de riñón, predecir el mantenimiento de máquinas y agilizar la gestión de reclamaciones. Desde su punto de vista, los principales desafíos en analítica de datos e IA incluyen la calidad de los datos, la colaboración entre equipos diversos y la gestión de costos en la nube.

¿Cuál es tu función en SAS como Senior Data Scientist?

Me incorporé a SAS hace más de cinco años como Senior Data Scientist para la región EMEA, y desde entonces, he ayudado a las organizaciones y a nuestros clientes a tomar mejores decisiones, basadas en datos fiables y respaldadas por la inteligencia artificial. Me siento muy afortunada de trabajar en mi día a día con tecnologías de vanguardia tan demandadas en el panorama empresarial actual, como la IA generativa, el procesamiento del lenguaje natural o computer vision. Y a pesar de ser una “friki” de la tecnología, con todo lo que ello engloba, la parte que más disfruto de mi trabajo es cuando nos encargamos de resolver los problemas del mundo real.

Me siento muy afortunada de trabajar en mi día a día con tecnologías de vanguardia tan demandadas en el panorama empresarial actual, como la IA generativa, el procesamiento del lenguaje natural o computer vision

FEDERICA CITTERIO, SAS

Entre algunos de estos proyectos, podría destacar nuestra labor en la evaluación de imágenes biomédicas para detectar si un riñón es apto para un trasplante, gracias a la creación de una serie de modelos por visión artificial. O cuando trabajamos para predecir cuándo una maquina necesita ciertos mantenimientos utilizando modelos de machine learning. E incluso cuando nos encargamos de agilizar los procesos de gestión de reclamaciones, asignándolas automáticamente al departamento pertinente.

Como Data Scientist, ¿cuáles son los principales problemas que deben abordar las empresas en el ámbito de la analítica de datos y la IA?

Uno de los principales retos al que se enfrentan las organizaciones en este ámbito es la falta de la calidad de los datos en las soluciones analíticas. Datos precisos, completos y relevantes son esenciales para garantizar que los análisis sean fiables y que los modelos de inteligencia artificial puedan aprender y generar predicciones con exactitud.

Por otro lado, el Data Science y la inteligencia artificial requieren de la colaboración de equipos con distintas competencias, ya que la complejidad de estos campos demanda una combinación de habilidades en áreas como la estadística, la programación o la gestión de datos. Sin embargo, en ocasiones, el proceso no llega a ser del todo fluido y es necesario gobernarlo con herramientas adecuadas para facilitar la integración y la alineación de los esfuerzos.

Además, dado que cada vez más organizaciones están adoptando los servicios en la nube, la gestión y optimización de los costes asociados se han convertido en un desafío crítico. Aunque la nube ofrece una flexibilidad y escalabilidad sin precedentes, si no existe una estrategia adecuada de gestión de costes que incluya el monitoreo continuo, la optimización de recursos o la implementación de buenas prácticas, las organizaciones pueden llegar a enfrentarse a retos económicos.

¿Qué papel desempeñarán las nuevas tecnologías como la IA generativa en el futuro de la analítica de datos?

La IA Generativa está revolucionando la forma en la que nos relacionamos con la tecnología, y democratizará el acceso a los datos y la analítica, para que más gente pueda utilizarlos. No hay más que pensar en los viejos tiempos, cuando uno estaba obligado a utilizar un terminal para manejar un ordenador: sólo unas pocas personas con una formación especial eran capaces de hacerlo. Más tarde, las interfaces visuales facilitaron el uso del ordenador a todo el mundo.

Sucede lo mismo con la IA Generativa. Esta tecnología facilitará el acceso a los datos, acelerará el proceso de escritura de código y servirá modelos de inteligencia artificial a un público más amplio.

Como resultado, podemos esperar una enorme mejora de la productividad para desarrolladores, científicos de datos y también usuarios empresariales que trabajan con datos cada día. En el SAS Innovate on Tour acabamos de anunciar SAS Viya Copilot: un asistente personal impulsado por IA Generativa que acelera las tareas analíticas, empresariales e industriales. Viya Copilot ofrece diversas herramientas para tareas como generación de código, limpieza de datos, exploración de datos, planificación de marketing, el journey design y el análisis de brechas de conocimiento. De esta forma, estamos rediseñando la interacción con la tecnología para convertirla en conversacional y ayudar a los usuarios a crear, probar e iterar más rápidamente.

¿Qué ventajas o elementos diferenciadores destacaría de la plataforma SAS para la analítica de datos y la IA?

Desde SAS, trabajamos constantemente en ampliar nuestra plataforma SAS Viya para convertirse en el partner analítico más fiable, proporcionando los conocimientos adecuados en los momentos que importan. Así, se basa en tres pilares fundamentales que la diferencian de la competencia.

En primer lugar, la productividad. SAS Viya proporciona herramientas a medida para ayudar a acelerar el tiempo desde la recopilación de datos hasta la generación de insights. Esto incluye interfaces visuales, soluciones personalizadas, capacidades de colaboración y automatización de tareas repetitivas. Por otro lado, el rendimiento. SAS Viya es, de media, 30 veces más rápido que las alternativas comerciales y de código abierto, lo que permite reducir los costes de infraestructura y garantizar que las respuestas que se buscan lleguen a tiempo para tener un impacto. Y, por último, la confianza. En SAS ofrecemos herramientas y técnicas analíticas para garantizar que los resultados sean explicables, transparentes y justos para todos nuestros clientes.

¿Podrías compartir algún ejemplo de proyecto o caso de éxito en el que hayas desplegado en SAS?

Partimos de la situación de que la demanda de trasplantes de riñón ha aumentado considerablemente en los últimos años, ya que, a menudo, el trasplante es la mejor solución para muchas personas que sufren de insuficiencia renal. Sin embargo, los profesionales médicos del Reino Unido se enfrentan a la dificultad de encontrar órganos suficientes, y si sumamos además la creciente escasez de personal y el número limitado de especialistas capaces de realizar una biopsia renal, la presión que sufre su Servicio Nacional de Salud es cada vez mayor.

Es por este motivo por el que desde SAS nos asociamos con la Facultad de Medicina de la Universidad de Cambridge con el fin de ayudar a los equipos sanitarios a valorar y detectar si un riñón es apto para un trasplante, gracias a la evaluación de imágenes de biopsias renales mediante inteligencia artificial.

Concretamente, mediante la automatización de procesos con tecnologías de computer vision, desde SAS se ha podido lograr mejoras significativas en la precisión, fiabilidad y eficacia de los procedimientos médicos. Estas tecnologías permiten el análisis detallado y rápido de imágenes médicas, y al reducir la carga de trabajo manual y minimizar el riesgo de errores humanos, los médicos pueden disponer de más tiempo para centrarse en la atención directa y en la toma de decisiones más informadas. Con todo ello, potenciamos la capacidad de los profesionales sanitarios para salvar vidas y mejorar los resultados de los pacientes.

¿Cómo crees que evolucionarán la analítica de datos y la IA en los próximos años?

Si hay algo que ha quedado demostrado es que la inteligencia artificial está muy presente en nuestro día a día y en todo lo que hacemos, y lo seguirá estando cada vez más. No hay más que echar un vistazo a las apps que tenemos descargadas en nuestros teléfonos para darnos cuenta de que todas, o la gran mayoría, ya emplean la IA.

En este sentido, y aunque es algo que se ha comentado mucho en los últimos meses, la inteligencia artificial no va a sustituir a los profesionales en su trabajo. Sin embargo, los profesionales que sepan utilizar, dominar y aprovechar todo el potencial que ofrece la IA, podrán llegar a sustituir a aquellos que no lo hagan o estén menos preparados. Por este motivo, espero que todo el mundo sea más consciente de cómo se recopilan y utilizan los datos.

Un avance en este camino es reconocer que hay muchos usuarios que construyen o desarrollan IA, pero hay muchos más que simplemente la consumen o la utilizan en su trabajo diario. Un claro ejemplo son los profesionales del marketing que ya implementan esta tecnología para personalizar sus campañas, o los investigadores y médicos que son capaces de obtener recomendaciones de IA para conseguir el mejor tratamiento para un paciente, o los agentes antifraude que la emplean para realizar sus investigaciones.

Por ello, una tendencia que espero es ver cada vez más modelos de IA personalizados listos para su uso. Tal y como lo anunciamos durante el SAS Innovate, pronto ofreceremos modelos de IA ligeros específicos del sector para licencia individual, con el objetivo de equipar a las organizaciones con tecnología de IA fácilmente implementable para producir casos de uso del mundo real con una eficiencia insuperable.

Esta entrega de modelos como paquetes de ofertas es uno de los resultados del nuestro compromiso de destinar 1.000 millones de dólares a soluciones industriales impulsadas por IA. Y es que como ya hicimos público el año pasado, nuestra inversión en IA se basa en el enfoque de décadas de SAS de ofrecer soluciones integradas para abordar los retos del sector de la banca, la administración pública, la sanidad y muchos otros más.

¿Qué tendencias o tecnologías emergentes crees que tendrán mayor impacto en este ámbito?

Evidentemente la IA Generativa será de una de las herramientas con más impacto en este ámbito, con el foco puesto en la provisión de asistentes adecuados para ayudar en tareas especializadas, como comentábamos antes al hablar de Copilot.

Pero otro campo muy prometedor es el de la generación de datos sintéticos. Muchas veces, los datos que recopilamos del mundo real no son lo suficientemente buenos porque pueden contener sesgos, información sensible que impida a los científicos de datos utilizarlos para el análisis, o puede que simplemente no sean suficientes. Basta pensar en una entidad financiera que quiere detectar fraudes. El número de casos fraudulentos es extremadamente pequeño en comparación con los casos que no lo son, y los enfoques tradicionales de modelado se enfrentan a dificultades para entrenar eficazmente modelos sobre comportamientos fraudulentos a partir de los datos disponibles.

Mediante el uso de datos sintéticos, es posible obtener datos en situaciones en las que no los hay, generarlos para dar voz a las categorías infrarrepresentadas para ayudar a hacer frente a los sesgos, o incluso producir nuevos datos que, directamente, no contengan información privada o sensible. En este aspecto, desde SAS acabamos de anunciar SAS Data Maker, una herramienta sin código que puede ayudar a mitigar los problemas de calidad y escasez de datos.

También espero una mayor adopción de técnicas para la interpretabilidad y la explicabilidad de los modelos de IA, tratando de luchar contra la parcialidad y desarrollar modelos justos y fiables. Y, por último, veremos como la mejora de los servicios en la nube va a hacer que las tecnologías avanzadas se encuentren más al alcance de todo el mundo, gracias a la reducción del coste de los modelos más sofisticados, como los LLM.

Artículos relacionados

Artículo 1 de 5