Fujitsu Limited y el Centro de Cerebros, Mentes y Máquinas (CBMM, siglas en inglés), con sede en el Massachusetts Institute of Technology (MIT), han logrado un importante hito en una iniciativa conjunta para mejorar la precisión de los modelos de inteligencia artificial (IA). Los resultados de la investigación entre Fujitsu y el CBMM se publican en un artículo en el que se discuten los principios computacionales que se inspiran en la neurociencia para permitir que los modelos de IA reconozcan datos no vistos (fuera de distribución, OOD) que se desvían de los datos de entrenamiento originales. Los aspectos más destacados del artículo se presentarán en la NeurIPS 2021 (Conferencia sobre Sistemas de Procesamiento de Información Neuronal), mostrando mejoras en la precisión de los modelos de IA.
La llegada de las redes neuronales profundas (DNN) en los últimos años ha contribuido a una creciente variedad de aplicaciones en el mundo real para la IA y las tecnologías de aprendizaje automático, incluyendo tareas como la detección de defectos para la industria manufacturera y el diagnóstico por imágenes en el campo médico. Aunque estos modelos de IA pueden demostrar a veces un rendimiento igual o mejor que el de los humanos, siguen existiendo retos, ya que la precisión del reconocimiento tiende a deteriorarse cuando las condiciones ambientales, como la iluminación y la perspectiva, difieren significativamente de las de los conjuntos de datos utilizados durante el proceso de entrenamiento.
Para resolver este problema, los investigadores de Fujitsu y el CBMM han avanzado conjuntamente en la comprensión de los principios de la IA que permiten el reconocimiento de datos OOD con gran precisión, dividiendo la DNN en módulos -por ejemplo, la forma y el color, entre otros atributos- adoptando un enfoque único inspirado en las características cognitivas de los seres humanos y la estructura del cerebro. Un modelo de IA que utiliza este proceso fue calificado como el más preciso en una evaluación que mide la exactitud del reconocimiento de imágenes frente a la referencia “CLEVR-CoGenT”, como se muestra en el documento presentado por el grupo en NeurIPS.
El Dr. Seishi Okamoto, Fellow de Fujitsu Limited comentó “Desde 2019, Fujitsu ha participado en la investigación conjunta con el CBMM del MIT para profundizar en nuestra comprensión de cómo el cerebro humano sintetiza la información para generar un comportamiento inteligente, persiguiendo cómo realizar dicha inteligencia como IA y aprovechando este conocimiento que contribuye a resolver los problemas a los que se enfrentan una variedad de industrias y la sociedad en general. Este logro marca un hito importante para el desarrollo futuro de la tecnología de IA que podría ofrecer una nueva herramienta para entrenar modelos que puedan responder con flexibilidad a diferentes situaciones y reconocer incluso datos desconocidos que difieran considerablemente de los de entrenamiento originales con gran precisión. Y esperamos con interés las emocionantes posibilidades del mundo real que esto abre.”
El Dr. Tomaso Poggio, catedrático Eugene McDermott del Departamento de Ciencias Cerebrales y Cognitivas del MIT y director del Centro de Cerebros, Mentes y Máquinas, señaló: “Existe una brecha significativa entre las DNN y los humanos cuando se evalúan en condiciones fuera de distribución, lo que compromete seriamente las aplicaciones de la IA, especialmente en términos de su seguridad y equidad. La investigación inspirada en la neurociencia puede dar lugar a nuevas tecnologías capaces de superar el sesgo de los conjuntos de datos. Los resultados obtenidos hasta ahora en este programa de investigación son un buen paso en esta dirección”.
Las posibles aplicaciones futuras pueden incluir una IA para la vigilancia del tráfico que pueda responder a los cambios en las distintas condiciones de observación y una IA de diagnóstico de imágenes médicas que pueda reconocer correctamente los distintos tipos de lesiones.
Sobre el nuevo método
Los resultados de la investigación se centran en el hecho de que el cerebro humano puede captar y clasificar con precisión la información visual, aunque haya diferencias en las formas y los colores de los objetos que percibimos. El nuevo método calcula un índice único basado en la forma en que un objeto es percibido por las neuronas y en cómo la DNN clasifica las imágenes de entrada. El modelo fomenta el aumento del índice con el fin de mejorar el reconocimiento de los objetos de ejemplo OOD con mayor eficacia.
Hasta ahora se suponía que el mejor método para crear un modelo de IA con alta precisión de reconocimiento era entrenar la DNN como un único módulo sin dividirla. Sin embargo, al dividir la DNN en módulos separados en función de las formas, los colores y otros atributos de los objetos basándose en el nuevo índice desarrollado, los investigadores de Fujitsu y CBMM han conseguido una mayor precisión de reconocimiento.