La inteligencia artificial es una tecnología con un enorme potencial aún por explotar. No cabe duda de que ha llegado para quedarse. Para comprender los retos que plantea desde la perspectiva del almacenamiento, hay que analizar sus fundamentos. Cualquier capacidad de aprendizaje automático requiere un conjunto de datos de entrenamiento, en el caso de la IA Generativa se basa en modelos complejos, y sus algoritmos pueden tener una gran cantidad de parámetros a aprender. Cuantos más datos obtenga el modelo, mayor probabilidad de obtener un resultado preciso o de minimizar la función de error/coste. Para alojar esta cantidad creciente de datos se necesita una capacidad de almacenamiento cada vez mayor.
En los últimos años, la IA ha ido aumentando el tamaño de estos conjuntos de datos, pero la introducción de grandes modelos lingüísticos, en los que se basan ChatGPT y otras plataformas de IA generativa, ha hecho que su tamaño y complejidad incrementen su envergadura. Esto se debe a que los patrones de conocimiento aprendidos que surgen durante el proceso de entrenamiento del modelo de IA deben almacenarse, convirtiéndose en un verdadero reto con modelos más grandes.
Dado que los volúmenes de datos crecen exponencialmente, es más importante que nunca que las compañías puedan utilizar el almacenamiento de datos más denso y eficiente posible
Almacenamiento de datos más denso
Dado que los volúmenes de datos crecen exponencialmente, es más importante que nunca que las compañías puedan utilizar el almacenamiento de datos más denso y eficiente posible, para limitar la expansión de los centros de datos y la espiral de costes de energía y refrigeración que conllevan. En un momento en que la huella de carbono y el consumo energético son una preocupación importante, la IA tendrá efectos en los compromisos de sostenibilidad de las empresas debido a la demanda energética que conlleva su implementación a los centros de datos.
Algunos proveedores de tecnología ya tienen en cuenta la sostenibilidad en el diseño de sus productos. De hecho, las soluciones de almacenamiento totalmente flash son considerablemente más eficientes que sus homólogas de disco giratorio. Algunos, incluso, pueden reducir el consumo de energía hasta un 85% respecto a las soluciones all-flash de la competencia, y tener 10 veces menos espacio frente a los sistemas de disco rotacional.
Los centros de datos se enfrentan también a un reto secundario, pero igual de importante, que será más patente por el continuo aumento de la IA y el ML, ya que muchos utilizan la refrigeración por evaporación. Una idea inteligente pero problemática por la presión que el cambio climático está ejerciendo sobre los recursos hídricos. Un método de refrigeración cuestionado en el último año que ha provocado volver a depender de sistemas más tradicionales con un alto consumo energético, como el aire acondicionado. Una razón más para pasarse a los centros all-flash, que requieren menos energía y no precisan una refrigeración intensiva como la de los HDD y los híbridos.
A medida que la IA y el ML sigan evolucionando, la atención también se centrará en la seguridad de los datos, la replicabilidad de los modelos y una mayor solidez ética. Algunos proveedores de almacenamiento ya lo tienen en cuenta en el desarrollo de productos, sabiendo que los directores de tecnología buscarán soluciones de almacenamiento seguras, de alto rendimiento, escalables y eficientes que les ayuden a alcanzar estos objetivos.