FlashLink: El secreto del sistema de almacenamiento all-flash de alto rendimiento de Huawei

Según una encuesta realizada con cientos de usuarios de sistemas de datos, alrededor del 87% de los problemas de rendimiento de los sistemas tienen origen en la interacción entre el subsistema de almacenamiento y la base de datos de la aplicación.

Publicado el 18 Ene 2019

12301_07

En la era de la economía digital, los datos están aumentando de manera exponencial, y el mismo concepto de «dato» se está transformando. Aunque antiguamente los datos también resultaban útiles en las operaciones comerciales, ahora se han convertido en una de las fuerzas motrices de la transformación digital de las empresas. Ahora que los centros de datos de las empresas llevan a cabo un número de operaciones cada vez mayor, los datos también se emplean y mueven con mayor frecuencia, por lo que las empresas necesitan encontrar sistemas de datos que ofrezcan menor latencia y mejores niveles de servicio.

Según una encuesta realizada con cientos de usuarios de sistemas de datos, alrededor del 87% de los problemas de rendimiento de los sistemas tienen origen en la interacción entre el subsistema de almacenamiento y la base de datos de la aplicación. Es decir, que la latencia en la respuesta y el tráfico de acceso simultáneo en el subsistema de almacenamiento determinan los del sistema de aplicación. La exasperante realidad para muchas empresas es que la latencia alta y la escasa capacidad de tráfico simultáneo en el subsistema de almacenamiento se han convertido en el cuello de botella de rendimiento de todo el sistema.

Repasemos rápidamente la historia de los requisitos de latencia de los sistemas de almacenamiento necesarios para la expansión comercial. En la era HDD, las aplicaciones de copia de seguridad y discos web de las empresas requerían una latencia de almacenamiento relativamente baja: unos 10 ms bastaban para que los usuarios lidiaran sin problemas con las demandas de las aplicaciones. Hoy en día, la mayoría de los escritorios virtuales requieren una latencia de 5 ms, y con el auge de las tecnologías en la nube y de virtualización, las oficinas con escritorios virtuales han pasado a ser la norma para las empresas grandes. Los Big Data han cambiado los modelos de negocio, y el gran aumento de los volúmenes de datos tiene un impacto enorme sobre los sistemas de gestión de relaciones con clientes (CRM) y de planificación de recursos empresariales (ERP). Las empresas que desean garantizar unos servicios de calidad tienen como objetivo último conseguir una latencia de 0,5 ms.

La latencia de 0,5 ms es un valor esperado capaz de actuar en condiciones reales de gran carga de trabajo. No se trata de un número máximo manipulado y obtenido siguiendo parámetros de pruebas cuidadosamente controlados, ni tampoco de un número producido en sistemas sometidos a una carga de trabajo nula. Los sistemas de almacenamiento deben mantener una latencia predecible de 0,5 ms incluso durante los picos del servicio, con el fin de ofrecer a los usuarios una experiencia uniforme.

La innovadora tecnología FlashLink

Tras 20 años acumulando experiencia técnica de forma continuada, en 2016 Huawei presentó con orgullo su sistema de almacenamiento all-flash OceanStor Dorado V3, de una velocidad extrema y una solidez sin precedentes. Este sistema, que hoy en día sigue teniendo una gran relevancia en el sector, ofrece un rendimiento puntero gracias a la innovadora tecnología FlashLink; su alto rendimiento se sustenta sobre tres elementos: el chip, la arquitectura y el sistema operativo.

El OceanStor Dorado V3 integra tres chips inteligentes que permiten una aceleración del servicio de extremo a extremo que se traduce en un 45% más de rendimiento en comparación con el almacenamiento SAS all-flash. Huawei es un proveedor de telecomunicaciones revolucionario, ya que se mantiene constantemente al día de las últimas tendencias en tecnología arquitectónica, llegando incluso a desarrollar sus propias tecnologías. Por ejemplo, el OceanStor Dorado V3 es uno de los primeros sistemas de almacenamiento all-flash que emplean NVMe (memoria no volátil) para uso comercial. Además, el OceanStor Dorado V3 cuenta con un diseño de SSD optimizado y totalmente nuevo, y una tecnología de colaboración entre los controladores de disco que permite que los controladores de almacenamiento detecten la organización de los datos de los SSD en tiempo real y sincronicen los datos en controladores y SSD. Esto contribuye a reducir las pérdidas de rendimiento provocadas por la recopilación de basura y garantiza una respuesta rápida a las operaciones de E/S de lectura y escritura de datos. Estas son tan solo las características más destacadas del nutrido catálogo de OceanStor Dorado V3, y todas ellas ayudan a mantener una latencia predecible de 0,5 ms, incluso cuando está sometido a grandes cargas de trabajo. El secreto de tales avances radica en la tecnología FlashLink, que ayuda al OceanStor Dorado a triplicar su rendimiento de servicio en comparación con los sistemas de almacenamiento tradicionales.

Características de FlashLink.
Características de FlashLink.

La innovadora colaboración entre controladores de disco garantiza un gran rendimiento predecible

Las células de almacenamiento flash de un SSD solamente pueden reescribirse después de haber sido borradas. Por lo general, la unidad de escritura básica de un SSD es una página de 16 KB, y la unidad de borrado básica es un bloque de 8 MB. Para evitar borrar páginas válidas, las páginas válidas de un bloque deben ser trasladadas a otro espacio para su almacenamiento. El espacio de páginas válidas del bloque se convierte en espacio de páginas no válidas, tras lo cual el bloque puede borrarse de una sola vez. El proceso de migración de páginas válidas se conoce como «recolección de basura».

La recolección de basura mejora la reutilización del espacio de un SSD, pero cada migración merma el rendimiento del sistema de almacenamiento, que sufre más cuanto mayor sea la cantidad de datos válidos migrados y cuanto más corto sea el intervalo entre la escritura de una página en el SSD y la invalidación de dicha página.

Para asegurarse de maximizar el rendimiento de los SSD y los sistemas de almacenamiento flash, las empresas deben controlar la recolección de basura de manera eficaz. Gracias a sus SSD de fabricación propia y al sistema operativo flash OceanStor OS, el OceanStor Dorado de Huawei incorpora una innovadora tecnología de colaboración entre controladores de disco para evitar las caídas de rendimiento provocadas por la recolección de basura. Al optimizar los algoritmos del software interno, el OceanStor Dorado permite que los controladores de almacenamiento detecten la organización de los datos de los SSD en tiempo real y realicen los ajustes necesarios. Esto ayuda a evitar la migración de datos después de que estos hayan sido grabados en los SSD y la recolección de basura, garantizando así un gran rendimiento predecible en los sistemas de almacenamiento flash.

La escritura secuencial en bloques grandes reduce la frecuencia de recolección de basura

Tomemos como ejemplo los viajes compartidos en tiempo real. Se trata de servicios que permiten que varios usuarios con rutas similares compartan vehículo, con el consiguiente ahorro en gastos de viaje y consumo de energía.

Siguiendo esta analogía, los controladores de OceanStor Dorado V3 detectan la organización de los datos de los SSD en tiempo real y agrupan en la caché del controlador los bloques de datos que van a ser grabados en los SSD. Los formatos de estos bloques de datos se unifican y después se incluyen en un bloque de datos de mayor tamaño que se graba en el SSD de una sola vez, con el fin de mejorar el rendimiento general del sistema. Sus ventajas son, entre otras:

  • La tecnología de escritura secuencial en bloques grandes controla la frecuencia de grabación de bloques pequeños aleatorios (E/S) en los SSD varias veces, aprovechando al completo el ancho de banda del SAS de respaldo.
  • La penalización de escritura del RAID (lecturas y escrituras adicionales necesarias durante la verificación) lleva tiempo siendo uno de los factores que merman el rendimiento de los sistemas de almacenamiento que utilizan protección del RAID. El OceanStor Dorado V3 graba los datos en los SSD una vez que dichos datos han sido agrupados, reduciendo en la práctica el número de operaciones de escritura en el disco y el número de solicitudes de lectura y escritura adicionales necesarias para la verificación. Esta característica garantiza un rendimiento predecible del sistema al utilizar RAID 5, RAID 6 y RAID-TP. Incluso en el improbable caso de que tres discos fallen simultáneamente, RAID-TP, una tecnología exclusiva de OceanStor Dorado V3, se asegurará de que los servicios no se vean afectados.
  • OceanStor Dorado admite la recolección de basura global. Supervisa la presión del sistema en tiempo real y controla la frecuencia de la recolección de basura en los discos, mitigando el impacto de este proceso sobre el rendimiento del sistema.
Tecnología de escritura secuencia en bloques de gran tamaño.
Tecnología de escritura secuencia en bloques de gran tamaño.

La partición independiente para metadatos controla la frecuencia de recolección de basura

En un sistema de almacenamiento, la frecuencia de actualización de los datos de usuario es distinta de la de los metadatos, ya que estos últimos se actualizan con mayor frecuencia. Cuando los metadatos y los datos de usuario se graban en la misma partición de un disco, se requiere una mayor recolección de basura que cuando se graban únicamente datos de usuario. Esto sucede porque aunque las páginas de metadatos dejen de ser válidas, es posible que no ocurra lo mismo con las páginas de datos de usuario. Por tanto, se hace necesario migrar una gran cantidad de datos de usuario durante la recolección de basura, lo que se traduce en un aumento excesivo de la escritura del disco, así como en una vida útil más corta y un rendimiento más bajo del SSD.

El sistema de almacenamiento all-flash OceanStor Dorado V3 incorpora una partición independiente para metadatos. Graba los metadatos con frecuencia en una partición y los actualiza ocasionalmente en una partición distinta del sistema de almacenamiento y el SSD. Esto reduce la migración de bloques de datos de usuario cuando se actualizan los metadatos, mitigando el impacto de la recolección de basura sobre el rendimiento del sistema. En pocas palabras, la tecnología de partición independiente para metadatos controla el número de operaciones de recolección de basura, garantizando un gran rendimiento predecible del sistema de almacenamiento.

Partición independiente para metadatos.
Partición independiente para metadatos.

Prioridad de las E/S de lectura y escritura de datos

Las grandes empresas financieras, como los bancos más importantes, suelen disponer de un mostrador especial para separar a los clientes VIP de los normales. Asimismo, cuando los mostradores VIP están ocupados, los clientes VIP pueden saltarse la cola de los mostradores normales. Esta clase de modelo garantiza que los clientes VIP disfruten del mejor servicio más rápidamente que los clientes normales.

OceanStor Dorado también adopta este modelo, que presenta un mecanismo de programación de prioridad de E/S para garantizar una latencia predeciblemente baja en las solicitudes de servicio. OceanStor Dorado da prioridad a las solicitudes de lectura/escritura con recursos de TI, incluidos CPU, memorias y tráfico de acceso simultáneo a discos de sistemas de almacenamiento. En caso de contención de recursos, otras solicitudes como la reconstrucción de datos, el vaciado de caché asíncrona y las solicitudes en segundo plano dentro del sistema quedarían interrumpidas.

El ajuste de prioridades de OceanStor Dorado se lleva a cabo simultáneamente en el controlador de almacenamiento y en el SSD, para garantizar que las solicitudes de lectura/escritura de datos tengan la máxima prioridad en todo momento. Otros tipos de solicitudes de E/S de datos se suspenden cuando llega la solicitud de lectura/escritura y se reanudan tras completar esta operación, garantizando así una latencia de respuesta óptima de la lectura y la escritura de datos en el sistema de almacenamiento.

Ajuste de prioridad de E/S.
Ajuste de prioridad de E/S.

Rendimiento 3 veces superior con el almacenamientoall-flash

La sustitución del almacenamiento tradicional por el all-flash abre un nuevo capítulo en la era de la transformación digital. Las personas y las empresas ya no tendrán que esperar a que sus aplicaciones respondan, ni en el ámbito laboral ni en el día a día.

Para la industria financiera, y especialmente para las empresas del sector bursátil que realizan transacciones frecuentes y en tiempo real, el tiempo es dinero. Veamos el ejemplo de la empresa china Hundsun. Antes de que empezara a trabajar con Huawei, su arquitectura de TI tradicional solamente admitía 60.000 transacciones por segundo (TPS) durante los picos comerciales, muy lejos de su objetivo de 100.000 TPS. OceanStor Dorado V3 permite que Hundsun sea capaz de procesar 150.000 transacciones por segundo, y es ampliable en vistas a futuras expansiones comerciales.

En la industria manufacturera, las capacidades de procesamiento por lotes de los almacenes de datos son la base del análisis comercial de ERP. Por ejemplo, BYD, el mayor fabricante de vehículos de nueva energía de China, necesitaba un mínimo de 3,5 horas diarias para procesar sus solicitudes comerciales por lotes. Cuando el volumen comercial era muy grande, el sistema desperdiciaba demasiado tiempo procesando estas solicitudes, lo que suponía una enorme presión a la hora de tomar decisiones sobre los servicios del día siguiente. Sin embargo, tras adoptar el OceanStor Dorado V3 de Huawei, el procesamiento por lotes del sistema dura solamente 1 hora y 12 minutos, permitiendo así reservar tiempo suficiente para la toma de decisiones final.

En la industria médica, el sistema de información de hospitales (HIS) es el corazón de la gestión de los servicios hospitalarios. Está vinculado a múltiples procesos, como el registro, el diagnóstico, el tratamiento, el cobro y la medicación. Tomemos como ejemplo un conocido hospital terciario de China. Con su arquitectura de TI tradicional, cada paciente pasaba 3 segundos de media en el registro, y debía esperar en 3-6 colas distintas durante el diagnóstico, un proceso que duraba al menos una hora. Tras empezar a utilizar OceanStor Dorado de Huawei, el tiempo de registro de cada paciente se ha reducido a únicamente 0,5 segundos, mejorando la eficiencia del diagnóstico y la relación entre médico y paciente.

El alquiler de almacenamiento es uno de los servicios principales de los operadores y los proveedores de servicios independientes (ISP). Tomemos como ejemplo el grupo ACESI, el mayor ISP del este de Francia. La velocidad de despliegue de máquinas virtuales por lotes era una de las preocupaciones principales de los ISP, porque estaba muy relacionada con el lanzamiento de nuevas actividades. Se tardaba 30 minutos en desplegar 100 máquinas virtuales mediante el almacenamiento tradicional, imposibilitando el desarrollo de un servicio rápido. OceanStor Dorado V3 acortó el tiempo de despliegue de 100 máquinas virtuales a solamente 10 minutos. Además, Huawei permitió que ACESI desarrollara nuevos servicios de alquiler de nivel platino basados en el almacenamiento all-flash Dorado de alto rendimiento, mejorando así la competitividad global de ACESI. De esta manera, ACESI se mantiene a la cabeza del sector, por delante de sus competidores.

En el futuro, el sistema de almacenamiento all-flash OceanStor Dorado V3 de Huawei seguirá beneficiando a cada vez más clientes.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados

Artículo 1 de 2