Virtualización del almacenamiento -consideraciones sobre la arquitectura-

José Luis Solla, director general de EMC Iberia.

Publicado el 23 Feb 2006

Son varios los enfoques y retos asociados con esta nueva tecnología de virtualización. En última instancia, la arquitectura juega un papel fundamental en este tipo de soluciones para entornos corporativos.

Virtualización del almacenamiento basado en host

Una solución para abordar este reto de agregar y gestionar la capacidad de diversos dispositivos de la SAN, es el gestor de volúmenes lógicos basado en host (LVM “Logical Volume Manager”). Sin duda, los LVMs se están convirtiendo en un estándar en la mayoría de los sistemas operativos de servidores modernos. Los LVMs son utilidades de software que gestionan volúmenes lógicos presentados desde varios dispositivos de almacenamiento, configurando la capacidad dependiendo de las necesidades de la aplicación.

Mientras que los LVMs ofrecen algunas de las ventajas de la virtualización a gran escala, también llevan consigo una limitación intrínseca están basados en el servidor y, por tanto, la configuración y la implantación debe hacerse individualmente para cada host. Esto no supone un problema si el número de hosts es pequeño, pero en un entorno corporativo, donde hay cientos e incluso miles de servidores accediendo al almacenamiento SAN, la manejabilidad de esta función distribuida se convierte en todo un reto.

Virtualización del almacenamiento basada en red

Las arquitecturas de virtualización basadas en red intentan abordar algunos de los problemas inherentes al modelo basado en host. Al situar la virtualización en una capa intermedia entre los hosts y los subsistemas de almacenamiento, esta funcionalidad está más centralizada, de manera que la gestión es más sencilla. Hay dos enfoques de arquitectura: in-band y out-of band.

Las arquitecturas in-band introducen un dispositivo de virtualización en el camino de los datos en la red (o “in band”) entre los hosts y los arrays. La principal ventaja de este enfoque es la simplicidad se puede utilizar un (nuevo) dispositivo independiente que actúe como punto central de gestión de los distintos dispositivos conectados.

Una desventaja básica del enfoque in-band es la adición de un “salto” extra en el camino de la red, lo que añade latencia entre los servidores y el almacenamiento físico. Una desventaja más significativa de las arquitecturas de virtualización in-band es la limitación de la escalabilidad. Puesto que toda la E/S dentro del dominio de virtualización tiene que pasar por el dispositivo in-band, éste se puede convertir en un cuello de botella, bien en términos de ancho de banda o de potencia de proceso.

La única manera viable de escalar una arquitectura in-band es añadir nodos cada vez mayores para ofrecer la virtualización a gran escala y en entornos grandes habrá que implantar nuevos dispositivos in-band. Cada uno de estos dispositivos asume la responsabilidad de su propio dominio de virtualización separado, lo que da como resultado la necesidad de gestionar islas de virtualización independientes. El overhead de gestionar islas dispares puede tener en algunos casos mayor peso que las ventajas originales de reducir la complejidad y simplificar la gestión a través de la virtualización.

Las soluciones “out-of-band” están diseñadas para evitar los problemas de rendimiento inherentes a las arquitecturas “in-band” al separar la información de gestión del propio flujo de datos. En una arquitectura “out-of-band”, existe una pieza aparte de hardware, llamada servidor de metadatos, que contiene información acerca de las relaciones lógicas a físicas del almacenamiento virtualizado, y se comunica con cada servidor, informándole de dónde debe dirigir sus peticiones de E/S. Esta comunicación se hace mediante una red independiente, separada de la red Fiber Channel utilizada por el tráfico de datos -de ahí la denominación de “out-of-band”. La comunicación entre el servidor de metadatos y los hosts normalmente viene facilitada por un agente que se carga en el host y que funciona conjuntamente con un controlador de E/S modificado que redirige las peticiones.

Dado que el host emite las peticiones de almacenamiento directamente al dispositivo de destino, el rendimiento de E/S queda libre de latencias adicionales o de cuellos de botella de ancho de banda. Por tanto, el enfoque “out-of-band” teóricamente es más adecuado para las aplicaciones que requieren alto rendimiento. Sin embargo, este tipo de soluciones out-of-band reintroducen algunos de los problemas de manejabilidad de las soluciones basadas en host.~ En concreto, la necesidad de cargar, mantener y cualificar el software basado en host.

Está surgiendo una arquitectura refinada del enfoque out-of-band en la que se aborda este problema potencial de manejabilidad. Esta arquitectura hace uso de los switches SAN inteligentes como la plataforma de implantación de la virtualización del almacenamiento basada en red. Estos switches tienen procesadores especializados a nivel de puerto (con frecuencia ASICs optimizados, aunque también pueden ser FPGAs o procesadores de red) que inspeccionan y redirigen la E/S (convierten direcciones lógicas a físicas) a la velocidad de la red. Al incorporar estos procesadores directamente en la estructura SAN existente, se obvia la necesidad de gestionar otra capa de dispositivos de virtualización. Los metadatos, que anteriormente se gestionaban en el host a través de un agente, se cargan en la memoria flash del puerto inteligente, eliminando la necesidad de disponer de software en el servidor. En lugar de comunicarse con los hosts, el servidor de metadatos se comunica con los puertos inteligentes, lo que asegura que siempre disponen de la información correcta de los hosts que acceden al almacenamiento a través de esos puertos. En suma, la manejabilidad de esta arquitectura aumenta considerablemente.

Esta solución out-of-band basada en switch es también mucho más flexible frente a una estrategia de “escalado”. En resumen, esta arquitectura teóricamente es capaz de escalar a configuraciones muy grandes, escalabilidad que será necesaria para obtener las ventajas de la virtualización del almacenamiento en los grandes centros de datos que existen en la actualidad.

Existen distintos enfoques para la virtualización del almacenamiento, cada uno con sus propias características. La arquitectura puede ser un factor determinante de la manejabilidad, escalabilidad y, en última instancia, del valor de una solución de virtualización del almacenamiento. La plena comprensión de la arquitectura de una solución debe ser una de las consideraciones clave para cualquier usuario potencial de esta tecnología.

¿Qué te ha parecido este artículo?

La tua opinione è importante per noi!

C
Redacción Computing

Artículos relacionados

Artículo 1 de 3