Aún con la resaca de la celebración del IV Congreso Europeo de Biología Computacional y las VI Jornadas de Bioinformática en Madrid, los últimos estudios apuntan a que la biotecnología española crece a un ritmo cuatro veces superior a la media de los países de la Europa de los 15. Este se debe, en gran medida, a la labor de la Fundación Genoma España, auspiciada por los Ministerios de Sanidad y Consumo y de Educación y Ciencia como una Fundación para el Desarrollo de la investigación en Genómica y Proteómica.
En este contexto, el Instituto Nacional de Biotecnología (INB) se ha erigido como la piedra angular de todo el proceso, al frente del cual se encuentra el doctor Alfonso Valencia. Los proyectos de genómica han avanzado a una velocidad vertiginosa, más allá de la secuenciación, impulsados por la llegada de los DNA arrays (una serie de sondas de ADN unidas a un soporte sólido en una disposición regular y prefijada). Así las cosas, la necesidad de contar con mayor potencia computacional se ha convertido en una exigencia ineludible. Valencia explica que “hasta hace muy poco, la biología molecular era muy artesanal y ahora es necesario contar con una infraestructura tecnológica para poder acceder a nuestros datos, que no sólo son tremendamente complejos, sino variantes en el tiempo”.
Corría el año 2001 cuando surgió el primer Plan Nacional de Genómica con cerca de una docena de proyectos. Tres años después, se suscribió un convenio por tres años con 4,44 millones de euros, constituyéndose así el Instituto Nacional de Biotecnología, que “actúa como una plataforma a la que los proyectos de genómica de distintas entidades y diferente naturaleza acceden para analizar sus datos y organizar su información de un modo más coherente”, indica el experto.
En realidad, se trata de un proyecto multicentro en el cual el ubicado en Madrid actúa como nodo central. “Llevamos funcionando un año aproximadamente y en ese tiempo hemos desarrollado todo”, señala Valencia, “desde la tecnología computacional a las metodologías con las que se iba a trabajar”.
Desde un punto de vista tecnológico, el doctor precisa que “tenemos dos centros de computación, uno de ellos está en el Parque Tecnológico de Madrid y el otro en la Universidad Politécnica en Barcelona”, con el superordenador Marenostrum.
En este último caso, el responsable del INB relata que antes de conocer la noticia de la compra de Marenostrum, “en Madrid habíamos planeado un equipo que en cuanto a configuración era igual en procesadores y organización que el de Barcelona”. Este es el motivo por el que se optó por “llegar a un acuerdo con ellos por el cual teníamos acceso al superordenador y, entonces, nuestro dinero lo dedicamos a adquirir unos técnicos en supercomputación para ir explorando todas las posibilidades”.
En el caso concreto del Parque Tecnológico de Madrid, éste combina la potencia de un supercluster SGI Altix 3700, con 24 CPUs Itanium 2, con la de otros dos clusters de Apple y HP.
En la actualidad, la conexión entre Madrid y Barcelona se ha resuelto de un modo trivial, hasta el punto de que Valencia explica que “tenemos duplicadas todas las cosas en los dos sitios, de modo que cuando lo usamos como servicio web podemos elegir en qué centro trabajar”. El objetivo de este planteamiento era adquirir la experiencia necesaria para avanzar en el corto plazo y ahora el experto asegura que “ya empezamos a pensar que habrá procesos específicos que será mejor hacerlos en un sitio concreto”. Así, entre los “futuribles deseables se encuentra poder transmitir de un centro a otro pruebas de laboratorio por imagen y que se puedan manipular las imágenes de proteínas, etc., pero todo eso ahora no es necesario”, aclara el experto.
En este mismo contexto y a pesar de que ya se cuenta con varios terabytes de información almacenada, el doctor precisa que “durante este tiempo hemos desarrollado proyectos pilotos y no hemos alcanzado tampoco volúmenes exagerados”. Esta situación comenzará a cambiar progresivamente, dado que el INB va a iniciar su participación en un proyecto internacional de segmentación del genoma del tomate que disparará el volumen de datos.
El INB presta servicios para DNA arrays de manera transparente para los investigadores, que acceden a los recursos gracias a la tecnología de servicios web. Esto ha posibilitado que, a pesar de que en cada uno de los centros que componen la red bioinformática se cuenta con diferentes sistemas informáticos, las aplicaciones se ejecutan sin problemas.
Para poder haber llegado a esta situación, el INB tuvo que optar por la mejor tecnología, labor nada sencilla hace algo más de un año. Las dos opciones que ganaron más peso fueron DAS (Distributed Access Services) y BioMoby. Mientras que la primera se presenta como “un visualizador del genoma muy sencillo, que incorpora un master brindando la posibilidad de elegir las coordenadas que quiere ver”, BioMoby se trata de “una tecnología de integración de servidores con la que se crean las aplicaciones y éstas se publican como servicios web”, explica el experto.
Cuando el INB se subió al tren de BioMoby, este consorcio estaba en sus primeros albores y, como si de una comunidad de software libre se tratara, el centro español tuvo oportunidad de desarrollar más servicios. De hecho, uno de los nodos de la Universidad de Málaga, especializado en informática integrativa, contribuyó especialmente a crear, instalar y poner en marcha toda esta tecnología, proceso durante el cual resolvieron algunas lagunas técnicas de BioMoby. Gracias a ello, a día de hoy el INB participa directamente en el consorcio que desarrollo BioMoby lo que, como puntualiza Valencia, “está muy bien porque nos da control sobre el futuro”.