Nuevo sitio del Blog

Todas las entradas antiguas de este blog han sido movidas a mi sitio personal. Las nuevas entradas serán publicadas directamente en ese sitio.


http://astronomia.udea.edu.co/jzuluaga

Las entradas publicadas en este blog no pasan por un proceso editorial riguroso, como tampoco lo hacen la mayoría de los blogs personales. La revisión de la ortografía y la gramática es normalmente realizada por sistemas automáticos en editores de texto comerciales. El autor se disculpa por los errores involuntarios cometidos aquí y agradece cualquier esfuerzo de los lectores para que los reporten.

domingo, 26 de agosto de 2007

1000 galaxias por minuto!

Después de una prolongada interrupción y esperando que los pocos lectores que habían desarrollado algún habito para leer este blog, todavía estén por ahí esperando que se publique semanalmente una nota, regreso este fin de semana para contarles sobre una iniciativa que curiosamente esta relacionada con una idea que se me vino a la cabeza la semana pasada durante una conferencia de computación avanzada.

1,000 galaxias por minuto no es el ritmo al que las galaxias chocan en el Universo, ni el número de las que descubren los telescopios en Tierra en esa unidad de tiempo, mucho menos la velocidad a la que nacieron estos racimos estelares en el Universo jóven. Esta es la rata con la que las millones de imágenes de galaxias registradas por el Sloan Digital Sky Survey (SDSS) son analizadas y clasificadas por 85,000 cerebros humanos distribuidos por todo el mundo. ¿Sorprendente, no? Pero, ¿quiénes son esos privilegiados cerebros? no hay que ir muy lejos: usted puede ahora mismo convertirse en uno de ellos.

Me refiero a lo que científicos de la Universidad de Oxford y el Instituto John Hopkins han bautizado como el proyecto Galaxy Zoo, una ambiciosa y creativa iniciativa destinada a explotar el poder de computo de decenas de miles de cerebros alrededor del mundo, contenidos en el craneo de aficionados, profesionales, jóvenes, viejos, mujeres, hombres, cualquiera dispuesto a ceder parte de su tiempo y capacidad para resolver un inmenso problema de computo: clasificar de la manera más precisa posible el cerca de un millón de galaxias contenidas en los registros del SDSS.

Pero, ¿por qué utilizar seres humanos para realizar esta labor titániaca? ¿por qué no cederle la tarea a alguno de los supercomputadores más poderosos del mundo que podrían completarla inclusive en una fracción del tiempo? La razón básica es simple: el cerebro humano posee la capacidad de procesar información relativamente compleja de una forma espontánea y aparentemente no algorítmica (sin unas recetas determinadas o siguiendo procedimientos matemáticos establecidos) lo que le da el poder para realizar esta tarea de manera más precisa que un computador. Pero un sólo ser humano, e inclusive un grupo pequeño y altamente capacitado se vería en problemas para procesar la enorme pila de información que SDSS ha acumúlado sobre la forma de galaxias a todas las distancias a lo largo y ancho del cielo. ¿Para qué pagar un sueldo a 10 o 100 personas que se demoraran años analizando unos datos si podemos pedirle a decenas de miles de entusiastas de la astronomía a nivel mundial que desde su esquina en el planeta contribuyan con esta particular tarea? Esta es la idea detrás de Galaxy Zoo.

El modelo de este peculiar proyecto (aprovecho para agradecer a David Vasquez por hacerme saber de él hace unas semanas) tiene un especial parecido con el de la afamada iniciativa y red mundial SETI@Home (convertida ahora en uno de los proyectos de la plataforma de computo sobre internet BOINC). Como la mayoría de ustedes sabrán el proyecto “SETI en casa” busca aprovechar el poder de computo del que en su caso son mayoritariamente centenares de miles de computadoras personales conectadas a internet en practicamente todos los rincones del planeta, para realizar sofisticados análisis sobre las señales de radio capturadas por un par de grandes radiotelescopios en el mundo en el marco de la búsqueda por señales de una civilización extraterrestre. Este proyecto, que se lo podría llamar (tal vez sin el acuerdo de muchos académicos) el más puro ejemplo de computación ditribuida a escala mundial (Global Grid Computing, pure Grid, Intergrid) le ha dado paso de manera muy creativa al que se convierte en el primer ejemplo de una red de computo mundial que en lugar de utilizar computadoras de Silicio, se vale de las computadoras fisiológicas que miles de seres humanos llevan sobre sus cabezas! Como les decía al principio una idea como estas vino a mi cabeza durante una charla sobre computación Grid en la Conferencia Latinoamericana de Computación de Alto Rendimiento que se realizó la semana pasada (agosto 13 a 18) en la ciudad de Santa Marta, Colombia. Naturalmente en su momento para mí fue simplemente una inquietud curiosa que nisiquiera comenté con los participantes del evento y que consistía basicamente en pensar que si podíamos conectar miles de computadores en una inmensa red de computo que traspasara barreras institucionales, nacionales e internacionales, por qué no podríamos hacer lo mismo pero usando el cerebro de miles de personas que en últimas también es una máquina que hace cálculos pero que los realiza de una manera fundamentelmente diferente a los cerebros de Silicio en nuestros escritorios. Me complace muchísimo saber que finalmente los astronómos (que con los físicos han sido los jalonadores de los más importantes adelantos en computación en los últimos 50 años) hayan sido finalmente los primeros en explotar esta fantástica idea.

Pero en que consiste exactamente la tarea que resuelve este enorme “Grid de cerebros”. Las galaxias, que como ya he mencionado en otras ocasiones en el blog, son los ladrillos fundamentales del universo, adoptan formas específicas que son determinadas fundamentalmente por los procesos que dan lugar a su formación. A muy grandes rasgos la inmensa mayoría de las formas galácticas pueden clasificarse en 2 categorías básicas: galaxias espirales y galaxias elípticas. Ambos tipos de galaxias se sabe hoy por hoy surgen en procesos relativamente distintos y su abundancia o ausencia en una determinada región del Universo brinda interesantes pistas sobre los procesos de manufactura galáctica presentes allí. El reto es entonces determinar en el cerca de un millón (y creciendo) de imágenes de galaxias individuales acúmuladas por años por los telescopios del SSDS cuáles galaxias son de un tipo y cuáles de otro! Como ya había mencionado, si bien es posible encargar esta tarea a un computador que logra clasificar bien una galaxia si dispone de suficiente información (una imágen nitida, un fondo limpio, etc.) muchas imágenes son tan vagas y a veces complejas que la rata de equivocaciones es bastante alta. Pero los seres humanos (o nuestros cerebros para ser exactos) son capaces de descubrir sin mucho esfuerzo patrones, formas en una imágen sin necesidad de realizar complejos procedimientos de análisis y de cálculos matemáticos. Las mismas neuronas que usamos posiblemente para reconocer la cara de una persona que vimos solo un par de veces (un increiblemente complejo problema computacional!) podrían entrar en juego cuando a una persona se la coloca frente a una imagen galáctica para que la juzgue o clasifique. Mejor aún, nuestros circuitos crebrales, a diferencia de los circuitos electrónicos de los computadores, son reconfigurables y se modifican dinámicamente lo que nos da una capacidad sorprendente (para los estándares computacionales) de aprender y entrenarnos, de modo que nuestras habilidades se refinan con el tiempo haciendonos aún mejores para esas tareas específicas. Esta es fundamentalmente la razón por la que los creadores de Galaxy Zoo se inclinaron por los humanos en lugar de los supercomputadores para hacer su tarea.

Pero si algo caracteriza al cerebro humano es también su capacidad para equivocarse y aveces muy frecuentemente (“errar es humano!”). ¿Cómo podemos construir conocimiento científico a partir de resultados posiblemente con errores introducidos por la ignorancia o el cansancio de un cerebro que analiza una imágen astrofísica? Por suerte lo que buscan los astrofísicos es construir información “estadística” sobre la formación de las galaxias y la forma como el ambiente la afecta, de modo que algunos errores cometidos en el proceso de identificación seguramente no afectaran las conclusiones finales. Además de eso los diseñadores de Galaxy Zoo se aseguran que una misma imágen sea analizada por más de un observador y así contar con “la opinión” de más de un cerebro en cada caso, una estrategia también utilizada por SETI@Home donde la existencia de un pequeño error (aún uno cometido por un aparentemente infalible computador) puede ser la diferencia entre descrubrir a E.T. o el ruido de fondo de la Galaxia. A principios de este mes (Agosto 6 de 2007) el proyecto tenía más de 85,000 afiliados, analizando más de 60,000 imágenes de galaxias por hora (1,000 galaxias por minuto!) para un total de 12 millones de imágenes análizadas en poco más de 20 días desde la apertura del proyecto a mediados del mes de Julio de este año (2007).

Un pantallazo del sitio de Galaxy Zoo donde se muestran parte de las galaxias que yo personalmente he clasificado.

Aparte de todo esto hay una cosa que hace aún más romántico (dejenme decirlo así) este proyecto: cualquiera puede participar de él! Es más (me atrevo a decirlo) entre menos sepas de Astrofísica mejor! Los mismos creadores del proyecto reconocen que los astronómos no podrían realizar probablemente de manera tan efectiva el proceso de identificación de una galaxia cuya imágen no es tan clara debido a que al contar con mucha más información podrían buscar (y hasta inventar) detalles que un cerebro menos preparado no vería. Obviamente saber un poco de Astrofísica ayuda para entender la importancia de lo que se esta haciendo además de qué te permite reconocer que estas participando de un proyecto científico sin precedentes y que tus aportes serán usados probablemente para derivar resultados científicos.

Existe un único riesgo para quien desee participar en el proyecto Galaxy Zoo: volverse un adicto! Una vez se identifican las primeras manchas (a veces aburridas e informes) y empiezan a desfilar imagenes que retan tu capacidad para distinguir entre una galaxia elíptica y un disco espiral de canto, es díficil detenerse. Existen usuarios que reportan haber clasificado más de 50,000 galaxias en una semana y quien ostenta el record de clasificación va por las 152,000 galaxias en un poco más de un mes que lleva el proyecto. Las cosas se ponen más difíciles (especialmente para tus responsabilidades habituales que descuidas por estar frente al portal del proyecto!) cuando aparece (y no es tan raro) una verdadera diva, el cariñoso apodo que los usuarios de esta creciente comunidad dan a las galxias que exhiben una imágen espectacular!

Aún con todo esto estoy dispuesto a volverme un adicto de la clasificación galáctica. Peores vicios lo acosan a uno todos los días!

Jorge Zuluaga
Medellín - Colombia

P.S. La única nota negativa de todo esto y como es costumbre la ponen los mal llamados “comunicadores científicos”. No se sabe quiénes son peores, si aquellos que al conocer esta curiosa noticia la pasan por alto porque no incluye ninguna de las palabras mágicas “agujero negro”, “stephen hawking”, “big-bang”, “vida extraterrestre”, etc. o aquellos que increiblemente tienen la sensibilidad para reconocer que en esto hay algo interesante pero que (como decimos en mi tierra) saben más de maternidad de gallinas. Para la muestra, dejenme transcribir para ustedes algunos apartes de una nota (la original referida a mi por David Vasquez) publicada en ABC.es (un periodico español relativamente importante): “Científicos de las universidades de Oxford y Portsmouth (Reino Unido) y Johns Hopkins (Estados Unidos) invitan a los internautas a clasificar la Vía Lactea mediante la observación de imágenes captadas por el telescopio Sloan Digital Sky Survey (en Nuevo México) con una resolución de 142 megapíxeles.”

Por donde comenzar a analizar las burradas de este parráfo que en lo único que parece atinar es en la ubicación de las instituciones lideres del proyecto. En primer lugar el Sloan Digital Sky Survey es un proyecto (el más ambicioso de su tipo) para levantar un completo mapa de la distribución de galaxias en 3 dimensiones, mediante el registrode millones de imágenes de practicamente todo el cielo. NO ES UN TELESCOPIO. En su primera fase el SDSS se ha valido de un telescopio especialmente diseñado ubicado en Apache Mount, Nuevo Mexico pero para la segunda fase que concluirá el año entrante otros instrumentos se han unido al programa. En segunda instancia y como ya habrán todos reconocido a partir del infortunado parráfo no se busca “clasificar la Vía Láctea” que como es bien sabido ya es una galaxia espiral con una moderada barra central, sino clasificar el casí un millón de galaxias observadas por el programa.

El texto continua más adelante afirmando: “A partir de las fotografías, deben distinguir cuáles son galaxias elípticas o espirales (y en qué sentido giran estas últimas).” En este punto el comunicador se equivoca en un aspecto más sútil que quizas es importante clarificar. Efectivamente además de distinguir si se trata de una galaxia espiral el observador debe indicar el sentido en el que se enrollan los brazos espirales, que sin embargo no es necesariamente el sentido en que las galaxias rotan, como lo señala el comunicador.

A pesar de estas confusiones se le concede a este medio de comunicación y al periodista, por hacer un esfuerzo para entender la iniciativa e intentar que la misma llegará al gran público.


Imagen: Tomada de http://www.astro.princeton.edu/~rhl/PrettyPictures

Para saber más:


Visita ya el nuevo sitio Física Cotidiana