Communauté

Astronomie / Espace

Aladin au service de la communauté astronomique

Publié par Planétarium du Jardin des sciences - Jardin des Sciences, le 15 mars 2023   1.3k

Capture d'écran Aladin - crédits : CDS-ObAS

Fin janvier 2023, le Centre de Données astronomiques de Strasbourg (CDS) lançait officiellement la version 3 de Aladin Lite, son atlas du ciel interactif. Sébastien Derrière, astronome-adjoint au sein du CDS et correspondant communication de l’Observatoire astronomique de Strasbourg, nous aide à mieux comprendre les missions de ce service de renommée internationale.

Qu’est-ce que le CDS et quelles sont ses missions ?

C’est une équipe de l’Observatoire qui a été créée en 1972 avec pour mission de collecter les données astronomiques sous forme électronique, de les améliorer et de le redistribuer à la communauté astronomique internationale. Des recherches sont alors menées à partir de ces données. Ces missions définies il y a 50 ans restent d’actualité.

Et ses données proviennent de l’ensemble des instruments astronomiques au niveau international ?

Il y a 50 ans, il y avait beaucoup moins de données. A l’origine, il y avait quelques missions qui consistaient à rassembler des informations sur les objets astronomiques individuels identifiés par plusieurs catalogues. Le but était alors de trouver facilement le nom d’un même objet dans ces différents catalogues.

Au CDS, on découvre trois noms originaux : Simbad, VizieR, Aladin. Mais quelles sont leurs différences ? Et pourquoi Aladin apparaît plus facile d’accès pour les utilisateurs ?

Capture écran de SIMBAD - crédits : CDS - ObAS

Vous avez raison, il y a 3 services principaux au CDS. Le plus ancien est Simbad qui constitue la base de données des objets individuels et leur bibliographie. En effet, les chercheurs publient des articles citant des objets individuels, des étoiles, des galaxies comme M31, M101… et les astronomes ont besoin de trouver régulièrement des articles parlant d’un objet en particulier, comme par exemple tous les articles qui citent la galaxie d’Andromède, ou inversement de savoir quels sont les objets cités dans un article. C’est le travail de Simbad. Le service VizieR lui est une collection de catalogues. Aujourd’hui, il y a près de 24 000 catalogues dans VizieR ; c’est une grande bibliothèque de listes dont certaines peuvent dépasser un milliard de lignes.

Et donc Aladin est le dernier né de ces services ?

Emergence d’un service dédié à visualiser des images, Aladin est né il y a environ 25 ans. A la base, les images n’étaient pas forcément stockées au CDS. Aladin était donc à cette époque un logiciel permettant d'accéder à des collections d’images. Pour se développer, Aladin a mis du temps car, au début, le volume de données des images était trop gros pour être accessible informatiquement et nous n’avions encore les réseaux pour les échanger aussi facilement. Avec le développement du Web à la fin des années 90, on a commencé à rendre ces données accessibles via les réseaux et on pouvait alors fournir ces images sur de grands disques magnéto-optiques, de grands jukebox de disques, qui stockaient toutes les images du ciel d’un même projet.

Comment cela fonctionne-t-il vis-à-vis des divers observatoires à travers le monde ?

Pendant longtemps, les observatoires au sol ou spatiaux collectaient leurs images et les stockaient dans les meilleurs des cas dans leurs propres archives, dans le pire des cas dans des bandes magnétiques ou disquettes non accessibles en réseau. Il y a eu des plaques photographiques qui furent numérisées et ensuite distribuées à qui en voulait une copie sachant toutefois que le volume de données était parfois si important que certains ne pouvaient copier cela sur leurs ordinateurs. Nous avons ainsi récupéré, à Strasbourg, un projet de plaques photographiques numérisées et qui mobilisaient à elles seules une machine. Aladin puisait dans cette base d’images pour fournir aux utilisateurs qui le désiraient une petite image couvrant la zone qui les intéressait.

Aladin est-il pionnier en la matière ?

Il y avait bien sûr d’autres logiciels de visualisation d’images. La nouveauté d’Aladin était de pouvoir à la fois récupérer les images et de superposer facilement par-dessus les informations de la base Simbad et des catalogues VizieR. On intégrait ainsi dans un même outil les images et les catalogues. Par la suite, au début des années 2000, la grosse différence fut la mise en route d’un projet d’observatoire virtuel international. Plutôt que d’avoir des images stockées séparément dans des archives en plusieurs endroits de la planète avec la nécessité d’un nom d’utilisateur et d’un mot de passe pour chaque lieu, on définit alors des méthodes d’accès à ces images qui sont les mêmes pour tous. Ainsi avec un seul et même outil, on peut alors interroger tous les services aux quatre coins du globe.

A-t-il été facile de lancer un tel partage de données à grande échelle ?

Ce n’est certes pas simple de mettre en place cela, car il faut discuter et se mettre d’accord, mais en astronomie nous avons l’avantage que nos données ne sont pas monétisables. En astronomie, on a cette culture de la science ouverte et on peut rendre facilement accessibles ces données. Les chercheurs ont généralement un an où ils sont propriétaires de leurs données en prévision de leurs publications et ensuite celles-ci sont accessibles gratuitement à la communauté.

Les images arrivent-elles déjà traitées ou sont-elles traitées par le CDS ?

                                                Exemples de HiPS 
                                                Crédits : CDS - ObAS

Au début, chacun était d’accord pour partager les données. Ce furent au début des données quasiment originales où chacun décrivait en détails son contenu. On a ainsi ajouté des métadonnées pour apporter des informations et les rendre accessibles. Un nouveau mécanisme d’accès aux images fut alors proposé à Strasbourg. Avant le début de l’observatoire virtuel, il fallait demander spécifiquement une image pour chaque zone désirée sans avoir la possibilité d’une vue d’ensemble du ciel. De là sont nés les HiPS (Hierarchical Progressive Surveys) : un mécanisme permettant d’avoir une approche progressive, hiérarchique depuis la vue complète du ciel à basse résolution jusqu’à une vue pleine résolution des objets que l’on a demandé.

Sur le site du CDS, on remarque un Aladin Desktop et un Aladin Lite, pourquoi une telle distinction ?

Le logiciel de base appelé Aladin Desktop est une application que chacun peut télécharger sur son ordinateur. Ecrit en Java, cela tourne sur tous les ordinateurs sans problème. Mais faire tourner Aladin dans un navigateur web demande un plug’in pour que java fonctionne. Et c’est une technologie qui a désormais disparu pour des raisons de sécurité. Si l’on voulait donc faire tourner Aladin dans un navigateur, il fallait une nouvelle technologie. C’est ainsi qu’est née une version légère, baptisée Aladin Lite, qui n’a donc pas besoin de programme Java pour fonctionner. De fait, dans une page Web, on peut aujourd’hui intégrer Aladin Lite sous forme d’un petit bout de code Javascript, permettant ainsi l’accès aux mêmes images astronomiques que Aladin Desktop.

Aladin Lite, c’est l’assurance de nouveaux utilisateurs ?

Oui, on s’ouvre à un public plus large sans cette démarche d’installation d’un nouveau programme sur sa propre machine. Certaines personnes peuvent même tomber par hasard sur Aladin au détour d’une page Web. Cela ouvre aussi de nouvelles possibilités pour des collègues qui développent des applications Web. On a de nombreux exemples d’utilisation d’Aladin Lite par des collègues astronomes comme par exemple ceux de l’Agence Spatiale Européenne (ESA). L’ESA a développé ESA Sky, un outil permettant d’explorer les collections de données de l’Agence. On a la même chose avec l’Observatoire Européen Austral (ESO).

De tels services demandent un Data Center important non ?

Le grand changement est arrivé lorsque l’on a commencé à fabriquer des images du ciel au format HiPS. Il a fallu stocker les nombreux pixels correspondant. Il a donc fallu un lieu de stockage puissant car les plus gros HiPS représentent chacun 15 tera octets. On stocke à ce jour pour l’ensemble des HiPS environ 430 000 milliards de pixels ! On a donc effectivement des serveurs de stockage qui doivent intégrés au Data Center de notre université.

Et en terme de requêtes quotidiennes sur vos serveurs ?

On est à plus de 2 millions de requêtes par jour pour l’ensemble des serveurs du CDS avec une proportion dédiée à Aladin qui a tendance à croître plus fortement que les autres.

De quelle façon le CDS va-t-il gérer la croissance annoncée du volume de données astronomiques ?

Ce qui va générer les plus gros volumes de données arrivant ce sont les grands projets d’imagerie du ciel. On a aujourd’hui des projets qui font des images du ciel avec de très grosses caméras. Chaque cliché peut atteindre le milliard de pixels voire plus. On attend la mise en service prochaine d'EUCLID et du Vera Rubin Télescope (LSST), pour n'en citer que deux. Des instruments qui vont réaliser des images allant jusqu' à 3,2 milliards de pixels en couvrant l’ensemble du ciel de façon régulière. Tous les 2 ou 3 jours, on pourrait ainsi avoir une image complète du ciel d’environ 1 tera pixel. Si l’on veut stocker tout cela, cela va représenter d’énormes volumes de données.

Mais alors comment le CDS va gérer la mise à disposition de tels flux de données ?

Il y a 2 possibilités pour nous :

Soit on identifie un projet comme très intéressant et utile pour les astronomes. Dans ce cas, on contacte les responsables pour récupérer des copies de leurs images et les stocker, ici à Strasbourg, en les traitant au format HiPS. Et c’est en ce format que les images seront rendues accessibles à la communauté.

Soit, des collègues ont compris l’intérêt de cette technologie HiPS. Comme il existe d’autres outils pouvant générer du HiPS, ils vont eux-mêmes traiter leurs images et les rendre accessibles en HiPS. Du coup, il est nul besoin d’avoir une copie complète de ces données au CDS et cela soulage nos serveurs.

Mais pourquoi une telle communication autour de la version 3 d’Aladin Lite ?

Les technologies informatiques évoluent très vite et on essaye de suivre toutes ces améliorations pour actualiser nos services. De fait, cette 3ème version rendue publique en début d’année intègre tout particulièrement les capacités des cartes graphiques des machines, des ordinateurs, pour accélérer le rendu, améliorer la fluidité et ainsi se rapprocher au plus près de la capacité du logiciel complet Aladin Desktop. On peut désormais jouer avec le contraste et la dynamique des images comme sur l’application. On a la chance au CDS d’avoir des ingénieurs en informatique très très compétents et brillants qui savent exploiter les nouvelles techniques informatiques. Ils font une véritable veille technologique pour suivre les nouveaux développements. Ils vont ensuite interagir avec les astronomes et chercheurs du CDS pour intégrer ces nouvelles technologies dans les outils et ainsi répondre à leurs besoins.

La collecte des données du satellite Gaia est un bel exemple de collaboration. Vous pouvez nous en dire plus ?

Gaia est une mission scientifique de l’Agence Spatiale Européenne qui collecte des données depuis 2015. Ces données sont traitées au fur et à mesure, mais on n’a pas encore atteint la fin de cette mission. Et on ne veut pas attendre cette fin de mission pour commencer à exploiter les résultats du satellite. Le consortium international qui gère le satellite a déterminé au départ un calendrier précis de publications de flots de données Gaia. On appelle ces étapes DR1, DR2, DR3,… Et le CDS est un centre partenaire pour la distribution de ces données. A chaque remise de données, le CDS les reçoit en amont. C’est ensuite un travail intense de quelques semaines pour nos équipes afin que ces données soient accessibles le jour J à l’heure H pour la communauté.

Gaia-EDR3-flux-map-crédits : CDS-ObAS

Quel avenir face à l’augmentation exponentielle des flux de données ?

On essaye d’anticiper face à des projets qui vont bientôt démarrer tels le Vera Rubin Télescope, le SKA en radio, EUCLID qui va observer de très nombreuses galaxies… Cela va faire des volumes de données importants. On pense ainsi être capable de gérer des catalogues de quelques dizaines de milliards d’objets ou des grands relevés du ciel pesant des dizaines, voire des centaines de Tera octets grâce à une petite évolution des technologies actuelles. Il se pose tout de même une question plus profonde : comment visualiser la dimension temporelle ?

Pendant très longtemps on avait peu de données accessibles et donc, quand on disait donnez-moi une image du ciel, on donnait un cliché du ciel qui était à disposition, et on était bien content d’en avoir une ! Maintenant, lorsque l’on dit : donne-moi une image de tel objet à telle position dans le ciel, on va avoir des milliers de réponses. Il convient alors de décider comment filtrer en tenant compte de la dimension temporelle. Par exemple : vous voulez telle galaxie, mais à quelle date, à quelle époque ? Et la base de données a des milliers, voire des dizaines de milliers d’images de la même galaxie prise à différentes époques. Et donc, on peut faire le film temporel de l’évolution de l’aspect du ciel à l’endroit de cet objet. C’est un vrai challenge pour le CDS de pouvoir fournir à l’avenir des cubes de données avec des tranches pour chaque période de temps. Ce sera le cas avec les multiples images collectées par le LSST.

Interview réalisée par Jean-Yves Marchal - 2 mars 2023

Quelques liens utiles :

- previewer Aladin
- le HiPS ESO outreach
- le HiPS HST outreach
- le visualiseur de planètes
- une sélection de sites de Mars préférés