Nos tutelles

Nos partenaires

annuaire

aigle

Rechercher




Accueil > Recherche > Les Axes et Activités de Recherche > Expériences et Modélisation en Astroparticules (EMA) > CTA

Projet Organisation et traitement des données

publié le , mis à jour le

Le LUPM est fortement impliqué depuis plusieurs années dans les lots de travail concernant l’organisation et le traitement des données de CTA, avec en ligne de mire le fait que la distribution des données aux utilisateurs via les protocoles de l’observatoire virtuel soit à la fois rapide, efficace et compréhensive.

Modèle de données

Le travail sur le modèle de données concerne la définition d’un modèle théorique qui décrit comment organiser, marquer, traiter, chercher ou sélectionner les données. Le LUPM est notamment en charge de la description de la Provenance des données : lorsqu’un utilisateur télécharge le spectre en énergie d’un objet céleste, comment sait-il quelles données ont été utilisées pour le créer et comment ces données ont été traitées ?

Ce problème en apparence banal est en réalité complexe à résoudre pour CTA car les chaines de traitement comportent de nombreuses étapes et algorithmes. La Provenance des données est donc une information d’une importance capitale pour le chercheur qui souhaite en faire une interprétation.

Ce travail sur le modèle des données de CTA est réalisé par le LUPM en collaboration étroite avec le Laboratoire de l’Univers et (de ses) Théories de l’Observatoire de Paris et des experts du Centre de Données Astronomiques de Strasbourg.

Simulations Monte Carlo et gestion de la CTA Computing Grid

Depuis 2011, le LUPM est responsable de la production des simulations Monte Carlo de CTA sur la grille de calcul.

Les simulations Monte Carlo consistent à simuler le fonctionnement de CTA en incluant un maximum de détails sur chaque élément de la chaîne : simulation de l’interaction des particules dans l’atmosphère (gerbes électromagnétiques et cascades hadroniques), production et propagation des photons Cherenkov à travers l’atmosphère et jusqu’aux télescopes, réponse de l’optique des télescopes et de l’électronique de la caméra qui enregistre l’image, déclenchement et lecture des signaux électroniques.

Les logiciels utilisés sont mis au point par le groupe de travail sur la simulation Monte Carlo, et sont basés sur le logiciel "Corsika" pour la partie simulation de gerbe atmosphérique, et sur "simtel" programme développé dans le cadre de l’expérience H.E.S.S. pour la réponse des télescopes.

Plusieurs productions majeures ont été réalisées ces dernières années. La PROD2 (2014/2015) avait pour objectif de tester divers sites d’implantation dans les deux hémisphères afin de déterminer quels étaient les meilleurs du point de vue de la physique voulue.

Une fois les 2 sites choisis (Paranal au Chili et La Palma aux Iles Canaris), la PROD3 (2015/2016) a été lancée afin de tester différentes géométries possibles pour chacun des réseaux (configuration hexagonal ou carré, différentes distances entre télescopes). Une fois les réseaux fixés, les prochaines campagne de simulations porteront sur l’optimisation de la réponse des télescopes,de l’électronique des caméras et de la logique de déclenchement.

Les ressources de calcul pour CTA sont pour le moment essentiellement fournies sur une base volontariste par les différents sites membres de la grille de calcul européenne. L. Arrabito, ingénieure de recherche au LUPM, est coordinatrice technique de la grille de calcul pour CTA, baptisée CTACG.

Les ressources rassemblées sont loin d’être négligeables comme le montre les graphes ci-dessous présentant l’utilisation des ressources en calcul et en gestion de données ces 3 dernières années.

Système de gestion des ressources de calcul (DIRAC)

Afin de gérer au mieux les ressources de calcul mises à disposition du consortium CTA sur la grille de calcul, le LUPM a choisi de recourir à DIRAC, une couche logicielle s’insérant entre l’utilisateur et les outils d’accès bas niveau à la grille de calcul permettant de faciliter et d’optimiser l’efficacité de la gestion des tâches.

Le groupe informatique du LUPM a donc développé une extension à DIRAC, baptisée CTADIRAC, et mis en place une instance propre du système pour la gestion de ses ressources et la distribution des tâches sur la grille. Ce travail a été initialement réalisé avec l’aide des membres du consortium DIRAC, puis de par son intérêt pour ce logiciel et ses contributions à la communauté. Le LUPM a ensuite choisi de passer de simple utilisateur final à membre à part entière.

Actuellement, CTADIRAC est utilisé à la fois pour résoudre le problème de "management" des données (catalogue des données, effacer/déplacer/répliquer des données etc...), et pour simplement lancer et monitorer les tâches de simulations et d’analyses pour les productions officielles et celles des utilisateurs.

L’objectif du LUPM est d’adapter et améliorer le système en place afin que celui-ci puisse être utilisé pour le traitement des vraies données des télescopes par les pipelines d’étalonnage, de reconstruction et de sélection des données.