Le SLAC étend et centralise les infras informatiques

Le SLAC étend et centralise les infras informatiques

Une installation informatique du laboratoire national des accélérateurs SLAC du ministère de l’Énergie double de taille, préparant le laboratoire à de nouvelles initiatives scientifiques qui promettent de révolutionner notre compréhension du monde, de l’échelle atomique à l’échelle cosmique, mais nécessitent également la gestion de flux de données sans précédent.

Lorsque le laser à rayons X supraconducteur du SLAC, par exemple, sera mis en ligne, il finira par accumuler des données à un rythme vertigineux d’un téraoctet par seconde. Et le plus grand appareil photo numérique au monde pour l’astronomie, en construction au laboratoire de l’observatoire Vera C. Rubin, capturera à terme 20 téraoctets de données chaque nuit.

“La nouvelle infrastructure informatique sera à la hauteur de ces défis et bien plus encore”, a déclaré Amedeo Perazzo, qui dirige la division Contrôles et systèmes de données au sein de la Direction de l’innovation technologique du laboratoire. “Nous adoptons certaines des technologies les plus récentes et les plus performantes pour créer des capacités informatiques pour l’ensemble du SLAC pour les années à venir.”

La construction dirigée par l’Université de Stanford ajoute un deuxième bâtiment au Stanford Research Computing Facility (SRCF) existant. Le SLAC deviendra l’un des principaux locataires de SRCF-II, un centre de données moderne qui fournira un environnement conçu pour fonctionner 24 heures sur 24, 7 jours sur 7, sans interruption de service et avec l’intégrité des données à l’esprit. SRCF-II doublera les capacités actuelles du centre de données, pour un total de 6 mégawatts de capacité électrique.

“L’informatique est une compétence essentielle pour une organisation axée sur la science comme le SLAC”, a déclaré Adeyemi Adesanya, chef du département des systèmes de calcul scientifique de la division de Perazzo. « Je suis ravi de voir notre vision d’une installation informatique intégrée prendre vie. C’est une nécessité pour analyser des données à grande échelle, et cela ouvrira également la voie à de nouvelles initiatives.

Un hub pour le Big Data du SLAC

L’équipe d’Adesanya se prépare à mettre en place du matériel pour le SLAC Shared Science Data Facility (S3DF), qui trouvera sa place dans le SRCF-II. Il deviendra une plaque tournante informatique pour toutes les expériences gourmandes en données réalisées au laboratoire.

Avant tout, cela profitera aux futurs utilisateurs de LCLS-II, la mise à niveau du laser à rayons X Linac Coherent Light Source (LCLS) qui produira plus de 8 000 impulsions de plus par seconde que la machine de première génération. Les chercheurs espèrent utiliser LCLS-II pour acquérir de nouvelles connaissances sur les processus atomiques qui sont fondamentaux pour certains des défis les plus urgents de notre époque, notamment la chimie des technologies d’énergie propre, la conception moléculaire des médicaments et le développement de matériaux et dispositifs quantiques.

Mais ces nouvelles capacités s’accompagnent de défis informatiques difficiles, a déclaré Jana Thayer, responsable de la division LCLS Data Systems. “Pour obtenir les meilleurs résultats scientifiques et tirer le meilleur parti de leur temps au LCLS-II, les utilisateurs auront besoin d’un retour d’information rapide – en quelques minutes – sur la qualité de leurs données”, a-t-elle déclaré. “Pour ce faire, avec un laser à rayons X qui produit des milliers de fois plus de données chaque seconde que son prédécesseur, nous avons besoin des pétaflops de puissance de calcul que S3DF fournira.”

Un autre problème auquel les chercheurs devront faire face est le fait que LCLS-II amassera trop de données pour tout stocker. La nouvelle installation de données exécutera un pipeline innovant de réduction des données qui rejettera les données inutiles avant qu’elles ne soient enregistrées pour analyse.

Une autre technique informatique exigeante qui bénéficiera de la nouvelle infrastructure est la microscopie électronique cryogénique (cryo-EM) de biomolécules, telles que les protéines, l’ARN ou les particules virales. Dans cette méthode, les scientifiques prennent des images de la façon dont un faisceau d’électrons interagit avec un échantillon contenant les biomolécules. Ils doivent parfois analyser des millions d’images pour reconstruire la structure moléculaire tridimensionnelle avec des détails quasi atomiques. Les chercheurs espèrent également visualiser les composants moléculaires dans les cellules, et pas seulement les molécules biochimiquement purifiées, à haute résolution à l’avenir.

Le processus complexe de reconstruction d’image nécessite beaucoup de puissance CPU et GPU et implique des algorithmes d’apprentissage automatique élaborés. Faire ces calculs au S3DF apportera de nouvelles opportunités, a déclaré Wah Chiu, responsable du Stanford-SLAC Cryo-EM Center.

“J’espère vraiment que le S3DF deviendra un centre intellectuel pour l’informatique, où des experts se réunissent pour écrire du code qui nous permet de visualiser des systèmes biologiques de plus en plus complexes”, a déclaré Chiu. “Il y a beaucoup de potentiel pour découvrir de nouveaux états structuraux de molécules et d’organites dans des cellules normales et pathologiques au SLAC.”

En fait, tout le monde au laboratoire pourra utiliser les ressources informatiques disponibles. Parmi les autres « clients » potentiels figurent l’instrument de SLAC pour la diffraction électronique ultrarapide (MeV-UED), la source lumineuse de rayonnement synchrotron de Stanford (SSRL), l’initiative d’apprentissage automatique à l’échelle du laboratoire et les applications en science des accélérateurs. Au total, le S3DF pourra prendre en charge 80 % des besoins informatiques du SLAC, tandis que 20 % des calculs scientifiques les plus exigeants seront effectués dans des installations de supercalculateurs hors site.

Plusieurs services sous un même toit

SRCF-II hébergera deux autres installations de données majeures.

L’un d’eux est l’US Data Facility (USDF) de l’Observatoire Rubin. Dans quelques années, l’observatoire commencera à prendre des images du ciel nocturne du Sud depuis le sommet d’une montagne au Chili à l’aide de son appareil photo de 3 200 mégapixels construit par le SLAC. Pour le Legacy Survey of Space and Time (LSST), il faudra deux images toutes les 37 secondes pendant 10 ans. Les informations qui en résultent pourraient contenir des réponses à certaines des plus grandes questions sur notre univers, y compris ce qui accélère exactement son expansion, mais ces informations seront contenues dans un catalogue de 60 pétaoctets que les chercheurs devront parcourir. L’archive d’images résultante atteindra environ 300 pétaoctets, dominant l’utilisation du stockage dans SRCF-II. L’USDF, avec deux autres centres au Royaume-Uni et en France, s’occupera de la production de l’énorme catalogue de données.

Un troisième centre de données desservira la communauté des utilisateurs du laser à rayons X de première génération du SLAC. L’infrastructure informatique existante pour l’analyse des données LCLS passera progressivement au SRCF-II et y deviendra un système beaucoup plus vaste.

Bien que chaque centre de données ait des besoins spécifiques en termes de spécifications techniques, ils s’appuient tous sur un noyau de services partagés : les données doivent toujours être transférées, stockées, analysées et gérées. Travaillant en étroite collaboration avec Stanford, Rubin Observatory, LCLS et d’autres partenaires, les équipes de Perazzo et d’Adesanya mettent en place les trois systèmes.

Pour Adesanya, cette approche unifiée – qui comprend un modèle de coût qui aidera à payer les futures mises à niveau et la croissance – est un rêve devenu réalité. “Historiquement, l’informatique au SLAC était hautement distribuée et chaque installation aurait son propre système spécialisé”, a-t-il déclaré. “La nouvelle approche plus centralisée aidera à stimuler de nouvelles initiatives à l’échelle du laboratoire, telles que l’apprentissage automatique, et en brisant les silos et en convergeant vers une installation de données intégrée, nous construisons quelque chose qui est plus capable que la somme de tout ce que nous avait avant.

La construction du SRCF-II est un projet de Stanford. Une grande partie de l’infrastructure S3DF est financée par le Bureau des sciences du ministère de l’Énergie. LCLS et SSRL sont des installations d’utilisateurs de l’Office of Science. L’Observatoire Rubin est une initiative conjointe de la National Science Foundation (NSF) et de l’Office of Science. Sa mission principale est de réaliser le Legacy Survey of Space and Time, fournissant un ensemble de données sans précédent pour la recherche scientifique soutenue par les deux agences. Rubin est exploité conjointement par le NOIRLab de la NSF et le SLAC. NOIRLab est géré pour la NSF par l’Association des universités pour la recherche en astronomie et SLAC est exploité pour le DOE par Stanford. Le Stanford-SLAC Cryo-EM Center (S2C2) est soutenu par le programme Transformative High-Resolution Cryo-Electron Microscopy du Fonds commun des National Institutes of Health (NIH).

Le SLAC est un laboratoire multiprogramme dynamique qui explore le fonctionnement de l’univers aux échelles les plus grandes, les plus petites et les plus rapides et invente des outils puissants utilisés par les scientifiques du monde entier. Avec des recherches couvrant la physique des particules, l’astrophysique et la cosmologie, les matériaux, la chimie, les sciences biologiques et énergétiques et l’informatique scientifique, nous aidons à résoudre les problèmes du monde réel et à faire progresser les intérêts de la nation.

Le SLAC est exploité par l’Université de Stanford pour le département américain de l’Énergie. Bureau des sciences. L’Office of Science est le plus grand soutien de la recherche fondamentale en sciences physiques aux États-Unis et s’efforce de relever certains des défis les plus urgents de notre époque.

Clause de non-responsabilité: AAAS et EurekAlert ! ne sont pas responsables de l’exactitude des communiqués de presse publiés sur EurekAlert! par les institutions contributrices ou pour l’utilisation de toute information via le système EurekAlert.

#SLAC #étend #centralise #les #infras #informatiques

Leave a Comment

Your email address will not be published.