Intel a annoncé récemment que son supercalculateur Aurora a atteint une vaste performance de 1 012 exaflops. Cette réalisation remarquable en fait le supercalculateur le plus rapide en matière d’intelligence artificielle dédié à la recherche.
Présenté lors de l’ISC High Performance 2024 en collaboration avec Argonne National Laboratory et Hewlett Packard Enterprise (HPE), Aurora a dépassé la barrière de l’exaflopique avec 10,6 exaflops en IA, démontrant ainsi l’importance d’un écosystème ouvert pour le progrès dans le HPC et l’IA. Cette collaboration entre Intel, Le laboratoire national d’Argonne et HPE marque une étape importante dans le domaine du calcul à haute performance (HPC) et de l’IA. Cette réussite du supercalculateur Aurora marque un tournant dans l’IA et le HPC. Ogi Brkic, vice-président et directeur général de la division Data Centre AI Solutions d’Intel, souligne l’importance de cette étape en déclarant :
“Le franchissement de la barrière de l’exaflopique par le supercalculateur Aurora ouvre la voie aux découvertes de demain. Qu’il s’agisse de comprendre les modèles météorologiques ou de percer les mystères de l’univers, les superordinateurs servent de boussole pour résoudre des défis scientifiques complexes qui peuvent améliorer l’humanité.”
Spécifications techniques et réalisations
Aurora est un système massif composé de 166 racks, 10 624 lames de calcul et 21 248 processeurs Intel Xeon CPU Max series et 63 744 unités Intel Data Center GPU Max Series. Avec cette configuration impressionnante, il s’agit de l’un des plus grands clusters de GPU au monde. Le système comprend également la plus grande interconnexion ouverte de supercalculateurs basée sur Ethernet dans un seul système, avec 84 992 points d’extrémité HPE Slingshot fabric.
Bien qu’Aurora se classe deuxième dans le benchmark de haute performance LINPACK (HPL), il a dépassé la barrière de l’exaflopique en n’utilisant que 87 % de ses nœuds. De plus, il a obtenu la troisième place dans le benchmark High Performance Conjugate Gradient Gradient (HPCG) avec 5 612 téraflops par seconde (TF/s), démontrant ainsi ses capacités dans des scénarios HPC plus réalistes.
Optimisation de l’IA
La performance d’Aurora repose sur le GPU Intel Max Series Data Centre avec l’architecture Intel Xe GPU. Cette architecture comprend du matériel spécialisé optimisé pour les tâches d’IA et de HPC, permettant ainsi à Aurora d’exceller dans des benchmarks tels que le LINPACK à précision mixte (HPL-MxP), qui met en évidence les charges de travail d’IA dans le HPC. Les capacités de traitement parallèle de l’architecture Xe sont essentielles pour traiter les opérations matricielles et vectorielles complexes dans les calculs de réseaux neuronaux d’IA. Soutenue par les outils logiciels d’Intel, tels que le compilateur Intel oneAPI DPC/C et les bibliothèques de performance, l’architecture Xe favorise un écosystème ouvert pour un développement souple et évolutif.
Faire progresser l’informatique accélérée
Lors d’une session spéciale à l’ISC 2024, Andrew Richards, PDG de Codeplay, a souligné la demande croissante de calcul accéléré et l’importance des écosystèmes logiciels ouverts. Il a mentionné la oneAPI d’Intel, qui offre un modèle de programmation unifié sur différentes plates-formes matérielles, réduisant ainsi les verrouillages des fournisseurs et favorisant l’innovation.
La Fondation Linux a lancé une initiative, l’Unified Accelerator Foundation (UXL), pour faire tomber les barrières propriétaires et développer un écosystème ouvert pour tous les accélérateurs. Cette initiative, soutenue par des entreprises telles que Arm, Google, Intel et Qualcomm, est essentielle pour faire progresser l’informatique hétérogène sur la base de normes ouvertes.
Développements futurs
Le Tiber Development Cloud d’Intel augmente sa capacité de calcul avec de nouvelles plates-formes matérielles et de nouvelles capacités de service, notamment des aperçus de systèmes Intel Xeon 6 E-core et P-core et des clusters à grande échelle basés sur Intel Gaudi 2 et Intel Data Centre GPU Max Series. Les nouvelles capacités incluent également le service Kubernetes d’Intel pour les charges de travail d’entraînement et d’inférence d’IA natives du cloud.
L’avenir en perspective
La prochaine génération de GPU d’Intel pour l’IA et le HPC, appelée Falcon Shores, combinera le meilleur de l’architecture Intel Xe de nouvelle génération et d’Intel Gaudi. Cette intégration promet une interface de programmation unifiée, jetant ainsi les bases solides pour les progrès à venir. Les premiers résultats de performance sur Intel Xeon 6 avec P-cores et mémoire MCR offrent des améliorations significatives pour les applications HPC du monde réel, telles que le Noyau de Modélisation Européen pour l’Océan (NEMO), par rapport aux générations précédentes.
Les réalisations révolutionnaires du supercalculateur Aurora lors de l’ISC 2024 mettent en lumière l’avenir de l’IA et du HPC. En franchissant la barrière de l’exaflopique et en démontrant des performances exceptionnelles sur les charges de travail d’IA, Aurora fixe une nouvelle norme pour la découverte scientifique et l’innovation technologique.
Alors qu’Intel continue de faire progresser ses technologies, les implications pour divers domaines, de la science climatique à la physique des particules, sont profondes et promettent d’entraîner des progrès et des innovations significatifs dans les années à venir.
Source : Intel