Ordinateurs

Skynet Smiles : AMD dévoile l’accélérateur d’IA hybride Monster Instinct MI300

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Lors du discours d’ouverture d’AMD au CES cette semaine, la présidente-directrice générale, le Dr Lisa Su, a apparemment gardé le meilleur pour la fin. À la toute fin, elle a brandi un monstre absolu d’APU, le décrivant comme la première puce de centre de données qui combine un processeur, un processeur graphique et une mémoire sur un seul boîtier. Il s’appelle AMD Instinct MI300 et contient 146 milliards de transistors, soit 46 milliards de plus que ce que l’on trouve dans la puce de centre de données sophistiquée d’Intel, Ponte Vechio. AMD dit que le MI300 arrivera dans la seconde moitié de 2023, donc pour l’instant, il voulait juste le montrer un peu.

La puce est absolument massive; lorsque elle le tenait en l’air, c’était la taille de sa paume. Le MI300 arbore 24 cœurs Zen 4 avec son architecture GPU CDNA 3 et 128 Go de mémoire à bande passante élevée (HBM3). AMD n’a pas mentionné combien de CU étaient utilisées côté GPU. Les chiplets CPU et GPU sont empilés en 3D sur une matrice de base qui les relie aux huit piles de HBM. La conception utilise neuf chiplets de 5 nm empilés en 3D sur quatre chiplets de 6 nm. On ne sait pas comment les puces CPU et GPU sont réparties entre les chiplets et AMD ne l’a pas encore révélé. Les quatre matrices de base de 6 nm sont des interposeurs actifs qui gèrent les communications et les E/S entre les puces et les piles de mémoire.

AMD affirme que cette approche intégrée permet une amélioration significative des performances ainsi que de l’efficacité. À titre d’exemple, le Dr Su dit qu’il détruit le produit de génération précédente de l’entreprise, l’Instinct MI250X. Dans l’ensemble, il offre 8 fois les performances de l’IA ainsi qu’une augmentation de 5 fois les performances par watt. De plus, elle a déclaré que le MI300 peut réduire le temps de formation des modèles d’IA de quelques mois à quelques semaines seulement. Cela pourrait théoriquement permettre aux entreprises d’économiser des millions de dollars en coûts d’électricité. L’intégration du CPU et du GPU leur permet également de travailler simultanément sur les mêmes données. De plus, comme le HBM3 est intégré, il peut fonctionner sans modules DRAM séparés.

Bien que les puces Epyc « Genoa » de 4e génération de la société soient largement disponibles et à grand volume, ce ne sera probablement pas le cas avec le MI300. AMD n’a pas divulgué de prix car il ne le publiera pas de sitôt, mais ce ne sera pas bon marché. Il est actuellement prévu d’alimenter le supercalculateur El Capitan à 2 exaflops du Lawrence National Laboratory. Cet ordinateur sera alimenté par le fin 2023 et offrira le double des performances du supercalculateur le plus rapide au monde, Frontier, qui est également alimenté par AMD. Frontier a été le premier supercalculateur à franchir la barrière de l’exaflop. Maintenant, il semble qu’El Capitan pourrait être le premier à 2 exaflops.

Maintenant lis:

Bouton retour en haut de la page