Ordinateurs

IBM construit un cluster de 120 pétaoctets sur 200 000 disques durs – High-teK.ca

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Brisant tous les records connus par un multiple de 10, IBM Research Almaden, en Californie, a développé des technologies matérielles et logicielles qui lui permettront de relier 200 000 disques durs pour créer un seul cluster de stockage de 120 pétaoctets, soit 120 millions de gigaoctets. Le collectif Drive, lorsqu’il sera terminé, devrait stocker mille milliards de fichiers – ou pour le dire en termes Apple, deux milliards d’heures de musique MP3.

Le référentiel de données, qui n’a actuellement pas de nom, est en cours de développement pour un client anonyme – mais avec une capacité de 120 Po, son utilisation la plus probable sera le périphérique de stockage d’un supercalculateur appartenant au gouvernement ou financé par le gouvernement fédéral ou d’autres calculs haute performance. (CHP) application; 120PB est le type de capacité dont vous avez besoin pour stocker des modèles météorologiques mondiaux ou des simulations de systèmes d’armes infiniment détaillées, qui sont rarement réalisées par des intérêts commerciaux. Alternativement, il pourrait être utilisé pour stocker une grande partie d’Internet (ou des données sur ses utilisateurs) pour Google ou Facebook, ou un autre client avec des poches très profondes. Les plus grands systèmes actuellement existants sont généralement d’environ 15 pétaoctets – bien que, à partir de 2010, Facebook avait un cluster Hadoop de 21 Poet maintenant il est probablement beaucoup plus grand.

Les détails exacts sur le logiciel et le matériel ne sont pas donnés par IBM, mais nous savons qu’il comporte une version nouvelle et mise à jour du système de fichiers parallèles général d’IBM (GPFS). GPFS est un système de fichiers couvrant plusieurs volumes qui stocke des fichiers individuels sur plusieurs disques. En d’autres termes, au lieu de lire un modèle haute résolution de plusieurs téraoctets à 100 Mo/s à partir d’un seul lecteur, le même fichier peut être lu de manière massivement parallèle. mode à partir de plusieurs disques. Le résultat final est des vitesses de lecture/écriture dans la région de plusieurs téraoctets par seconde — et, en corollaire, la possibilité de créer plus de 30 000 fichiers par seconde. GPFS prend également en charge la redondance et la tolérance aux pannes : lorsqu’un disque meurt, son contenu est automatiquement reconstruit sur un disque de remplacement par l’ordinateur responsable.

Psssssst :  Verizon dit toujours aux clients du cuivre de mettre à niveau ou de perdre le service - High-teK.ca

Du côté du disque dur, si nous divisons 120 Po par 200 000, vous obtenez 630 Go – et une fois que vous avez pris en compte la redondance, il est assez sûr de supposer que les disques ont tous une taille de 1 To. Nous savons également que chacun des 200 000 disques sera refroidi à l’eau avec probablement la plomberie la plus grande et la plus compliquée jamais tentée – mais compte tenu Le penchant d’IBM pour le watercooling de ses serveurs haut de gammece n’est guère surprenant (même si nous espérons toujours publier une photo du système une fois qu’il sera terminé).

Dans l’état actuel des choses, les supercalculateurs – et à grande échelle des expériences scientifiques comme le LHC — peut produire (et calculer) bien plus de données qu’il n’est possible d’en stocker. On espère que le système d’IBM sera un référentiel de données qui comblera en quelque sorte le fossé entre le silicium, la technologie régie par la loi de Moore, et le stockage électromécanique. Bien sûr, d’un autre côté, il est peut-être temps d’arrêter de jouer avec les disques durs et de commencer à construire des matrices de stockage de masse à partir de mémoire flash

Lire la suite sur Examen de la technologieou environ IBM Research Almaden ou GPFS

Bouton retour en haut de la page