Ordinateurs

AMD détruit Nvidia lors de l’extraction de Bitcoin, l’écart pourra-t-il jamais être comblé ? – ExtrêmeTech

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Si vous suivez généralement les performances du GPU en ce qui concerne les jeux, mais que vous êtes devenu curieux à propos de l’extraction de Bitcoin, vous avez probablement remarqué et été surpris par le fait que les GPU AMD sont les leaders incontestés des performances sur le marché. Cela contraste fortement avec le secteur des graphiques PC, où la série HD 7000 d’AMD joue un jeu défensif contre la famille de produits GK104 / GeForce 600 de Nvidia. Dans le minage de Bitcoin, la situation est presque complètement inversée — la Radeon 7970 est capable de 550MHash/seconde, tandis que la GTX 680 est environ 1/5 aussi rapide.

Il y a un article sur le Bitcoin Wiki qui tente d’expliquer la différence, mais la pièce originale a été écrite en 2010-2011 et n’a pas été mise à jour depuis. Ça fait référence à Fermi et les architectures VLIW d’AMD et impliquent que les meilleures performances d’AMD sont dues à la présence de beaucoup plus de cœurs de shader que les cartes Nvidia équivalentes. Ce n’est pas tout à fait exact, et cela n’explique pas pourquoi la GTX 680 est en fait plus lent que la GTX 580 à l’exploitation minière BTC, malgré le fait d’avoir beaucoup plus de noyaux. Cet article va expliquer la différence, déterminer si de meilleurs mineurs CUDA modifieraient considérablement le delta de performances entre AMD et Nvidia, et indiquer si les performances GPGPU de Nvidia sont généralement comparables à celles d’AMD de nos jours.

Psssssst :  HBM2 vs GDDR6 : nouvelles comparaisons vidéo, contraste des types de mémoire - High-teK.ca

Les sujets ne pas discuté ici comprennent:

  • Bulles
  • Opportunité d’investissement
  • Qu’il s’agisse ou non d’ASIC, à leur arrivée le mois prochain, cet étéà l’avenir détruira le marché du minage GPU.

Ce sont des questions importantes, mais elles ne font pas l’objet de cet article. Nous sera discuter de l’efficacité énergétique et de Mhash/watt dans une certaine mesure, car ces facteurs ont un impact sur la comparaison des performances de minage d’AMD par rapport à Nvidia.

La mécanique de l’exploitation minière

Le minage de Bitcoin est une implémentation spécifique de l’algorithme SHA2-256. L’une des raisons pour lesquelles les cartes AMD excellent dans l’exploitation minière est que les GPU de l’entreprise ont un certain nombre de fonctionnalités qui améliorent leurs performances entières. C’est en fait quelque chose d’étrange; Les charges de travail GPU ont toujours été lourdes en virgule flottante car les textures sont stockées avec une précision de moitié (FP16) ou complète (FP32).

Le problème est rendu plus déroutant par le fait que lorsque Nvidia a commencé à pousser CUDA, il a mis l’accent sur le craquage de mot de passe comme une force majeure de ses cartes. Il est vrai que les GPU GeForce, à commencer par G80, offraient des performances cryptographiques nettement supérieures à celles des processeurs – mais le matériel d’AMD fait maintenant exploser celui de Nvidia. hors de l’eau.

La première raison pour laquelle les cartes AMD surpassent leurs homologues Nvidia dans l’exploitation minière BTC (et l’entrée actuelle de Bitcoin le fait couvrir ça) est dû au fait que l’algorithme SHA-256 utilise une opération de rotation à droite d’entier 32 bits. Cela signifie que la valeur entière est décalée (explication ici), mais les bits manquants sont ensuite rattachés à la valeur. Dans une rotation à droite, les bits qui tombent à droite sont rattachés à gauche. Les GPU AMD peuvent effectuer cette opération en une seule étape. Avant le lancement du GTX Titan, les GPU Nvidia nécessitaient trois étapes – deux quarts de travail et un ajout.

Nous disons « avant Titan », car l’une des fonctionnalités introduites par Nvidia avec Compute Capability 3.5 (uniquement pris en charge sur le GTX Titan et le Tesla K20/K20X) est un levier de vitesses en entonnoir. Le levier de vitesses en entonnoir peut combiner les opérations, réduisant considérablement la pénalité de 3 cycles de Nvidia. Nous verrons dans quelle mesure les performances s’améliorent momentanément, car ce n’est pas la seule amélioration du GK110 par rapport au GK104. Le GK110 est également capable d’effectuer jusqu’à 64 décalages d’entiers 32 bits par SMX (Titan a 14 SMX). GK104, en revanche, ne pouvait gérer que 32 décalages entiers par SMX et ne disposait que de huit blocs SMX.

Psssssst :  La NASA dévoile son vaisseau futuriste Warp Drive - appelé Enterprise, bien sûr

Capacité d'instruction Kepler

Nous avons mis en évidence la différence de capacité de décalage d’entier 32 bits entre CC 3.0 et CC 3.5.

AMD joue les choses près de la poitrine en ce qui concerne les capacités d’entiers 32 bits de Graphics Core Next (GCN), mais la société a confirmé que GCN exécute le code INT32 au même rythme que la virgule flottante double précision. Cela implique un taux de répartition maximal théorique int32 de 64 par horloge par CU – le double du taux de base de GK104. L’autre avantage d’AMD, cependant, est le grand nombre d’unités de calcul (CU) qui composent un GPU. Le Titan, comme nous l’avons dit, a 14 SMX, par rapport aux 32 CU du HD 7970. Les unités de calcul / SMX peuvent être bien plus importantes que le nombre total de cœurs dans ces contextes.

Page suivante: La colère du titan…

Bouton retour en haut de la page