Ordinateurs

AMD fait exploser Trinity : Voici la seconde venue de Bulldozer – High-teK.ca

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Cela a été 12 mois mouvementés pour AMD. Depuis que la société a lancé Llano, sa première partie « Fusion » grand public, elle a remplacé son PDG, recruté plusieurs nouveaux cadres, lancé une architecture décevante, différé ses pièces Brazos de nouvelle génération d’une année complèteet esquissé une vision globale de l’avenir qui atténue les transitions de nœuds de processus de pointe au profit de blocs IP réutilisables pouvant être partagés entre plusieurs SoC (système sur puce).

Lors de son lancement l’année dernière, Bulldozer fonctionnait à chaud, évoluait mal et était moins efficace que son prédécesseur. En ce qui concerne la construction du successeur de Llano, AMD avait clairement du pain sur la planche. Nous n’insisterons pas davantage sur ce point; si vous voulez plus d’informations, consultez notre couverture précédente.

Présentation de Piledriver

Nous supposons que Trinity (le nom de code) est un clin d’œil au fait que Trinity (l’APU) contient un nouveau CPU, un nouveau GPU et une nouvelle structure d’interconnexion. Il y a aussi une référence pratique au premier essai de bombe atomique en juillet 1945 (c’est là qu’Oppenheimer a dit « Je suis devenu la mort, destructeur de mondes » et, bien sûr, à la Sainte Trinité. Ce sont deux grosses chaussures à remplir , alors abordons ce qu’ils ont trouvé, en commençant par le cœur du CPU. Nous n’aborderons ici que le CPU et le GPU, mais une discussion sur l’interconnexion est dans un avenir très proche.

Détails du piledriver

AMD prétend avoir fait beaucoup d’optimisation de bas niveau pour nettoyer le gâchis de Bulldozer. La prédiction de branche de Piledriver est meilleure, sa planification d’entiers et de FPU utilise mieux les ressources partagées, et des TLB L1 (Translation Lookaside Buffers) plus grands réduisent le risque que le CPU « manque » lors de la recherche d’adresses virtuelles traduites.

Psssssst :  Il est temps d'appeler les fabricants d'ordinateurs portables pour leurs conneries de limitation du processeur - High-teK.ca

Piledriver ajoute également la prise en charge de deux instructions supplémentaires, FMA3 (Fused Multiply-Add) et F16C. FMA3 est une forme différente de l’instruction FMA4 prise en charge par Bulldozer. AMD a battu Intel au poinçon sur celui-ci ; Le support FMA3 d’Intel fera ses débuts en 2013, avec Haswell. Les deux instructions peuvent améliorer l’efficacité de l’exécution du code en fusionnant les opérations et en les exécutant en un seul cycle d’horloge, mais ni FMA3 ni FMA4 ne devraient fournir d’augmentations de vitesse significatives. F16C est une méthode de conversion et de stockage de valeurs à virgule flottante 32 bits à l’aide de 16 bits. AMD pourrait l’utiliser pour le GPU (les GPU ont une capacité native de shader à virgule flottante 16 bits), mais c’est aussi une inconnue.

Presque tous les changements répertoriés sont petits en eux-mêmes, mais combinés, ils pourraient faire une différence significative dans l’efficacité globale de la puce. Je suis particulièrement curieux des «améliorations de l’efficacité L2» non spécifiées, ayant longtemps soupçonné que les latences élevées du cache ont fondamentalement saboté Bulldozer l’automne dernier.

Une caractéristique majeure de Piledriver n’a pas change est le nombre d’instructions décodées par cycle d’horloge (4 par module, pour un total de huit dans une conception à double module / quadricœur. C’est nettement moins que Llano (12 par quadricœur) ou Sandy Bridge (16). Avec Bulldozer, il n’a jamais été clair à quel point cela jouait un rôle dans les performances inférieures aux attentes de la puce.

Performances du processeur

Sans notre propre système de test, nous sommes obligés de nous fier aux propres chiffres publiés par AMD et aux critiques d’autres sites. Appeler les données de performances du processeur d’AMD «cherchées» est un euphémisme drastique, pratiquement tous les scores de performance fournis par la société sont centrés sur le GPU ou exploitent fortement le GPU. Les seules données de performances non GPU publiées par AMD étaient dans PCMark Vantage et PCMark 7. Ce ne sont pas de mauvais choix pour la productivité totale du système – bien qu’ils ne reposent pas entièrement sur le processeur, ils sont probablement beaucoup plus pertinents à la fin- AMD courtise les utilisateurs avec ces nouveaux designs.

Psssssst :  AMD repense la stratégie des pilotes pour les graphiques et arrête les mises à jour mensuelles - High-teK.ca

Malheureusement, même ici, les données sont extrêmement limitées. L’affirmation vantée d’AMD selon laquelle Trinity offre 2 fois les performances/watt de Llano est basée uniquement sur le score global de PCMark Vantage. AMD affirme qu’un Trinity 17 W double cœur à 2,6 GHz lie essentiellement un Llano quadricœur à 2,3 GHz, mais déclare ailleurs qu’un A10-4600M (Trinity, quadricœur, 3,2 GHz) n’est que 28,5 % plus rapide qu’un A8. -3500M (Llano, quadricœur, 2,4 GHz). Soit dit en passant, l’affirmation de la société selon laquelle les performances x86 sont supérieures de 28,5 % est basée uniquement sur ce dernier chiffre.

Avec des données douteuses et plutôt contradictoires, notre meilleure estimation est que Trinity améliore le positionnement global et les offres de Llano équivalent performances, horloge pour horloge. Cela se traduira par de meilleures performances du processeur dans certaines références. Plus important, du point de vue d’AMD, était la nécessité de réduire la consommation d’énergie de Bulldozer à quelque chose qui s’intégrerait dans les facteurs de forme grand public et «ultra-légers». Trinity accomplit cela. Il ne rivalisera pas avec Ivy Bridge – correspondre à Llano signifie qu’il ne rivalisera même pas particulièrement bien avec Sablonneux Bridge dans les charges de travail centrées sur le processeur – mais AMD fixe le prix de ces pièces sur des marchés bien en deçà de l’objectif d’Intel pour IVB et les ultrabooks.

Page suivante: Passons au GPU…

Bouton retour en haut de la page