Ordinateurs

Secrets de la PS4 : Radeon fortement modifiée, conception APU suralimentée – High-teK.ca

Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Depuis des mois, des rumeurs circulent selon lesquelles PS4 ne serait pas seulement plus puissant que la prochaine Xbox de Microsoft – il serait capable de certaines charges de travail de calcul que la console de nouvelle génération de Redmond ne pourrait pas toucher. Dans une interview la semaine dernière, l’architecte matériel principal de Sony, Mark Cerny, a mis en lumière à quoi ressemblent ces capacités. Nous avons pris ses commentaires et les avons combinés avec ce que nous avons appris d’autres sources pour construire un modèle de la façon dont la PS4 est probablement organisée et de ce qu’elle peut faire.

Premièrement, nous savons maintenant que la PS4 est une conception à système unique sur puce (SoC). Selon Cerny, les huit cœurs de processeur, le GPU et un certain nombre d’autres unités personnalisées sont tous sur le même dé. En règle générale, lorsque nous parlons de conception de SoC, nous distinguons entre « sur puce » et « sur emballage ».

Pack Wii U

Les composants sont sur l’emballage s’ils font partie d’un processeur fini mais ne sont pas fabriqués dans une seule unité. La Wii U, par exemple, a le CPU et le GPU sur le package, mais pas sur le die. Construire l’intégralité de la PS4 dans une matrice monolithique pourrait réduire les coûts à long terme et améliorer les performances, mais est plus risqué à court terme.

Un GPU remanié

Selon Cerny, le GPU alimentant la PS4 est une ATI Radeon avec « un grand nombre de modifications ». Du point de vue du GPU, le grand pool de RAM n’est pas considéré comme innovant. La PS4 dispose d’un pool unifié de 8 Go de RAM, mais l’architecture GPU Graphics Core Next d’AMD (ci-après abrégée GCN) est déjà livrée avec 6 Go de GDDR5 sur les cartes de station de travail. Le plus grand changement apporté au processeur graphique est la modification apportée par Sony au processeur de commande, décrite comme suit :

L’architecture AMD GCN d’origine autorisait une source de commandes graphiques et deux sources de commandes de calcul. Pour PS4, nous avons travaillé avec AMD pour augmenter la limite à 64 sources de commandes de calcul. L’idée est que si vous souhaitez effectuer un calcul asynchrone, vous placez des commandes dans l’une de ces 64 files d’attente, puis il y a plusieurs niveaux. d’arbitrage dans le matériel pour déterminer ce qui s’exécute, comment il s’exécute et quand il s’exécute, parallèlement aux graphiques qui se trouvent dans le système.

C’est une déclaration assez audacieuse. Regardons la partie pertinente de la structure du HD 7970 :

Front-end AMD GCN

Ici, vous pouvez voir les moteurs de calcul asynchrones et le processeur de commande GPU. AMD a toujours dit qu’il pourrait ajouter plus de blocs Asynchronous Compute Engine à cette structure pour faciliter un plus grand degré de parallélisation, mais je pense que Cerny a mélangé ses pommes et ses oranges ici, peut-être exprès. Tout d’abord, il fait référence à des blocs matériels spécifiques, puis passe à la discussion sur les profondeurs de file d’attente. AMD a publié une diapositive différente dans ses premiers dévoilements GCN qui pourrait apporter un éclairage supplémentaire sur ce sujet.

AMD-ACE

Chaque ACE peut récupérer des informations de file d’attente à partir du processeur de commande et peut basculer entre des tâches de calcul asynchrones en fonction de ce qui va suivre. GCN a été conçu avec une certaine prise en charge du traitement dans le désordre, et il semble que Sony ait étendu la capacité de la puce à surveiller et à planifier l’exécution des tâches. Il est tout à fait possible que Sony ait ajouté des ACE supplémentaires à GCN pour prendre en charge une plus grande capacité de calcul asynchrone, mais le simple fait de remplir l’avant de la puce avec 61 ACE supplémentaires ne rendrait pas magiquement plus de ressources d’exécution disponibles.

Psssssst :  La MinnowBoard x86 d'Intel est livrée et vise le Raspberry Pi - High-teK.ca

Maintenant, nous tournons notre attention vers l’architecture de la mémoire. Nous savons que la PS4 utilise un bus mémoire 256 bits et Cerny spécifie 176 Go de bande passante. Cela équivaut à une vitesse d’horloge GDDR5 de 1375 MHz, ce qui se situe confortablement dans la gamme actuelle des produits GDDR5 déjà sur le marché. Nous avons rassemblé un ensemble de ce que nous considérons comme les trois structures les plus probables, leurs forces et leurs faiblesses.

Option 1 : Une conception de style APU suralimenté

AMD a publié de nombreuses informations sur la conception des APU de Llano et Trinity. Llano et Trinity partagent une structure commune qui ressemble à ceci :

Schéma APU AMD

Dans Llano et Trinity, le chemin de communication CPU-GPU varie beaucoup en fonction de qui type de données est communiqué. La ligne continue (Onion) est un bus à bande passante inférieure (2x16B) qui permet au GPU d’espionner le cache du CPU. Les lignes pointillées sont le Radeon Memory Bus (Garlic). Il s’agit d’un lien direct entre le GPU et l’architecture Unified North Bridge, qui contient le contrôleur de mémoire.

Page suivante: Qu’en est-il d’un bus annulaire ?

Bouton retour en haut de la page