1 Reply Latest reply: Apr 4, 2012 2:46 AM by GregC RSS

Les différents coeurs ARM

GregC Level 7

Merci de laisser un petit vote sur mon sondage disponible à l'adresse ci-dessous

Please let a quick vote on my survey available at the address below


"Which ARM Microcontroller or Microprocessor Core are you using or interested in ?"


 

Extrait du dossier de Pierre Dandumont sur le site web Tom's Hardware publié le 16 Mars 2012

 

ARM. On entend de plus en plus parler des processeurs de cette société anglaise, sauvée par Apple dans les années '90 et devenue en quelques années leader dans le monde des processeurs mobiles. Comme chaque année, le MWC a permis à plusieurs sociétés de montrer leur savoir-faire dans le domaine des processeurs, et ARM est souvent le fournisseur choisi pour ce dernier et - parfois - la carte graphique.

Dans ce dossier, nous allons passer en revue ce qui existe, ce qui a été présenté et ce qui va arriver dans le petit monde des puces ARM.

Les différents cores ARM

 

ARM est une société qui vend des licences, et pas directement des processeurs. Elle propose soit d'utiliser son jeu d'instructions, soit d'utiliser les architectures qu'elle développe. Si la société propose énormément de modèles différents, adaptés à des usages variés, il n'y a que quelques puces qui sont réellement utilisées dans les smartphones et autres tablettes.

ARM11 et Cortex A5

Animé par un ARM11

Animé par un ARM11

En entrée de gamme, on trouve encore parfois des puces de type ARM11 ou de typeCortex A5. La première est ancienne et peu puissante — 1,25 DMIPS par MHz — et se retrouve par exemple dans le premier iPhone (à 400 MHz), dans la première version de Tegra ou dans des smartphones d'entrée de gamme. Le principal défaut de la puce est le jeu d'instructions ARMv6, qui n'est plus d'actualité. Le Cortex A5 est le remplaçant de l'ARM11 en entrée de gamme, qui est un peu plus puissant (1,58 DMIPS/MHz) mais surtout compatible ARMv7, le jeu d'instructions actuel. On trouve le Cortex A5 dans les solutions d'entrée de gamme de Qualcomm. Si les deux puces peuvent fonctionner en couple (MPcore), elles sont généralement utilisées seules.

Cortex A8

Le Cortex A8 est l'ancien haut de gamme d'ARM. Il est utilisé dans l'Apple A4, les OMAP3 de Texas Instruments ou les i.MX5 de Freescale. Efficace (2,07 DMIPS/MHz), la puce peut atteindre 1,2 GHz dans ses implémentations récentes. Le A8 souffre de deux défauts : une FPU peu performante et l'absence de version MPCore. En clair, les solutions à base de Cortex A8 ne contiennent qu'un seul core.

Cortex A9

1,5 GHz chez Archos

1,5 GHz chez Archos

Le Cortex A9 est le haut de gamme actuel : disponible en versionMPCore, la majorité des implémentations se limitent à deux cores, même si les versions à quatre cores arrivent (Tegra 3 est la première disponible) et que des versions huit cores sont utilisés dans le monde industriel. Les puces actuelles peuvent atteindre 1,5 GHz environ (2 GHz à terme) et le core est environ 25 % plus rapide que le Cortex A8 (2,5 DMIPS/MHz). Petit défaut, le support des instructions NEON (SIMD) n'est pas obligatoire et NVIDIA ne l'a pas intégré dans Tegra 2, ce qui pose parfois des problèmes.

Cortex A7

Le Cortex A7 est la prochaine architecture ARM : compatible ARMv7, ce CPU est plus simple que les autres, mais aussi plus moderne. Selon ARM, il consomme beaucoup moins que le Cortex A8 et est plus petit, mais a des performances très proches (1,9 DMIPS/MHz). Destiné à l'entrée de gamme, il devrait aussi être utilisé en couple avec le Cortex A15 dans l'architecture big.LITTLE. Aucun constructeur n'a annoncé de puces basées sur le Cortex A7 actuellement.

Cortex A15

Le Cortex A15 est le futur haut de gamme d'ARM. Toujours 32 bits, ce CPU ARMv7 est plus rapide que le Cortex A9. Les deux premières implémentations annoncées sont celles de Texas Instruments (OMAP5) et de Samsung (Exynos 5xxx), prévues pour débarquer en 2013. Si le 28 nm doit permettre d'atteindre des fréquences élevées (2 GHz), les premières puces sont très loin d'atteindre cette limite : l'OMAP5 en démonstration au MWC fonctionnait à 800 MHz.


ARM11
Cortex A5
Cortex A7
Cortex A8
Cortex A9
Cortex A15
Scorpion
Krait
DMIPS/MHz
1,251,581,92,072,53,52,13,1
Fréquence classique
500 - 1 000 MHz800 MHz-1 GHz1 - 1,5 GHz-1 - 1,5 GHz1,5 GHz

 

Les autres cores

 

Si la majorité des constructeurs utilisent les design d'ARM, d'autres alternatives existent. Intel utilisait son propre design à une époque (Xscale) et d'autres sociétés ont suivi la même voie.

ARM

Nous avons volontairement omis les ARM7, ARM9 et autres Cortex Mx dans la première page : s'ils sont encore très utilisés dans beaucoup de domaines, ce n'est que rarement le cas dans le monde de la mobilité. Ils sont simplement parfois utilisés dans certains SoC (OMAP, Tegra, etc.) comme coprocesseur. Les ARM7 et ARM9 se retrouvent souvent dans les appareils réseaux (NAS, etc.) alors que les Cortex Mx remplacent de plus en plus les micro-contrôleurs.

Scorpion

Sanpdragon

Snapdragon

 

Scorpion est le nom de la puce de Qualcomm, qui est compatibleARMv7. Elle se place entre le Cortex A8 et le Cortex A9 d'ARM au niveau des performances, avec généralement un petit avantage en fréquence. Qualcomm propose des versions avec un ou deux cores dans ses SoC Snapdragon, sous les noms Snapdragon S1, S2 et S3. L'implémentation de Qualcomm a un petit avantage : la possibilité de gérer la fréquence des cores indépendamment.

Krait

Krait est la puce utilisée dans le Snapdragon S4. C'est une évolution de Scorpion, nettement plus rapide. Actuellement, Krait est proposé dans des SoC avec deux cores et une fréquence de 1,5 GHz. Le CPU se place en concurrence directe avec le Cortex A15 et est plus performant que le Cortex A9.Les versions à quatre cores, montrées au MWC, sont attendues en fin d'année.

Denver

NVIDIA devrait proposer — à terme — son propre CPU ARM, Denver. Pour le moment, la société utilise un design ARM (Cortex A9) mais devrait évoluer à terme vers sa solution maison. Denver vise a priori le marché mobile mais aussi celui des ordinateurs portables et celui des serveurs, en conjonction avec les GPU de la société.

Et les autres ?

D'autres sociétés proposent des puces « compatibles ARM », notamment dans le monde professionnel, avec descores ARMv8 destinés aux serveurs, mais c'est un marché très particulier, avec des contraintes différentes du monde mobile.

Les GPU

 

Dans les GPU, on trouve aussi plusieurs fabricants. Certains utilisent une puce maison (Qualcomm, NVIDIA), d'autres une technologie sous licence (Apple, Texas Instruments, Samsung, etc.).

Mali : ARM

Le Galaxy S 2 et son Mali-400MP4

Le Galaxy S 2 et son Mali-400MP4


ARM propose sa propre puce graphique, sous le nom Mali. Disponible en plusieurs versions (200, 300 et 400), la puce est notamment utilisée par Samsung et ST-Ericsson. La version 400 peut utiliser plusieurs « cores », ou plutôt unités de calcul, Samsung en utilisant par exemple 4 dans l'Exynos du Galaxy S 2. La version MP4 offre une puissance de calcul de 7,2 gigaflops à 200 MHz. La fréquence dépend fortement du constructeur du SoC.

Adreno : Qualcomm

Qualcomm utilise sa propre puce graphique, développée sur les cendres des Imageon d'ATi. L'Adreno 220 (haut de gamme sur S3) et 225 (entrée de gamme sur S4) sont compatibles DirectX et très efficace. La future version 320 duSnapdragon S4 Pro est annoncée comme quatre fois plus rapide. L'Adreno 225 atteint 12,8 gigaflops à 200 MHz, la fréquence étant dépendante de l'implémentation.

GeForce : NVIDIA

NVIDIA utilise sa propre puce — ce qui est assez logique — dans les Tegra. Le nombre d'unités est plus élevé dans Tegra 3 que dans Tegra 2 et NVIDIA a un gros avantage sur ses concurrents : les relations avec les développeurs. Comme dans le jeu vidéo sur PC, la société travaille avec les développeurs pour les aider à optimiser pour les puces GeForce. De plus, l'image de marque de la société est plutôt bonne dans le grand public. La version Tegra 2 propose 4 unités de pixel shader et 4 unités de vertex shader alors que Tegra 3 porte le nombre d'unités de pixel shader à 8. La puissance à 200 MHz de Tegra 2 est de 3,2 gigaflops, 4,8 gigaflops pour Tegra 3. Sur Tegra 3, la fréquence du GPU varie entre 333 MHz et 500 MHz, en fonction des implémentations.

PowerVR : Imagination

Le plus gros vendeur reste Imagination, avec ses PowerVR. Les puces sont utilisées par Samsung, Apple ou Texas Instruments. Les PowerVR SGX 530/535/540 sont des anciennes puces, alors que les PowerVR SGX543 et 544 sont plus modernes. Point intéressant, il est possible d'installer plusieurs « cores » : Apple en utilise deux (MP2) dans l'Apple A5 et quatre dans l'Appple A5X, Texas Instruments deux dans l'OMAP5 et Sony en a mis quatre dans sa console portable, la PS Vita. Le PowerVR SGX540 dispose de 4 unités USSE et offre une puissance de 3,2 gigaflops. Sur les versions PowerVR SGX543 et 544, on a des unités USSE2 qui offrent une puissance de 6,4 gigaflops, le tout à 200 MHz. L'augmentation de la puissance est linéaire avec l'augmentation des cores (MP2, MP4) et la fréquence varie en fonction des puces. Apple travaille généralement vers 250 MHz, Texas Instruments vers 300/380 MHz (en fonction des puces) et Intel atteint des fréquences élevées (533 MHz).

Vivante

Enfin, certains utilisent aussi les services d'une société américaine, Vivante. Les informations sur les puces sont rares, mais Vivante équipe l'i.MX6 de Freescale et — officieusement — la nouvelle puce de Huawei. Vivante communique très peu sur la puissance et les fréquences de ses puces.


ARM Mali 400MP4
Qualcomm Adreno 225
Imagination PowerVR SGX540
Imagination PowerVR SGX543MPx
NVIDIA Tegra 2
NVIDIA Tegra 3
Puissance à 200 MHz
7,2 gigaflops12,8 gigaflops3,2 gigaflops6,4 / 12,8 / 25,6 gigaflops3,2 gigaflops4,8 gigaflops
Fréquence habituelle
-400 MHz300 - 380 MHz200 - 533 MHz200 - 250 MHz333 - 500 MHz

 

Le futur des puces

 

Maintenant que vous avez une bonne idée de l'existant, parlons du futur.

Le Cortex A15 devrait débarquer officiellement fin 2012 et s'imposer en 2013. L'OMAP5 et le prochain Exynosl'utiliseront et Apple, Freescale et NVIDIA devraient a priori passer aussi à la nouvelle puce d'ARM. Le Cortex A15 permet deux choses : améliorer les performances brutes, mais aussi limiter la consommation. À tâches identiques, le Cortex A15 doit fonctionner moins rapidement que le Cortex A9, ce qui permet de diminuer la consommation.

Les architectures hétérogènes (4-PLUS-1 chez NVIDIA, big.LITTLE chez ARM) devraient aussi se démocratiser, ce qui va permettre d'augmenter encore un peu l'autonomie. En entrée de gamme, le Cortex A7 devrait remplacer le Cortex A5 et l'ARM11 en entrée de gamme. Ce qui va permettre aux modèles à 150 € en 2013 d'offrir les performances du haut de gamme de 2010.

Le jeu d'instructions ARMv8, qui apporte notamment le 64 bits, ne devrait pas arriver rapidement dans nos appareils mobiles. ARM modifie environ tous les deux à trois ans son architecture haut de gamme et le successeur du Cortex A15 ne devrait pas débarquer dans les smartphones avant la fin de l'année 2014. Ne vous attendez donc pas à des smartphones avec 4 Go de RAM (ou plus) avant quelques années.

Mali T658

Mali T658

Dans les GPU, la Serie 6 de PowerVR est sur les rails (Rogue), et les Mali T604 et T658 ont été annoncés. Les deux puces sont optimisées pour le calcul en OpenCL, proposent la possibilité d'intégrer plusieurs cores et sont bien évidemment plus rapides que le Mali-400. Chez Qualcomm, l'Adreno 320 a été annoncé et est donné comme quatre fois plus rapide que le 225 actuel. Enfin, une solution simple existe pour augmenter facilement les performances : multiplier le nombre d'unités. Apple, sans changer de génération, a par exemple doublé la puissance de son A5 au niveau du GPU simplement en installant un PowerVR SGX543MP4 au lieu du MP2, et la technologie de PowerVR permet d'atteindre 16 unités ("GPU") en théorie.

Notons qu'un des grands de la 3D, NVIDIA, n'a pas encore annoncé sa prochaine architecture, mais on peut s'attendre à une puce programmable du niveau des GeForce 8, ce qui est de bon augure. Actuellement, l'architecture des GPU mobile de NVIDIA est proche de celles des GeForce 6 qui équipaient nos PC il y a quelques années.

Les fonctionalités, le nerf de la guerre ?

 

Actuellement, les constructeurs se partagent généralement des CPU et des GPU proches (quand ils ne sont pas identiques). La différentiation se fait donc sur un autre point : les fonctions annexes.


Qualcomm joue sur un facteur : l'intégration du modem. La société, spécialiste de la 3G et de la 4G, intègre en effet le modem, le GPS et le Wi-Fi (dans le S4) dans ses puces. Texas Instruments, un autre exemple, joue sur la présence de l'USB 3.0 dans l'OMAP5, ainsi que d'un décodeur vidéo très performant. Chez NVIDIA, c'est l'optimisation des jeux dans la « Tegra Zone », avec de l'aide aux développeurs.

Tegra 3

Tegra 3

Plus on avance, plus les SoC (System on a Chip) sont complets et intègrent des fonctions. Et — paradoxalement — plus ils se spécialisent. En effet, si les SoC des premiers smartphones étaient polyvalents et utilisés aussi bien dans l'embarqué que dans les PDA (comme l'OMAP3 et ses prédécesseurs), plus on avance, plus les fonctions sont spécialisées. Les interfaces peu utilisées dans les appareils mobiles disparaissent, mais d'autres sont intégrées (modem, Wi-Fi, etc.). La partie vidéo est de plus en plus importante et des « accélérateurs » dédiés sont ajoutés pour OpenVG (affichage vectoriel) ou pour le traitement de la 2D (chez Texas Instruments). De plus, les GPU sont de plus en plus puissants et la compatibilitéOpenCL arrive.

L'avenir n'est très clairement pas la puissance du processeur, mais dans les fonctions annexes et dans la 3D. On le voit d'ailleurs très bien : seul NVIDIA se lance dans la bataille du quad core. Apple, Texas Instruments ou Qualcomm se limitent actuellement à des puces dual core en expliquant que ces dernières sont assez puissantes pour tous les usages, ce qui est d'ailleurs globalement le cas.

Dans le monde de la vidéo, le décodage du H.264 en High Profile (complexe) et avec des débits élevés (Level 4.1 et 5.0) devient la norme, alors que pendant un temps les puces se sont limitées au Main Profile et au Level 3.x. Le décodage d'autres codecs (Xvid par exemple) est aussi de plus en plus courant et on devrait trouver des SoC décodant le H.265 durant l'année 2013.

Lire la suite du dossier de Pierre Dandumont sur le site web Tom's Hardware

AirPlay, WI-Fi Display, etc.
AMD, NVIDIA, le futur
La menace Intel