FRnOG 39 - Philippe Notton : Comment concevoir et déployer un CPU haute performance Européen ?
Category
🤖
TechnologieTranscription
00:00 Bonjour à tous, deux points préliminaires avant de démarrer.
00:03 Mon CTO étant très très taïwanais, j'ai l'honneur de le remplacer.
00:08 Je suis Philippe Noton, CEO et fondateur de Cyperl. Deuxième point préliminaire,
00:12 j'ai cru comprendre que parler des AI c'est un sujet qui fâche. Alors je vais
00:16 essayer de limiter un peu. On fait juste le hardware, on fait pas les
00:21 couches qui sont au-dessus. Pour vous présenter brièvement
00:25 Cyperl pour ceux qui connaissent pas. On est une émergence
00:30 d'un programme européen. La société a cinq ans d'âge. On a été virtuellement
00:34 créé à Bruxelles dans le cadre d'un gros programme européen. On travaille sur
00:38 la base de technologie ARM. On a d'ailleurs ARM comme très gros
00:40 investisseurs à bord ainsi que pas mal d'investisseurs publics également. On a
00:45 réalisé l'année dernière et après je m'arrêterai sur les Terms Business,
00:49 une des plus grosses séries à française vu qu'on a levé en deux tours plus de
00:53 113 millions d'euros. Sachant que vous allez voir le coût de
00:56 développement de ce type de plateforme est assez énorme.
00:58 On est en partenariat avec la plupart des GPU qui existent aujourd'hui sur le
01:03 marché et d'autres qui arrivent. On va y reparler. Et notre business model c'est
01:06 donc fabriquer des puces électroniques qui sont vendues à des fabricants de
01:09 serveurs ou des fabricants de supercalculateurs qui eux-mêmes vendent à
01:12 des data centers comme vous êtes ici. On a pas loin de 200 employés, 600
01:17 DRD, donc quatre en France et d'autres qui vont être annoncés
01:20 assez semblement sous peu. La thématique que je voudrais vous exposer c'est comment
01:25 globalement on développe ce type de ce type de composants parce que vous êtes
01:28 tous utilisateurs ou probablement de composants Intel, AMD, Nvidia. On espère
01:33 bientôt de ce qu'on met sur le marché. Sachant que dans le
01:37 cadre des recrutements qu'on a dans le monde IT parce qu'on a nos propres
01:40 data centers, on a un message un peu différent. C'est que venez nous
01:46 aider aujourd'hui à développer notre propre ferme de calcul pour faire ce type
01:49 de composants mais à terme vous pourrez administrer des serveurs, des machines
01:52 qui sont sur la base de notre propre CPU. Ce qui est plutôt innovant
01:56 dans le domaine européen. Pour développer ce type de
02:00 composants il y a énormément d'étapes. Comme dit dans notre cas on travaille sur
02:03 base ARM, c'est à dire qu'ils nous fournissent le coeur de calcul ce qui
02:05 nous évite de tout développer surtout créer un écosystème logiciel qui est
02:09 juste globalement impossible aujourd'hui dans le monde des CPU parce
02:13 qu'au delà de x86 d'ARM, il y a effectivement risque 5 qui décolle un peu mais
02:16 la grosse percée dans le monde des data centers en ce moment c'est ARM.
02:20 On est sur un cycle qui est très très lent surtout dans l'autre cas c'est
02:24 découvert sur beaucoup de choses et quasiment plus de quatre ans pour
02:27 mettre au point le premier avec pas mal d'étapes qui
02:30 vont dans ce qu'on appelle la micro architecture c'est à dire comment
02:33 l'architecture du chip en termes de cache, en termes de mémoire,
02:38 en termes de mémoire interne, mémoire externe etc. avec énormément
02:41 d'intégrations, de tests pour sélectionner que ça marche pour arriver sur ce qu'on
02:45 appelle le design physique c'est à dire quand vous allez intégrer l'ensemble
02:48 dans notre cas on parle hors mémoire de plus de 60 milliards de transistors qui
02:52 doivent tous travailler ensemble et d'un chip qui va avoir une consommation de
02:55 l'ordre de 400 watts quand il sera à plein pot avant de l'envoyer en
02:59 production chez TSMC dans notre cas parce que c'est la seule usine qui peut
03:01 développer ce type de composants et faire après la réception des
03:07 échantillons ce qu'on appelle le bring up. Je vais faire un zoom sur
03:10 quelques éléments en termes de tests et d'émulation c'est la
03:13 machine vous voyez en bas, enfin petite machine vous voyez en bas à gauche
03:16 sachant que ce que vous voyez à droite, c'est une carte d'Eval, globalement c'est
03:20 une carte de serveur qu'on développe nous même pour être sûr de tout
03:22 maîtriser, schéma, routage, jusqu'au sur la partie software, kernel, bios et tous
03:28 ces éléments là. Un des éléments qu'on utilise pour développer ce type de
03:33 composants, vous ne pouvez pas attendre que le chip soit sorti pour tout
03:36 tester, vous êtes obligé de tester énormément de choses en amont et c'est un
03:39 concept qu'on appelle les plateformes virtuelles, c'est à dire sur des modèles
03:43 de simulation très haut niveau qui permettent de faire tourner des petites
03:46 charges applicatives sur ce type de processeur et à partir de là
03:51 préparer des modèles ou des modèles de tests qui vont nous aider pour monter
03:54 dans les différentes couches en attendant que le chip arrive. Donc ça va
03:58 sur ce qu'on appelle la vérification fonctionnelle qui permet de s'assurer
04:01 que tout marche, comme dit préparer le firmware et surtout
04:06 préparer des modèles d'émulation, je vais vous montrer après quelques
04:09 photos de ce type de machine qui permet de mettre l'ensemble en musique.
04:13 Stratégie de test, quand on fait du hardware comme on le fait nous-mêmes, c'est
04:17 à dire du microprocesseur, ce sont des langages de codage qu'on va appeler RTL
04:22 etc qui sont des langages un peu différents de ce que vous utilisez,
04:26 tout à l'heure vous parliez de Rust etc, ça reste quand même du codage avec des
04:30 langages particuliers, des modes de tests qui sont particuliers
04:34 mais une stratégie de développement et de tests qui
04:37 restent la même, si ce n'est que le coût d'un bug quand on fait ce
04:42 type de composants est colossal parce que sur notre première plateforme on est sur un
04:45 coût de développement qui est de plus de 150 millions d'euros, ce qui explique tout
04:48 ce qu'on doit lever et corriger un bug c'est globalement un cycle
04:52 d'un an. On n'a pas la chance de faire du software comme certains
04:57 d'entre vous pouvaient le faire mais après ça peut quand même
05:00 ramener énormément. Donc plusieurs étapes en termes de... alors on a un petit
05:04 souci de couleur là je crois donc du coup je vais passer dessus
05:09 ça nous fera gagner du temps et comme dit, qui dit processeur dit
05:13 couche basse, ça valide driver, kernel, bios etc, à part faire partie des
05:18 livrables qu'on doit voir à nos clients parce que globalement un
05:20 RefDesign c'est une carte mère et une carte mère sur ce type de composants
05:24 sont des cartes qui sont très très lourdes, c'est à dire ce qu'on fait
05:28 même avant que le chip soit sorti, que ce soit sur des plateformes
05:31 virtuelles ou en émulation ce qu'on va voir ou bien évidemment sur le chip
05:35 réel, ça démarre avec tout ce qui est bios qu'on va appeler UFI, tout ce qui est
05:38 firmware embarqué, tout ce qui est d'USB-S, c'est à dire l'intérêt de
05:43 travailler avec ARM c'est qu'ils fournissent énormément de paquets de
05:46 logiciels qui font partie de leur écosystème donc ça va être pour pouvoir
05:49 arriver sur des descriptions Linux mais également sur tout ce qui est
05:53 Microsoft, MicroKernel, MiniApp, énormément de benchmarks parce que quand
05:56 vous parlez de composants de haute performance, ce qu'attendent vos clients
05:58 c'est que pour un watt consommé vous génériez la plus grosse puissance de
06:02 calcul et une façon de les déclencher en avant-vente et qu'ils aient un intérêt
06:06 sur ce qu'on fait c'est de les convaincre qu'on a globalement les
06:08 meilleurs benchmarks et bien meilleurs qu'on peut avoir sur des composants par
06:12 exemple x86 aujourd'hui ainsi que tous les paquets de logiciels, le
06:15 sort de compilateur etc et que vous utilisez sûrement au quotidien.
06:20 On parlait d'une machine d'émulation, qu'est ce que c'est qu'une machine
06:23 d'émulation ? Dans notre cas c'est un très très gros outil Siemens que vous
06:26 pouvez voir en photo ici, c'est sur la gauche de la datacenter
06:31 c'est plus de 15 millions d'euros de dépenses dans notre cas
06:37 pour acheter la machine, l'intégrer etc et un budget qui va être a priori
06:41 doublé sur cette année. Globalement c'est quoi ? C'est une
06:45 ferme d'FPGA et vous pouvez projeter sur les deux armoires vous voyez à gauche
06:50 un modèle du chip qui tourne au niveau RTL c'est à dire quasiment au niveau
06:54 porte sur lequel vous allez pouvoir commencer à projeter du soft, des
06:58 drivers, quelques charges logicielles légères parce que globalement
07:01 l'émulateur va vous faire tourner le chip au medium, plutôt que de tourner à
07:05 3 GHz dans le monde réel vous allez tourner à 3 MHz.
07:07 L'avantage c'est qu'au bout de quelques minutes ou sur des charges un peu
07:11 compliquées c'est à dire pour l'instant on pourrait donner une idée pour faire
07:13 booter la carte mère, avoir le BIOS qui démarre, on a quatre heures de temps de
07:17 calcul. Faire ça en mode simulation logicielle ça serait quasiment un temps
07:21 infini et ça permet d'avancer, de débugger énormément, gérer énormément
07:25 d'éléments en avance et d'éviter des coups de bug hardware qui seraient
07:28 juste colossaux voire fatales dans notre dans notre cas. Donc ça fait partie des
07:33 éléments. Pour vous donner une idée ce qu'on a là c'est globalement un vingtième
07:36 en termes de puissance de calcul qu'ont les gros américains TKMD qui ont des
07:39 pléthore d'émulateurs comme ça dans leur data center mais c'est une
07:43 mouvance qu'on suit avec nos moyens qui sont plus sur des budgets français
07:48 que des budgets californiens comme vous vous en doutez. Pour terminer
07:51 avec un petit peu de pub pour vous donner une idée de ce qu'on développe
07:54 en termes de composants, l'animation à démarrer c'est quasiment
07:58 du réel au sens, c'est pas l'échelle 1 parce que le
08:01 boîtier fait 7 cm sur 7, pour vous donner une idée du type de composants
08:05 qu'il y a de suite, il y a la propre puce qu'on développe nous
08:09 même qui a géré plus de 60 coeurs de très haute performance qu'on appelle le
08:12 V1 chez ARM qui est équivalent à ce que vous allez pouvoir trouver chez AWS sur
08:15 Graviton3, qui est d'ailleurs un mode de test chez nous et énormément de
08:20 mémoire embarquée qu'on appelle la mémoire HBM, High Bandwidth Memory, que
08:23 vous pouvez un peu considérer comme un cache de niveau 3 que vous mettez dans le
08:26 processeur mais qui est intégré dans le boîtier, c'est à dire les coûts d'accès à
08:29 cette mémoire en termes d'énergie sont très très bas parce qu'il n'y a pas besoin
08:32 de sortir du boîtier pour accéder à DDR5 et en plus vous avez une bande passante
08:36 qui est colossale parce qu'on se retrouve à des troupeaux de mémoire c'est à dire
08:40 quand on va passer par notre port PCI qui permet de communiquer avec le monde
08:43 extérieur type GPU ou autre ou d'accès de la mémoire qui sont de l'ordre du
08:48 terabyte par seconde ce qui est plutôt colossal sur ce type de plateforme
08:52 équivalent à ce que fait aujourd'hui Intel sur de l'X86. Pour terminer
08:59 parce que c'est là où cette partie peut vous intéresser, on a démarré et c'est
09:03 le premier succès commercial qu'on a eu parce que notre processeur a été
09:06 sélectionné en face d'Intel pour équiper le plus gros supercalculateur
09:10 européen qui sera la machine Jülich en Allemagne qui va être allumée en 2025
09:14 Nvidia qui fait la partie GPU, Cyperl qui fait la partie cluster de CPU
09:19 ce qui est une ronde de lancement avant d'arriver dans le monde
09:22 data center et d'arriver sur vos sites avec processeur sur base ARM comme font
09:27 par exemple les américains aujourd'hui d'Amper, Amper Computing que vous
09:30 utilisez peut-être chez vous ou comme va faire AWS sur la famille
09:34 Graviton mais qui développe eux-mêmes pour leurs usages exclusifs
09:37 la possibilité ça va être d'amener sur ce marché ce type de composants ARM
09:41 pour vos propres besoins. Je m'arrête là j'étais dans les temps c'est bon ?
09:47 Parfait merci