Samsung et d’autres testent la puce RISC-V AI à 1 000 cœurs d’Esperanto

  • FrançaisFrançais



  • On dit que la branche des services informatiques de Samsung et d’autres sociétés testent un processeur doté de plus de 1 000 cœurs RISC-V à usage général pour fournir ce que le concepteur de la puce prétend être des performances d’inférence d’IA plus rapides et plus économes en énergie que le silicium spécialisé gourmand en énergie .

    Le concepteur de puces, Esperanto Technologies, a déclaré jeudi que Samsung SDS et d’autres sociétés anonymes, qu’il n’a identifiées que comme des “clients principaux”, procédaient à des évaluations initiales de l’accélérateur d’inférence IA ET-SoC-1 de la startup.

    La startup basée à Mountain View, en Californie, a été fondée en 2014 par Dave Ditzel, un vétéran de l’industrie des semi-conducteurs qui a travaillé sur des architectures informatiques parallèles chez Intel et, plus tôt dans sa carrière, a dirigé le développement de l’architecture du jeu d’instructions CPU SPARC chez Sun Microsystems. Esperanto est désormais dirigé par Art Swift, qui a occupé plusieurs postes de direction dans les semi-conducteurs, notamment celui de PDG de Wave Computing.

    L’ET-SoC-1 contient 1 088 cœurs de processeur 64 bits économes en énergie qui utilisent l’architecture du jeu d’instructions RISC-V, une alternative émergente aux ISA x86 et Arm. Ces cœurs sont accompagnés de leurs propres unités mathématiques vectorielles/tensorielles pour l’accélération des opérations d’apprentissage automatique, et la puce est également livrée avec quatre cœurs RISC-V hautes performances, plus plus de 160 millions d’octets de SRAM sur puce (plus de 152 Mo, puis) ​​et des interfaces pour mémoire flash et DRAM externe.

    Avec cette architecture, Esperanto affirme disposer de la puce AI RISC-V la plus rapide. Combiné avec ses exigences de faible puissance, la startup a déclaré que l’ET-SoC-1 était “conçu pour répondre aux exigences de performance, de puissance et de coût total de possession des clients de centres de données à grande échelle”.

    Alors qu’Esperanto affirme que l’ET-SoC-1 peut “bien exécuter n’importe quelle charge de travail d’apprentissage automatique”, la société a déclaré que la puce excelle dans la recommandation ML, l’une des applications de serveur les plus courantes exécutées par des soi-disant hyperscalers comme la société mère de Facebook Meta et Amazon.

    Félicitations de Samsung SDS

    Patrick Bangert, vice-président de l’IA chez Samsung SDS, a déclaré que son équipe de science des données “était très impressionnée” par le premier test de l’ET-SoC-1 par la société. Il a ajouté que les processeurs des concurrents d’Esperanto n’offrent pas le même niveau de mise à l’échelle des performances que l’ET-SoC-1, ce qui signifie que la puce fait du bon travail pour fournir un niveau de performances plus élevé proportionnellement à la quantité de puces utilisées.

    “Il était rapide, performant et globalement facile à utiliser. En outre, le SoC a démontré une mise à l’échelle des performances quasi linéaire sur différentes configurations de clusters de calcul d’IA. Il s’agit d’une capacité assez unique, et que nous n’avons pas encore vue de manière cohérente. sociétés établies offrant des solutions alternatives à l’espéranto », a déclaré Bangert dans une citation fournie par Esperanto.

    C’est tout à fait le témoignage d’un important fournisseur informatique, qui vend une variété de services d’IA et d’analyse de données via sa plate-forme logicielle Brightics AI.

    Mais c’est une chose de tester une nouvelle puce. C’est une autre chose pour une grande entreprise de passer un bon de commande en gros volume et de s’appuyer sur de telles puces pour alimenter des produits et services générateurs de revenus. Ainsi, les nouvelles d’échantillonnage d’Esperanto ne sont que l’une des nombreuses étapes qu’il devra franchir avant d’inquiéter le principal fournisseur de puces AI, Nvidia, et d’autres concepteurs de puces.

    En tant que tel, Esperanto a déclaré qu’il recherchait d’autres entreprises souhaitant rejoindre son programme d’évaluation, qui permet aux utilisateurs de reposer l’ET-SoC-1 sur une variété de modèles d’IA prêts à l’emploi, notamment des modèles de recommandation, de transformateur et de réseau visuel. Le programme permet aux utilisateurs de tester divers modèles, types de données, tailles de lots et configurations de calcul jusqu’à 32 clusters.

    Bon support logiciel, mais est-il trop tard ?

    Karl Freund, analyste principal chez Cambrian-AI Research, a déclaré que l’Esperanto avait démontré des performances “solides comme le roc” pour ET-SoC-1 avec les modèles ResNet 50, DLRM et Transformer, bien qu’il ne puisse pas encore partager les résultats. Il a ajouté qu’il s’attend à ce que la puce ne nécessite que 20 watts pour fonctionner à pleine puissance.

    Freund a déclaré qu’il était initialement sceptique quant à la capacité de l’ET-SoC-1 à fournir un niveau élevé de performances d’inférence en utilisant des cœurs RISC-V à usage général, mais les résultats lui ont donné tort. “Ce qui rend vraiment cette approche unique, c’est que les cœurs RISC-V font le gros du travail, sans décharger les multiplications matricielles sur un cœur MAC ou un GPU”, a-t-il déclaré.

    Tout aussi important, a déclaré Freund, Esperanto “dispose des outils de programmation et de la pile logicielle pour s’adapter plus facilement aux nouvelles charges de travail d’IA, aux côtés des charges de travail non-IA, toutes exécutées sur le même silicium”.

    Cependant, Freund a admis que la puce d’Esperanto est arrivée “un peu en retard”, il y a donc une question de savoir si la startup peut suivre le rythme d’autres entreprises travaillant sur des puces à faible puissance pour l’inférence. ®

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.