D’anciens Googleurs tentent de créer une « intelligence générale » qui permet aux logiciels de faire ce que vous leur dites

  • FrançaisFrançais



  • Adept AI, un laboratoire de R&D en intelligence artificielle fondé par d’anciens Googleurs qui ont aidé à inventer l’architecture populaire des transformateurs, a été lancé mardi avec l’objectif ambitieux d’enseigner aux machines comment utiliser “tous les outils logiciels et API du monde”.

    Le parvenu a levé 65 millions de dollars auprès des investisseurs Saam Motamedi et du co-fondateur de LinkedIn Reid Hoffman au fonds de capital-risque Greylock; Lee Fixel chez Addition; et Root Ventures. Parmi les autres investisseurs providentiels figurent : Andrej Karpathy, responsable de Tesla Autopilot ; Jaan Tallinn, un des premiers développeurs de Skype ; et Chris Ré, informaticien à l’université de Stanford et co-fondateur de Lattice Data, acquis par Apple en 2017.

    Le co-fondateur et PDG David Luan a déclaré qu’Adept est un “laboratoire de recherche et de produits développant une intelligence générale”. Luan est rejoint par le CTO Niki Parmar et le scientifique en chef Ashish Vaswani ainsi qu’un premier groupe d’employés, qui ont quitté leurs postes précédents chez Google et DeepMind.

    Les co-fondateurs ont une connaissance approfondie des systèmes à base de transformateurs. Luan a aidé à construire GPT-2 et GPT-3 chez OpenAI et est ensuite parti pour Google, travaillant aux côtés de Parmar et Vaswani. La paire est créditée dans le développement de l’architecture du transformateur AI, proposée pour la première fois en 2017.

    “Le transformateur a été le premier réseau de neurones qui semblait ‘fonctionner’ pour chaque cas d’utilisation majeur de l’IA – c’était la résultat de recherche qui m’a convaincu que l’intelligence générale était possible », a déclaré Luan dans un communiqué.

    “Nous avons formé des transformateurs de plus en plus gros, avec le rêve de construire éventuellement un modèle général pour alimenter tous les cas d’utilisation de ML – mais il y avait une limite claire : les modèles formés sur du texte peuvent écrire de la grande prose, mais ils ne peuvent pas agir dans le numérique. monde.”

    Adept se concentrera sur la formation d’un réseau neuronal pour effectuer des tâches générales sur votre ordinateur, comme générer des rapports de conformité ou tracer des données à l’aide de logiciels existants tels que Photoshop, Tableau ou Twilio. “Par exemple, vous pouvez utiliser GPT-3 pour parler de la commande d’une pizza, mais vous ne pouvez pas le faire pour vous”, a déclaré Luan. Le registre. Au lieu de cela, le modèle d’Adept agira comme une “superposition”, faisant l’interface entre un utilisateur et son PC ou son appareil.

    Pour nous, cela ressemble aux ordinateurs de Star Trek, dans lesquels vous décrivez une action à entreprendre, et le système détermine comment l’exécuter. Cela ne semble pas trop exagéré.

    Luan envisage un avenir où les gens pourront demander au modèle d’effectuer des actions en utilisant le langage naturel. Le système aura appris comment effectuer ces tâches à l’aide des logiciels disponibles. Cette partie est cruciale : on apprendra en théorie au système à utiliser les interfaces logicielles et applicatives pour qu’il puisse exécuter de sa propre initiative les commandes de quelqu’un. Cette conception flexible et évolutive se distingue de l’approche plus triviale et rigide consistant à transcrire une commande et, par exemple, à l’analyser à la recherche d’instructions et de mots-clés codés en dur.

    Adept continuera à s’appuyer sur l’architecture actuelle des transformateurs. “Contrairement aux modèles qui sont entraînés uniquement sur du texte, nous l’entraînons sur des actions sur un ordinateur”, nous a expliqué Luan.

    Les tâches et les outils qu’Adept pourra contrôler seront simples au départ et deviendront de plus en plus complexes avec le temps, nous dit-on. Luan a suggéré un scénario dans lequel les développeurs pourraient utiliser le modèle pour aider à réfléchir et mener des recherches scientifiques.

    “Cette vision du produit nous passionne non seulement en raison de son utilité immédiate pour tous ceux qui travaillent devant un ordinateur, mais aussi parce que nous pensons qu’il s’agit en fait de la voie la plus pratique et la plus sûre vers l’intelligence générale”, a-t-il ajouté.

    “Contrairement aux modèles géants qui génèrent du langage ou prennent des décisions par eux-mêmes, les nôtres ont une portée beaucoup plus étroite – nous sommes une interface avec les outils logiciels existants, ce qui facilite l’atténuation des problèmes de biais.” ®

    L'équipe de Comparaland

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.