TECH ACTUS – xAI, la société d’Elon Musk spécialisée dans l’IA, a dévoilé son dernier modèle de langage étendu (LLM).
Dans une diffusion en direct (que vous pouvez regarder ci-dessous), ils ont présenté Grok 3, qui est disponible pour les utilisateurs de Twitter qui s’abonnent au niveau le plus cher, car il est disponible dans la catégorie Premium+. Alors que la société d’intelligence artificielle continue de vanter les capacités du nouveau LLM comme étant les meilleures de sa catégorie, certains experts soulignent des lacunes critiques dans les tests de performance publiés. Musk a annoncé que l’ancien Grok 2 LLM sera open source dans quelques mois.
La société xAI a tenu à souligner que Grok 3 LLM a battu toutes les autres versions publiées publiquement du modèle de base, y compris DeepSeek-V3 et GPT-4o, dans les tests de performance en mathématiques, en sciences et en codage. Le LLM a obtenu un score sans précédent de 1402 sur le test de performance Arena. En attendant, le pari de Manifold Markets selon lequel Grok 3 est l’intelligence artificielle la plus puissante du monde devrait désormais recevoir une écrasante majorité de votes positifs. Il faut cependant ajouter que la probabilité d’une victoire du oui est passée de 91 % lundi soir à seulement 78 %. Les commentaires critiques autour de xAI Grok 3 ont peut-être joué un rôle dans ce phénomène.
Zihan Wang (qui travaillait également chez DeepSeek, par coïncidence) a montré à Grok 3 une image de deux boules de fer de tailles différentes suspendues à la tour penchée de Pise à des hauteurs différentes, puis a demandé quelle boule atterrirait en premier. La réponse logique ne pouvait être que celle qui était la plus lourde et la plus proche du sol, mais LLM a répondu que les deux boules atterriraient en même temps. D’autres ont demandé pourquoi xAI n’avait pas publié le score de Grok 3 sur les benchmarks FrontierMath, Arc-AGI ou HLE.
Cela peut soulever la question de savoir s’il s’agit vraiment du meilleur LLM de sa catégorie. Pendant ce temps, Bloomberg a récemment rapporté que xAI était en pourparlers avec des investisseurs existants pour lever jusqu’à 10 milliards de dollars dans un nouveau tour de financement qui valoriserait la startup à 75 milliards de dollars. Lors de son dernier tour de financement, xAI a levé 6 milliards de dollars pour une valorisation de 40 milliards de dollars. Guodang Zhang de xAI a confirmé que Grok 3 a été formé sur 100 000 GPU.
Vous devriez étayer cette affirmation, n’est-ce pas, Elon ?
Source: WCCFTech
GROK 3: SOLVING PHYSICS, GAMES, AND THE UNIVERSE
Full presentation and demo of xAI’s latest model
0:00 xAI’s mission: Understand the universe
1:20 Team presentation
2:01 Grok means to profoundly understand
2:29 From Grok 2 to Grok 3
6:30 Grok 3 benchmarks
9:07 Grok 3 improves… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I— Mario Nawfal (@MarioNawfal) February 18, 2025