OpenAI sera-t-il le plus gros client de la puce IA Nvidia-Groq ?

ACTUALITÉS TECH – Le dernier partenariat de l’entreprise connue pour ChatGPT risque d’engloutir des sommes colossales.

 

Le dernier partenariat d’OpenAI avec Nvidia ne se concentre pas uniquement sur Vera Rubin, mais aussi sur les capacités d’inférence que doit apporter la future solution Nvidia-Groq. OpenAI est actuellement en train de conclure des accords de financement avec des partenaires d’infrastructure à travers l’ensemble de l’industrie de l’IA, et le géant a récemment annoncé vouloir lever 110 milliards de dollars de capitaux frais, avec le soutien notamment d’Nvidia, de SoftBank et d’Amazon. Selon OpenAI, ces investissements sont indispensables pour maintenir les opérations dans le secteur de l’IA et constituent l’un des moyens de sécuriser la capacité de calcul nécessaire.

D’après le Wall Street Journal, Nvidia présentera son « processeur » orienté Groq lors du GTC de cette année. OpenAI serait le plus gros client de la solution à venir, un choix pour le moins intéressant. Dans le cadre du dernier investissement d’Nvidia dans OpenAI, il aurait été révélé qu’OpenAI utilisera 3 GW de capacité d’inférence dédiée, probablement issue du produit qu’Nvidia doit dévoiler en mars. Des rumeurs antérieures affirmaient que l’inférence était devenue l’une des principales préoccupations d’OpenAI ces derniers temps, et que l’entreprise se montrait plutôt insatisfaite des solutions proposées par Nvidia pour gérer l’inférence.

OpenAI aurait également discuté avec Cerebras et Groq afin de conclure des accords garantissant des performances optimales sur des charges de travail sensibles à la latence. Mais il semble désormais qu’OpenAI reste aux côtés d’Nvidia, ce qui pourrait indiquer que la solution à venir, basée sur les LPU de Groq, est jugée suffisamment prometteuse pour que le géant de l’IA y associe 3 GW de capacité. L’accord entre Nvidia et Groq est surtout attendu comme une configuration de calcul hybride.

À ce stade, on s’attend à ce qu’Nvidia fasse des annonces importantes lors du GTC de cette année, avec au centre Vera Rubin, éventuellement la prochaine génération Feynman, ainsi qu’une solution construite autour de Groq. Cela prolongerait la trajectoire récente d’Nvidia: d’après les derniers résultats financiers publiés, le segment des GPU gaming n’aurait représenté qu’environ un dixième des revenus générés par les activités data center.

Source : WCCFTech, WSJ

Spread the love
Avatar photo
Anikó, our news editor and communication manager, is more interested in the business side of the gaming industry. She worked at banks, and she has a vast knowledge of business life. Still, she likes puzzle and story-oriented games, like Sherlock Holmes: Crimes & Punishments, which is her favourite title. She also played The Sims 3, but after accidentally killing a whole sim family, swore not to play it again. (For our office address, email and phone number check out our IMPRESSUM)