ACTUALITÉS TECH – Le dernier partenariat de l’entreprise connue pour ChatGPT risque d’engloutir des sommes colossales.
Le dernier partenariat d’OpenAI avec Nvidia ne se concentre pas uniquement sur Vera Rubin, mais aussi sur les capacités d’inférence que doit apporter la future solution Nvidia-Groq. OpenAI est actuellement en train de conclure des accords de financement avec des partenaires d’infrastructure à travers l’ensemble de l’industrie de l’IA, et le géant a récemment annoncé vouloir lever 110 milliards de dollars de capitaux frais, avec le soutien notamment d’Nvidia, de SoftBank et d’Amazon. Selon OpenAI, ces investissements sont indispensables pour maintenir les opérations dans le secteur de l’IA et constituent l’un des moyens de sécuriser la capacité de calcul nécessaire.
D’après le Wall Street Journal, Nvidia présentera son « processeur » orienté Groq lors du GTC de cette année. OpenAI serait le plus gros client de la solution à venir, un choix pour le moins intéressant. Dans le cadre du dernier investissement d’Nvidia dans OpenAI, il aurait été révélé qu’OpenAI utilisera 3 GW de capacité d’inférence dédiée, probablement issue du produit qu’Nvidia doit dévoiler en mars. Des rumeurs antérieures affirmaient que l’inférence était devenue l’une des principales préoccupations d’OpenAI ces derniers temps, et que l’entreprise se montrait plutôt insatisfaite des solutions proposées par Nvidia pour gérer l’inférence.
OpenAI aurait également discuté avec Cerebras et Groq afin de conclure des accords garantissant des performances optimales sur des charges de travail sensibles à la latence. Mais il semble désormais qu’OpenAI reste aux côtés d’Nvidia, ce qui pourrait indiquer que la solution à venir, basée sur les LPU de Groq, est jugée suffisamment prometteuse pour que le géant de l’IA y associe 3 GW de capacité. L’accord entre Nvidia et Groq est surtout attendu comme une configuration de calcul hybride.
À ce stade, on s’attend à ce qu’Nvidia fasse des annonces importantes lors du GTC de cette année, avec au centre Vera Rubin, éventuellement la prochaine génération Feynman, ainsi qu’une solution construite autour de Groq. Cela prolongerait la trajectoire récente d’Nvidia: d’après les derniers résultats financiers publiés, le segment des GPU gaming n’aurait représenté qu’environ un dixième des revenus générés par les activités data center.



