ACTUALITÉS TECH – De premières rumeurs audacieuses circulent autour du nouveau modèle d’IA de DeepSeek !
Le premier modèle majeur de DeepSeek, le R1, a clairement montré au monde occidental que la Chine n’était pas en retard dans le développement de modèles d’intelligence artificielle de pointe. Cette avancée technologique a infligé un camouflet aux marchés boursiers américains, prouvant que la création de modèles IA de qualité n’exige pas les coûts faramineux affichés par des entreprises comme OpenAI. Désormais, les médias chinois évoquent déjà l’arrivée du prochain modèle : le DeepSeek R2.
Selon les rumeurs, le modèle R2 adopterait une architecture hybride MoE (Mixture of Experts), améliorant la version actuelle de cette technologie. Il combinerait probablement des mécanismes de répartition sophistiqués et des couches denses pour optimiser la gestion des charges de travail intensives. Grâce à cette approche, DeepSeek R2 disposerait de deux fois plus de paramètres que le R1, soit 1,2 billion. Cela placerait immédiatement le R2 au même niveau que GPT-4 Turbo et Google Gemini 2.0 Pro. Et ce n’est pas tout : DeepSeek compte bien frapper fort sur plusieurs fronts.
En matière de coût par token, le DeepSeek R2 serait 97,4 % moins cher que GPT-4, qui facture 0,07 $ pour 1 million de tokens d’entrée et 0,27 $ pour 1 million de tokens de sortie. Face à la grille tarifaire d’OpenAI, le R2 représenterait une solution bien plus économique pour les entreprises, devenant ainsi le modèle le plus compétitif du marché. Lors de sa sortie, il pourrait marquer un tournant majeur pour l’intelligence artificielle et l’économie mondiale.
On rapporte également que le modèle atteint un taux d’utilisation de 82 % sur un cluster de puces Ascend 910B de Huawei, avec une puissance de calcul mesurée à 512 PetaFLOPS en FP16. Cela confirme que DeepSeek pourrait effectivement reposer sur des ressources entièrement nationales.
On soupçonnait déjà que la société chinoise MI cherchait à privilégier les puces locales. Avec cette démarche, DeepSeek intègre verticalement toute sa chaîne d’approvisionnement en intelligence artificielle. Si ces rumeurs s’avèrent exactes, le R2 pourrait bien créer la surprise sur le marché et infliger un nouveau revers à Wall Street… Mais tout cela reste à confirmer !
Source: WCCFTech, Jiuyangongshe