DeepSeek publie le modèle d'IA V3 amélioré trois mois après son lancement initial

DeepSeek-V3-0324 est disponible avec des performances et des capacités améliorées. (Source de l'image : DeepSeek)

La version DeepSeek-V3-0324 est publiée trois mois après le lancement initial de DeepSeek V3 en décembre 2024. Ce modèle mis à jour offre des performances et des capacités améliorées, telles que la création de pages web attrayantes et de rapports bien rédigés en chinois.

David Chien (traduit par Ninh Duy), Publié 03/29/2025 🇺🇸 🇪🇸 ...

Launch AI Software Open Source

DeepSeek, une entreprise chinoise spécialisée dans l'IA, a publié DeepSeek-V3-0324, une version mise à jour de son modèle d'IA à grand langage (LLM) V3, qui a été initialement lancé en décembre 2024. Le modèle V3 a surpris le monde entier en raison de ses exigences beaucoup plus faibles en matière de matériel d'entraînement, de son temps d'entraînement plus court et de ses coûts d'API moins élevés, tout en étant très performant par rapport aux IA concurrentes telles que les modèles GPT d'OpenAI.

Le modèle V3 mis à jour est un modèle d'IA sans raisonnement, ce qui signifie qu'il tente de répondre rapidement aux questions et ne prend pas le temps de réfléchir aux problèmes difficiles, contrairement au modèle R1 de DeepSeek. Ses 685 milliards de paramètres le placent parmi les plus grands LLM accessibles au public. Le dernier modèle est disponible sous la licence MIT.

DeepSeek-V3-0324 a obtenu des résultats de 5,3 % à 19,8 % supérieurs à ceux de la version originale V3 dans les tests de référence en matière d'IA. Ses performances sont comparables à celles d'autres systèmes d'IA de premier plan, tels que GPT-4.5 et Claude Sonnet 3.7

Le modèle mis à jour possède également des capacités améliorées. L'un des domaines d'amélioration est sa capacité à créer des pages web attrayantes et des interfaces pour les jeux en ligne. Il permet également d'améliorer la recherche, l'écriture et la traduction en chinois.

Les lecteurs souhaitant expérimenter la version complète de 685B DeepSeek-V3-0324 auront besoin d'au moins 700 Go d'espace de stockage libre et de plusieurs GPU Nvidia A100/H100. Les versions distillées et à paramètres réduits du modèle peuvent être exécutées sur un seul GPU, tel que le Nvidia 3090(vendu ici sur Amazon).