Notebookcheck Logo

DeepSeek publie le modèle d'IA V3 amélioré trois mois après son lancement initial

DeepSeek-V3-0324 est disponible avec des performances et des capacités améliorées. (Source de l'image : DeepSeek)
DeepSeek-V3-0324 est disponible avec des performances et des capacités améliorées. (Source de l'image : DeepSeek)
La version DeepSeek-V3-0324 est publiée trois mois après le lancement initial de DeepSeek V3 en décembre 2024. Ce modèle mis à jour offre des performances et des capacités améliorées, telles que la création de pages web attrayantes et de rapports bien rédigés en chinois.

DeepSeek, une entreprise chinoise spécialisée dans l'IA, a publié DeepSeek-V3-0324, une version mise à jour de son modèle d'IA à grand langage (LLM) V3, qui a été initialement lancé en décembre 2024. Le modèle V3 a surpris le monde entier en raison de ses exigences beaucoup plus faibles en matière de matériel d'entraînement, de son temps d'entraînement plus court et de ses coûts d'API moins élevés, tout en étant très performant par rapport aux IA concurrentes telles que les modèles GPT d'OpenAI.

Le modèle V3 mis à jour est un modèle d'IA sans raisonnement, ce qui signifie qu'il tente de répondre rapidement aux questions et ne prend pas le temps de réfléchir aux problèmes difficiles, contrairement au modèle R1 de DeepSeek. Ses 685 milliards de paramètres le placent parmi les plus grands LLM accessibles au public. Le dernier modèle est disponible sous la licence MIT.

DeepSeek-V3-0324 a obtenu des résultats de 5,3 % à 19,8 % supérieurs à ceux de la version originale V3 dans les tests de référence en matière d'IA. Ses performances sont comparables à celles d'autres systèmes d'IA de premier plan, tels que GPT-4.5 et Claude Sonnet 3.7

Le modèle mis à jour possède également des capacités améliorées. L'un des domaines d'amélioration est sa capacité à créer des pages web attrayantes et des interfaces pour les jeux en ligne. Il permet également d'améliorer la recherche, l'écriture et la traduction en chinois.

Les lecteurs souhaitant expérimenter la version complète de 685B DeepSeek-V3-0324 auront besoin d'au moins 700 Go d'espace de stockage libre et de plusieurs GPU Nvidia A100/H100. Les versions distillées et à paramètres réduits du modèle peuvent être exécutées sur un seul GPU, tel que le Nvidia 3090(vendu ici sur Amazon).

DeepSeek-V3-0324 AI améliore les performances par rapport à la version originale, avec de meilleurs scores de référence en matière d'IA. (Source de l'image : DeepSeek)
DeepSeek-V3-0324 AI améliore les performances par rapport à la version originale, avec de meilleurs scores de référence en matière d'IA. (Source de l'image : DeepSeek)

Version DeepSeek-V3-0324

Augmentation importante des performances de raisonnement

Compétences plus solides en matière de développement frontal

Capacités d'utilisation d'outils plus intelligentes

Pour les tâches de raisonnement non complexes, nous vous recommandons d'utiliser la V3 - désactivez simplement "DeepThink"

L'utilisation de l'API reste inchangée

Les modèles sont maintenant publiés sous la licence MIT, tout comme DeepSeek-R1 !

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 03 > DeepSeek publie le modèle d'IA V3 amélioré trois mois après son lancement initial
David Chien, 2025-03-29 (Update: 2025-03-29)