DeepSeek, une entreprise chinoise spécialisée dans l'IA, a publié DeepSeek-V3-0324, une version mise à jour de son modèle d'IA à grand langage (LLM) V3, qui a été initialement lancé en décembre 2024. Le modèle V3 a surpris le monde entier en raison de ses exigences beaucoup plus faibles en matière de matériel d'entraînement, de son temps d'entraînement plus court et de ses coûts d'API moins élevés, tout en étant très performant par rapport aux IA concurrentes telles que les modèles GPT d'OpenAI.
Le modèle V3 mis à jour est un modèle d'IA sans raisonnement, ce qui signifie qu'il tente de répondre rapidement aux questions et ne prend pas le temps de réfléchir aux problèmes difficiles, contrairement au modèle R1 de DeepSeek. Ses 685 milliards de paramètres le placent parmi les plus grands LLM accessibles au public. Le dernier modèle est disponible sous la licence MIT.
DeepSeek-V3-0324 a obtenu des résultats de 5,3 % à 19,8 % supérieurs à ceux de la version originale V3 dans les tests de référence en matière d'IA. Ses performances sont comparables à celles d'autres systèmes d'IA de premier plan, tels que GPT-4.5 et Claude Sonnet 3.7
Le modèle mis à jour possède également des capacités améliorées. L'un des domaines d'amélioration est sa capacité à créer des pages web attrayantes et des interfaces pour les jeux en ligne. Il permet également d'améliorer la recherche, l'écriture et la traduction en chinois.
Les lecteurs souhaitant expérimenter la version complète de 685B DeepSeek-V3-0324 auront besoin d'au moins 700 Go d'espace de stockage libre et de plusieurs GPU Nvidia A100/H100. Les versions distillées et à paramètres réduits du modèle peuvent être exécutées sur un seul GPU, tel que le Nvidia 3090(vendu ici sur Amazon).
Version DeepSeek-V3-0324
Augmentation importante des performances de raisonnement
Compétences plus solides en matière de développement frontal
Capacités d'utilisation d'outils plus intelligentes
Pour les tâches de raisonnement non complexes, nous vous recommandons d'utiliser la V3 - désactivez simplement "DeepThink"
L'utilisation de l'API reste inchangée
Les modèles sont maintenant publiés sous la licence MIT, tout comme DeepSeek-R1 !
Poids open-source : huggingface.co/deepseek-ai/DeepSeek-V3-0324
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs