Notebookcheck Logo

Deepseek dévoile Deepseek V3 AI LLM avec accès gratuit à un chatbot

Deepseek ouvre l'accès gratuit au chatbot Deepseek V3 AI LLM à tous. (Source de l'image : Deepseek)
Deepseek ouvre l'accès gratuit au chatbot Deepseek V3 AI LLM à tous. (Source de l'image : Deepseek)
L'entreprise chinoise spécialisée dans l'IA a amélioré son LLM Deepseek V2, classé parmi les dix premiers, en lançant Deepseek V3. Le LLM est nettement moins cher que la plupart des IA concurrentes grâce à une optimisation minutieuse du processus de formation.

Deepseek a dévoilé son dernier modèle de grande langue (LLM) Deepseek V3, et le modèle ainsi que le chatbot sont disponibles gratuitement.

Les LLM qui équipent les chatbots les plus courants sont tous formés sur des millions de documents afin de comprendre les liens entre les mots et les sujets. Plus ces modèles ont de paramètres, plus les chatbots sont performants pour répondre aux questions des utilisateurs. Cependant, les milliards de paramètres utilisés nécessitent beaucoup de puissance de calcul et d'énergie, de sorte qu'un réglage minutieux du processus de formation est essentiel pour maintenir les coûts et le temps de formation à un niveau bas.

Pour atteindre ces objectifs, Deepseek a utilisé une stratégie innovante d'équilibrage de la charge associée à des calculs en virgule flottante 8 bits de faible précision (FP8), à la méthode unique de l'entreprise pour réduire l'utilisation de la mémoire (Multi-Head Latent Attention ou MLA) et à d'autres méthodes décrites en détail dans leur document technique ( ).

L'optimisation minutieuse du processus de formation de Deepseek V3 a permis de maintenir les coûts à moins de 6 millions de dollars, contrairement aux 78 millions de dollars nécessaires à la formation du GPT-4 d'OpenAI ( ) ou aux 500+ millions de dollars estimés ( ) ou des 500 millions de dollars et plus par cycle estimés sur pour former le GPT-5 d'OpenAI. Des coûts plus faibles et une formation plus rapide réduisent le coût de Deepseek pour les utilisateurs commerciaux. Les personnes soucieuses de l'environnement peuvent également se réjouir de la réduction de la consommation d'énergie et des émissions de carbone nécessaires à la formation à Deepseek V3.

Deepseek V2 était déjà classé parmi les dix modèles LLM d'IA les plus puissants disponibles, et des tests préliminaires de chatbot réalisés par l'entreprise ont indiqué qu'il avait gagné dans 12 des 21 tests contre les LLM les mieux classés, tels que Anthropic Claude 3.5 Sonnet et OpenAI GPT-4o.

Les lecteurs peuvent utiliser gratuitement le chatbot Deepseek V3 pour les aider à rédiger des essais, leur fournir des réponses et leur simplifier le travail. Les entreprises peuvent commencer à créer des applications à l'aide de l'API de la plateforme V3. Les personnes qui souhaitent garder le secret doivent savoir que toutes les données de chat sont conservées sur dans des serveurs situés en République populaire de Chine. Cependant, les plus grandes entreprises américaines à l'origine des meilleurs LLM d'IA d'aujourd'hui, telles que Facebook, ont été prises en flagrant délit de partage de donnéeségalement.

Deepseek V3 gagne dans 12 des 21 tests de référence LLM contre les LLM les plus performants, tels que OpenAI GPT-4o et Anthropic Claude 3.5 Sonnet. (Source de l'image : Deepseek sur Github)
Deepseek V3 gagne dans 12 des 21 tests de référence LLM contre les LLM les plus performants, tels que OpenAI GPT-4o et Anthropic Claude 3.5 Sonnet. (Source de l'image : Deepseek sur Github)
Les premières analyses comparatives de Deepseek V3 dans le classement de l'Open Large Model AI suggèrent qu'il se classe parmi les dix IA LLM les plus puissantes au monde. (Source de l'image : Open Large Model AI)
Les premières analyses comparatives de Deepseek V3 dans le classement de l'Open Large Model AI suggèrent qu'il se classe parmi les dix IA LLM les plus puissantes au monde. (Source de l'image : Open Large Model AI)
Une optimisation minutieuse du processus de formation a permis de réduire considérablement les coûts et le temps nécessaires à la création de Deepseek V3 LLM, ce qui s'est traduit par une réduction considérable des coûts d'utilisation. (Source de l'image : Deepseek sur X)
Une optimisation minutieuse du processus de formation a permis de réduire considérablement les coûts et le temps nécessaires à la création de Deepseek V3 LLM, ce qui s'est traduit par une réduction considérable des coûts d'utilisation. (Source de l'image : Deepseek sur X)
Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 12 > Deepseek dévoile Deepseek V3 AI LLM avec accès gratuit à un chatbot
David Chien, 2024-12-29 (Update: 2024-12-29)