Deepseek dévoile Deepseek V3 AI LLM avec accès gratuit à un chatbot
Deepseek a dévoilé son dernier modèle de grande langue (LLM) Deepseek V3, et le modèle ainsi que le chatbot sont disponibles gratuitement.
Les LLM qui équipent les chatbots les plus courants sont tous formés sur des millions de documents afin de comprendre les liens entre les mots et les sujets. Plus ces modèles ont de paramètres, plus les chatbots sont performants pour répondre aux questions des utilisateurs. Cependant, les milliards de paramètres utilisés nécessitent beaucoup de puissance de calcul et d'énergie, de sorte qu'un réglage minutieux du processus de formation est essentiel pour maintenir les coûts et le temps de formation à un niveau bas.
Pour atteindre ces objectifs, Deepseek a utilisé une stratégie innovante d'équilibrage de la charge associée à des calculs en virgule flottante 8 bits de faible précision (FP8), à la méthode unique de l'entreprise pour réduire l'utilisation de la mémoire (Multi-Head Latent Attention ou MLA) et à d'autres méthodes décrites en détail dans leur document technique ( ).
L'optimisation minutieuse du processus de formation de Deepseek V3 a permis de maintenir les coûts à moins de 6 millions de dollars, contrairement aux 78 millions de dollars nécessaires à la formation du GPT-4 d'OpenAI ( ) ou aux 500+ millions de dollars estimés ( ) ou des 500 millions de dollars et plus par cycle estimés sur pour former le GPT-5 d'OpenAI. Des coûts plus faibles et une formation plus rapide réduisent le coût de Deepseek pour les utilisateurs commerciaux. Les personnes soucieuses de l'environnement peuvent également se réjouir de la réduction de la consommation d'énergie et des émissions de carbone nécessaires à la formation à Deepseek V3.
Deepseek V2 était déjà classé parmi les dix modèles LLM d'IA les plus puissants disponibles, et des tests préliminaires de chatbot réalisés par l'entreprise ont indiqué qu'il avait gagné dans 12 des 21 tests contre les LLM les mieux classés, tels que Anthropic Claude 3.5 Sonnet et OpenAI GPT-4o.
Les lecteurs peuvent utiliser gratuitement le chatbot Deepseek V3 pour les aider à rédiger des essais, leur fournir des réponses et leur simplifier le travail. Les entreprises peuvent commencer à créer des applications à l'aide de l'API de la plateforme V3. Les personnes qui souhaitent garder le secret doivent savoir que toutes les données de chat sont conservées sur dans des serveurs situés en République populaire de Chine. Cependant, les plus grandes entreprises américaines à l'origine des meilleurs LLM d'IA d'aujourd'hui, telles que Facebook, ont été prises en flagrant délit de partage de donnéeségalement.
Source(s)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs