Notebookcheck Logo

xAI lance Grok 3 AI avec des performances de pointe et des modèles de raisonnement bêta

xAI lance la famille Grok 3 d'IA de pointe. (Source de l'image : xAI)
xAI lance la famille Grok 3 d'IA de pointe. (Source de l'image : xAI)
Les derniers grands modèles de langage xAI sont arrivés en tête des classements grâce à leur capacité à rechercher des informations sur l'internet, à raisonner sur des problèmes complexes et à traiter des données avec une fenêtre contextuelle d'un million de mots. Les modèles Grok 3 ont battu OpenAI GPT-4o et DeepSeek-V3 sur la plupart des critères d'évaluation.

L'entreprise xAI d'Elon Musk a lancé la famille Grok 3 de modèles de langage large d'IA de pointe qui surpassent généralement les autres IA dans les tests de référence standardisés de l'IA.

Les modèles Grok 3 ont été entraînés sur la grappe de superordinateurs Colossus de l'entreprise, qui utilise 100 000 GPU Nvidia Hopper Tensor Core. Une paire de modèles de non-raisonnement standard et mini (Grok 3 beta et Grok 3 mini beta) ainsi qu'une paire de modèles de raisonnement (Grok 3 beta (Think) et Grok 3 mini beta (Think)) ont été publiés.

Les modèles sans raisonnement sont généralement plus performants que les anciennes IA les plus populaires, telles que OpenAI GPT-4o et DeepSeek-V3. L'une des raisons est qu'ils disposent d'une fenêtre contextuelle d'un million de jetons, ce qui permet à l'IA d'utiliser de très grandes quantités de texte. Cela améliore la capacité des modèles à synthétiser la bonne réponse à partir d'une variété de sources. Cela dit, les modèles bêta de Grok 3 répondent encore à des questions de recherche d'informations avec une précision inférieure à 50 % (référence SimpleQA), de sorte que les humains auront encore du travail demain.

Les modèles de raisonnement répondent à des questions complexes étape par étape, ce qui permet à l'utilisateur de voir le processus de réflexion de l'IA. Cela permet à ces IA de résoudre des problèmes comme le ferait un expert, en résolvant des parties plus petites du problème et en combinant les résultats pour obtenir une réponse appropriée. La sélection de l'agent DeepSearch, ou option de recherche, permet à Grok 3 d'effectuer des recherches larges et approfondies sur Internet et d'utiliser des interprètes de code avant de générer des rapports résumant ses résultats. Les modèles Grok 3 (Think) sont généralement plus performants que les autres IA pour résoudre des problèmes mathématiques, répondre à des questions à choix multiples de niveau universitaire et effectuer des tâches de codage.

xAI prévoit de continuer à améliorer les performances de Grok 3 dans les mois à venir sur une grappe de superordinateurs de 200 000 GPU. Grok 3 est désormais disponible pour tous les utilisateurs sur X et Grok.com. Les utilisateurs gratuits peuvent se heurter à des limites d'utilisation, tandis que les utilisateurs payants auront accès à des fonctionnalités avancées.

Les scores ELO de Chatbot Arena pour Grok 3 AI le classent parmi les plus performants au monde. (Source de l'image : xAI)
Les scores ELO de Chatbot Arena pour Grok 3 AI le classent parmi les plus performants au monde. (Source de l'image : xAI)
Grok 3 beta et Grok 3 mini beta surpassent généralement GPT-4o et DeepSeek-V3 d'OpenAI sur les benchmarks d'IA standardisés. (Source de l'image : xAI)
Grok 3 beta et Grok 3 mini beta surpassent généralement GPT-4o et DeepSeek-V3 d'OpenAI sur les benchmarks d'IA standardisés. (Source de l'image : xAI)
Grok 3 beta (Think) et Grok 3 mini beta (Think) surpassent généralement tous les autres modèles d'intelligence artificielle testés. (Source de l'image : xAI)
Grok 3 beta (Think) et Grok 3 mini beta (Think) surpassent généralement tous les autres modèles d'intelligence artificielle testés. (Source de l'image : xAI)
Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 02 > xAI lance Grok 3 AI avec des performances de pointe et des modèles de raisonnement bêta
David Chien, 2025-02-21 (Update: 2025-02-21)