IBM lance Granite 3.0, un modèle d'IA en libre accès pour les entreprises

Les modèles d'IA open-source IBM Granite 3.0 pour les entreprises sont désormais disponibles (Image source : IBM)

Couverte par les termes de la licence Apache 2.0, la famille de modèles d'IA IBM Granite 3.0 s'adresse aux entreprises et offre des performances de pointe ainsi que (prétendument) l'ensemble le plus complet de capacités de détection des risques et des préjudices sur le marché. Les personnes intéressées peuvent télécharger les modèles sur le site Hugging Face.

Codrut Nistor (traduit par Ninh Duy), Publié 10/22/2024 🇺🇸 🇪🇸 ...

Plus tôt dans la journée, IBM a dévoilé sa famille de modèles d'IA la plus avancée à ce jour, portant le numéro de version de Granite à 3.0. En septembre 2023, IBM a présenté les modèles de base Granite https://www.ibm.com/blog/building-ai-for-business-ibms-granite-foundation-models/et aujourd'hui, la famille passe à un modèle open-source tout en améliorant tous les autres aspects en même temps. Tous les modèles Granite 3.0 (qui seront mentionnés ultérieurement) sont couverts par les termes de la licence Apache 2.0, ce qui permet aux entreprises clientes et à la communauté dans son ensemble d'en tirer parti.

Les trois branches de Granite 3.0 et les membres de chacune d'entre elles sont les suivants :

Usage général/langage : Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Garde-fous et sécurité : Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mélange d'experts : Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

Contrairement à leurs concurrents, qui sont formés sur des données publiques, les modèles Granite d'IBM utilisent des données d'entreprise et peuvent être facilement intégrés dans divers flux de travail et environnements commerciaux, ce qui permet de réduire les coûts jusqu'à 23 fois par rapport aux grands modèles de frontière. Selon IBM, la formation de ces nouveaux modèles a impliqué plus de 12 trillions de tokens sur des données provenant de 12 langues naturelles différentes et de 116 langages de programmation différents.

L'un des points forts de la famille est Guardian 3.0, qui propose une détection des risques et des préjudices à la pointe du marché, en tenant compte de l'ancrage, de la pertinence du contexte et de la pertinence de la réponse, en plus des attributs déjà courants tels que les préjugés sociaux, la haine, la toxicité, le blasphème, la violence, le piratage de prison, etc.

Ceux qui souhaitent commencer à utiliser Granite 3.0 d'IBM (ou passer aux nouveaux éléments de code) peuvent se rendre sur le site Hugging Face et les télécharger. Alors qu'une sélection de modèles sera intégrée aux microservices NIM de Nvidia et à Google Cloud Vertex AI Model Garden avec Hugging Face, les variantes d'instruction des nouveaux modèles de langage Granite 3.0 8B et 2B et les modèles Granite Guardian 3.0 8B et 2B sont disponibles pour une utilisation commerciale via la plateforme watsonx d'IBM ( ) .

Fin août, Clifford A. Pickover a publié Artificial Intelligence : An Illustrated History : From Medieval Robots to Neural Networks, un livre qui est maintenant disponible au prix de 8,99 $ en format Kindle et de 17,26 $ en version brochée.

Source(s)

Salle de presse IBM

▶ ▼ Communiqué de presse

IBM présente Granite 3.0 : Des modèles d'IA très performants conçus pour les entreprises

- Les nouveaux modèles Granite 3.0 8B & 2B, publiés sous la licence Apache 2.0, affichent de solides performances dans de nombreux benchmarks académiques et d'entreprise, capables de surpasser ou d'égaler des modèles de taille similaire

- Les nouveaux modèles Granite Guardian 3.0 offrent les capacités de garde-fou les plus complètes d'IBM pour faire progresser l'IA sûre et fiable

- Les nouveaux modèles Granite 3.0 Mixture-of-Experts permettent une inférence extrêmement efficace et une faible latence, adaptée aux déploiements basés sur l'unité centrale et à l'informatique périphérique

- Le nouveau modèle Granite Time Series a atteint des performances de pointe en matière de prévision zéro/petit coup, surpassant des modèles 10 fois plus grands

- IBM dévoile la nouvelle génération de watsonx Code Assistant alimenté par Granite pour le codage à usage général ; présente de nouveaux outils dans watsonx.ai pour la construction et le déploiement d'applications et d'agents d'IA

- Annonce que Granite deviendra le modèle par défaut de Consulting Advantage, une plateforme de livraison alimentée par l'IA utilisée par les 160 000 consultants d'IBM pour apporter plus rapidement de nouvelles solutions aux clients

ARMONK, N.Y., 21 oct. 2024 /PRNewswire/ -- Aujourd'hui, lors de la conférence d'IBM (NYSE : IBM), la société a annoncé la sortie de sa famille de modèles d'IA la plus avancée à ce jour, Granite 3.0. La troisième génération de modèles linguistiques phares Granite d'IBM peut surpasser ou égaler des modèles de taille similaire des principaux fournisseurs de modèles sur de nombreux critères académiques et industriels, en faisant preuve d'une performance, d'une transparence et d'une sécurité élevées.

Conformément à l'engagement de l'entreprise en faveur de l'IA open-source, les modèles Granite sont publiés sous la licence permissive Apache 2.0, ce qui les rend uniques dans la combinaison des performances, de la flexibilité et de l'autonomie qu'ils offrent aux entreprises clientes et à la communauté dans son ensemble.

La famille Granite 3.0 d'IBM comprend :

Usage général/langage : Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
Garde-fous et sécurité : Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
Mélange d'experts : Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

Les nouveaux modèles linguistiques Granite 3.0 8B et 2B sont conçus comme des modèles de base pour l'IA d'entreprise, offrant d'excellentes performances pour des tâches telles que la Génération Augmentée par Récupération (RAG), la classification, le résumé, l'extraction d'entités et l'utilisation d'outils. Ces modèles compacts et polyvalents sont conçus pour être affinés avec les données de l'entreprise et intégrés de manière transparente dans divers environnements professionnels ou flux de travail.

Alors que de nombreux modèles linguistiques de grande taille (LLM) sont formés sur des données accessibles au public, une grande majorité des données d'entreprise reste inexploitée. En combinant un petit modèle Granite avec des données d'entreprise, notamment en utilisant la technique d'alignement révolutionnaire InstructLab - introduite par IBM et RedHat en mai, IBM pense que les entreprises peuvent obtenir des performances spécifiques à une tâche qui rivalisent avec les grands modèles à une fraction du coût (sur la base d'une fourchette observée de 3x à 23x moins de coûts que les grands modèles frontières dans plusieurs preuves de concept ^{préliminaires1}).

La version 3.0 de Granite réaffirme l'engagement d'IBM en faveur de la transparence, de la sécurité et de la confiance dans les produits d'IA. Le Rapport technique Granite 3.0 et le guide d'utilisation responsable fournissent une description des ensembles de données utilisés pour entraîner ces modèles, des détails sur les étapes de filtrage, de nettoyage et de curation appliquées, ainsi que des résultats complets sur les performances des modèles dans les principales références universitaires et d'entreprise.

IBM fournit une indemnité de propriété intellectuelle pour tous les modèles Granite sur watsonx.ai afin que les entreprises clientes puissent fusionner leurs données avec les modèles en toute confiance.

Relever la barre : Points de référence Granite 3.0

Les modèles linguistiques Granite 3.0 affichent également des résultats prometteurs en termes de performances brutes.

Sur les critères de référence académiques standard définis par l'OpenLLM Leaderboard de Hugging Face, les performances globales du modèle Granite 3.0 8B Instruct sont en moyenne supérieures aux performances de pointe des modèles open source de taille similaire de Meta et Mistral. Sur le benchmark de sécurité AttaQ d'IBM, le modèle Granite 3.0 8B Instruct est en tête sur toutes les dimensions de sécurité mesurées par rapport aux modèles de Meta et Mistral^.2

Dans les tâches fondamentales de l'entreprise (RAG, utilisation d'outils) et dans les tâches du domaine de la cybersécurité, le modèle Granite 3.0 8B Instruct affiche en moyenne les meilleures performances par rapport aux modèles open source de taille similaire de Mistral et Meta^.3

Les modèles Granite 3.0 ont été entraînés sur plus de 12 trillions de tokens sur des données provenant de 12 langues naturelles différentes et de 116 langages de programmation différents, en utilisant une nouvelle méthode d'entraînement en deux étapes, tirant parti des résultats de plusieurs milliers d'expériences conçues pour optimiser la qualité des données, la sélection des données et les paramètres d'entraînement. D'ici à la fin de l'année, les modèles linguistiques 3.0 8B et 2B devraient inclure la prise en charge d'une fenêtre contextuelle étendue de 128K et des capacités de compréhension de documents multimodaux.

Démontrant un excellent équilibre entre performance et coût d'inférence, IBM propose ses modèles Granite Mixture of Experts (MoE) Architecture, Granite 3.0 1B-A400M et Granite 3.0 3B-A800M, en tant que modèles plus petits et plus légers pouvant être déployés pour des applications à faible latence ainsi que pour des déploiements basés sur l'unité centrale.

IBM annonce également une mise à jour de ses modèles pré-entraînés Granite Time Series, dont les premières versions ont été publiées au début de l'année. Ces nouveaux modèles sont entraînés sur 3 fois plus de données et offrent d'excellentes performances sur les trois principaux benchmarks de séries temporelles, surpassant des modèles 10 fois plus grands de Google, Alibaba et d'autres. Les modèles mis à jour offrent également une plus grande flexibilité de modélisation grâce à la prise en charge de variables externes et de prévisions glissantes^.4

Présentation de Granite Guardian 3.0 : l'avènement de la prochaine ère de l'IA responsable

Dans le cadre de cette version, IBM introduit également une nouvelle famille de modèles Granite Guardian qui permettent aux développeurs d'applications de mettre en place des garde-fous en vérifiant les invites utilisateur et les réponses LLM pour une variété de risques. Les modèles Granite Guardian 3.0 8B et 2B offrent l'ensemble le plus complet de capacités de détection des risques et des dommages disponibles sur le marché aujourd'hui.

Outre les dimensions de préjudice telles que les préjugés sociaux, la haine, la toxicité, le blasphème, la violence, le piratage de prison et bien d'autres, ces modèles fournissent également une gamme de vérifications uniques spécifiques au RAG, telles que le fondement, la pertinence du contexte et la pertinence de la réponse. Lors de tests approfondis portant sur 19 critères de sécurité et RAG, le modèle Granite Guardian 3.0 8B a une précision globale plus élevée sur la détection des dommages en moyenne que les trois générations de modèles Llama Guard de Meta. Il affiche également des performances globales équivalentes à celles des modèles spécialisés WeCheck et MiniCheck pour la détection des hallucinations^.5

Bien que les modèles Granite Guardian soient dérivés des modèles de langage Granite correspondants, ils peuvent être utilisés pour mettre en œuvre des garde-fous avec n'importe quel modèle d'IA ouvert ou propriétaire.

Disponibilité des modèles Granite 3.0

L'ensemble des modèles Granite 3.0 et les modèles de séries temporelles mis à jour peuvent être téléchargés sur HuggingFace sous la licence permissive Apache 2.0. Les variantes d'instruction des nouveaux modèles linguistiques Granite 3.0 8B et 2B et les modèles Granite Guardian 3.0 8B et 2B sont disponibles dès aujourd'hui pour une utilisation commerciale sur la plateforme watsonx d'IBM. Une sélection de modèles Granite 3.0 sera également disponible en tant que microservices NVIDIA NIM et via les intégrations Vertex AI Model Garden de Google Cloud avec HuggingFace.

Pour faciliter le choix et l'utilisation des développeurs et prendre en charge les déploiements locaux, un ensemble de modèles Granite 3.0 est également disponible sur Ollama et Replicate.

La dernière génération de modèles Granite élargit le solide catalogue open-source d'IBM de LLM puissants. IBM a collaboré avec partenaires de l'écosystème comme AWS, Docker, Domo, Qualcomm Technologies, Inc. via son Qualcomm® AI Hubsalesforce, SAPet d'autres pour intégrer une variété de modèles Granite dans les offres de ces partenaires ou rendre les modèles Granite disponibles sur leurs plateformes, offrant ainsi un plus grand choix aux entreprises du monde entier.

Des assistants aux agents : réaliser l'avenir de l'IA d'entreprise

IBM fait progresser l'IA d'entreprise grâce à un éventail de technologies - des modèles et des assistants aux outils nécessaires pour régler et déployer l'IA spécifiquement pour les données et les cas d'utilisation uniques des entreprises. IBM ouvre également la voie à de futurs agents d'IA capables de s'autogérer, de réfléchir et d'effectuer des tâches complexes dans des environnements professionnels dynamiques.

IBM continue de faire évoluer son portefeuille de technologies d'assistants d'IA - de watsonx Orchestrate, qui aide les entreprises à créer leurs propres assistants grâce à des outils à code bas et à l'automatisation, à un large éventail d'assistants préconstruits pour des tâches et des domaines spécifiques tels que le service client, les ressources humaines, les ventes et le marketing. Des organisations du monde entier ont utilisé watsonx Assistant pour les aider à créer des assistants IA pour des tâches telles que répondre aux questions courantes des clients ou des employés, moderniser leurs ordinateurs centraux et leurs anciennes applications informatiques, aider les étudiants à explorer les carrières potentielles, ou fournir une assistance numérique en matière d'hypothèque pour les acheteurs de maison.

Aujourd'hui, IBM a également dévoilé la prochaine version de la nouvelle génération de watsonx Code Assistantqui s'appuie sur les modèles de code Granite, pour offrir une assistance au codage généraliste dans des langages tels que C, C++, Go, Java et Python, avec des capacités avancées de modernisation des applications pour les applications Java d'entreprise^.6 Les capacités de code de Granite sont également désormais accessibles par le biais d'une extension Visual Studio Code, IBM Granite.Code.

IBM prévoit également de publier de nouveaux outils pour aider les développeurs à construire, personnaliser et déployer l'IA plus efficacement via watsonx.ai - y compris des cadres agentiques, des intégrations avec des environnements existants et des automatisations à code bas pour des cas d'utilisation courants tels que RAG et les agents^.7

IBM se concentre sur le développement de technologies d'agents d'IA capables d'une plus grande autonomie, d'un raisonnement sophistiqué et d'une résolution de problèmes en plusieurs étapes. La version initiale du modèle Granite 3.0 8B prend en charge des capacités agentiques clés, telles que le raisonnement avancé, un modèle de chat hautement structuré et un style d'invite pour la mise en œuvre de flux de travail d'utilisation d'outils. IBM prévoit également d'introduire une nouvelle fonction de chat d'agent d'IA dans IBM watsonx Orchestrate, qui utilise des capacités agentiques pour orchestrer des assistants d'IA, des compétences et des automatisations qui aident les utilisateurs à accroître la productivité au sein de leurs équipes^.8 IBM prévoit de continuer à développer des capacités d'agent dans l'ensemble de son portefeuille en 2025, y compris des agents préconstruits pour des domaines et des cas d'utilisation spécifiques.

Une plateforme de livraison élargie alimentée par l'IA pour suralimenter les consultants IBM avec l'IA

IBM annonce également annonce également une expansion majeure de sa plateforme de livraison alimentée par l'IA, IBM Consulting Advantage. La plateforme multi-modèle contient des agents, des applications et des méthodes d'IA comme des cadres reproductibles qui peuvent permettre à 160 000 consultants d'IBM de fournir une valeur client meilleure et plus rapide à moindre coût.

Dans le cadre de cette expansion, les modèles linguistiques Granite 3.0 deviendront le modèle par défaut dans Consulting Advantage. En s'appuyant sur les performances et l'efficacité de Granite, IBM Consulting sera en mesure d'aider à maximiser le retour sur investissement des projets d'IA générative des clients d'IBM.

Un autre élément clé de l'expansion est l'introduction d'IBM Consulting Advantage for Cloud Transformation and Management et d'IBM Consulting Advantage for Business Operations. Chacun comprend des agents, des applications et des méthodes d'IA spécifiques à un domaine, infusés avec les meilleures pratiques d'IBM afin que les consultants d'IBM puissent aider à accélérer les transformations du cloud et de l'IA des clients dans les tâches, telles que la modernisation du code et l'ingénierie de la qualité, ou transformer et exécuter des opérations dans des domaines, tels que la finance, les ressources humaines et l'approvisionnement.

Pour en savoir plus sur Granite et sur la stratégie AI for Business d'IBM, consultez le site suivant www.ibm.com/granite.

¹ Les calculs de coûts sont basés sur le coût de l'API par million de jetons d'IBM watsonx pour les modèles ouverts et d'openAI pour les modèles GPT4 (en supposant un mélange de 80 % d'entrées et de 20 % de sorties) pour les preuves de concept des clients.
2 Document technique d'IBM Research : Modèles linguistiques Granite 3.0
³ Document technique d'IBM Research : Modèles linguistiques Granite 3.0
⁴ Le Tiny Time Mixer : Modèles pré-entraînés rapides pour l'amélioration des prévisions de zéro/petit coup sur les séries temporelles multivariées
⁵ Résultats de l'évaluation publiés dans Granite Guardian GitHub Repo
⁶ Disponibilité prévue pour le quatrième trimestre 2024
7 Disponibilité prévue pour le quatrième trimestre 2024
8 Disponibilité prévue pour le premier trimestre 2025