Google annonce les nouveaux modèles de langage visuel PaliGemma 2
Google a annoncé la suite du modèle de langue visuelle PaliGemma lancé en mai 2024. PaliGemma 2 est disponible en plusieurs tailles allant de 3 milliards de paramètres à 28 milliards et en différentes résolutions allant jusqu'à 896px.
La société affirme que le modèle affiche "des performances de premier plan en matière de reconnaissance de formules chimiques, de reconnaissance de partitions musicales, de raisonnement spatial et de génération de rapports de radiographie thoracique"
Il dispose également de capacités de sous-titrage longues avec "des légendes détaillées et contextuelles pour les images, allant au-delà de la simple identification des objets pour décrire les actions, les émotions et la narration globale de la scène"
Les nouveaux modèles seront proposés en tant que "remplacement direct" dans plusieurs tailles sans "modifications majeures du code" Les modèles pré-entraînés sont disponibles sur Hugging Face et Kaggle et peuvent être téléchargés et testés gratuitement par tous. Il prend également en charge de nombreux cadres, notamment Hugging Face Transformers, Keras, PyTorch, JAX et Gemma.cpp.
Selon Google, la "flexibilité de PaliGemma 2 permet un réglage précis pour des tâches et des ensembles de données spécifiques, ce qui vous permet d'adapter ses capacités à vos besoins précis"
Source(s)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs