Notebookcheck Logo

Whisperfile de l'équipe Mozilla Ocho offre une ASR locale et facile

projet llamafile (Source de l'image : Mozilla)
projet llamafile (Source de l'image : Mozilla)
L'équipe de Mozilla, connue pour ses innovations et ses expérimentations, a intégré le système de reconnaissance vocale automatique Whisper d'OpenAI dans son projet llamafile. Ce projet vise à fournir des modèles de langage de grande taille adaptés au matériel local dans un fichier exécutable unique. La possibilité d'exécuter localement un logiciel de transcription peut être utile aux utilisateurs soucieux de la protection de la vie privée qui souhaitent transcrire des fichiers audio sensibles.

Pour ceux qui ne connaissent pas le projet llamafile l'équipe Mozilla Ocho travaille à supprimer la complexité entourant l'installation des LLM en combinant llama.cpp et Cosmopolitan Libc, qui utilisent tous deux le langage de programmation C/C++. Llamafile utilise l'inférence de Meta's LLaMA de Meta fournie par llama.cpp et l'associe à la transformation build-once run-anywhere de C par Cosmopolitan Libc. Cosmopolitan Libc supprime également la nécessité d'un interpréteur ou d'une machine virtuelle pour exécuter le langage C sur les machines Linux, Mac et Windows.

Le dernier ajout au projet llamafile, Whisperfilea été présenté en détail sur le profil Hugging Face de Mozilla. Selon cette page, "Whisperfile est une implémentation haute performance de la technologie OpenAI Whisper d'OpenAI, créée par Mozilla Ocho dans le cadre du projet llamafile et basée sur le logiciel whisper.cpp écrit par Georgi Gerganov, et al Pour le projet, l'équipe a regroupé tous les poids nécessaires au modèle dans des "whisperfiles" qui conservent les caractéristiques de Cosmopolitan Libc, ce qui permet au modèle de fonctionner sur la plupart des systèmes.

La documentation "Getting Started with Whisperfile" sur le profil GitHub de l'équipe détaille un processus d'installation simple composé de seulement trois étapes. Une fois que l'utilisateur a téléchargé le modèle, construit le logiciel et exécuté le programme, il peut choisir parmi trois modèles différents pour commencer à transcrire de l'audio. Les modèles vont du plus petit au plus grand, la vitesse étant échangée contre la précision dans le processus de transcription. En outre, Whisperfile peut traduire différentes langues en anglais en utilisant le modèle multilingue et l'option "--translate".

Pour plus d'informations sur llamafile, Whisperfile, et des détails supplémentaires sur le processus d'installation, veuillez visiter les ressources ci-dessous.

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 08 > Whisperfile de l'équipe Mozilla Ocho offre une ASR locale et facile
Stephen Pereyra, 2024-08-23 (Update: 2024-08-23)