Notebookcheck Logo

Open NotebookLM adopte une approche open-source pour convertir les PDF en podcasts.

Open NotebookLM (Image Source : gabrielchua on Hugging face)
Open NotebookLM (Image Source : gabrielchua on Hugging face)
Le développeur Gabriel Chua a publié sa réponse au convertisseur de PDF en podcast de Google, notebookLM, de plus en plus populaire. Open NotebookLM reproduit les capacités de Google en combinant plusieurs modèles open-source.

Pour ceux qui ne connaissent pas l'expérience de Google en matière d'IA, NotebookLM est une plateforme d'assistant de recherche qui prend en charge les documents téléchargés par l'utilisateur et utilise Gemini 1.5 pro pour offrir une première approche de prise de notes afin d'interagir avec les informations trouvées dans le document. NotebookLM génère un résumé de tous les documents téléchargés dans le carnet de l'utilisateur et permet à ce dernier de poser des questions sur le matériel. Une fois l'information traitée, NotebookLM répond en citant les documents téléchargés. Cependant, la fonction la plus impressionnante est la possibilité de générer des podcasts à partir des documents téléchargés. Le podcast généré par Gemini reprend les informations sélectionnées par l'IA dans les documents. Il crée un fichier audio d'une discussion entre deux intervenants sur des sujets trouvés dans les documents, avec des clips audio d'une durée comprise entre cinq et trente minutes. Cependant, certains utilisateurs peuvent hésiter à télécharger des documents dans un LLM propriétaire, et c'est là que Open NotebookLM se distingue.

Doté d'une interface utilisateur simple et directe, Open NotebookLM a été conçu à l'aide de divers modèles open-source et de synthèse vocale pour transformer les PDF en podcasts. Pour traiter le PDF, Open NotebookLM utilise Llama 3.1 avec une limite de 100 000 caractères. Bien qu'il ne soit pas aussi performant que Gemini, MeloTTS fournit de bonnes performances de synthèse vocale pour le projet, et les utilisateurs peuvent ajuster le ton de l'IA entre "amusant" et "formel" En outre, Open NotebookLM prend en charge un peu plus de dix langues, dont l'espagnol, le français et l'allemand. Actuellement, les utilisateurs peuvent essayer le projet sur la page Hugging face de Chua ou le construire localement à partir des ressources disponibles sur le repo GitHub du projet.

Source(s)

Gabriel Chua sur Hugging face et sur Github

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2024 10 > Open NotebookLM adopte une approche open-source pour convertir les PDF en podcasts.
Stephen Pereyra, 2024-10- 2 (Update: 2024-10- 2)