NotebookLM : le générateur de podcasts IA de Google parle désormais 50 langues

NotebookLM transforme désormais vos documents en podcasts dans 50 langues ! Découvrez comment cette IA de Google révolutionne l'audio.

NotebookLM : le générateur de podcasts IA de Google parle désormais 50 langues

L'outil d'intelligence artificielle de Google franchit une étape majeure en proposant ses résumés audio conversationnels dans plus de 50 langues, dont le français. Une révolution pour la consommation de contenu à l'international.

Google vient d'annoncer l'extension linguistique de la fonctionnalité "Résumé audio" (Audio Overviews) de NotebookLM. Cette fonction transforme instantanément n'importe quel document en conversation audio de type podcast, et prend désormais en charge plus de 50 langues — de l'afrikaans au turc, en passant par l'hindi et le français.

Des laboratoires Google à l'international

Initialement baptisé "Project Tailwind" lors de sa présentation à la Google I/O 2023, NotebookLM est né comme un projet expérimental au sein des laboratoires de Google. D'abord limité au marché américain, l'outil s'est progressivement déployé dans plus de 200 pays durant l'année 2024.

La fonction "Résumé audio" a fait son apparition à l'automne 2024, rencontrant immédiatement un vif succès auprès des utilisateurs anglophones. Ce qui n'était alors qu'un assistant documentaire est devenu un puissant outil de transformation de contenu, capable de synthétiser et d'animer des informations complexes sous forme de conversations audio naturelles.

Bien plus qu'une simple lecture de texte

Contrairement aux systèmes classiques de synthèse vocale, la technologie derrière NotebookLM crée une véritable discussion entre deux animateurs virtuels. Ces voix analysent, résument et échangent sur le contenu de manière dynamique, comme le feraient de véritables présentateurs de podcast.

L'utilisation est d'une simplicité remarquable : l'utilisateur importe ses documents (PDF, présentations, liens YouTube ou pages web) dans NotebookLM, puis clique sur "Générer" dans la section "Résumé audio" du panneau Studio. Après quelques minutes de traitement, l'IA produit un fichier audio où deux voix distinctes discutent des points essentiels du contenu d'origine.

Ces conversations générées durent généralement entre 5 et 15 minutes selon la complexité des documents sources. Les voix synthétiques atteignent un niveau de naturel surprenant, avec des intonations adaptées et parfois même une subtile dose d'humour.

Des applications concrètes pour un monde multilingue

Cette extension linguistique ouvre la voie à des usages novateurs dans de nombreux domaines :

Pour les équipes internationales, la fonctionnalité facilite le partage d'informations entre collaborateurs parlant différentes langues. Des rapports techniques, analyses de marché ou évaluations de concurrents peuvent être téléchargés dans leur langue d'origine puis transformés en format audio dans la langue préférée de chaque auditeur.

Les enseignants peuvent désormais créer des supports pédagogiques multilingues en combinant des ressources diverses — comme un documentaire en portugais, un article scientifique en espagnol et des rapports en anglais — pour les convertir en un résumé audio cohérent dans la langue de leur choix.

Pour les étudiants confrontés à des cours complexes, il suffit de télécharger les supports de cours pour générer un résumé conversationnel facilitant la mémorisation et la compréhension. Ce format "podcast" peut être écouté pendant les déplacements ou d'autres activités quotidiennes.

Une personnalisation linguistique flexible

Par défaut, les résumés audio sont générés dans la langue configurée pour le compte Google de l'utilisateur. Toutefois, cette mise à jour introduit également une nouvelle option "Langue de sortie" dans les paramètres de NotebookLM, permettant de changer de langue à tout moment.

Pour modifier la langue, il suffit d'accéder à Paramètres > Langue de sortie > Définir la langue, depuis le menu supérieur droit de l'interface. Google précise néanmoins que le support des langues non anglophones est encore en version bêta et pourrait présenter quelques imperfections.

Au-delà du choix linguistique, les utilisateurs peuvent également ajouter une "instruction directrice" (steering prompt) pour orienter la conversation audio vers un aspect spécifique du contenu, avec une limite fixée à 500 caractères.

L'avenir de l'information audio personnalisée

Google présente cette extension linguistique comme "un premier aperçu des possibilités offertes par cette fonctionnalité" et prévoit de poursuivre le développement de l'outil en fonction des retours utilisateurs. Si la technologie actuelle impressionne déjà, certaines limitations demeurent : les utilisateurs ne peuvent pas encore ajuster le nombre d'intervenants, leurs caractéristiques démographiques, leurs accents ou la durée précise des conversations.

Cette évolution s'inscrit dans une tendance plus large d'applications d'IA rendant l'information plus accessible et plus facile à consommer. Dans un monde où le volume de données augmente de façon exponentielle, ces outils permettent de rester informé tout en surmontant les barrières linguistiques qui ont longtemps fragmenté notre paysage numérique.