![L’impressionnant Live Caption de Google ajoutera des sous-titres à tous les fichiers audio de votre téléphone. - Nouvelles L’impressionnant Live Caption de Google ajoutera des sous-titres à tous les fichiers audio de votre téléphone. - Nouvelles](https://a.23rdpta.org/news/googles-impressive-live-caption-will-add-subtitles-to-any-audio-on-your-phone-1.jpg)
Contenu
L'un des grands thèmes du discours d'ouverture de Google I / O 2019 était l'inclusivité. Une nouvelle fonctionnalité d'Android Q vise à améliorer l'inclusivité pour les personnes sourdes et malentendantes en offrant des sous-titres instantanés pour pratiquement tout type d'audio ou de vidéo lu sur un téléphone.
Appelée Live Caption, cette fonctionnalité utilise l'IA pour traduire les paroles lues sur un smartphone en sous-titres rapides et précis. La beauté de cette fonctionnalité réside dans le fait que cette fonctionnalité fonctionne avec toutes les applications, qu’elle lise de la musique ou du son, que le contenu soit diffusé depuis un serveur, lu depuis une mémoire de stockage locale ou généré à la volée par un humain.
Google Pixel 3a XL Review: Venez pour la caméra, restez pour l'expérience
Live Caption fonctionne avec des podcasts, des vidéos, de l'audio et des applications de chat vidéo comme Duo. La démonstration que nous avons vue sur la scène du discours de Google I / O semblait très fluide et impressionnante, bien que les résultats réels puissent varier.
Un sous-clic sera accessible en un clic: les utilisateurs pourront l'activer en cliquant sur une nouvelle icône visible lors du changement de volume du système. Tout est traité localement, ce qui signifie que vous n'avez pas à vous soucier des tiers qui écoutent vos conversations.
Les sous-titres sont affichés dans une fenêtre noire superposée au-dessus de l'interface normale. Les légendes ne sont pas sauvegardées pour plus tard, vous ne les verrez donc que lorsque le fichier audio correspondant sera lu.
Live Caption fonctionne avec des podcasts, des vidéos, de l'audio et des applications de chat vidéo comme Duo.
Bien que les personnes sourdes puissent tirer le meilleur parti de cette nouvelle fonctionnalité, Live Caption a le potentiel d’être utile pour de nombreux autres utilisateurs, dans diverses situations. Cela fonctionne même lorsque le son est mis à zéro, permettant aux utilisateurs de consommer du contenu sans déranger personne.
Live Caption est une nouvelle fonctionnalité d’accessibilité intégrée à Android Q. Vous devez l’activer à partir des paramètres avant de l’utiliser. Il n’est pas clair pour l’instant si la fonctionnalité sera incluse par tous les constructeurs OEM sur leurs appareils Android Q.
Relais en direct
Bien que la possibilité de regarder des vidéos en mode muet soit plutôt cool, cela est également trivial par rapport à l’effet de changement de vie que la technologie du sous-titrage en direct pourrait avoir pour certaines personnes. Google a montré comment Live Caption, associé à ses fonctions Smart Reply et Smart Compose, qui avait fait ses débuts l’année dernière, peut aider les personnes qui ne savent pas parler à tenir une conversation. La technologie, appelée Live Relay, peut transformer la parole en texte écrit avec lequel les utilisateurs sourds peuvent facilement interagir. Ensuite, la réponse est transformée en voix synthétisée et transmise à la personne en bout de ligne.
Projet Euphonia
Les chercheurs de Google recherchent également des moyens d’entraîner des modèles de reconnaissance vocale à la compréhension de discours non standard, tels que ceux de personnes qui bégaient, subissent un AVC ou souffrent d’autres déficiences. L’objectif à long terme est de faire comprendre aux ordinateurs les millions de personnes atteintes de troubles de la parole ou qui ne peuvent même pas parler du tout.
Google a averti qu'il restait encore beaucoup à faire pour que la technologie fonctionne au service de tous. Le PDG, Sundar Pichai, a invité les personnes ayant une déficience de la parole à fournir des échantillons de parole qui aideront la société à concevoir des technologies de reconnaissance plus inclusives.
Restez à l'écoute pour en savoir plus sur Google I / O.