Googles imponerande Live Caption kommer att lägga till undertexter till alla ljud på din telefon

Författare: Laura McKinney
Skapelsedatum: 10 April 2021
Uppdatera Datum: 1 Juli 2024
Anonim
Googles imponerande Live Caption kommer att lägga till undertexter till alla ljud på din telefon - Nyheter
Googles imponerande Live Caption kommer att lägga till undertexter till alla ljud på din telefon - Nyheter

Innehåll


Ett av de stora teman för Google I / O 2019-öppningsnyckeln var inkludering. En ny funktion i Android Q syftar till att förbättra inkluderingen för personer som är döva och hörselskadade genom att erbjuda omedelbara bildtexter till nästan alla ljud eller videor som spelas på en telefon.

Funktionen kallas Live Caption och använder AI för att översätta tal som spelas upp på en smartphone till snabba, exakta bildtexter. Det vackra med det är att funktionen fungerar med alla appar, oavsett om den spelar ljud eller video, och oavsett om innehållet strömmas från en server, spelas från lokal lagring eller genereras i farten av en människa.

Google Pixel 3a XL-recension: Kom för kameran, stanna för upplevelsen

Live Caption fungerar med podcast, videor, ljud och videochatt-appar som Duo. Demo som vi såg på scenen för Google I / O-keynote verkade mycket smidig och imponerande, men uppenbarligen verkliga resultat kan variera.


Live Caption kommer att vara tillgängligt med ett tryck - användarna kan aktivera det genom att klicka på en ny ikon som är synlig när systemvolymen ändras. Allt bearbetas lokalt, vilket innebär att du inte behöver oroa dig för att tredjeparter lyssnar på dina samtal.

Bildtexter visas i ett svart fönster ovanpå det normala gränssnittet. Bildtexterna sparas inte för senare, så du ser dem bara när motsvarande ljud spelas upp.

Live Caption fungerar med podcast, videor, ljud och videochatt-appar som Duo.

Medan döva kan dra nytta av det mesta av denna coola nya funktion, har Live Caption potentialen att vara användbar för många andra användare, i en mängd olika situationer. Det fungerar till och med när ljudet ställs ner till noll, vilket gör att användare kan konsumera innehåll utan att störa någon i närheten.

Live Caption är en ny tillgänglighetsfunktion bakad i Android Q. Du måste aktivera den från inställningarna innan du använder den och det är inte klart för tillfället om funktionen kommer att inkluderas av alla OEM-apparater i deras Android Q-enheter.


Live relä

Även om förmågan att titta på videor på stum är ganska cool, är det också trivialt i jämförelse med den livsförändrande effekten levande bildteknik kan ha för vissa människor. Google visade hur Live Caption, i kombination med dess smarta svar och Smart Compose-funktioner som den först debuterade förra året, kan hjälpa människor som inte kan prata med konversationer. Tekniken, kallad Live Relay, kan förvandla tal till skriven text som döva användare lätt kan interagera med. Därefter förvandlas svaret till syntetiserad röst och vidarebefordras till personen i slutet av raden.

Projekt Euphonia

Genom att ta saker ett steg framåt söker Googles forskare också sätt att utbilda modeller för taligenkänning för att förstå icke-standarda tal, som de från personer som stammar, hade slag eller lider av andra funktionsnedsättningar. Det långsiktiga målet är att få datorer att förstå de miljoner människor där ute som har funktionshinder eller inte ens kan tala alls.

Google varnade för att det fortfarande krävs mycket arbete i denna strävan att få teknik att fungera för bokstavligen alla. VD Sundar Pichai bjöd in personer med talhinder att bidra med talprover som hjälper företaget att bygga mer inkluderande erkännande tekniker.

Håll ögonen öppna för mer från Google I / O.

HMD Global Nokia 7.1 har kommit för att locka o med ett annat trevligt marttelefonalternativ. Det har varit ett ganka bra år för mer privärda marknader, å Nokia 7.1 har en vi ...

Uppdatering 23 auguti 2019 (12:50 ET):Vi åg några praktika läckta bilder av Nokia 7.2 för några veckor edan, men nu har vi några nya bilder tack vareTechmeto....

Fascinerande Inlägg