Google Live Transcribe: Mieliśmy aplikację Posłuchaj Justina Biebera i Twisty

Konwersja nagrania z pliku m4a na tekst

Konwersja nagrania z pliku m4a na tekst

Spisu treści:

Anonim

Google opublikowało we wtorek ograniczoną wersję beta aplikacji do pobrania dla prawników, dziennikarzy i studentów. Live Transcribe twierdzi, że jest w stanie skrupulatnie rejestrować każde słowo wypowiedziane w rozmowie, wywiadzie lub nawet rapie.

Oprogramowanie zostało zaprojektowane specjalnie z myślą o niesłyszących i niedosłyszących, ale ten przykład projektowania włączającego otworzył drzwi do wielu zastosowań. Robi szaleńczo notowanie zadania dla algorytmu rozpoznawania mowy Google i pozostawia użytkownikowi swobodę skupienia się na głośniku.

Nawet płatne usługi transkrypcji mogą być obarczone błędami, a jako usługa nowa w wersji beta założyliśmy, że nowe narzędzia do transkrypcji Google będą zawierały pewne błędy. Aby zidentyfikować niedociągnięcia, Odwrotność postanowił przenieść go przez dzwonek, próbując transkrybować „Overnight Celebrity” Twisty i teksty Spanglish w remiksie „Despacito” Luisa Fonsiego i Justina Biebera. Wyniki były z pewnością imponujące, ale podkreśliły pewne pole do poprawy, zanim naprawdę będziesz mógł zaufać swojemu smartfon, aby być doskonałym notatorem.

Oprogramowanie jest fabrycznie zainstalowane na smartfonach Pixel 3 i będzie stopniowo wprowadzane na inne telefony z systemem Android i urządzenia z systemem iOS w nieokreślonym czasie. Zainteresowani użytkownicy mogą zarejestrować się, aby otrzymywać powiadomienia o tym, kiedy staną się bardziej dostępne.

Transkrypcja na żywo: to nie jest demon szybkości

Ludzie rozmawiają szybko, a czasem bezładnie, więc aby sprawdzić, jak zdolny jest transkrypcja na żywo w profesorze motoryzacji, próbowaliśmy napisać tekst Twista. Raper z Chicago znany jest z szybkich rymów, dzięki którym „Overnight Celebrity” wydaje się idealnym testem stresu dla aplikacji.

Transkrybowanie na żywo rozpoczęło się dobrze, ale wkrótce zaczęło pomijać zawrotne pasy MC, ale nie poddało się. Napisał wiersz „Czy może ją zabić, 2000 i 3”, „Mogę wpisać trzy, brzmi trzy”.

Jakość transkrypcji szybko uległa pogorszeniu, aw połowie wersetu całkowicie się zagubiła i po prostu przestała transkrybować. Wyglądało to jak A.I. wstrzymano, gdy tekst dotarł do dolnej części ekranu. Nie jest jasne, czy A.I. Myślałam, że transkrypcja się skończyła, albo po prostu została zaostrzona przez test stresu i rozbił się.

Google nie od razu odrzucił prośbę o komentarz.

Transkrypcja na żywo: nie obsługuje rozmów dwujęzycznych

Remiks „Despacito” zaowocował dokładniejszą transkrypcją angielskich tekstów, ale Live Transcribe został całkowicie rzucony na pętlę, kiedy Luis Fonsi zaczął śpiewać po hiszpańsku.

Ogłoszenie Google wyjaśnia, że ​​chociaż aplikacja była dostępna w ponad 70 językach i dialektach, na blogu nie była jeszcze w stanie obsłużyć dwóch jednocześnie. Przyszłe uaktualnienie, które to umożliwi, może sprawić, że transkrypcja na żywo będzie jeszcze bardziej przydatna w przypadku dwujęzycznych głośników, które wrócą i zmienią się w dwóch językach.