Microsoft Research Invents Better-Than-Human Speech Recognition

$config[ads_kvadrat] not found

Rozpoznawanie mowy polskiej - Jak działa SkryBot?

Rozpoznawanie mowy polskiej - Jak działa SkryBot?
Anonim

Microsoft stał się pierwszą na świecie firmą, która opracowała oprogramowanie do rozpoznawania mowy, które jest bardziej dokładne niż ludzie. W artykule „Osiągnięcie ludzkiej równości w rozmowie z konwersacją” opublikowanym w poniedziałek, oprogramowanie wyprodukowało transkrypcje, które zawierały o połowę mniej błędów niż ludzkie wysiłki, co jest niesamowite, biorąc pod uwagę, jak dobrzy ludzie rozumieją mowę. Przełom otwiera drzwi do nowego A.I. asystenci, którzy są bardziej dokładni niż kiedykolwiek wcześniej.

To imponujące, jak dalece technologia ta pojawiła się w tak krótkim czasie. Nie tak dawno temu rozpoznawanie mowy komputerowej było dziwną niszą, która wydawała się beznadziejnie odległa. Obejrzyj prezentację oprogramowania głosowego systemu Windows Vista z 2006 r.:

Zespół wykorzystał test National Institute of Standards and Technology (NIST) 2000, wykorzystywany w przemyśle do pomiaru wiarygodności transkrypcji mowy. Rozmowa odbywa się między dwoma uczestnikami przez telefon, po kolei, zanim wynikowy skrypt zostanie porównany i sprawdzony pod kątem pisowni słownika.

W części centrali telefonicznej, gdzie dwóch nieznajomych mówi po raz pierwszy, wskaźnik błędu ludzkiego wynosi około 5,9 procent, podczas gdy w części domowej połączenia, gdzie dwie osoby znają się nawzajem, wskaźnik błędu wynosi około 11,3 procent. Oprogramowanie Microsoftu uzyskało około 0,4 procent niższy poziom błędu.

Przełom pomoże wprowadzić nowe formy wciągającego A.I.. W sierpniu student Joshua Browder zdjął okładki swojego chatbota DoNotPay, który może pomóc bezdomnym w uzyskaniu bezpłatnej porady prawnej. W połączeniu z postępem w rozpoznawaniu łatwo jest wyobrazić sobie przyszłość, w której ludzie proszą wirtualnego asystenta o pomoc w utrzymaniu mieszkania, przeprowadzając regularną rozmowę z komputerem.

Na tym etapie naukowcy zastanawiają się, w jaki sposób rozpoznawanie mowy w oparciu o A.I. może dać mądrzejsze odpowiedzi. Sensay, wykrywający gniew A.I. z laboratorium Siri korzysta z zaawansowanych funkcji rozpoznawania, aby wykryć, czy użytkownik czuje się zły lub zmieszany, zmieniając odpowiedzi w zależności od sytuacji. Usunięcie bariery podatnego na błędy rozpoznawania głosu tworzy nowe, ekscytujące możliwości wirtualnej pomocy.

$config[ads_kvadrat] not found