Microsoft Research Invents Better-Than-Human Speech Recognition

Rozpoznawanie mowy polskiej - Jak działa SkryBot?

Microsoft stał się pierwszą na świecie firmą, która opracowała oprogramowanie do rozpoznawania mowy, które jest bardziej dokładne niż ludzie. W artykule „Osiągnięcie ludzkiej równości w rozmowie z konwersacją” opublikowanym w poniedziałek, oprogramowanie wyprodukowało transkrypcje, które zawierały o połowę mniej błędów niż ludzkie wysiłki, co jest niesamowite, biorąc pod uwagę, jak dobrzy ludzie rozumieją mowę. Przełom otwiera drzwi do nowego A.I. asystenci, którzy są bardziej dokładni niż kiedykolwiek wcześniej.

To imponujące, jak dalece technologia ta pojawiła się w tak krótkim czasie. Nie tak dawno temu rozpoznawanie mowy komputerowej było dziwną niszą, która wydawała się beznadziejnie odległa. Obejrzyj prezentację oprogramowania głosowego systemu Windows Vista z 2006 r.:

Zespół wykorzystał test National Institute of Standards and Technology (NIST) 2000, wykorzystywany w przemyśle do pomiaru wiarygodności transkrypcji mowy. Rozmowa odbywa się między dwoma uczestnikami przez telefon, po kolei, zanim wynikowy skrypt zostanie porównany i sprawdzony pod kątem pisowni słownika.

W części centrali telefonicznej, gdzie dwóch nieznajomych mówi po raz pierwszy, wskaźnik błędu ludzkiego wynosi około 5,9 procent, podczas gdy w części domowej połączenia, gdzie dwie osoby znają się nawzajem, wskaźnik błędu wynosi około 11,3 procent. Oprogramowanie Microsoftu uzyskało około 0,4 procent niższy poziom błędu.

Przełom pomoże wprowadzić nowe formy wciągającego A.I.. W sierpniu student Joshua Browder zdjął okładki swojego chatbota DoNotPay, który może pomóc bezdomnym w uzyskaniu bezpłatnej porady prawnej. W połączeniu z postępem w rozpoznawaniu łatwo jest wyobrazić sobie przyszłość, w której ludzie proszą wirtualnego asystenta o pomoc w utrzymaniu mieszkania, przeprowadzając regularną rozmowę z komputerem.

Na tym etapie naukowcy zastanawiają się, w jaki sposób rozpoznawanie mowy w oparciu o A.I. może dać mądrzejsze odpowiedzi. Sensay, wykrywający gniew A.I. z laboratorium Siri korzysta z zaawansowanych funkcji rozpoznawania, aby wykryć, czy użytkownik czuje się zły lub zmieszany, zmieniając odpowiedzi w zależności od sytuacji. Usunięcie bariery podatnego na błędy rozpoznawania głosu tworzy nowe, ekscytujące możliwości wirtualnej pomocy.

Dlaczego Mston Graduation Speech Winstona Churchilla nadal rezonuje

W 1949 r. - około 66 lat przed ukończeniem studiów - Winston Churchill został zaproszony do wygłoszenia przemówienia programowego podczas zwołania MIT w połowie wieku. Odbywające się w samym środku berlińskiej blokady, jego rozległa, wspaniała mowa skondensowała pięćdziesiąt lat historii świata w dokładną i ostrożną analizę fledgli ...

Hillary Clinton Impression Perfected Via Facial Recognition Iana McKellena

Naukowcy z University of Washington zademonstrowali oprogramowanie, które pozwala im (między innymi) brać słowa i wyrażenia byłego prezydenta George'a W. Busha i opracować model 3D prezydenta Baracka Obamy. Oprogramowanie wykorzystuje stare zdjęcia (wiele z nich) i wideo do mapowania twarzy, ale co bardzo ...

Negan ma zamiar podbić „The Walking Dead” Beyond Recognition

The Walking Dead zawsze naznaczony był ponurym tonem, a nawet antagoniści o najbardziej niepokojących naturach - Gubernator, Meryl, Gareth i Łowcy - ranili innych, aby przeżyć. Nawet gubernator, który przez ponad dwa sezony zajmował The Walking Dead jako jego mieszkaniec Baddie, miał choćby warp ...

$config[ads_kvadrat] not found