Dlaczego A.I. Może walczyć, aby zrozumieć język arabski

$config[ads_kvadrat] not found

[EN SUB] JĘZYK ARABSKI - Jak to brzmi? ♪♪♪ Głoski i ich wymowa | نطق اللغة العربية

[EN SUB] JĘZYK ARABSKI - Jak to brzmi? ♪♪♪ Głoski i ich wymowa | نطق اللغة العربية
Anonim

W świecie sztucznej inteligencji dane są królem. Im więcej masz, tym lepsze stają się Twoje narzędzia, ponieważ systemy „uczą się” więcej o tym, czego się spodziewać. Ale w zależności od platformy A.I. według danych Miriam Redi, naukowca z Yahoo Labs, rysuje dane, niektóre języki mogą być lepiej reprezentowane niż inne.

„Na przykład tak jak Flickr, skąd bierzemy nasze dane, niektóre języki są bardzo mało reprezentowane”, powiedział Redi, przemawiając na londyńskim Deep Learning Summit w czwartek. „Mamy więc angielski, miliony obrazów w języku angielskim, ale mamy może 100 000 na arabski”.

Zespół Redi pracuje nad narzędziem, które może zidentyfikować niewidoczne elementy do obrazów, takich jak wartości kulturowe i konotacje emocjonalne. Narzędzie analizuje tekst dołączony do publicznie dostępnych zdjęć w serwisie Flickr. Z biegiem czasu A.I. zaczyna rozumieć, dlaczego ktoś może oznaczyć obraz „happy party” lub „awkward moment”, ale te pomysły będą coraz bardziej dokładne, ponieważ narzędzie analizuje więcej obrazów.

„Niestety dokładność wykrywania sentymentu w obrazach w językach arabskich jest zazwyczaj niższa, ponieważ nie mamy wystarczającej ilości danych” - powiedział Redi.

W językach, które miały większe ilości danych, zespół Redi zauważył kilka interesujących wzorów. Języki romańskie, takie jak francuski i hiszpański, mają tendencję do wyrażania siebie w podobny sposób, podczas gdy włoski wydają się być jedynym językiem, w którym użytkownicy identyfikują obrazy z terminem „oszustwa podatkowe”.

Bariery językowe nadal stanowią problem dla A.I. naukowcy. Każdy, kto używał Tłumacza Google, będzie wiedział, że przełączanie języków nigdy nie jest tak proste, jak się wydaje. Jednak nowe wydarzenia zmieniają się, a Facebook ogłasza latem, że zbliża się do marzenia o jednoukładowej sieci społecznościowej, automatycznie tłumaczącej teksty dla użytkowników.

Rozwój w usuwaniu barier językowych może pomóc w promowaniu komunikacji międzynarodowej, ale w przypadku projektów takich jak Redi nie ma prawdziwego substytutu danych generowanych przez ludzi.

$config[ads_kvadrat] not found