[EN SUB] JĘZYK ARABSKI - Jak to brzmi? ♪♪♪ Głoski i ich wymowa | نطق اللغة العربية
W świecie sztucznej inteligencji dane są królem. Im więcej masz, tym lepsze stają się Twoje narzędzia, ponieważ systemy „uczą się” więcej o tym, czego się spodziewać. Ale w zależności od platformy A.I. według danych Miriam Redi, naukowca z Yahoo Labs, rysuje dane, niektóre języki mogą być lepiej reprezentowane niż inne.
„Na przykład tak jak Flickr, skąd bierzemy nasze dane, niektóre języki są bardzo mało reprezentowane”, powiedział Redi, przemawiając na londyńskim Deep Learning Summit w czwartek. „Mamy więc angielski, miliony obrazów w języku angielskim, ale mamy może 100 000 na arabski”.
Zespół Redi pracuje nad narzędziem, które może zidentyfikować niewidoczne elementy do obrazów, takich jak wartości kulturowe i konotacje emocjonalne. Narzędzie analizuje tekst dołączony do publicznie dostępnych zdjęć w serwisie Flickr. Z biegiem czasu A.I. zaczyna rozumieć, dlaczego ktoś może oznaczyć obraz „happy party” lub „awkward moment”, ale te pomysły będą coraz bardziej dokładne, ponieważ narzędzie analizuje więcej obrazów.
„Niestety dokładność wykrywania sentymentu w obrazach w językach arabskich jest zazwyczaj niższa, ponieważ nie mamy wystarczającej ilości danych” - powiedział Redi.
W językach, które miały większe ilości danych, zespół Redi zauważył kilka interesujących wzorów. Języki romańskie, takie jak francuski i hiszpański, mają tendencję do wyrażania siebie w podobny sposób, podczas gdy włoski wydają się być jedynym językiem, w którym użytkownicy identyfikują obrazy z terminem „oszustwa podatkowe”.
Bariery językowe nadal stanowią problem dla A.I. naukowcy. Każdy, kto używał Tłumacza Google, będzie wiedział, że przełączanie języków nigdy nie jest tak proste, jak się wydaje. Jednak nowe wydarzenia zmieniają się, a Facebook ogłasza latem, że zbliża się do marzenia o jednoukładowej sieci społecznościowej, automatycznie tłumaczącej teksty dla użytkowników.
Rozwój w usuwaniu barier językowych może pomóc w promowaniu komunikacji międzynarodowej, ale w przypadku projektów takich jak Redi nie ma prawdziwego substytutu danych generowanych przez ludzi.
Dlaczego język stworzony przez Hanka uzupełnia finał sezonu 2 Fargo
Trzeba być wdzięcznym, że drugi sezon Fargo nie zakończył się symboliczną, dwuznaczną reklamą Coke. Fargo zawsze kroczy po niebezpiecznej linii między tajemnicą i pretensjonalną sugestią a bardziej standardową, sterowaną postacią narracją. Bije publiczność nad głową dzięki aluzjom i zagadkom, ale zachowuje ...
Marvel ujawnia, dlaczego X-Men będą walczyć z nieludzkimi
Marvel w końcu ujawnia powód, dla którego Mutant X-Men będzie walczyć z nieludzkimi w grudniowym wydaniu komiksowym Inhumans vs X-Men.
Dlaczego muzea muszą być cyfrowe, aby zrozumieć przeszłość, mówi paleontolog
Wiele muzeów mieści miliony milionów okazów historii naturalnej, które ukryte są przed widokiem publicznym. Naukowcy pracują jednak nad wprowadzeniem tych „ciemnych danych” do sieci w celu zebrania bogatszego zrozumienia przeszłych zmian środowiskowych.