Informatycy chcą, aby roboty zapomniały o swoich złych danych

$config[ads_kvadrat] not found

ILE NAPRAWDĘ ZARABIAJĄ PROGRAMIŚCI?

ILE NAPRAWDĘ ZARABIAJĄ PROGRAMIŚCI?
Anonim

Kiedy „złe” dane zostaną wessane w system uczenia maszynowego - tak przedstawił to Alan Greenspan, omawiając modele komputerowe, które nie zdołały przewidzieć recesji w 2008 r. - informacje te mogą być trudne do usunięcia. Ale nowa koncepcja, zaproponowana przez naukowców komputerowych Junfeng Yang i Yinzhi Cao, z Uniwersytetu Columbia i Lehigh University, przynosi ideę oduczania się do komputerów. Gdy Cao i Yang piszą w streszczeniu opublikowanym na konferencji IEEE Xplore 2015, nie musisz cofać się aż do kwadratu, aby zapomnieć:

Aby zapomnieć o próbce danych treningowych, nasze podejście po prostu aktualizuje niewielką liczbę sumowań - asymptotycznie szybciej niż przekwalifikowanie od podstaw. Nasze podejście jest ogólne, ponieważ forma sumowania pochodzi ze statystycznego uczenia się zapytań, w którym można zaimplementować wiele algorytmów uczenia maszynowego. Nasze podejście dotyczy również wszystkich etapów uczenia maszynowego, w tym wyboru funkcji i modelowania. Nasza ocena czterech różnych systemów nauczania i obciążeń rzeczywistych pokazuje, że nasze podejście jest ogólne, skuteczne, szybkie i łatwe w użyciu.

Koncepcja uczenia maszynowego opiera się na fundamencie zbudowanym z kopców i kopców informacji. Może to być pomocne, aby nauczyć roboty lub sztuczne inteligencje nawiązania pewnych połączeń - na przykład, jeśli osoba w ciężkim płaszczu dzierży topór, może być strażakiem. Ale w tych sesjach szkoleniowych mogą powstać błędne połączenia na podstawie zestawu danych. Twój robot może pomyśleć, że wszyscy strażacy mają brody. Jest to oczywiście coś, do czego chciałbyś komputera bezmyślnie.

Cao i Yang opierają ten pomysł robotycznego rozprzęgania informacji na koncepcji linii danych - że dane nie są w pełni ukształtowane na świecie, ale mają historię możliwą do prześledzenia w miarę przetwarzania surowych danych, notatek Kurzweil A.I. Wykorzystanie tej linii umożliwia maszynom oduczenie się wybranych części danych bez całkowitego wymazania ich edukacji.

$config[ads_kvadrat] not found