Glavni Inovirati Googleova umjetna inteligencija 'Alpha Go Zero' samo je pritisnula reset kako učiti

Googleova umjetna inteligencija 'Alpha Go Zero' samo je pritisnula reset kako učiti

Vaš Horoskop Za Sutra

Sjećate se (nejasno) kako ste naučili hodati, razgovarati, voziti bicikl ili voziti? Bilo je neuredno i puno grešaka, ali vještine koje ste na taj način naučili ostale su. Izvan živih sustava bilo je izazovno strukturirati dovoljno jake algoritme koji će uzeti 'stvarno iskustvo' i razviti ljepljiva, prilagodljiva ponašanja za umjetnu inteligenciju.

Pa, Alpha Go Zero je to upravo učinio.

'Polazi od praznog lista i shvaća samo za sebe, samo iz samoigranja i bez ikakvog ljudskog znanja, ili bilo kakvih ljudskih podataka, karakteristika ili primjera ili intervencije od strane ljudi. Otkriva kako igrati igru ​​Go od prvih principa ', kaže profesor DeepMinda David Silver.

AI je imao nekoliko ponavljanja, od kojih je svaka pametnija i sposobnija od one prije. Prethodna verzija koristila je ogromnu bazu podataka prethodnih igara zajedno s hrpom algoritama koji su je usmjeravali prema pobjedi. Taj je pristup doveo do poraza od vladajućeg svjetskog prvaka profesionalnog igrača Goa. U pokeru je AI Libratus nedavno skinuo vodeće svjetske pokeraše s gotovo 2 milijuna dolara, također učeći kroz samoigranje umjesto podataka o ljudskim igrama.

što je princeza ljubav nacionalnost

Sada, u ovoj najnovijoj verziji Alpha Goa, podučava se program umjetne inteligencije sebe kako igrati Go - bez ljudske pozadine.

Izvodeći milijune simulacija igara protiv sebe, trebalo je 40 dana da nauči - od nule - kako pobijediti verziju svjetskog prvaka. To se uistinu mijenja u igri, ne samo za Go, već i za to kako se otkriva novo znanje. Koliko je točna ili potpuna stručnost vaše domene? Eto puno što više treba otkriti, govori nam ovaj fascinantni eksperiment u učenju s Alpha Go Zero.

'Ideja Alpha Goa nije izaći i pobijediti ljude, već zapravo otkriti što znači baviti se znanošću - da bi program mogao sam od sebe naučiti što je znanje', kaže Silver u objavi na YouTubeu o postignuće.

Alpha Go Zero Deep Mind tim to naziva prvim principom, 'tabula rasa' (prazno) učenje.

»Ako možeš postići prazna ploča učeći, imate agenta koji se može presaditi iz igre Go na bilo koju drugu domenu, a specifičnosti igre u kojoj se nalazite smislite algoritam koji je toliko općenit da se može primijeniti bilo gdje ', kaže on . To je provokativna ideja kada proširite koncept. Samo pomislite što bismo mogli učiniti sa skupom jakih algoritama za učenje koji bi se mogli sustavno nositi s teškim problemima i učiti brže od kolektivnog znanja naše civilizacije. . . u danima, a ne desetljećima.

claire hosterman i dove cameron

Za sada je veliko oduzimanje 'algoritmi su bitni puno više od računanja ili dostupnih podataka', rekao je Silver. Samo je to promjena u načinu na koji pristupamo širenju poznatog svijeta. Iako Alpha Go troši oko 25 milijuna američkih dolara na hardver - to nije baš lagan sustav - znate kako AI gurui već dugo rade na stvaranju čistijih i boljih skupova podataka. Danas se mnogi skupovi velikih podataka smatraju previše bučnim - prepunima loših podataka - da bi se točno trenirala umjetna inteligencija. Ako AI uči iz podataka, a podaci su loši, ne uči. Veliki problem.

Što ako vam nisu potrebni čisti podaci, već samo iskustvo, a umjetna inteligencija može sama trenirati?

To je uzbudljivo postignuće u Alpha Go Zero. Iako je u nišnom svijetu igara zasnovan na pravilima, on ima velike implikacije u svakoj industriji koja radi na fizičkim pravilima - pomislite na kemiju, promet, biologiju, farmakologiju, putovanja, logistiku i proizvodnju. Ako možemo dizajnirati pravila tako fleksibilna da mogu raditi iz šireg iskustva i toliko usmjerena da uvijek stvaraju jače vještine - poput Alpha Go Zero - tada je moguće postići umjetnu inteligenciju koja vodi računa o sustavima. Ovim sustavima ne bi trebali vanjski podaci, nemaju problema s čišćenjem podataka i ne trebaju usporavanja. To je dijelom razlog zašto se Googleova matična tvrtka Alphabet kladila u tvrtku na umjetnu inteligenciju i ubrzano ulaže u umjetnu inteligenciju. (Amazon također ulaže u umjetnu inteligenciju, poput najnovije AI akvizicije BodyLabs.)

yoon eun-hye dob

Profesor Deep Mind-a David Silver kaže: 'Činjenica da smo vidjeli da program postiže performanse na visokoj razini ... trebala bi značiti da sada možemo početi rješavati neke od najizazovnijih i najutjecajnijih problema za čovječanstvo.'

Ovaj je post ažuriran kako bi pojasnio da je AI Libratus nedavno pobijedio vrhunske pokeraše koristeći strategiju koja uključuje samo igranje, a ne podatke koje unosi čovjek.