Główny Wprowadzać Innowacje Sztuczna inteligencja Google „Alpha Go Zero” właśnie nacisnęła przycisk Reset, aby dowiedzieć się, jak się uczyć

Sztuczna inteligencja Google „Alpha Go Zero” właśnie nacisnęła przycisk Reset, aby dowiedzieć się, jak się uczyć

Twój Horoskop Na Jutro

Pamiętasz (niewyraźnie), jak nauczyłeś się chodzić, rozmawiać, jeździć na rowerze lub jeździć? To było bałaganiarskie i pełne błędów, ale umiejętności, których się w ten sposób nauczyłeś, pozostały. Poza żywymi systemami wyzwaniem było skonstruowanie wystarczająco silnych algorytmów, aby przejąć „doświadczenie z prawdziwego życia” i rozwinąć lepkie, adaptowalne zachowania dla sztucznej inteligencji .

Cóż, Alpha Go Zero właśnie to zrobiła.

„Zaczyna od pustej tablicy i dowiaduje się tylko dla siebie, tylko na podstawie własnej gry, bez jakiejkolwiek ludzkiej wiedzy, jakichkolwiek ludzkich danych, cech, przykładów czy interwencji ze strony ludzi. Odkrywa, jak grać w grę Go od pierwszych zasad” – mówi profesor DeepMind, David Silver.

Sztuczna inteligencja miała kilka iteracji, z których każda była mądrzejsza i bardziej zdolna niż poprzednia. Poprzednia wersja korzystała z ogromnej bazy danych poprzednich gier wraz z kilkoma algorytmami, które wskazywały jej na wygraną. Takie podejście doprowadziło do porażki aktualnego mistrza świata profesjonalnego gracza Go. W pokerze AI Libratus ostatnio obdarzył najlepszych pokerzystów na świecie skórą o prawie 2 miliony dolarów, również ucząc się poprzez samodzielną grę zamiast danych z gry.

Hillary pokochaj to lub wymień wiek

Teraz, w najnowszej wersji Alpha Go, nauczany jest program sztucznej inteligencji samo jak grać w Go — bez ludzkiego pochodzenia.

Uruchamiając miliony symulacji gier przeciwko sobie, 40 dni zajęło mu nauczenie się – od zera – jak pokonać swoją wersję mistrza świata. To naprawdę zmienia zasady gry, nie tylko w Go, ale także w sposobie odkrywania nowej wiedzy. Jak dokładna lub kompletna jest Twoja wiedza o domenie? Jest dużo więcej do odkrycia, mówi nam ten fascynujący eksperyment w nauce z Alpha Go Zero.

„Ideą Alpha Go nie jest wyjście i pokonanie ludzi, ale w rzeczywistości odkrycie, co to znaczy uprawianie nauki – aby program mógł uczyć się od siebie, czym jest wiedza”, według Silvera w poście na YouTube o osiągnięcie.

Zespół Alpha Go Zero Deep Mind nazywa to pierwszą zasadą, nauką „tabula rasa” (pusta karta).

„Jeśli możesz osiągnąć” tabula rasa ucząc się, masz agenta, który można przeszczepić z gry Go do dowolnej innej domeny, a specyfika gry, w której uczestniczysz, wymyślasz algorytm, który jest tak ogólny, że można go zastosować wszędzie – mówi . To prowokacyjny pomysł, gdy rozszerzasz koncepcję. Pomyśl tylko, co moglibyśmy zrobić z zestawem silnych, uczących się algorytmów, które mogłyby systematycznie rozwiązywać trudne problemy i uczyć się szybciej niż zbiorowa wiedza naszej cywilizacji. . . w ciągu dni, a nie dziesięcioleci.

ile lat ma Brennan Elliott

Na razie najważniejsze jest to, że 'algorytmy mają znacznie większe znaczenie niż obliczenia czy dostępne dane' - powiedział Silver. Już samo to zmienia reguły gry w naszym podejściu do rozszerzania znanego świata. Chociaż Alpha Go działa na sprzęcie około 25 milionów dolarów – nie jest to do końca lekki system – wiesz, że guru AI od dawna pracują nad tworzeniem czystszych, lepszych zbiorów danych. Obecnie wiele dużych zbiorów danych uważa się za zbyt hałaśliwych – pełnych złych danych – aby dokładnie szkolić sztuczną inteligencję. Jeśli sztuczna inteligencja uczy się na podstawie danych, a dane są złe, nie uczy się. Wielki problem.

A gdyby nie czyste dane, tylko doświadczenie, a sztuczna inteligencja mogłaby się sama trenować?

To ekscytujące osiągnięcie w Alpha Go Zero. Mimo że znajduje się w niszowym, opartym na regułach świecie gier, ma duże znaczenie w każdej branży opartej na zasadach fizycznych – pomyśl o chemii, ruchu drogowym, biologii, farmakologii, podróżach, logistyce i produkcji. Jeśli potrafimy zaprojektować reguły tak elastyczne, że mogą działać na podstawie szerszego doświadczenia i tak kierunkowe, że zawsze tworzą silniejsze umiejętności – takie jak Alpha Go Zero – wtedy możliwe jest osiągnięcie sztucznej inteligencji, która zarządza systemami. Systemy te nie potrzebowałyby żadnych danych zewnętrznych, nie miałyby problemów z czyszczeniem danych i nie potrzebowałyby spowolnień typu „człowiek w pętli”. Między innymi dlatego firma macierzysta Google, Alphabet, postawiła firmę na sztuczną inteligencję i inwestuje w sztuczną inteligencję w szybkim tempie. (Amazon inwestuje również w sztuczną inteligencję, podobnie jak najnowsze nabycie AI BodyLabs.)

ile jest warta Erin Moran

Profesor Deep Mind, David Silver, mówi: „Fakt, że widzieliśmy, jak program osiągnął wysoki poziom wydajności… powinien oznaczać, że teraz możemy zacząć rozwiązywać niektóre z najtrudniejszych i najbardziej znaczących problemów dla ludzkości”.

Ten post został zaktualizowany, aby wyjaśnić, że AI Libratus ostatnio pokonało najlepszych graczy w pokera, stosując strategię, która obejmuje samodzielną grę, a nie dane wprowadzone przez człowieka.