Pamiętasz (niewyraźnie), jak nauczyłeś się chodzić, rozmawiać, jeździć na rowerze lub jeździć? To było bałaganiarskie i pełne błędów, ale umiejętności, których się w ten sposób nauczyłeś, pozostały. Poza żywymi systemami wyzwaniem było skonstruowanie wystarczająco silnych algorytmów, aby przejąć „doświadczenie z prawdziwego życia” i rozwinąć lepkie, adaptowalne zachowania dla sztucznej inteligencji .
Cóż, Alpha Go Zero właśnie to zrobiła.
„Zaczyna od pustej tablicy i dowiaduje się tylko dla siebie, tylko na podstawie własnej gry, bez jakiejkolwiek ludzkiej wiedzy, jakichkolwiek ludzkich danych, cech, przykładów czy interwencji ze strony ludzi. Odkrywa, jak grać w grę Go od pierwszych zasad” – mówi profesor DeepMind, David Silver.
Sztuczna inteligencja miała kilka iteracji, z których każda była mądrzejsza i bardziej zdolna niż poprzednia. Poprzednia wersja korzystała z ogromnej bazy danych poprzednich gier wraz z kilkoma algorytmami, które wskazywały jej na wygraną. Takie podejście doprowadziło do porażki aktualnego mistrza świata profesjonalnego gracza Go. W pokerze AI Libratus ostatnio obdarzył najlepszych pokerzystów na świecie skórą o prawie 2 miliony dolarów, również ucząc się poprzez samodzielną grę zamiast danych z gry.
Hillary pokochaj to lub wymień wiek
Teraz, w najnowszej wersji Alpha Go, nauczany jest program sztucznej inteligencji samo jak grać w Go — bez ludzkiego pochodzenia.
Uruchamiając miliony symulacji gier przeciwko sobie, 40 dni zajęło mu nauczenie się – od zera – jak pokonać swoją wersję mistrza świata. To naprawdę zmienia zasady gry, nie tylko w Go, ale także w sposobie odkrywania nowej wiedzy. Jak dokładna lub kompletna jest Twoja wiedza o domenie? Jest dużo więcej do odkrycia, mówi nam ten fascynujący eksperyment w nauce z Alpha Go Zero.
„Ideą Alpha Go nie jest wyjście i pokonanie ludzi, ale w rzeczywistości odkrycie, co to znaczy uprawianie nauki – aby program mógł uczyć się od siebie, czym jest wiedza”, według Silvera w poście na YouTube o osiągnięcie.
Zespół Alpha Go Zero Deep Mind nazywa to pierwszą zasadą, nauką „tabula rasa” (pusta karta).
„Jeśli możesz osiągnąć” tabula rasa ucząc się, masz agenta, który można przeszczepić z gry Go do dowolnej innej domeny, a specyfika gry, w której uczestniczysz, wymyślasz algorytm, który jest tak ogólny, że można go zastosować wszędzie – mówi . To prowokacyjny pomysł, gdy rozszerzasz koncepcję. Pomyśl tylko, co moglibyśmy zrobić z zestawem silnych, uczących się algorytmów, które mogłyby systematycznie rozwiązywać trudne problemy i uczyć się szybciej niż zbiorowa wiedza naszej cywilizacji. . . w ciągu dni, a nie dziesięcioleci.
ile lat ma Brennan Elliott
Na razie najważniejsze jest to, że 'algorytmy mają znacznie większe znaczenie niż obliczenia czy dostępne dane' - powiedział Silver. Już samo to zmienia reguły gry w naszym podejściu do rozszerzania znanego świata. Chociaż Alpha Go działa na sprzęcie około 25 milionów dolarów – nie jest to do końca lekki system – wiesz, że guru AI od dawna pracują nad tworzeniem czystszych, lepszych zbiorów danych. Obecnie wiele dużych zbiorów danych uważa się za zbyt hałaśliwych – pełnych złych danych – aby dokładnie szkolić sztuczną inteligencję. Jeśli sztuczna inteligencja uczy się na podstawie danych, a dane są złe, nie uczy się. Wielki problem.
A gdyby nie czyste dane, tylko doświadczenie, a sztuczna inteligencja mogłaby się sama trenować?
To ekscytujące osiągnięcie w Alpha Go Zero. Mimo że znajduje się w niszowym, opartym na regułach świecie gier, ma duże znaczenie w każdej branży opartej na zasadach fizycznych – pomyśl o chemii, ruchu drogowym, biologii, farmakologii, podróżach, logistyce i produkcji. Jeśli potrafimy zaprojektować reguły tak elastyczne, że mogą działać na podstawie szerszego doświadczenia i tak kierunkowe, że zawsze tworzą silniejsze umiejętności – takie jak Alpha Go Zero – wtedy możliwe jest osiągnięcie sztucznej inteligencji, która zarządza systemami. Systemy te nie potrzebowałyby żadnych danych zewnętrznych, nie miałyby problemów z czyszczeniem danych i nie potrzebowałyby spowolnień typu „człowiek w pętli”. Między innymi dlatego firma macierzysta Google, Alphabet, postawiła firmę na sztuczną inteligencję i inwestuje w sztuczną inteligencję w szybkim tempie. (Amazon inwestuje również w sztuczną inteligencję, podobnie jak najnowsze nabycie AI BodyLabs.)
ile jest warta Erin Moran
Profesor Deep Mind, David Silver, mówi: „Fakt, że widzieliśmy, jak program osiągnął wysoki poziom wydajności… powinien oznaczać, że teraz możemy zacząć rozwiązywać niektóre z najtrudniejszych i najbardziej znaczących problemów dla ludzkości”.
Ten post został zaktualizowany, aby wyjaśnić, że AI Libratus ostatnio pokonało najlepszych graczy w pokera, stosując strategię, która obejmuje samodzielną grę, a nie dane wprowadzone przez człowieka.