AlphaGo против Ли Седола - AlphaGo versus Lee Sedol
Сеул , Южная Корея , 9–15 марта 2016 г. | |
---|---|
Игра первая | AlphaGo W + R |
Игра вторая | AlphaGo B + R |
Игра третья | AlphaGo W + R |
Игра четвертая | Ли Седол W + R |
Игра пятая | AlphaGo W + R |
AlphaGo против Lee Sedol , также известный как Google DeepMind Challenge Match , представлял собой матч из пяти игр по го между 18-кратным чемпионом мира Ли Седолом и AlphaGo , компьютерной программой для игры в го, разработанной Google DeepMind , в которую играли в Сеуле , Южная Корея, между 9 и 9 часами. 15 марта 2016 г. AlphaGo выиграла все игры, кроме четвертой; все игры были выиграны отставкой. Матч сравнивают с историческим шахматным матчем между Deep Blue и Гарри Каспаровым в 1997 году.
Победитель матча должен был выиграть 1 миллион долларов. Поскольку AlphaGo выиграла, Google DeepMind заявила, что приз будет передан благотворительным организациям, в том числе ЮНИСЕФ и организациям Go. Ли получил 170 000 долларов (150 000 долларов за участие в пяти играх и дополнительные 20 000 долларов за победу в одной игре).
После матча Корейская ассоциация бадук присвоила AlphaGo высшее звание гроссмейстера Го - «почетный 9 дан ». Это было дано в знак признания «искренних усилий» AlphaGo овладеть го. 22 декабря 2016 года этот матч был признан журналом Science одним из финалистов конкурса « Прорыв года» .
Фон
Сложный вызов искусственного интеллекта
Внешнее видео | |
---|---|
Машина тренирует себя, чтобы побеждать людей в самой сложной игре в мире, Retro Report , 2:51, Retro Report |
Го - сложная настольная игра, требующая интуиции, творческого и стратегического мышления. Это долгое время считалось сложной задачей в области искусственного интеллекта (ИИ), и ее значительно труднее решить, чем шахматы . Многие в области искусственного интеллекта считают, что для го требуется больше элементов, имитирующих человеческое мышление, чем для шахмат . Математик И. Дж. Гуд писал в 1965 году:
Идти на компьютер? - Чтобы запрограммировать компьютер на разумную игру в го, а не просто в легальную игру, необходимо формализовать принципы хорошей стратегии или разработать обучающую программу. Принципы более качественные и загадочные, чем в шахматах, и больше зависят от суждений. Так что я думаю, что будет еще труднее запрограммировать компьютер для разумной игры в го, чем в шахматы.
До 2015 года лучшим программам го удавалось достигать уровня любительского дана . На маленькой доске 9 × 9 компьютер показал себя лучше, и некоторым программам удалось выиграть часть своих игр 9 × 9 у профессиональных игроков. До AlphaGo некоторые исследователи утверждали, что компьютеры никогда не смогут победить лучших людей в Go. Илон Маск , один из первых инвесторов Deepmind, сказал в 2016 году, что эксперты в этой области считают, что искусственному интеллекту осталось 10 лет до победы над ведущим профессиональным игроком в го.
Матч AlphaGo против Ли Седола сравним с шахматным матчем 1997 года, когда Гэри Каспаров проиграл компьютеру IBM Deep Blue . Поражение Каспарова Deep Blue считается моментом, когда компьютер стал лучше людей в шахматах.
AlphaGo значительно отличается от предыдущих попыток ИИ. Вместо использования алгоритмов вероятности, жестко запрограммированных людьми-программистами, AlphaGo использует нейронные сети для оценки вероятности выигрыша. AlphaGo получает доступ и анализирует всю онлайн-библиотеку Go; включая все матчи, игроков, аналитику и литературу; а также игры, в которые AlphaGo играет против себя и других игроков. После настройки AlphaGo не зависит от команды разработчиков и оценивает лучший путь к решению Go (то есть к победе в игре). Используя нейронные сети и поиск по дереву Монте-Карло , AlphaGo вычисляет колоссальное количество вероятных и маловероятных вероятностей многих шагов в будущее.
Результаты соответствующих исследований применяются в таких областях, как когнитивная наука , распознавание образов и машинное обучение .
Матч против Фань Хуэй
AlphaGo победил чемпиона Европы Фан Хуэй , профессионала с 2 данами, 5–0 в октябре 2015 года, впервые ИИ победил профессионального игрока-человека в игре на полноразмерной доске без гандикапа. Некоторые комментаторы подчеркнули пропасть между Фэном и Ли, имеющей 9 дан профессионального уровня. Компьютерные программы Zen и Crazy Stone ранее побеждали игроков-людей с рейтингом 9 и профессионалов с гандикапом в четыре или пять камней. Канадский специалист по искусственному интеллекту Джонатан Шеффер , комментируя победу над Fan, сравнил AlphaGo с «вундеркиндом», которому не хватало опыта, и считал, что «настоящее достижение будет, когда программа сыграет игрока в истинном высшем эшелоне». Затем он считал, что Ли выиграет матч в марте 2016 года. Хаджин Ли , профессиональный игрок в го и генеральный секретарь Международной федерации го , прокомментировала, что она «очень взволнована» перспективой того, что ИИ бросит вызов Ли, и подумала: у обоих игроков были равные шансы на победу.
После матча с AlphaGo Фань Хуэй отметил, что игра научила его быть лучшим игроком и видеть то, чего он раньше не видел. К марту 2016 года Wired сообщил, что его рейтинг поднялся с 633 в мире до примерно 300.
Подготовка
Эксперты по го обнаружили ошибки в игре AlphaGo против Fan, в частности, связанные с недостаточной осведомленностью всей доски. До игры с Ли было неизвестно, насколько программа улучшила свою игру после октябрьского матча. Первоначальный набор тренировочных данных AlphaGo начался с игр сильных игроков-любителей с серверов интернет-Go, после чего AlphaGo тренировалась, играя против себя в десятках миллионов игр.
Игроки
AlphaGo
AlphaGo - это компьютерная программа, разработанная Google DeepMind для настольной игры Go . Алгоритм AlphaGo использует комбинацию машинного обучения и методов поиска по дереву в сочетании с обширным обучением, как в игровой, так и в компьютерной среде. Первоначально нейронные сети системы были созданы на основе человеческого опыта игры. AlphaGo изначально был обучен имитировать человеческую игру, пытаясь сопоставить ходы опытных игроков из записанных исторических игр, используя базу данных KGS Go Server, содержащую около 30 миллионов ходов из 160 000 игр, выполненных игроками-людьми с 6 по 9 сом. Когда он достиг определенной степени мастерства, его обучали дальше, настраивая на то, чтобы играть в большое количество игр против других экземпляров самого себя, используя обучение с подкреплением для улучшения своей игры. Система не использует «базу данных» ходов для игры. Как пояснил один из создателей AlphaGo:
Хотя мы запрограммировали эту машину на игру, мы не знаем, какие ходы она будет использовать. Его движения - явление, возникающее в процессе тренировки. Мы просто создаем наборы данных и алгоритмы обучения. Но ходы, которые он придумывает, находятся вне наших рук - и намного лучше, чем мы, как игроки в го, могли придумать.
В матче против Ли AlphaGo использовала примерно ту же вычислительную мощность, что и в матче с Fan Hui, где использовала 1202 процессора и 176 графических процессоров . The Economist сообщил, что он использовал 1920 процессоров и 280 графических процессоров. Google также заявил, что в матче против Ли Седола использовались его собственные блоки обработки тензорных данных .
Ли Седол
Ли Седол - профессиональный игрок в го с рейтингом 9 дан и один из сильнейших игроков в истории го . Он начал свою карьеру в 1996 году (получил звание профессионального дана в возрасте 12 лет), с тех пор выиграв 18 чемпионатов мира. Он - «национальный герой» в своей родной Южной Корее, известный своей нестандартной и творческой игрой. Ли Седол изначально предсказывал, что он победит AlphaGo в «оползне». За несколько недель до матча он выиграл титул корейского Мёнгина , крупного чемпионата.
Игры
Матч состоял из пяти игр с главным призом в один миллион долларов США по китайским правилам с 7,5-очковым коми . Для каждой игры было установлено двухчасовое ограничение по времени для каждого игрока, за которым следовали три 60-секундных сверхурочных периода байо-ёми . Каждая игра начинается в 13:00 KST (04:00 GMT ).
Матч проходил в отеле Four Seasons в Сеуле , Южная Корея, в марте 2016 года и транслировался в прямом эфире с комментариями Майкла Редмонда (9 дан профессионально) и Криса Гарлока. Аджа Хуанг , член команды DeepMind и любительский игрок с 6 данами в го, разместил камни на доске Go для AlphaGo, которая работала через облачную платформу Google с ее сервером, расположенным в Соединенных Штатах.
Резюме
Игра | Дата | Чернить | белый | Результат | Движется |
---|---|---|---|---|---|
1 | 9 марта 2016 г. | Ли Седол | AlphaGo | Ли Седол подал в отставку | 186 Игра 1 |
2 | 10 марта 2016 г. | AlphaGo | Ли Седол | Ли Седол подал в отставку | 211 Игра 2 |
3 | 12 марта 2016 г. | Ли Седол | AlphaGo | Ли Седол подал в отставку | 176 Игра 3 |
4 | 13 марта 2016 г. | AlphaGo | Ли Седол | AlphaGo ушел в отставку | 180 Игра 4 |
5 | 15 марта 2016 г. | Ли Седол | AlphaGo | Ли Седол подал в отставку | 280 Игра 5 |
Результат: AlphaGo 4-1 Ли Седол |
|||||
^ примечание 1: Согласно официальным правилам, для пятой игры предполагалось, что цвет будет назначаться случайным образом. Однако во время пресс-конференции после четвертого матча Ли попросил: «... поскольку я выиграл белыми, я действительно надеюсь, что в пятом матче я смогу выиграть черными, потому что победа черными намного ценнее». Хассабис согласился позволить Седолу играть черными. |
Игра 1
AlphaGo (белый) выиграл первую игру. Ли, казалось, контролировал игру на протяжении большей части матча, но AlphaGo получил преимущество в последние 20 минут, и Ли подал в отставку. Ли позже заявил, что допустил критическую ошибку в начале матча; он сказал, что стратегия компьютера в начале игры была «превосходной» и что ИИ сделал один необычный ход, который не сделал бы ни один игрок-человек. Дэвид Ормерод, комментируя игру в Go Game Guru, описал седьмой камень Ли как «странный ход для проверки силы AlphaGo в дебюте», охарактеризовав этот ход как ошибку, а ответ AlphaGo как «точный и эффективный». Он охарактеризовал позицию AlphaGo как благоприятную в первой части игры, учитывая, что Ли начал возвращаться на 81-м ходу, прежде чем сделать «сомнительные» ходы на 119 и 123, после чего последовал «проигрышный» ход на 129. Профессиональный игрок в го Чо Hanseung отметил, что игра AlphaGo значительно улучшилась по сравнению с тем, когда она победила Fan Hui в октябре 2015 года. Майкл Редмонд описал компьютерную игру как более агрессивную, чем против Fan.
По словам гроссмейстера 9 дан Го Ким Сон Рёна, Ли казался ошеломленным сильной игрой AlphaGo на 102-м камне. Наблюдая за тем, как AlphaGo делает 102-й ход, Ли более 10 минут обдумывал свои варианты.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Первые 99 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100–186 |
Игра 2
AlphaGo (черный) выиграла вторую игру. Ли позже заявил, что «AlphaGo сыграла почти идеальную игру», «с самого начала игры я не чувствовал, что есть точка, которую я возглавляю». Один из создателей AlphaGo, Демис Хассабис, сказал, что система была уверена в победе с середины игры, хотя профессиональные комментаторы не могли сказать, какой игрок впереди.
Майкл Редмонд ( 9p ) отметил, что 19-й камень AlphaGo (ход 37) был «креативным» и «уникальным». Ли потребовалось необычно много времени, чтобы отреагировать на это движение. Янгил (8p) назвал 37-й ход AlphaGo «редким и интригующим ударом плеча», но сказал, что контр-результат Ли был «изысканным». Он заявил, что контроль переходил между игроками несколько раз перед эндшпилем, и особенно похвалил шаги AlphaGo 151, 157 и 159, назвав их «блестящими».
AlphaGo показала аномалии и ходы с более широкой точки зрения, которые профессиональные игроки в Го описали как ошибки на первый взгляд, но как преднамеренную стратегию в ретроспективе. Как объяснил один из создателей системы, AlphaGo не пытается максимизировать свои очки или свой запас победы, но пытается максимизировать свою вероятность победы. Если AlphaGo придется выбирать между сценарием, в котором она выиграет с разницей в 20 очков с вероятностью 80 процентов, и другим сценарием, в котором она выиграет с разницей в полтора очка с вероятностью 99 процентов, она выберет последний, даже если ей придется отказаться от очков для достижения Это. В частности, ход 167 AlphaGo, казалось, дал Ли шанс на борьбу, и комментаторы объявили его очевидной ошибкой. Ан Янгил заявил: «Значит, когда AlphaGo делает слабый ход, мы можем рассматривать это как ошибку, но, может быть, это более точно следует рассматривать как объявление победы?»
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Первые 99 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
100–199 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 200–211 |
Игра 3
AlphaGo (белые) выиграли третью игру.
После второй игры игроки все еще сомневались, действительно ли AlphaGo является сильным игроком в том смысле, в каком может быть человек. Третья игра была описана как устранение этого сомнения; при этом аналитики комментируют, что:
AlphaGo победила настолько убедительно, что убрала все сомнения в ее силе из голов опытных игроков. Фактически, игра игралась так хорошо, что это было почти страшно ... Заставляя AlphaGo выдержать очень серьезную одностороннюю атаку, Ли раскрыл свою до сих пор незамеченную силу ... Ли не получал достаточной прибыли от своей атаки ... Один из величайших виртуозов средней игры только что был отодвинут на задний план в черно-белой прозрачности.
По словам Ан Янгила (8p) и Дэвида Ормерода, игра показала, что «AlphaGo просто сильнее любого известного игрока в го». Было замечено, что AlphaGo умело преодолевает сложные ситуации, известные как ко, которые не возникали в предыдущих двух матчах. Ан и Ормерод считают ход 148 особенно примечательным: в середине сложного ко- боя AlphaGo продемонстрировал достаточную «уверенность» в том, что он выигрывал бой, чтобы сделать большой ход в другом месте.
Ли, играя черными, начал с построения High Chinese и создал большую зону влияния черных, в которую AlphaGo вторглась на 12-м ходу. Это потребовало от программы защиты слабой группы, что она и сделала успешно. Ан Янгил описал 31-й ход Ли как возможный «проигрышный ход», а Энди Джексон из Американской ассоциации го посчитал, что исход уже был решен к 35-му ходу. AlphaGo получила контроль над игрой к 48-му ходу и вынудила Ли перейти в оборону. . Ли контратаковал на ходах 77/79, но ответ AlphaGo оказался эффективным, и его ход 90 упростил позицию. Затем он получил большую зону контроля в нижней части доски, укрепив свои позиции с помощью ходов со 102 на 112, которые Ан назвал «сложными». Ли снова атаковал на 115 и 125 ходах, но ответ AlphaGo снова оказался эффективным. В конце концов Ли попытался выполнить сложное ко на 131-м ходу, не вызвав ошибки в программе, и подал в отставку на 176-м ходу.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Первые 99 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100–176 (122 на 113, 154 на , 163 на 145, 164 на 151, 166 и 171 на 160, 169 на 145, 175 на ) |
Игра 4
Ли (белые) выиграл четвертую партию. Ли выбрал тип экстремальной стратегии, известной как амаси , в ответ на очевидное предпочтение AlphaGo Souba Go (попытка выиграть за счет множества небольших выигрышей, когда появляется возможность), захватив территорию по периметру, а не в центре. Поступая таким образом, его очевидная цель состояла в том, чтобы навязать стиль ситуации «все или ничего» - возможная слабость для оппонента, сильного в переговорных типах игры, и такая, которая могла бы сделать способность AlphaGo определять незначительные преимущества в значительной степени несущественной.
Первые 11 ходов были идентичны второй партии, где Ли также играл белыми. В начале игры Ли сосредоточился на захвате территории по краям и углам доски, что позволило AlphaGo получить влияние наверху и в центре. Затем Ли вторгся в область влияния AlphaGo наверху с 40-го по 48-й ход , следуя стратегии амаси . AlphaGo ответил ударом плеча на 47-м ходу, впоследствии пожертвовав четырьмя камнями в другом месте и получив инициативу на ходах с 47 по 53 и 69. Ли протестировал AlphaGo на ходах с 72 по 76, не вызвав ошибки, и к этому моменту комментаторы партии уже начал чувствовать, что игра Ли проиграна. Однако неожиданная игра белыми 78, описанная как «блестящий тэсудзи », перевернула игру. Этот ход образовал белый клин в центре и усложнил игру. Гу Ли (9p) назвал это « божественным ходом » и заявил, что этот шаг был им совершенно непредвиден.
AlphaGo плохо отреагировала на 79-м ходу, и тогда, по ее оценкам, у нее были 70% -ные шансы на победу. Ли последовал сильным ходом белыми 82. Первоначальная реакция AlphaGo на ходах с 83 по 85 была подходящей, но на 87-м ходу его оценка шансов на победу внезапно резко упала, что спровоцировало его на серию очень плохих ходов со стороны 87 черных. до 101. Дэвид Ормерод охарактеризовал ходы с 87 на 101 как типичные ошибки в программе, основанной на Монте-Карло. Ли вышел вперед ходом белых 92, и Ан Янгил назвал 105 ход черных последним проигрышным ходом. Несмотря на хорошую тактику во время ходов с 131 по 141, AlphaGo не смогла восстановиться в эндшпиле и сдалась. Отставка AlphaGo была вызвана тем, что она оценила свои шансы на победу менее 20%; это сделано для того, чтобы соответствовать решению профессионалов, которые уходят в отставку, а не играют до конца, когда их позиция кажется безвозвратной.
Юнггил из Go Game Guru пришел к выводу, что эта игра была «шедевром для Ли Седола и почти наверняка станет знаменитой игрой в истории го». Ли прокомментировал после матча, что, по его мнению, AlphaGo была сильнейшей в игре белыми (вторая). По этой причине он попросил его сыграть черными в пятой партии, которая считается более рискованной.
Дэвид Ормерод из Go Game Guru заявил, что, хотя анализ игры AlphaGo в 79–87 годах еще не был доступен, он полагал, что это результат известной слабости игровых алгоритмов, использующих поиск по дереву Монте-Карло . По сути, поиск пытается отсечь менее релевантные последовательности. В некоторых случаях игра может привести к очень специфической линии игры, которая имеет значение, но которую упускают из виду, когда дерево обрезается, и поэтому этот результат «вне поля зрения поиска».
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Первые 99 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100–180 (177 , 178 ). |
Игра 5
AlphaGo (белые) выиграли пятую игру. Игра была описана как близкая. Хассабис заявил, что результат пришел после того, как программа сделала «серьезную ошибку» в начале игры.
Ли, играя черными, начал игру так же, как и в первой игре, а затем начал разбивать территорию в правом и верхнем левом углах - стратегия, аналогичная той, которую он успешно применил в игре 4, - в то время как AlphaGo получил влияние в центре игры. доска. Игра продолжалась до тех пор, пока белые не пошли с 48 на 58, которые AlphaGo сыграла в правом нижнем углу. Эти движения излишне теряли ко-угрозы и адзи, что позволило Ли взять на себя инициативу. Майкл Редмонд (9p) предположил, что, возможно, AlphaGo пропустила «сжатие надгробной плиты» Тесудзи Блэка . Людей учат распознавать конкретный паттерн, но это длинная последовательность движений, если ее нужно вычислять с нуля.
Затем AlphaGo начал развивать верхнюю часть доски, а также центр, и успешно защитился от атаки Ли на ходах с 69 по 81, которую Дэвид Ормерод охарактеризовал как чрезмерную осторожность. К ходу белых 90 AlphaGo вернул себе равенство, а затем сыграл серию ходов, описанных Ормеродом как «необычные ... но слегка впечатляющие», которые получили небольшое преимущество. Ли попробовал выполнить пас «Радуйся, Мария» с ходами 167 и 169, но защита AlphaGo оказалась успешной. Янгил отметил, что ходы 154, 186 и 194 белых являются особенно сильными, и программа сыграла безупречный эндшпиль, сохраняя лидерство до тех пор, пока Ли не сдался.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Первые 99 ходов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ходы 100–199 (118 на 107, 161 на ) |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Передвигается 200–280 (240 при 200, 271 при , 275 при , 276 при ) |
Покрытие
Живое видео игр и соответствующие комментарии транслировались на корейском, китайском, японском и английском языках. Освещение на корейском языке осуществлялось через Baduk TV. Освещение игры 1 на китайском языке с комментариями игроков с 9 даном Гу Ли и Кэ Цзе было предоставлено Tencent и LeTV соответственно, и их посмотрели около 60 миллионов зрителей. Онлайн-трансляция на английском языке, представленная американцем 9 даном Майклом Редмондом и Крисом Гарлоком, вице-президентом Американской ассоциации го , достигла в среднем 80 тысяч зрителей, а пик - 100 тысяч зрителей ближе к концу первой игры.
Ответы
Сообщество AI
Победа AlphaGo стала важной вехой в исследованиях искусственного интеллекта. Ранее Go считался серьезной проблемой в машинном обучении, которая, как ожидается, будет недоступна для технологий того времени. Большинство экспертов считали, что до такой мощной программы Go, как AlphaGo, осталось по крайней мере пять лет; некоторые эксперты полагали, что потребуется еще как минимум десять лет, прежде чем компьютеры победят чемпионов го. Большинство наблюдателей в начале матчей 2016 года ожидали, что Ли обыграет AlphaGo.
С такими играми, как шашки, шахматы, а теперь и го, выигранные компьютерными игроками, победы в популярных настольных играх больше не могут служить важными вехами для искусственного интеллекта, как это было раньше. Deep Blue «s Мюррей Кэмпбелл назвал победу AlphaGo„Конец эпохи ... настольные игры более или менее сделаны , и это время , чтобы двигаться дальше.“
По сравнению с Deep Blue или Watson лежащие в основе AlphaGo алгоритмы потенциально более универсальны и могут свидетельствовать о том, что научное сообщество делает успехи в направлении общего искусственного интеллекта . Некоторые комментаторы считают, что победа AlphaGo дает обществу хорошую возможность начать обсуждение подготовки к возможному будущему столкновению с машинами с универсальным интеллектом . В марте 2016 года исследователь ИИ Стюарт Рассел заявил, что «методы ИИ развиваются намного быстрее, чем ожидалось, (что) делает вопрос о долгосрочных результатах более актуальным», добавив, что «для того, чтобы гарантировать, что все более мощные системы ИИ останутся полностью под человеческим контролем ... предстоит много работы ". Некоторые ученые, такие как физик Стивен Хокинг , предупреждают, что некоторый будущий самосовершенствующийся ИИ может получить реальный общий интеллект, что приведет к неожиданному захвату ИИ ; другие ученые не согласны: эксперт по искусственному интеллекту Жан-Габриэль Ганашиа считает, что «такие вещи, как« здравый смысл »... могут никогда не воспроизводиться», и говорит: «Я не понимаю, почему мы должны говорить о страхах. Напротив, это вселяет надежды. во многих областях, таких как здоровье и освоение космоса ". Ричард Саттон сказал: «Я не думаю, что люди должны бояться ... но я действительно думаю, что люди должны обращать внимание».
Команда DeepMind AlphaGo получила первую медаль Марвина Мински IJCAI за выдающиеся достижения в области искусственного интеллекта. «AlphaGo - прекрасное достижение и прекрасный пример того, за что была учреждена медаль Мински», - сказал профессор Майкл Вулдридж , председатель комитета по наградам IJCAI. «Что особенно впечатлило IJCAI, так это то, что AlphaGo достигает того, что делает, благодаря блестящей комбинации классических методов искусственного интеллекта, а также новейших методов машинного обучения, с которыми так тесно связан DeepMind. Это захватывающая демонстрация современного искусственного интеллекта, и мы рады, что удостоились этой награды ".
Сообщество Go
Го - популярная игра в Южной Корее, Китае и Японии, и этот матч смотрели и анализировали миллионы людей по всему миру. Многие ведущие игроки в го охарактеризовали неортодоксальные игры AlphaGo как кажущиеся сомнительными ходы, которые поначалу сбивали с толку зрителей, но имели смысл в ретроспективе: «Все, кроме самых лучших игроков в го, создают свой стиль, подражая лучшим игрокам. AlphaGo, кажется, имеет совершенно оригинальные ходы, которые создает сама. . " AlphaGo, похоже, неожиданно стал намного сильнее, даже по сравнению с его матчем в октябре 2015 года с Fan Hui, где компьютер впервые в истории победил профессионала в го без преимущества гандикапа.
Игрок номер один Китая, Кэ Цзе , который в то время был лучшим игроком в мире, первоначально утверждал, что сможет победить AlphaGo, но отказался играть против него, опасаясь, что это будет «копировать мой стиль». По ходу матчей Кэ Цзе ходил туда-сюда, заявляя, что «весьма вероятно, что я (смогу) проиграть» после анализа первых трех матчей, но вновь обретя уверенность после четвертого матча.
Тоби Мэннинг, рефери матча AlphaGo против Фан Хуэй, и Хаджин Ли, генеральный секретарь Международной федерации го , оба считают, что в будущем игроки в го будут получать помощь от компьютеров, чтобы узнать, что они сделали не так в играх, и улучшить свои навыки игры. навыки и умения.
Ли извинился за свои поражения, заявив после третьей игры, что «я недооценил возможности AlphaGo и почувствовал себя бессильным». Он подчеркнул, что поражение было «поражением Ли Седола», а не «поражением человечества». Ли сказал, что его окончательная потеря из-за машины была «неизбежной», но заявил, что «роботы никогда не поймут красоту игры так же, как мы, люди». Ли назвал свою победу в четвертой игре «бесценной победой, которую я (не променяю) ни на что».
Правительство
В ответ на этот матч правительство Южной Кореи 17 марта 2016 года объявило, что вложит 863 миллиона долларов (1 триллион вон) в исследования искусственного интеллекта (ИИ) в течение следующих пяти лет.
Документальный фильм
Документальный фильм о матчах AlphaGo был снят в 2017 году. 13 марта 2020 года фильм был размещен бесплатно онлайн на YouTube-канале DeepMind.
Смотрите также
использованная литература
внешние ссылки
Официальный комментарий матча
Официальный комментарий матча Майкла Редмонда (9 дан профи) и Криса Гарлока на канале Google DeepMind на YouTube:
- Игра 1 ( подведение итогов за 15 минут )
- Игра 2 ( подведение итогов за 15 минут )
- Игра 3 ( подведение итогов за 15 минут )
- Игра 4 ( подведение итогов за 15 минут )
- Игра 5 ( подведение итогов за 15 минут )
Файлы SGF
- Игра 1 (Go Game Guru)
- Игра 2 (Go Game Guru)
- Игра 3 (Go Game Guru)
- Игра 4 (Go Game Guru)
- Игра 5 (Go Game Guru)
Координаты : 37.5706 ° N 126.9754 ° E 37 ° 34′14 ″ с.ш., 126 ° 58′31 ″ в.д. /