27 мая 2017, 11:45

Восстание машин. Детище Google обыграло лидера мирового рейтинга

Антон Бабошин
Корреспондент
Окончательно подошла к концу эпоха господства человеческого разума в еще одной из интеллектуальных игр – программа AlphaGo, разработанная одной из дочерних компаний Google, убедительно обыграла чемпиона мира по го Кэ Цзэ.

Третий матч серии в субботу завершился так же, как и предыдущие два – победой компьютера. И это был четвертый и решающий удар по позициям игроков-людей в го. Начало было положено в январе 2016-го, когда с AlphaGo встретился чемпион Европы Фань Хуэй – и проиграл пять партий из пяти. Затем вызов компьютеру бросил один из сильнейших мастеров планеты кореец Ли Се Доль. Ему удалось отпраздновать одну победу, но матч все равно завершился со счетом 1:4. Создатели еще доработали программу, и в январе нынешнего года решились на оригинальный ход. AlphaGo, выступая анонимно, взяла в интернете 60 из 60 проведенных партий с ведущими игроками мира. После этого авторы сбросили маску, и на конец мая была назначена решающая битва.

– Программа AlphaGo совершенно другая, – приводит ТАСС слова Кэ Цзе после первого матча. – Она как бог игры в го. Я был шокирован. Многие ходы никогда бы не могли случиться в игре между людьми. В прошлом у программы были некоторые слабости, но сейчас я чувствую, что ее понимание игры го и принимаемые ею решения находятся за гранью наших возможностей.

Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP
Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP

МИССИЯ НЕВЫПОЛНИМА

А ведь всего два-три года назад небезосновательно считали, что до полной победы искусственного интеллекта в этом соперничестве еще довольно далеко – лучшие программы могли соперничать с гроссмейстерами, лишь получив фору, но и при этом проигрывали, что показывало их несовершенство. Чтобы понять, что произошло, нужно рассказать о том, что такое го и в чем его особенности.

Го, которую в просторечии называют китайские шашки, зародилась в Китае более двух тысяч лет назад и относится к числу так называемых интеллектуальных игр с полной информацией. Это значит, что в ней нет факторов удачи и скорости реакции. Участник в любой момент имеет данные о текущем положении дел и может просчитывать варианты их развития. Задача игрока – отгородить игровыми камнями черного или белого цвета большую территорию, чем оппонент.

При этом особенность го – в ее сложности и многообразии вариантов. Доска под названием гобан имеет по 19 вертикальных и горизонтальных линий, в пересечения которых – пункты – и ставятся камни. Если в шахматах есть 20 вариантов первого хода белых и 20 ответов черных, что дает 400 возможных позиций, то в го, где первый ход у черных, эти цифры составляют 361 и 360 соответственно. То есть уже на старте мы получаем 129 960 вариантов, при этом длительность средней партии в го составляет примерно 200 ходов. Поэтому число вероятных комбинаций на доске достигает 10 в 170-й степени и превышает число атомов в наблюдаемой Вселенной.

Ничего удивительного, что для постижения всех секретов игры требуется не один год, а сильнейшие игроки, как правило, вырастают из детей, которых в возрасте примерно 10 лет отдают в специальные академии. Ныне считающийся сильнейшим игроком планеты Кэ Цзэ, которому сейчас 19, решил уйти в профессионалы в 11 лет. AlphaGo, чтобы научиться обыгрывать лучших, понадобилось примерно три года. Как же это произошло?

Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP
Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP

ПОЙМАЛИ В СЕТЬ

– Разработки велись давно, – говорит четырехкратный чемпион Европы Илья Шикшин. – Раньше программы действительно играли довольно слабо. Но это было до того, как за разработку взялись Google и Facebook. Они конкурировали, и победа в этом соперничестве осталась за Google. Самое сложное было научить программу адекватно оценивать позицию. При таком количестве вариантов простым их перебором ничего не добьешься, потребуются очень большие вычислительные мощности. Google нашел способ научить программу анализировать позицию и выбирать ход.

Действительно, если в играх попроще достаточно подобрать правильный алгоритм, то в го, где число вариантов растет со скоростью света, этого недостаточно. Что же придумали разработчики? На помощь им пришли последние достижения науки. AlphaGo – не просто программа, а нейронная сеть. Чтобы не пускаться в пространные и понятные далеко не всем объяснения, просто скажем, что нейросети, в отличие от стандартных программ, обладают возможностью обучения. То есть искусственный интеллект играет миллиарды партий сам с собой и анализирует их, находя ошибки. Это и ставит его на ступень выше живого разума.

Сам Кэ Цзэ еще до матча заявил, что это будет его последний опыт состязания с неодушевленным соперником. "Это холодная машина, у которой нет чувств к этой игре", – сказал он. Но справедливости ради, играть на равных с AlphaGo ему уже не по плечу. При этом дело усложняет тот факт, что в отличие от других игр в го нет ничьих.

– Сравнивать человека и компьютер теперь не имеет особого смысла, – подчеркивает Шикшин. – Да, матчи проводятся, но всем очевидно, что искусственный разум сильнее. Эта встреча – просто констатация факта. Думаю, AlphaGo уже не уступит человеку, по крайней мере тем, что сейчас играют в го. Пока люди не научатся быть еще сильнее, может, и с помощью компьютера. Есть и другие программы, я знаю как минимум три, которые играют на уровне чемпионов мира, того же Кэ Цзэ. Они стабильно выигрывают у сильнейших в мире. То есть они слабее AlphaGo, но при этом из 10 партий против топ-профессионалов побеждают в девяти.

Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP
Май. КЭ ЦЗЭ в матче против AlphaGo. Фото AFP

В ХОРОШЕЙ КОМПАНИИ

Таким образом, го стало еще одной интеллектуальной игрой, в которой человек капитулировал перед созданной им же машиной. Но не стоит расстраиваться, ведь она оказалась в хорошей компании. Так, в шашках и шахматах компьютеры захватили пальму первенства еще 20 лет назад. Шашечная программа Chinook, разработанная в Канаде, в начале 90-х обыграла чемпиона мира по чекерс Мариона Тинсли, а к 2007-му ее авторы объявили, что максимально усовершенствовали алгоритм, и теперь их детище не может уступить. При идеальной игре соперник сведет встречу к ничьей.

В шахматах все помнят матчи сильнейшего на тот момент гроссмейстера мира Гарри Каспарова и программы Deep Blue, разработанной в IBM. Победа компьютера тогда была чудом, а теперь это никого не удивляет. Например, американец Хикару Накамура, играя в 2016-м с чемпионом мира среди программ Komodo, даже имея фору, не победил ни разу, довольствовавшись тремя ничьими в четырех партиях.

– Выиграть у компьютера сейчас совершенно точно невозможно, – считает Сергей Карякин, лишь недавно оспаривавший звание чемпиона мира. – Реально, например, белыми пойти на форсирование какого-нибудь ничейного варианта. Средней программе на современном смартфоне вполне по силам обыграть ведущих гроссмейстеров. Сейчас гораздо интереснее следить за чемпионатами мира среди компьютеров. Его участники по турнирному рейтингу заметно выше людей. Это никак не убивает игру – партии между программами можно изучать, анализировать выбираемые варианты продолжений.

Но машины побеждают человека даже там, где присутствует фактор везения. Так, первая победа компьютера над человеком, носящим звание чемпиона мира по одной из интеллектуальных игр, состоялась еще в 1979-м. Созданная профессором Хансом Берлинером программа BKG 9.8 обыграла в нарды Луиджи Виллу со счетом 7:1, при этом многие отмечали, что ей в числе прочего повезло с выпадающими на игровых костях числами. А в январе уже нынешнего года программа Libratus в 20-дневном турнире разгромила четырех профессиональных игроков в покер, за 80 тысяч раздач выиграв у них фишек на сумму 1,7 миллиона долларов.

Если прибавить к этому то, что искусственный интеллект уже побеждал человека в телевикторине Jeopardy, аналоге популярной в России "Своей игры", а сейчас готовится покорять киберспортивные дисциплины, то поневоле задумаешься – а так ли неправы кинематографисты, пророчившие разные апокалиптические сценарии, в которых машины покоряют мир людей? Впрочем, как говорилось в каноническом для такого жанра фильме "Терминатор-2": "Будущее не предопределено. Оно будет таким, каким мы его сделаем".