Лента TH Новости Искусственный интеллект



2017. Год когда Искусственный Интеллект победил

∴ 798

Прямо сейчас искусственный интеллект завоевывает мир. А мы и не против.

1145
Источник фото

В течение последних 50-ти лет, игра в шахматы была эталоном для исследователей искусственного интеллекта. Джон МакКарти, который в начале 1950-х ввел термин «искусственный интеллект», упоминал о шахматах как о «Дрозофиле для ИИ».

В конце 90-х была создана шахматная программа для суперкомпьютера IBM Deep Blue. Несколько лет тренировок, и в 1997 году Deep Blue победил мирового чемпиона, Гарри Каспарова. Впервые машина заняла титул чемпиона мира. Более того, к середине 2000-х годов технология усовершенствовалась на порядок. Машины стабильно побеждали гроссмейстеров практически в каждой партии.

Естественно, разработчики ИИ перешли на другие, более сложные игры, чтобы проверить все усложняющиеся алгоритмы. За последние 12 месяцев ИИ резко спрогрессировал в данной области. Машины одерживают верх как в древних играх (китайская Го), так и в современных видах покера (Texas Hold-Em Poker).

Шахматы это только начало

В конце 1990-х годов, после того, как машина обыграла шахматного гроссмейстера, астрофизик из Принстона заметил: «Может быть, пройдет еще лет сто до того, как компьютер сможет победить в Го. А может, времени потребуется еще больше».

Приняв вызов, ученые начали изучать специфику данной игры. На первый взгляд, она обманчиво проста. Но для победы жизненно необходимо крайне развитое стратегическое мышление.

Последние 4 года стали революционными для игры Го. Разработчики систем машинного обучения создали действительно конкурентоспособного агента Искусственного Интеллекта.

В 2014 году, разработчики Google начали работу над глубинной обучающейся нейронной сетью под названием AlphaGo. После нескольких лет не очень успешного решения задач, команда решила отойти от привычных канонов программирования.
В конце 2016 года на популярном азиатском игровом сервере Tygem появился таинственный онлайн-игрок под ником «Мастер». В течение следующих нескольких дней этот таинственный игрок стабильно держался в топе победителей. 4 января разработчики AlphaGo официально признали, что «Мастер», это искусственный интеллект, созданный на основе синтеза AlphaGo с платформой DeepMind.

В мае 2017 года AlphaGo «Мастер» победил Ке Джи, мирового чемпиона по игре Го. Три выигранные партии из трех. Но поразительным было не это.

После майского выхода AlphaGo и победы алгоритма, ученые повторно усовершенствовали его. В октябре был выпущен новый агент ИИ, на порядок сильнее своего предшественника.

Новый агент, по имени «AlphaGo Zero», был разработан с целью тестирования систем на самообучение. Система играет против себя, снова и снова. После чреды игр, система учится побеждать в любой игре, на прохождение которой она запрограммирована. После 21 дня самообучения, AlphaGo Zero достигла уровня ИИ «Мастер», и к 40-му дню превзошла все предыдущие версии.

К декабрю 2017 года DeepMind выпустила обновленную версию системы. Построенный на основе AlphaZero, новый ИИ может справиться с различными играми всего за несколько часов. После восьми часов самообучения, система смогла не только превзойти предыдущие версии AlphaGo Zero, но и стать шахматным гроссмейстером, а также чемпионом по сёги (японские шахматы).

Обучение лжи

Игра в Го строится на основе сложных стратегий. Но как быть с играми, в которых нужно обманывать и блефовать?
За 2017 год было проведено два отдельных исследования, по строению нейронных сетей. В результате ИИ наголову разгромил профессиональных игроков в покер. Команда DeepStack из Университета Альберты представила систему искусственного интеллекта, которая использует искусственную форму «интуиции».

Команда ученых из Университета Карнеги-Меллона представила улучшенного агента ИИ. Система Libratus AI потратила 20 дней на игру в модифицированную версию покера, No Limit Texas Hold’em. Каждый день ИИ играл против четырех профессионалов. При этом, игроки действовали сообща, играя против машины. Но и машина улучшалась каждый день, исправляя ошибки в стратегиях и адаптируясь к игровому процессу.

Человеческий мозг неспособен соревноваться с машиной. После месяца полноценных матчей, фонд Искусственного Интеллекта Libratus вырос на условные 1,7 миллиона долларов. Один из проигравших профессионалов признался: «Я чувствовал, что играю против кого-то, кто обманывает меня. Словно он может видеть мои карты».

Илон Маск и искусственный интеллект

Да, Илон Маск крайне осторожно относится к тому, как развиваются системы искусственного интеллекта. Его взгляды диаметрально противоположны взглядам Марка Цукерберга, и на этой почве между бизнесменами произошла небольшая перепалка.

Однако, негативное отношение к ИИ не мешает Илону изучать эту область. В 2015 году Илон Маск вместе с небольшой группой инвесторов основали компанию под названием OpenAI. Цель заключалась в разработке систем искусственного интеллекта, способных к самообучению.

В августе 2017 года команда OpenAI поставила перед собой цель – победа в Dota 2. Dota 2 – чрезвычайно популярная и сложная многопользовательская онлайн-игра.

После двух недель обучения, бот OpenAI был представлен на турнире и впоследствии победил нескольких лучших игроков мира. Тогда, система ИИ была обучена сражаться «один-на-один». Сейчас команда OpenAI работает над «социализацией» интеллекта, для игры в команде.

Разделяй и властвуй

Пару лет назад Google DeepMind начал обучение ИИ старым играм Atari. Всего агент испытал силы в 2600 разных играх. Некоторые задачи оказались простыми, другие – сложными. Труднее всего ИИ было в игре PacMan.

В 2017 году компания Microsoft приобрел стартап, связанный с областью глубокого обучения. Имя стартапа – Maluuba. Стоит заметить, что часть проекта озанимается особенностями понимания языков. Новый метод машинного обучения Maluuba назывался «Архитектура гибридных слоев» (HRA). Применяя этот метод к Pac-Man, система создала более 150 отдельных агентов, каждый из которых преследовал конкретную цель. Найти точку, или избежать призрака.

Метод HRA генерирует высшего агента, что похож на старшего менеджера. Этот высший агент оценивает все предложения от нижних агентов, прежде чем принимать окончательное решение по индивидуальному ходу. Этот подход был эвфемистически назван «разделяй и властвуй», когда сложная задача разбивается на более мелкие части.

После применения метода к игре, ИИ быстро вычислил, как достичь рекорда в 999,990 очков. Рекорда, которого ни один человек или ИИ не достиг ранее.

Какой следующий логический шаг развития ИИ, если сегодня он способен побеждать нас в играх?

Исследователь из Университета Фалмута недавно обнаружил алгоритм машинного обучения, который, как он утверждает, может мечтать о создании игр. На данный момент, агент ИИ проходит обучение. Но при этом, система уже может делать игры с использованием наборов данных из открытых источников.

Итак, что же все это значит?

Возможно, самым значительным и опасным событием 2017 года стал прогресс систем обучения, основанный на подкреплении. Эти программы могут эффективно обучаться сами, и обучаться чему угодно. Последняя версия AlphaZero может достичь сверхчеловеческих результатов почти в любой игре, всего за несколько дней.

В связи с этим, был проведен опрос среди специалистов (350 человек) данной области. Эксперты прогнозируют, что в течение 10 лет ИИ будет развиваться, становясь лучше нас. К 2049 году мы получим агентов, способных написать бестселлер. В 2053 искусственный интеллект сможет заменить лучших хирургов. Фактически, разработчики и футурологи сходятся в одном. Есть 50-процентный шанс на то, что к 2060 году ИИ сможет делать все, что делаем мы, только еще лучше.

2017, несомненно, стал годом, когда ИИ в полной мере развернулся в области искусства и игр. Последнее может показаться тривиальным достижением, но последствия огромны. Ведь главное это не победа в конкретной игре, а скорость обучения чему-то новому. Умение играть в игры можно применить для полезного дела. Google DeepMind уже адаптировал нейросеть AlphaGo Zero для изучения белковых структур. А это ключ для борьбы с такими болезнями как Альцгеймер, Паркинсон, рак. Более того, понимание белковых структур позволяет менять свойства организма в широких пределах, модифицируя тела в угоду личных интересов каждого. Это также позволит победить рак, еще при нашей жизни.

В конечном итоге мы хотим использовать подобные прорывы, чтобы решить всевозможные насущные проблемы реального мира. Ведь эти методы могут быть применены к другим проблемам: новые формы белка, снижение потребления энергии, поиск новых материалов. Полученные результаты могут способствовать продвижению человечества и положительно влиять на нашу жизнь.
Демис Хассавис, соучредитель и генеральный директор DeepMind.

Филипп Дончев