Влияние искусственного интеллекта на развитие робототехники
Исследователи и предприниматели, которые десятилетиями занимаются вопросами искусственного интеллекта, пытаются помочь людям лучше понять его тонкости и связанные с его использованием проблемы. Сейчас специалисты в этой области работают над тем, чтобы развеять заблуждения и не совсем правильные представления, сложившиеся вокруг ИИ, и показать, как искусственный интеллект может и уже применяется в промышленной робототехнике.
«Я думаю, что самым большим заблуждением является то, что мы считаем, будто развитие искусственного интеллекта (ИИ) уже зашло чересчур далеко, — говорит Родни Брукс (Rodney Brooks), председатель и технический директор компании Rethink Robotics (рис. 1). — Мы работаем над ИИ с 1956 г., почти с того времени, когда отец искусственного интеллекта Джон Маккарти (John McCarthy) в 1955-м придумал сам термин «искусственный интеллект», то есть уже примерно 62 года. Но это оказалось намного сложнее, чем чистая физика в ее реализации, хотя и сама физическая реализация заняла достаточно много времени. Думаю, в этой области мы пока еще находимся в зачаточном состоянии».
Брукс полагает, что большая часть упрощенного представления об ИИ происходит из недавних сообщений в СМИ, уделяющих повышенное внимание демонстрации антропоморфных роботов, бионических роботов, выполненных в виде животных и насекомых, а также реакции зрителей, которые восхищаются искусственными системами, соревнующимися с людьми, например, в шахматах, игре в настольный теннис или в древнюю китайскую игру «го». Здесь, несомненно, присутствует ИИ, но все это лишь его первые детские шаги.
Некоторое недоразумение связано с приравниванием производительной деятельности машины к ее компетенции, то есть способности как личности развиваться и адаптироваться к тем или иным условиям. Когда мы видим, как человек выполняет определенную задачу, то понимаем, что у него имеются определенные навыки и знания, которыми он должен обладать для выполнения конкретной задачи. Что касается ИИ — это совсем не так.
«Система с ИИ может фантастически играть в шахматы, но она не имеет ни малейшего представления о том, что она играет в эту игру, — поясняет Брукс. — Так что в случае, когда мы подгоняем действия машины под некую компетенцию, то глубоко ошибаемся. Когда вы видите, как программа узнала что-то такое, что человек тоже может узнать, вы делаете ошибку, думая, будто у нее есть все то богатство понимания, которое было бы, например, у вас в этой ситуации».
Понимание того, что такое ИИ и что таковым не является
Искусственный интеллект уже стал модным маркетинговым выражением, которое у всех на слуху и используется где ни попадя. Это напоминает то, что мы когда-то пережили с употреблением слова «робот». Теперь нам, как и с роботами, кажется, будто все обладает потенциалом ИИ. Действительность же такова, что иногда трудно определить, что по своей сути является ИИ, а что нет. Даже эксперты колеблются, когда дело доходит до окончательного определения того, имеет нечто конкретное в своей основе ИИ или нет. Как отмечает Брукс, то, что считалось искусственным интеллектом в 1960-х гг., теперь преподается на первом курсе по компьютерному программированию, но уже так не называется и даже не относится к этому понятию.
«В какой-то момент что-то называется ИИ, — говорит Брукс. — А потом это становится просто информатикой».
Подмножествами ИИ (как мы понимаем это в текущий момент) являются машинное обучение и все его вариации, включая глубокое обучение, обучение с подкреплением сигналами от среды взаимодействия и имитационное обучение.
«Какое-то время ИИ был очень узким понятием. Некоторые люди видели его как очень конкретный набор методов, основанных на поиске, — говорит Кен Голдберг (Ken Goldberg), директор Центра новых технологий (CNM, Беркли) и профессор на кафедре инженерных исследований Калифорнийского университета в Беркли (University of California, Berkeley). — Теперь ИИ рассматривается как широкий термин для робототехники и машинного обучения, поэтому сейчас он охватывает целый ряд дополняющих понятий и областей».
Передовые современные системы компьютерного зрения — это, безусловно, форма ИИ. «Если вы просто проверяете, находится ли винт в нужном месте, как было еще в 1960-х гг., то это чересчур просто, чтобы назвать ИИ, — поясняет Голдберг. — Но в то же время, когда система компьютерного зрения может распознать лица рабочих, мы обычно думаем об этом как об ИИ, поскольку решается гораздо более сложная задача».
Проблема ИИ — отсутствие контекста
Важным отличием человеческого интеллекта от машинного является контекст того или иного действия. У нас, поскольку мы разумные люди, есть лучшее понимание окружающего мира, а вот у ИИ такого понимания нет.
«Мы работаем над контекстом в области ИИ уже 60 лет и пока даже близко не подошли к решению данной проблемы, — говорит Брукс. — Вот почему я не беспокоюсь о том, что у нас вскоре появится некий суперинтеллектуальный ИИ. Да, мы несомненно добились успеха в ряде областей, и действительно — это революция в области ИИ, которая совершается прямо сейчас на наших глазах, но происходит еще в очень узких направлениях. Конечно, нынешнее распознавание речи радикально отличается от того, что было десять лет назад. Я раньше шутил, что системы понимания речи были настроены так, что либо вы нажимаете на кнопку, либо говорите «два» и впадаете в эйфорию, если машина вас поняла. Сейчас уже все иначе».
В качестве примера Брукс приводит смарт-динамик разработки корпорации Amazon.com, который управляется голосом и реагирует на имя Alexa, как на «слово пробуждения». Еще два наглядных примера современных систем с распознаванием речи — это Google Assistant («умный» персональный ассистент, созданный компанией Google) и облачный персональный помощник и вопросно-ответная система Siri от компании Apple.
«Вы говорите что-то Alexa, и система в значительной степени вас понимает, даже когда играет музыка, даже когда в комнате говорят другие люди, — рассказывает Брукс. — Удивительно, насколько это хорошо устроено благодаря глубокому обучению. Поэтому некоторые из узких возможностей ИИ расширились. И мы будем использовать эти, пусть и небольшие, достижения как можно эффективнее, чтобы сделать следующие продукты еще лучше. Когда я основал компанию Rethink Robotics, мы посмотрели на все коммерческие системы распознавания речи и пришли к мнению, что на тот момент было бы весьма наивно использовать какое-либо распознавание речи для промышленных роботов. Думаю, теперь ситуация изменилась и это может иметь смысл, но в 2008 г. подобного вообще не существовало».
Распознавание речи компилирует правильные последовательности (предложения) из отдельных распознанных слов. Брукс отмечает, что точность формирования таких последовательностей достаточно высока и вполне приемлема, чтобы применять данную технологию в разных сферах, но еще далека от того, как это делает человек.
«В этом-то и заключается разница, — говорит он. — Получение последовательностей из слов — узкая возможность. И хотя от наших человеческих способностей это пока еще далеко, но если присмотреться, то не так уж и мало».
Подобные возможности стали основой для многих оптимистичных предсказаний дальнейшего развития и перспектив ИИ, впрочем, чрезмерно пессимистичных относительно той роли, что отводится людям в подобном будущем.
Исследования поведения ИИ в реальном мире
Кен Голдберг (Ken Goldberg), директор компании Autolab, отмечая важность различных комбинаций людей и машин, работающих вместе для решения проблем и создания инноваций, подчеркивает, что сейчас пока имеет место превалирование множественности путей развития над сингулярностью Однако такое сотрудничество человека и машины особенно важно, поскольку приложения с ИИ выходят из лабораторий в реальный мир.
Питер Аббель (Pieter Abbeel), профессор кафедры электротехники и компьютерных наук в Калифорнийском университете в Беркли, который работает над внедрением ИИ в мир индустрии в качестве президента и главного ученого из компании Embodied Intelligence, в свою очередь, также подчеркивает важность совместной работы людей и машин (рис. 2).
«Часть проблемы заключается в том, — говорит Аббель, — чтобы люди могли не просто обратиться к технологии ИИ, но сделать это так, чтобы стать умнее, а не лишь использовать машины отдельно от нас. Когда машины являются частью нашей повседневной жизни и мы можем применять их так, чтобы сделать себя более продуктивными — тогда это становится действительно захватывающим».
Несмотря на восторг от перспектив ИИ, профессор Аббель все же считает, что тут более чем оправданна и некая предусмотрительность, осторожность: «В области ИИ имеется, безусловно, большой прогресс и, как следствие, идет много споров о том, что нам от него ожидать. С точки зрения опасений, я думаю, хорошо иметь в виду, что пока наиболее заметные достижения ИИ, такие как распознавание речи, машинный перевод и распознавание конкретных изображений из общей массы, являются примером контролируемого обучения».
Аббель отмечает, что, конечно, важно понимать различия в типах ИИ, которые мы сейчас создаем. Что же касается компьютерного обучения, то существует три его основных вида: контролируемое обучение (supervised learning), неконтролируемое обучение (unsupervised learning) на основе обработки данных в ЭВМ, а также обучение с подкреплением сигналами от среды взаимодействия (reinforcement learning).
«Контролируемое обучение — это просто распознавание моделей, образов, — говорит Аббель. — Хотя, особенно в случае, когда требуется переход от речи к тексту или от одного языка к другому, это безусловно могут быть довольно сложные для восприятия модели, но при этом типе обучения у ИИ в действительности нет поставленной цели или какого-либо особого интеллектуального подхода. Дайте ему что-нибудь по-английски, и он скажет вам, как это будет на китайском языке. Произнесите предложение, и он сделает транскрипцию и расшифровку, а затем выдаст его в виде последовательности букв. Но все это лишь простое сравнение на соответствие уже имеющейся модели. Если же вы вводите модель как изображение и надписи, тогда все происходит по типу того, как и вы переходите с изображения на его письменное воспроизведение».
«Неконтролируемое обучение — это когда вы даете ему (ИИ) только изображения, без надписей, — поясняет Аббель. — Вы надеетесь, что, увидев много изображений, ИИ начнет понимать, как выглядит мир, а затем, создавая это понимание, вероятно, в будущем сможет быстрее научиться чему-то другому. У неконтролируемого обучения также нет поставленной задачи. Просто вы даете ему много данных. Когда используется обучение с подкреплением сигналами от среды взаимодействия, то это совсем иной подход, который сильно отличается от двух предыдущих, он и интереснее, но и гораздо сложнее. Такое обучение реализуется, например, в современных беспилотных автомобильных технологиях. Его основа заключается в том, что вы даете системе цель. Целью может быть высокий балл в видеоигре, или победа в шахматной партии, или сборка нескольких элементов. Вот почему некоторые из наших страхов могут быть оправданны. Если у ИИ будет неправильная цель, что тогда может произойти? А какими вообще должны быть цели?»
Важно, чтобы люди и искусственный интеллект не развивались отдельно друг от друга. По мере того, как мы строим все более «умные» машины, наши возможности как людей будут дополняться.
«Меня очень волнует то, что мы делаем прямо сейчас в компании Embodied Intelligence, — недавние события в области искусственного интеллекта дали ИИ возможность понять, что они видят на картинах, то есть в живописи», — сказал Аббель.
Глубокое обучение для захвата манипуляторами робота
Компания Autolab, которой руководит Голдберг, уже более десяти лет фокусируется на проблемах ИИ и применяет его к проектам в облачной робототехнике, глубокому обучению с подкреплением сигналами от среды взаимодействия, обучению путем демонстрации, уделяя значительное внимание проблеме надежности захвата манипуляторами роботов и их действиям для нужд складской логистики, домашней и хирургической робототехники.
Проект Dexterity Network (Dex-Net) компании Autolab показал, что ИИ может помочь роботам научиться захватывать объекты разного размера и формы, загружая миллионы трехмерных объектных моделей, изображений и их измерений для того, чтобы впоследствии, после глубокого обучения, их могла понимать нейронная сеть (рис. 3). Раньше роботы узнавали, как захватывать и манипулировать объектами, обучаясь на разных объектах снова и снова, что является довольно-таки трудоемким и длительным процессом. Используя синтетические точечные облака вместо физических объектов для обучения нейронной сети, можно научить робота распознавать объекты и надежно их захватывать. Последние итерации Dex-Net в этом направлении намного эффективнее и достигают 99%-ной точности захвата.
В долгосрочной перспективе Голдберг надеется разработать высоконадежный робот, который сможет захватывать широкий круг твердых объектов, таких как инструменты, предметы домашнего обихода, упакованные товары и заводские детали.
Глубокое обучение коллаборативных роботов
Программная платформа Intera 5 компании Rethink Robotics предназначена для того, чтобы создать коллаборативные, то есть совместно используемые в одном общем рабочем пространстве с людьми, роботы. Благодаря этой платформе коллаборативные роботы Baxter и Sawyer стали более «умными» и позволяют каждому пользователю легко и быстро настраивать их для выполнения различных задач (рис. 4). Брукс отмечает, что в этом направлении нет единого подхода и у всех различное видение того, как использовать ИИ и каковы возможности обучения роботов.
«У традиционных промышленных роботов нет большого разума, — говорит Брукс. — Но, продвигаясь вперед, мы стараемся достичь этого. Мы вкладываем глубокие знания в роботов и пытаемся решить эту проблему, поскольку считаем, что 90% будущего производства — это роботы, работающие в одном общем пространстве с людьми».
У роботов Sawyer и Baxter есть функция «обучение через демонстрацию» (training-by-demonstration), которая, собственно, и заставляет ИИ работать.
«Когда вы обучаете роботов посредством показа операций, вы демонстрируете ему несколько вещей, передвигая его руку, и это движение должно перейти в программу, называемую деревом поведения, — поясняет Брукс. — Робот пишет программу для движения самостоятельно, так что у вас нет необходимости делать это».
Программная платформа Intera 5 — это графический язык программирования. Брукс говорит, что ее можно просмотреть, изменить или написать свою программу в дереве поведения, которая обходит опцию программы для автоматической работы.
Искусственный интеллект изменяет программирование роботов
ИИ предлагает новый способ программирования роботов. Аббель и его команда в компании Embodied Intelligence используют возможности ИИ, чтобы помочь промышленным роботам приобретать в процессе обучения новые, все более сложные навыки.
Эволюция их работы началась с исследований Аббеля в Калифорнийском университете в Беркли, где был достигнут большой прорыв в использовании имитационного обучения и глубокого обучения с подкреплением сигналами от среды взаимодействия, что позволило научить роботов манипулировать объектами. При этом используется сочетание чувствительности (сенсорики) и дистанционный тип взаимодействия с роботом в системе «человек — машина». Для восприятия того, как робот видит реальность через камеру, оператор использует гарнитуру виртуальной реальности (virtual reality, VR).
На стороне управления оператор, применяя виртуальную реальность и устройства слежения на руках, манипулирует и захватывает руками те или иные объекты (рис. 5). Когда руки оператора движутся, эти движения отслеживаются. Его координаты и ориентация подаются на компьютер, который управляет роботом. Таким образом, оператор имеет прямое управление манипуляторами робота, подобно тому, как кукловод двигает марионетками.
«Мы позволяем человеку буквально влезть в шкуру робота, — сказал Аббель. — Он может видеть окружающую обстановку глазами робота, контролировать и управлять его руками».
Аббель также говорит, что люди настолько ловкие, что нет и не может быть никакого сравнения между захватами робота и нашими руками. Так что, работая через систему виртуальной реальности, оператор вынужден подстраиваться под ограничения робота.
«Вы учите робота определенным навыкам, делая это посредством демонстрации, — комментирует Аббель. — Но это не значит, что в этот момент он будет роботоподобным. Нет, он будет выполнять операции в человеческом темпе, что замедляет работу большинства роботов. Так что такое имитационное обучение — лишь первый этап. Итак, сначала вы учите робота посредством демонстрации той или иной операции. Затем, во второй фазе, робот будет проходить обучение с подкреплением сигналами от среды взаимодействия, где он уже из собственного опыта путем проб и ошибок получает определенные навыки. Красота здесь в том, что робот уже изучил и понял суть задачи. Теперь ему нужно только научиться ускорять ее решение. Это то, чему он может относительно быстро обучиться сам, именно через обучение с подкреплением сигналами от среды взаимодействия».
Аббель сказал, что их технология особенно подходит для сложных задач с использованием машинного зрения и манипулирования, которые в настоящее время слишком сложны для традиционных методов программирования.
В конце концов, рано или поздно компания Embodied Intelligence позволит другим людям использовать это программное обеспечение для перепрограммирования своих роботов, делая свои собственные демонстрации. Это предоставит возможность любой компании, большой или малой, быстро перераспределить и программировать роботы для разных задач.
Коллективный потенциал
Облачная робототехника, машинное обучение, компьютерное зрение, распознавание речи — все эти аспекты ИИ развиваются и продвигаются, порой делая значительные шаги в конкретных областях. Однако у ИИ по-прежнему нет ничего человеческого.
Даже если роботы, используя ИИ и человеческую инженерию, когда-нибудь смогут приблизиться к нашей ловкости, они никогда не смогут по-настоящему понять находящийся вокруг них мир во всей его хрупкости и потенциале. Контекст и изобретательность останутся в сфере людей. Технология сама по себе не является ни плохой, ни хорошей — все зависит лишь от того, как мы ее используем. Хочется верить, что с помощью искусственного интеллекта, робототехники и у нас есть огромный потенциал для их использования именно для блага людей.