ИИ учит роботов ходить по полосе препятствий

 

Полоса препятствий для роботов

Открытый стиль обучения лучше, чем традиционные методы

Прежде чем бегать с препятствиями, нужно научиться ползать, а прежде чем читать Уильяма Шекспира, нужно знать алфавит. Любой педагог знает важность пошагового плана урока для овладения заданием. Теперь исследователи из Uber AI Labs разработали алгоритм, который

придумывает собственную учебную программу для обучения имитируемых роботов пересечению труднопроходимой местности, не падая плашмя на их безликие тела. Этот алгоритм может однажды даже помочь автономным транспортным средствам реагировать в чрезвычайных ситуациях.

Новая программа, получившая название Paired Open-Ended Trailblazer (POET), сначала предлагает набор уникальных ландшафтов, каждый из которых населен управляемым компьютером персонажем. Используя только две ноги и лазерный дальномер, персонаж должен научиться ходить. После некоторого периода практики искусственный интеллект меняет задачу - иногда делая ее проще, а иногда и сложнее. Это может сделать траншеи шире, пни выше, а землю более неровной. Иногда заменяют другого ходока, чтобы посмотреть, помогут ли навыки, полученные на одной местности, на другой. Это изменение и замена полос препятствий создает непредсказуемую серию ступеней на пути к ловкости.

Используя POET, роботы-ходоки могут в конечном итоге покрыть сложную местность, которая не может быть изучена без более ранних курсов, сообщают исследователи в статье, опубликованной в arXiv в этом месяце. Более того, ПОЭТ работал лучше, чем программа, которая просто увеличивала сложность местности с течением времени, не пробуя много косвенных путей. Обходные маршруты обучения ПОЭТА окупались снова и снова. В одном примере бот приседал, пока не столкнулся с миром с пнями и не должен был научиться ходить вертикально; позже он вернулся в более плоский мир и продолжал ходить вертикально, завершая курс быстрее, чем раньше.

Исследователи говорят, что ПОЭТ может однажды помочь реальным роботам решить множество сложных задач или даже позволить автономным автомобилям научиться справляться с чрезвычайными ситуациями, которые программисты не додумались включить в план урока. В открытой манере ПОЭТ может даже создавать и решать совершенно новые проблемы - от синтеза белка до сочинения стихов.



Комментарии

Популярные сообщения