18+
  • Город
  • Город
  • News
Город

Студенты ИТМО и НИУ ВШЭ рассказали, за какие исследования получили премию «Яндекса» имени Ильи Сегаловича

«Яндекс» впервые вручил ученым премию имени сооснователя компании Ильи Сегаловича — она выдается за развитие компьютерных наук. В номинации «Молодые исследователи» премию получили два студента из Петербурга: Александра Малышева, студентка НИУ ВШЭ и Арип Асадулаев, студент ИТМО. «Собака.ru» узнала, чем они занимаются, и какие исследования провели.

Александра Малышева, студентка НИУ ВШЭ.

Премия дается не за одну конкретную работу, поэтому я выделю два исследования. Расскажу на примере: есть игра Дота-2, и в ней пять агентов каждый день играют друг с другом или против компьютера.Машина уже умеет выигрывать в поединке один на один, но пять на пять — проигрывает. Я провела исследование и поняла, что это происходит из-за проблем с коммуникацией. Когда люди играют, они передают друг другу информацию. Часто это даже что-то не особо важное: «О, я вижу цветочек!». Их разговоры создают шумы, компьютер пока не умеет понимать, что важно, а что нет. Мое исследование как раз заключалось в том, как правильно передавать информацию. ( Видео — с 1:35).

Второе — я учила робота бегать, как человек, у которого вместо ноги протез, так, чтобы нагрузка на суставы остальной части ноги и второй ноги была минимальной, чтобы они не разрушались. У меня была полная модель человека, с мышцами и суставами. Каждый раз, когда робот пробегал сколько-то метров, ему давалась награда. Но проблема заключалась в том, что ему было сложно сделать первый шаг, он не понимал. И тогда мы с ним смотрели видео на YouTube, где люди бегают. Это как с ребенком — малыш не научится ходить, если не будет видеть, как это делают взрослые. 

Интересно, что робот запоминает и повторяет любую информацию. Если показать ему, как ходить гуськом, он будет ходить гуськом».

Арип Асадулаев, студент ИТМО.

« В основном мои исследования лежат в таких областях машинного обучения, как генерация последовательностей, алгоритмы обучения с подкреплением, и исследование нейронных сетей с внешней памятью.
Наибольший вклад, я думаю внесла работа, посвященная алгоритму обучения с подкреплением — это такая область машинного обучения где задачи сильно приближены к условиям реальной жизни, поэтому алгоритмы тестируются на компьютерных играх и сравниваются с показателями человека.

Нам удалость улучшить  "proximal policy optimization" — это очень популярный метод, который на сегодняшний день очень часто применяется в архитектурах, показывающих лучшие результаты. 
Если говорить о «нейронных сетях с памятью», то исследования в данной области у меня сейчас в процессе, и направлены они на стабилизирование и регулирование обучения подобных архитектур. 

Эти методы могут применяться практически везде, примеров использования нейронных сетей в реальной жизни множество. Например, в финансовой сфере, в медицине, при диагностировании болезней, в медиа, в поисковых системах, в социальных сетях и многих других, связанных с компьютерными технологиями.

В наших исследованиях мы не применяем методы сразу на практике, а предлагаем новую технологию и тестируем ее на эталонной задаче, котороя зачастую на практике не актуальна. Она сложная, и позволяет сравниваться с другими ранее предложенными методами. Затем другие исследователи и разработчики могут внедрить наши методы где-то на практике, для их задач, так как исследования публикуются в открытом доступе.

Еще я сейчас занимаюсь генерацией последовательностей, к примеру текста. Я обучил модель на комментариях пользователей с сайта IMDB, это достаточно популярный датасет для сравнения моделей между собой. Новизна здесь заключается в новой архитектуре. 
Все исследования я опубликую в открытом доступе в ближайшее время».


Подписывайтесь на наш канал в Telegram — подборка главных новостей за день.
 
 
Следите за нашими новостями в Telegram

Комментарии (0)