Дипфейк вместо живого лица, машины вытесняют писателей, дизайнеров и даже кинозвезд… Нейронная антиутопия отменяется! – уверен Денис Пиманкин. Сооснователь компании SOTA+ о том, способен ли искусственный интеллект к творчеству (нет!) и может ли он заменить человека (да, но бояться не надо!).
Дополненная реальность, сгенерированная суперсовременными нейронными сетями — во время фотосессии мы поместили наших героев в мир, который они создают сами. В нем любая информация доступна по первому клику, а интересующий объект можно приблизить простым касанием сенсорного экрана.
Вы разрабатываете программы, которые позволяют создавать качественную графику и анимацию даже тем, у кого нет профессионального опыта. Почему решили привести искусственный интеллект в сферу дизайна?
Эта идея появилась пять лет назад. По образованию я математик, айтишник, в свое время преподавал в университете, то есть всегда занимался вопросами машинного обучения – именно тем, что сейчас называют искусственным интеллектом. В 2020 году я встретил своего одногруппника Егора Шаклунова (операционный директор компании SOTA+, а в прошлом сооснователь Kurt studio, преподаватель Школы Дизайна НИУ ВШЭ Нижний Новгород), у которого была своя дизайнерская студия, – поговорили и поняли, что скоро ИИ зайдет и в сферу дизайна, а значит, пора запускать стартап! Тогда нейронные сети только еще учились рисовать, появлялись первые дипфейки, но все это требовало времени и слаженной работы большой команды. Однако тренд мы угадали верно!
За эти пять лет ИИ совершил резкий скачок: дипфейк уже сложно отличить от живого человека, нейросети грозят вытеснить не только дизайнеров, но и киноартистов…
Даже простому пользователю этот скачок очевиден, а для меня как математика он выглядит намного более впечатляющим. Получается, что направление мы угадали, но даже близко не смогли предвидеть, с какой скоростью все это будет развиваться.
Чем вы объясните такой прогресс в нейронных технологиях?
На мой взгляд, серией удачных совпадений. Во-первых, в начале десятых годов появились достаточно мощные графические ускорители (по-другому GPU), которые смогли обучать нейронные сети – на старых компьютерах это было невозможно. Увидев такой успех, производители ускорителей в своей деятельности сделали основной акцент на машинном обучении. Во-вторых, как раз в это же время большинству людей стали доступны айфоны, которые начали снабжать нейронки данными – собрать миллионы фотографий теперь не проблема. Поэтому машинное обучение стало развиваться просто сумасшедшими темпами. И в-третьих, успех первых глубоких сеток спровоцировал их популярность – огромное количество исследователей ринулись «копать» в сторону ИИ.
Итак, в чем же была идея вашего стартапа?
Изначально наша компания хотела создать продукт для обычного потребителя, чтобы любой пользователь мог просто выбрать стиль, нажать на кнопку и сгенерировать дизайн – красивые паттерны, заставки, которые можно использовать (например, для оформления презентации или сториз), а если результат не понравился, легко создать новое изображение. Обычно это занимало массу времени: чтобы сделать простейший фон, дизайнер мог потратить неделю. Освоив этот сегмент, мы начали разрабатывать программы для компаний. У большинства из них есть фирменный дизайнерский стиль, поэтому нужно, чтобы их дизайнерская продукция ему соответствовала: заказчик заводит в программу свой брендбук, и она начнет выдавать графику: стиль остается прежним, а контент может меняться бесконечно.
На рынке информационных технологий можно найти множество таких программ. Чем же тогда привлечь потребителя?
Своими ноу-хау. Большинство сеток используют растровую графику, но для дизайнера это не всегда удобно, особенно если необходимо создать большие изображения. Мы же с самого начала использовали векторную графику, которая позволяет рисовать просто гигантские картинки. Однажды для ННГУ мы сгенерировали огромные, размером с дом, изображения структуры металлов – в растре они просто расплылись бы на пиксели. И еще мы поработали над полным контролем цвета. Вроде бы так просто – задать нейронке нужную палитру, но на самом деле сети до сих пор с трудом распознают оттенки.
Вы сами на глаз сможете определить, что изображение сгенерировано искусственным образом?
На всех своих лекциях я объясняю слушателям, что нейронные сети с трудом оперируют строгими правилами. Все помнят казусы, когда генерилки рисовали людей с шестью пальцами: нам это смешно, а они просто не видят разницы! Или, скажем, для дизайнера отличие между углом в 90 градусов и в 90 с половиной сразу будет очевидно, а для нейронки это одно и то же. Поэтому, чтобы узнать работу нейросети, иногда достаточно просто измерить угол.
Но ведь нейронные сети могут совершенствоваться, чтобы достичь достоверности?
Для тех нейронок, которые сейчас используют для рисования, это фундаментальное свойство – они просто так устроены! Поэтому все программы, которые мы создавали до сих пор, учитывают эти их особенности.
Вы сотрудничаете не только с бизнесменами, но и с художниками – например, с основателем студии «Тихая» Артемом Филатовым, а для областного Агентства гостеприимства сгенерировали цифровые рисунки в стиле нижегородского гипюра. Не страшно заходить на территорию живого творчества?
Здесь принцип работы тот же: у каждого художника есть свой собственный стиль, на основе которого нейросеть создает вариации изображений, но в творческий процесс ни в коем случае не вмешивается.
И вновь про различия: вы распознаете, где произведение человека, а где – созданное искусственным интеллектом?
Уже не всегда. Мы же говорили, что нейросети неточны в деталях, но, возможно, явные ошибки на картине – это плод художественной фантазии живого автора. А вот когда речь идет, например, об архитектурных сооружениях, которые должны соответствовать математическим стандартам, работа ИИ заметна.
Насколько, по-вашему, это этично – доверять машине такой тонкий процесс, как творчество?
Я считаю, что машина не должна подменять творца, она нужна для того, чтобы автоматизировать и оптимизировать процессы. Скажем, писатель сам сочиняет свой роман, но проверить ошибки, исправить помарки вполне в состоянии и машина. На корректуру уходит масса времени, почему бы не поручить ее искусственному интеллекту?
Когда я защищал диплом по поэзии XVIII века, корректор исправил на современный лад все цитаты, которые были написаны по правилам старой орфографии. Интересно, что бы на его месте сделала машина?
У меня был похожий случай – в одной научной статье я использовал технический термин «связность», а корректор исправил его на «связанность», так и ушло в печать. Я думаю, если бы мы заложили в программу нужные данные, она бы сделала все как надо.
Но все-таки задания нейросети должен давать человек?
На сегодняшнем этапе развития техники – да! В этом и есть парадокс: нейронную сеть изобрели, чтобы она создавала что-то новое, но при этом создать что-то принципиально новое она по определению не в состоянии. Если помните, во время голливудской забастовки сценаристов обсуждался вопрос, не поручить ли написание сценариев искусственному интеллекту. Но я уверен: ИИ, конечно, сможет написать что-то похожее на то, что уже было, но придумать что-то свое – на это нужна фантазия Кристофера Нолана.
Вернемся к вашим продуктам. Что было следующим этапом после анимационного дизайна?
А дальше – motion graphic: изображения с заданными цветами и стилем мы анимировали: если нужно, программа будет выдавать уникальные картинки в нужном формате хоть неделю. У нас даже была фантазия создать «вечную» картину – чтобы изображение на ней бесконечно менялось и при этом никогда не повторялось. Следующая задача – композиционная: сети должны быть более универсальными, воспринимать и обрабатывать разную информацию. Например, я делаю ребенку ко дню рождения поздравительный альбом – и нейронка максимально гармонично верстает все изображения.
То есть верстальщикам журналов стоит напрячься?
Дизайнеры, верстальщики никуда не денутся, просто их задачи станут более высокоуровневыми: они зададут стиль, загрузят данные, а сеть лишь выполнит их требование. Мне не нравится эта паника, что машины якобы вытеснят людей. Я уже слышал истерические заявления, что нейронка в ближайшее время заменит программистов, а они никуда не делись, просто огромная часть их работы стала автоматизирована.
Это напоминает английских луддитов XIX века, которые ломали машины, потому что боялись, что они вытеснят рабочих с фабрик. Сейчас их потомки сидят в офисах, а всю физическую работу за них делают станки.
Проблема в том, что большинство людей очень инертны, с трудом принимают новое. Да, пришли нейронные сети, которые готовы выполнить нашу работу, – стоит лишь немного подвинуться и со своим багажом знаний выйти на новый уровень.
Какие перспективы у искусственного интеллекта?
Мне кажется, задача на ближайшее время – сделать нейронные сети более персонифицированными. Мы все пользуемся продуктами, созданными компаниями-гигантами, но мне нужен мой собственный – чтобы он справлялся с моими специфическими задачами, чтобы учитывал мои отклики и менялся со временем. Это похоже на работу стажера – он трудится, получает новый опыт и в процессе растет профессионально. Это долгосрочная задача, и у нас уже есть интересные наработки в этой области.
Текст: Сергей Костенко
Фото: Арина Федотова
Арт-директор: Юлия Анисимова
Стиль: Алина Семяшкина
Постпродакшн: Екатерина Тулупова
Комментарии (0)