В конце ноября Google представил Nano Banana Pro — обновление своего ИИ-сервиса для редактирования изображений. Разработчик обещает генерацию «фотографий» студийного качества, практически неограниченные возможности по коррекции реальных снимков, а также умение модели «рассуждать» в ходе работы. А еще с помощью Nano Banana Pro улучшают качество изображений, реставрируют старые фотокарточки и переводят тексты на фотографиях и рисунках. Журналисты уже называют новинку «убийцей Photoshop». Рассказываем подробнее.
Что такое Nano Banana Pro?
Если коротко, Nano Banana — это ИИ-сервис для генерации изображений от Google. Он работает на базе основной гугловской Gemini (одного из основных конкурентов ChatGPT).
Оригинальную Nano Banana представили еще в августе. Уже тогда разработчики обещали «больше возможностей для создания идеального снимка, чем когда-либо». В сентябре новая модель от Google породила новый тренд в сети — с ее помощью пользователи (в основном англоязычные) генерировали гиперреалистичные 3D-фигурки себя, похожие на коллекционные игрушки.
Впрочем, на этом возможности нового ИИ-генератора изображений не ограничивались. Разработчики также обещали возможность легко «менять костюм и локацию» на фото, объединять изображения с разных снимков в одну композицию и возможность многоэтапного редактирования. К примеру, модели предлагалось «скормить» изображение пустой комнаты без отделки, после чего попросить сначала «покрасить» стены, затем добавить на изображение шкаф, диван и наконец ковер с журнальным столиком.
В концу ноября в Google оказались готовы развить успех и выпустили модель Nano Banana Pro. Здесь пользователям пообещали не только работу с изображением как таковым, но и более нюансированные настройки — такие как корректировка освещения, «контроль над каждым аспектом» работы с изображением и, возможно самое главное, работа с текстом (включая редактуру, перенос текста с объекта на объект и перевод).
Как пользоваться Nano Banana Pro?
Чтобы начать генерировать изображения, нужно зайти в Google Gemini (отечественным пользователям сделать это с российских IP не получится). Затем в окне чат-бота нужно выбрать «Думающая модель с 3 Pro» (справа), и «Изображение» (слева).
После этого можно приступать к генерации и редактированию изображений. Здесь процесс работы ничем не отличается от уже привычной для многих работы в чат-ботах. Пользователь описывает желаемое изображение (чем детальнее, тем лучше). Если речь идет о редактуре существующего изображения или об объединении нескольких предметов на одной генерации, то, нажав «+», пользователь просто может добавить необходимые файлы к промпту.
На количество генераций есть лимиты, правда их точное количество не называется. Однако, судя по всему, на бесплатном аккаунте можно сделать три изображения за день.
Что умеет Nano Banana Pro
Редактировать изображения
С помощью нового инструмента от Google можно полностью преображать свои снимки: улучшать качество снимка, менять освещение и даже время суток на снимке. При этом композиция меняться не будет.
Более того, снимок можно менять в несколько итераций, попросив чуть-чуть изменить какие-то детали, или, добавив новые детали на снимок. Правда, не всегда эти детали будут выглядеть естественно.
Нередко пользователи задействуют возможности редактуры изображений для вполне прикладных целей: планировать ремонт в комнате, примеряя цвет обоев, реставрировать старые фотографии и тому подобное.
В частности, в русскоязычном сегменте пользователи активно пробуют в Nano Banana Pro новые прически и цвета волос, делая коллажи — пример промпта можно найти здесь.
Объединять несколько предметов в одном изображении
Еще одна важная функция Nana Banana Pro — возможность объединять несколько отдельно сфотографированных объектов на одном сгенерированном изображении.
При этом для таких объектов можно задать любые условия. Правда, как и всегда, необходимо задать максимально детализированные условия, чтобы получить результат, максимально близкий к изначально задуманному.
Зачастую запросы лучше писать на английском языке, поскольку модель может лучше реагировать именно на такие запросы и точнее понимать то, чего от нее хочет пользователь.
Работа с текстом
Одно из главных обновлений, которое анонсировали создатели Nano Banana Pro — улучшенные характеристики работы с текстом. Как утверждается, модель теперь понимает тексты на изображении.
Это позволяет редактировать, добавлять, убирать и даже переводить слова на изображении. Правда, в Google честно признают, что модель «может испытывать трудности с грамматикой, орфографией, культурными особенностями или идиоматическими выражениями».
При этом алгоритм сохраняет шрифт и стиль написания текста. Более того, они не меняются даже при дальнейшей редактуре изображения — например, если попросить взять объект, на котором находится надпись, и переместить его на другой фон.
Впрочем, важно учитывать, что качество фона все еще очень сильно зависит от запроса и может быть нереалистичным.
Комментарии (0)