«Яндекс» представил прототип своей нейросети для генерации изображений по текстовым запросам

Автор Владислав Касаткин На чтение 2 мин Просмотров 383 Опубликовано 05.04.2023

Российская компания «Яндекс» представила прототип собственной нейросети, предназначенной для генерации картинок по текстовым запросам. Новая технология поддерживает запросы на русском и английском языках и обещает гибкость в работе с различными художественными стилями и эффектами.

«Яндекс» выпустил бета-версию 0.1.4 приложения «Шедеврум», доступную для пользователей на платформах iOS и Android. Нейросеть способна подражать известным художникам и работать в различных художественных стилях. Чем подробнее описание, тем точнее будет результат, отметили разработчики.

После ввода текстового запроса, приложение предлагает четыре варианта картинки на выбор. Пользователи могут сохранять и публиковать понравившиеся изображения в ленте приложения, а также смотреть и лайкать результаты других пользователей, делиться ими. На отдельной ленте собраны популярные картинки.

Нейросеть формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, затем поэтапно увеличивает их разрешение и добавляет детали.

Первую версию генеративной модели для бета-теста разработчики обучили на 240 млн примеров картинок с текстовыми описаниями. В «Яндексе» отметили, что обучение продолжается на наборе данных из 500 млн примеров и в будущих версиях качество будет улучшаться.

«Яндекс» представил прототип своей нейросети для генерации изображений по текстовым запросам — Запрос «Пудель ныряет в бассейн, как на обложке альбома Nevermind»

Первые пользователи автоматически получают доступ к генерации изображений. С ростом их количества появится система заявок — новые пользователи смогут оставлять запросы после подтверждения заявки. В будущем такую возможность получат все зарегистрированные пользователи.