Компания OpenAI анонсировала новую функцию генерации изображений, встроенную в модель GPT-4o. Теперь пользователи могут создавать изображения прямо в чате с GPT — без необходимости переходить в отдельные инструменты вроде DALL·E. Это очередной шаг к превращению GPT-4o в универсального ассистента, способного не только обрабатывать текст, но и генерировать визуальный контент.


Что такое генерация изображений в GPT-4o
Новая функция позволяет пользователям задавать визуальные запросы в естественном языке — от простых («нарисуй город будущего») до сложных и многослойных («иллюстрация для научно-фантастического романа в стиле 80-х с неоновыми огнями и туманом»). Система интерпретирует запрос и выдает изображение прямо в чате. Не нужно переформулировать или использовать специальные теги — всё работает «из коробки».


OpenAI подчеркивает, что качество генерации улучшено: изображения создаются быстрее, становятся более детализированными, а анимация процесса — плавной. Пользователю доступна возможность наблюдать, как изображение постепенно проявляется, что делает взаимодействие более живым.





Безопасность и защита от злоупотреблений
С момента запуска функции текстовой генерации изображений в DALL·E 3, OpenAI активно развивает методы контентной модерации. Генератор изображений GPT-4o использует аналогичную архитектуру, включая:
• автоматическую фильтрацию опасных или неэтичных запросов;
• распознавание вредоносного контента;
• маркировку изображений с помощью системы C2PA, которая указывает, что изображение создано ИИ.
Эти меры особенно важны на фоне роста числа инструментов дипфейков и генеративного контента, способного вводить пользователей в заблуждение.
Зачем это нужно пользователям
Генерация изображений в GPT-4o особенно интересна тем, кто работает с визуальным контентом: дизайнерам, маркетологам, авторам презентаций и создателям цифровых продуктов. Возможность быстро получить иллюстрацию к идее прямо в ходе диалога с ИИ — это экономия времени и новый уровень интерактивности.
Сценарии применения:
• создание обложек и иллюстраций для статей;
• разработка визуальных концептов продуктов;
• помощь в визуализации идей на этапе мозгового штурма;
• генерация сторибордов и кадров для видео.
Конкуренция на фоне других генеративных ИИ
Появление этой функции поднимает планку для других игроков, таких как Midjourney, Pika или Ideogram. Но ключевое отличие GPT-4o — в синергии между текстом, изображением и (в будущем) видео и аудио в одном интерфейсе.
OpenAI стремится не просто создать отдельный инструмент генерации изображений, а предложить единое пространство для взаимодействия с ИИ. Это напоминает интеграцию Excel с Power BI или Photoshop с Firefly: одно окно — множество задач.
Когда и где доступно
Функция генерации изображений в GPT-4o пока внедряется постепенно. На момент написания статьи она уже работает в десктопной версии ChatGPT (при использовании GPT-4o) и доступна через API. Мобильная версия получит поддержку позже.
Заключение
Генерация изображений в GPT-4o — это не просто очередная галочка в списке функций. Это шаг в сторону по-настоящему универсального ИИ-инструмента. OpenAI продолжает приближать будущее, в котором взаимодействие с искусственным интеллектом становится неотъемлемой частью креативной и профессиональной работы.
Теперь создавать визуальный контент так же просто, как отправить сообщение в чат.
No-code specialist, always eager to learn and tackle challenges, exploring neural networks




