OpenAI представила модель Images 2.0 для генерации изображений в ChatGPT. Кроме того, что ИИ делает синтетические картинки, теперь он может искать информацию в интернете, затем генерировать несколько изображений для одного промпта и перепроверять свой результат.
Ключевые факты
- Когда пользователь в ChatGPT выбирает модель «рассуждерния», Images 2.0 ищет подходящую для задачи информацию в интернете, генерирует несколько картинок для одного промпта и перепроверяет свой результат, рассказывает компания OpenAI.
- Также разработчик отмечает, что Images 2.0 лучше передаёт детали, например, на фотографиях добавляет «недостатки» для реализма. И генерирует кинематографические кадры, пиксельную графику и другие стили.

Сравнение результатов генерации Images 2.0 (слева) и Nano Banana Pro от Google (справа). Источник: @ViralOps
- Но у инструмента могут быть трудности с задачами, которые требуют показать целостность физического мира, пишет OpenAI. То есть ИИ может некачественно сгенерировать инструкцию по оригами, кубик Рубика, детали под наклоном или перевёрнутые, а также маленькие и повторяющиеся элементы, к примеру, песчинки.
- Images 2.0 может генерировать картинки с текстом, который не содержит латинские буквы, к примеру японский, корейски, китайски, хинди и бенгальский. Компания отмечает, что ИИ может не просто переводить надписи, а синтезирует изображение, чтобы язык был «частью дизайна».

Источник: OpenAI
- Инструмент доступен всем пользователям ChatGPT бесплатно. Режим работы с рассуждениями открыт только для платных подписчиков ChatGPT Plus, Pro и Business цена примерно от 10$ в месяц.
Автор новости: Тимофей Петрищенко
Источник: OpenAI
Читайте больше новостей медиасферы здесь
Подпишитесь на соцсети «Соли», чтобы не пропустить другие тексты