Модель от OpenAI сможет делать видео из картинок и текста

OpenAI представила модель ИИ, которая создаёт видео из картинок и текстового описания

17 февраля 2024

Компания OpenAI, известная разработкой ChatGPT, представила новую модель искусственного интеллекта Sora, которая может создавать видео из текстовых запросов и статичных снимков. Однако пока этот функционал не доступен широкой публике.

Ключевые факты

В своём блоге компания пишет, что Sora может создавать сложные сцены с несколькими персонажами, разными типами движения и детальным фоном, а модель ИИ «понимает» принципы работы физики в реальном мире.
Однако Sora имеет и некоторые недостатки: порой она не понимает причинно-следственные связи (на видео человек откусывает печенье, но следа не остается), не ориентируется в пространстве, например, путает право и лево, и не отображает некоторые физические процессы: человек может висеть в воздухе или неестественно двигаться.
Модель способна создавать видео на основе статических изображений и заполнять пропущенные кадры в существующих видеороликах.

Стоп-кадр из видео, сгенерированного по текстовому описанию: «Стильная женщина идет по улице Токио, наполненной тёплым светом неона и анимированными вывесками города. На ней чёрная кожаная куртка, длинное красное платье и чёрные ботинки». Источник: openai.com.

Пока Sora доступна только «красной команде» специалистов, которая оценивает, как модель работает с потенциально опасными темами. Также доступ к ней получат некоторые художники, дизайнеры и кинематографисты для получения обратной связи.
Стоимость Sora пока не известна.

Автор новости: Алина Горюнова.

Чат-бот Bard теперь может генерировать изображения

Модель ИИ от Apple научилась «улучшать» фотографии

Instagram экспериментирует с ИИ: замена фона в сторис и генерация сообщений в директ

OpenAI представила модель ИИ, которая создаёт видео из картинок и текстового описания

Ключевые факты

Читайте больше новостей медиасферы здесь