OpenAI представила модель ИИ, которая создаёт видео из картинок и текстового описания

17 февраля 2024

Компания OpenAI, известная разработкой ChatGPT, представила новую модель искусственного интеллекта Sora, которая может создавать видео из текстовых запросов и статичных снимков. Однако пока этот функционал не доступен широкой публике.

Ключевые факты

  • В своём блоге компания пишет, что Sora может создавать сложные сцены с несколькими персонажами, разными типами движения и детальным фоном, а модель ИИ «понимает» принципы работы физики в реальном мире.
  • Однако Sora имеет и некоторые недостатки: порой она не понимает причинно-следственные связи (на видео человек откусывает печенье, но следа не остается), не ориентируется в пространстве, например, путает право и лево, и не отображает некоторые физические процессы: человек может висеть в воздухе или неестественно двигаться.
  • Модель способна создавать видео на основе статических изображений и заполнять пропущенные кадры в существующих видеороликах.

Стоп-кадр из видео, сгенерированного по текстовому описанию: «Стильная женщина идет по улице Токио, наполненной тёплым светом неона и анимированными вывесками города. На ней чёрная кожаная куртка, длинное красное платье и чёрные ботинки». Источник: openai.com.

  • Пока Sora доступна только «красной команде» специалистов, которая оценивает, как модель работает с потенциально опасными темами. Также доступ к ней получат некоторые художники, дизайнеры и кинематографисты для получения обратной связи.
  • Стоимость Sora пока не известна.

Автор новости: Алина Горюнова. 

Читайте больше новостей медиасферы здесь