Тимофей Петрищенко

Топ ИИ-технологий для усиления видеоредакции

Можно устроить брейнсторм с Мартином Скорсезе

Сегодня искусственный интеллект в состоянии помочь медиа на всех этапах создания видеоконтента: от подготовки сценария и раскадровки до генерации полноценных видеосцен.

Как ИИ упрощает и улучшает работу видеоотдела и какие именно сервисы лучше использовать? Об этом рассказала украинский эксперт по видео, режиссёр политического ток-шоу «Свобода слова Савика Шустера» и сценарист команды Netflix Лидия Несмачная. Мы записали её советы на конференции для видеожурналистов Wisła Video Forum, организованной в Варшаве Press Club Belarus.

Изображение: Павел Савицкий

Как работает ИИ и почему иногда он галлюцинирует?

Искусственный интеллект обрабатывает информацию, разбивая её на маленькие части — токены. Это могут быть слова, буквы или цифры. Чтобы понять и использовать эти данные, ИИ помещает их в особое многомерное пространство. Его можно представить как карту, на которой каждая точка содержит закодированную информацию.

Это пространство помогает ИИ находить скрытые связи между данными, которые обычному человеку не всегда видны. На основе этих связей ИИ может создавать что-то новое. Когда ИИ отвечает на вопросы, он старается выбрать информацию, которая, по его мнению, будет полезной или интересной для пользователя.

Однако иногда ИИ может «ошибаться» и придумывать ответы, которые не основаны на реальных данных. Это называют «галлюцинациями ИИ».

Как общаться с ИИ. Секретный ход:

Для эффективного взаимодействия с ИИ полезно использовать технику «жёлтой уточки», когда задача объясняется простыми словами, будто вы говорите с игрушечной уточкой. Это помогает яснее формулировать и улучшает результаты работы ИИ.

Различия между популярными чат-ботами: GPT, Gemini и Claude

1. ChatGPT – американский чат-бот. Подходит для работы над «продающими» видео;
2. Gemini – чат-бот от компании Google, поэтому корректно работает в паре с поисковиком;
3. Claude – французский чат-бот, предназначенный для креативных или научных задач.

В целом ChatGPT и Gemini создают более персонализированные ответы для конкретного пользователя.

Как устроить брейнсторм по видео с «недоступными» экспертами. Пример: 

Представьте, что в комнате находится 5 гениальных экспертов из разных областей. Выбирайте тех, чьё мнение вам было бы интересно. Лучше брать иностранных, например, Квентина Тарантино, Мартина Скорсезе, Карла Юнга и Тома Форда. (Увы, ИИ пока мало знает о беларусских или украинских профессионалах) Затем попросите ИИ написать пять идей по заданной теме от каждого, кто находятся в комнате.

Изображение: Павел Савицкий

Теперь разберёмся, для чего можно использовать искусственный интеллект и какие сервисы выбирать.

1. Подготовка сценпланов и раскадровки

GPT помогает писать сценарии и создавать раскадровки. Может генерировать идеи, тексты и диалоги на основе начальных данных.

2. Автоматизация видеомонтажа

Descript, Opus.pro и Lai-Lai Cut автоматизируют монтаж:

  • Descript: монтирует видео и подкасты на основе текста. Например, при редактировании интервью можно просто удалить ненужные фрагменты текста, и куски видео автоматически исчезнут. Цена: от 0 до 40$ в месяц.
  • Opus.pro: нарезает видео в вертикальном формате, что актуально для TikTok и Instagram. Стоит от 0 до 29$ в месяц.
  • Lai-Lai Cut: бесплатный инструмент для создания коротких видео на основе длинных записей, полезен для дистрибуции контента на разных площадках. К примеру, если пользователь выкладывает 2-х часовое интервью на YouTube, Lai-Lai Cut сможет нарезать короткие видео для Shorts, Reels и TikTok.

3. Расшифровка аудио и видео

Gladia AI и Whisper расшифровывае аудио- и видеофайлы.

  • Gladia AI – бесплатный для 10 часов аудио раз в месяц, подписка Pro стоит 0,612$ за час аудио. Поддерживает 99 языков, в том числе русский.
  • Whisper – это инструмент от компании OpenAI. Стоимость 0.006$ за минуту аудио. Технология работает со множеством языков, включая английский, испанский, китайский и русский.

4. Озвучивание видео

ElevenLabs.io синтезирует речь в высоком качестве. Бесплатный для 10 тысяч символов в месяц, подписка Pro стоит 99$ в месяц и имеет лимит в 500 тысяч символов. Инструмент считает не только количество букв, но также и пробелы, и абзацы.

5. Улучшение качества видео

Topaz Labs и Magnific используют ИИ для повышения разрешения видео, устранения шумов и улучшения чёткости изображения.

  • Topaz Labs создал несколько инструментов, которые на разных уровнях улучшают качество видео. Годовой абонемент на ИИ стоит от 99$ до  299$ в месяц.
  • Подписка на Magnific начинается от 39$ в месяц, а версия Pro стоит 299$ в месяц.

Инструменты для создания видео на основе ИИ

GEN-3: инструмент для генерации 3D-видео на основе текста или изображений, полезен для создания анимаций и спецэффектов. Бесплатная подписка открывает доступ к 125 запросам в месяц. А бесконечное количество запросов доступно при подписке в 76$ в месяц.

Luma: платформа для преобразования текста в видео и улучшения визуальных элементов. Раньше это была программа для архитекторов, поэтому после создания ИИ, Luma хорошо работает с выстраиванием плана, но плохо – со съёмкой человеческого тела. С бесплатной подпиской пользователь может написать 30 запросов в месяц, а с пакетом Pro лимит увеличивается до 480 запросов и стоит 99,99$ в месяц.

Kling: инструмент для съёмки именно человеческого тела. Бесплатная подписка не имеет лимит запросов, однако оставляет на видео водяной знак. С подпиской Pro пользователь открывает лимит в 3000 запросов в месяц за 18,5$.

Midjourney также может быть хорошим помощником в создании фото и видео контента. Но у этого инструмента есть цензура, которая не позволит создать “агрессивный” контент. К примеру, ИИ не сгенерирует человека с оружием или мёртвого человека. Базовый план стоит 10$ в месяц и включает 3.3 часа быстрого рендеринга, а также неограниченное медленное рендеринг-время. Подписка Pro стоит 60$ в месяц и даёт 30 часов быстрого рендеринга и возможность выполнять до 12 задач одновременно.

Актуальное

Лучшее на Соли