1. Главная
  2. Руководства

Делаем ИИ-видео для YouTube, Instagram и TikTok: ролики без съемок


Нейросети стремительно ворвались в повседневную жизнь и стали незаменимыми помощниками в самых разных сферах — от создания текстов, иллюстраций и музыки до генерации кода и обработки данных. Все чаще их используют для создания контента, и сейчас уже можно вести вполне успешные каналы, например в TikTok или YouTube, полностью создавая контент с использованием нейросетей. 

В нашем материале мы покажем на примере, как создавать вирусные ролики для YouTube Shorts, Instagram* Reels и TikTok с использованием ИИ-моделей. 

  1. Как выглядит процесс создания ИИ-видео 
  2. Какие нейросети потребуются 
  3. Гайд по созданию ИИ-видео 
  4. Рекомендации 

Как выглядит процесс создания ИИ-видео

Сам процесс достаточно прост: наша задача — придумать сюжет, сгенерировать и в дальнейшем «оживить» (то есть превратить в видео) подходящие фотографии. Останется озвучить текст с помощью ИИ, собрать все в одно видео и наложить звук в любом видеоредакторе.

Учитывайте, что длина «оживленного» видео около 6 секунд, поэтому на минутный ролик потребуется примерно 10 сгенерированных изображений.

Какие нейросети потребуются

Мы покажем весь процесс — от генерации изображения до монтажа готового ролика. Наш выбор пал на связку: ChatGPT (текст, идея для видео), Sora (генерация фото), ElevenLabs (озвучка) и Hailuo AI (анимация изображений). Для финального монтажа используем простой видеоредактор — CapCut.

В нашем случае оформлена подписка ChatGPT за $20 — в нее входит и доступ к Sora. Также приобретен платный тариф Hailuo AI за $10. Однако все эти нейросети доступны и бесплатно, просто с ограничением на количество генераций. Для озвучки мы используем бесплатный тариф ElevenLabs — его вполне достаточно для коротких роликов.

Но вы можете использовать и другие варианты: 

  • Ideogram — для создания изображений, есть бесплатные генерации;
  • Krea.ai — для создания изображений и превращения фото в видео, есть бесплатные генерации;
  • Grok AI — чат-бот (бесплатен), генерация изображений (есть ограниченное количество генераций в сутки);
  • Qwen — чат-бот, генерация изображений, полностью бесплатен;
  • Midjorney — для генерации изображений, только платные тарифы от $10.

На самом деле можно использовать любые другие подходящие нейросети. Мы лишь перечислили те, которые показали хорошие результаты при решении поставленных задач.

Гайд по созданию ИИ-видео

Для начала попросим ChatGPT придумать текст для вирусного ролика. Возьмем тему истории. Мы использовали следующий запрос: «Мне нужно, чтобы ты придумал текст для вирусного ролика на тему истории, какой-то интересный факт. Текста много не нужно, рассчитывай секунд на 40. Мы затем будем оживлять фотографии под этот текст — примерно по 6 секунд».

Нейросеть предложила такой текст для озвучки (его и возьмем): «Ты знал, что в Средние века в Европе судили… животных? Серьезно. Свиней, крыс, даже кузнечиков. Животных сажали в тюрьмы, судили перед настоящими судьями… И если признавали виновными — приговаривали к казни. Например, в 1386 году во Франции свинью повесили за убийство ребенка. А крыс однажды официально вызвали в суд за порчу зерна. Адвокат заявил, что они не явились... потому что боялись кошек. Средневековье: когда даже мышь могла попасть под следствие».

промпт для создания ИИ-видео

Теперь начинаем генерировать фотографии для дальнейшего «оживления». Чтобы упростить задачу, попросим чат-бота составить промпты для Sora. В том же диалоге чат-бота, где получили текст, мы написали: «Сделай промпты для Sora к каждой фотографии, которые мы потом будем оживлять. Промпты пиши на русском, качество должно быть как у настоящих фото».

Нейросеть все подробно расписала (мы вставим под каждым промптом то изображение, которое сгенерировала Sora по этому запросу).

1. «Ты знал, что в Средние века в Европе судили… животных?».

Промпт: Старинный европейский суд XIII века, интерьер зала, деревянные скамьи, мрачная атмосфера, судья в капюшоне, факелы на стенах, все в серо-коричневых тонах, фотореализм, старая фотография.

изображение, сгенерированое Sora

2. «Свиней, крыс, даже кузнечиков».

Промпт: Средневековая деревня, клетка с большой черной свиньей, люди в старинной одежде смотрят на нее, шок и удивление на лицах, деревенский двор, естественное освещение, реалистичное фото, 1300-е годы.

изображение, сгенерированое Sora

3. «Животных сажали в тюрьмы, судили перед настоящими судьями…»

Промпт: Тюремная камера из камня, за решеткой сидит грустная свинья, рядом охранник в кольчуге и с факелом, атмосфера Средневековья, тусклый свет, фотореализм, кадр, как из хроники.

изображение, сгенерированое Sora

4. «И если признавали виновными — приговаривали к казни».

Промпт: Старинная площадь, виселица, толпа зевак, судья зачитывает приговор, животное (свинья) в цепях, драматичная сцена, историческая реконструкция, натуральное освещение, реализм, стиль 1300-х годов.

изображение, сгенерированое Sora

5. «Например, в 1386 году во Франции свинью повесили за убийство ребенка».

Промпт: Французская деревня XIV века, плахи, на заднем плане виселица, люди в трауре, монах читает молитву, атмосфера напряженная, драматическая сцена, серые тона, реалистичное старое фото.

изображение, сгенерированое Sora

6. «А крыс однажды вызвали в суд за порчу зерна».

Промпт: Средневековый зал суда, крысы изображены на скамье подсудимых, адвокат в рясе жестикулирует, судья в мантии, свечи, тени, атмосфера абсурда, фотореализм.

изображение, сгенерированое Sora

7. «Адвокат заявил, что они не явились... потому что боялись кошек».

Промпт: Крупный план адвоката в средневековой одежде, он драматично указывает на изображенную в зале кошку, судья приподнимает брови, присутствующие удивлены, юмористическая нотка, реализм, хроника эпохи.

изображение, сгенерированое Sora

8. «Средневековье: когда даже мышь могла попасть под следствие».

Промпт: Крыса в цепях на фоне старого судебного зала, надпись на свитке: Accused, освещение ретро, мрачные тени, реализм, стилизация под фотоархив средневековой эпохи.

изображение, сгенерированое Sora

Генерируем все фотографии по промптам — только не забудьте выбрать вертикальный формат.

вертикальный формат генерации фото

Теперь открываем Hailuo AI, переходим в раздел Create video. Там нужно выбрать Image to Video. Необходимо сгенерировать ролики по каждой фотографии. Мы не будем писать промпты, но вы можете указать, что конкретно должно произойти и как камера должна перемещаться. Если оставить это поле пустым, нейросеть сама решит, как оживлять фото.

генерация видео с помощью Hailuo AI

Теперь откройте ElevenLabs и в разделе Text to Speech сгенерируйте текст. Справа нужно выбрать диктора — ищите с отметкой, что поддерживает русский (или тот, который вам нужен) язык.

озвучка через ElevenLabs

Нам остается открыть CapCut, загрузить все нужные фрагменты в медиатеку, перетащить их на монтажную дорожку и выстроить в нужной последовательности. Интерфейс программы очень простой и понятный — достаточно перетащить видео на таймлайн, подрезать лишнее и расположить фрагменты вплотную друг к другу, чтобы получился единый сюжет.

При необходимости можно сократить отдельные отрывки, чтобы подогнать под звуковую дорожку, которая добавляется. Все легко редактируется — важно лишь следить, чтобы совпадал тайминг.

генерация видео в CapCut

На самом деле некоторые фото стоило оживить заново, поскольку заметны артефакты — например, свинья проходит сквозь решетку. Да и диктора можно подобрать с более качественным произношением. Вот наш результат.


Отметим, что такие видео очень хорошо набирают просмотры на YouTube. Вы без труда найдете каналы, которые публикуют сгенерированный нейросетями контент. Можете позаимствовать идеи у других авторов.

Рекомендации

Чем выше качество видео, тем выше шанс привлечь подписчиков. Визуально привлекательные девушки вызывают больший отклик аудитории — это стоит учитывать при создании контента.

Визуал должен вызывать интерес — как и сам сюжет. Но с генерацией изображений, особенно в Sora, могут возникнуть сложности: любые промпты с намеком на откровенность, как правило, блокируются. Приходится искать обходные пути. Иногда это требует тонкой игры с формулировками — немного переиначить, сместить акцент, обойтись метафорами или двусмысленными выражениями.

Это уже почти искусство — подать промпт так, чтобы алгоритм не заподозрил ничего лишнего. Но есть немало моделей с менее строгой цензурой. Пробуйте разные версии, и вы обязательно подберете наиболее комфортный вариант.

Итоги 

Нейросети уже сейчас позволяют создавать вирусные ролики практически из воздуха — от идеи до готового видео. Вы можете придумать сюжет самостоятельно или подсмотреть у других авторов. Или попросите нейросеть о помощи — она обязательно подскажет. Даже без профессиональных навыков можно создавать контент и вести каналы на разных платформах. Главное — чтобы был интересный посыл, яркие образы и немного терпения.

* Принадлежит Meta — деятельность компании признана экстремистской на территории РФ.


Комментарии