Нереалистичные части тела и постоянные галлюцинации — факапы, за которые ругают нейросети, заточенные под видео и фото. При этом большинство таких нейросетей платные: юзеры отдают деньги за баги, а потом редактируют вручную. На рынке нейросетей для создания видеороликов доминировала Sora, выпущенная Open AI, и практически незамеченной для мирового сообщества оставалась KLING AI, потому что зарегистрироваться в ней можно было только на китайские номера. Однако 24 июля 2024 года нейросеть вышла на международный рынок и ее тут же засыпали восторженными отзывами. Что умеет KLING AI, чем нейросеть лучше конкурентов и как ей пользоваться — рассказываем в обзоре.
Что нужно знать о KLING AI и как работает нейросеть
KLING AI — нейросеть, выпущенная китайской компанией Kuaishou. Разработчики видеогенератора знают толк в коротких видео: еще в 2011 году команда выпустила одноименный аналог TikTok. Не удивительно, что KLING AI заточена именно под создание рилсов — коротких роликов со скоростью 30 кадров в секунду. Помимо видео, нейросеть шарит за статичные изображения и гифки: на графическом контенте функционал сервиса заканчивается.
«Под капотом» у китайской нейросети 3 составляющие:
- алгоритмы машинного обучения;
- искусственный интеллект;
- 3D-механики.
Как и конкуренты, нейросеть понимает текстовые и графические промты.
Чем KLING AI лучше аналогов: 7 аргументов
Слабая медийность — единственная причина, по которой нейроэнтузиасты не пересели на KLING AI. Нейросеть предлагает юзерам весомые плюшки по сравнению с конкурентами.
Интуитивный интерфейс. Часами ковыряться в интерфейсе и гуглить значения ползунков не придется.
Разработчики вынесли меню настроек в левую часть интерфейса и не стали мудрить с вариативностью.
Полубесплатный режим. После регистрации юзеру выдадут 66 кредитов: раз в день поинты пополняются, но не копятся. Одно пятисекундное видео обойдется в 10 кредитов. Дневного запаса хватит на 6–7 роликов и пару картинок. Этого хватит, чтобы разнообразить сплошной текст графическим контентом.
Обилие ракурсов. KLING AI не ограничивается ракурсом «анфас». На выбор пользователя здесь 7 базовых и 4 продвинутых режима.
Плюсом к ракурсам разработчики разрешили юзерам играться с шириной объектива.
Туториалы для юзеров. Разработчики не стали бросать юзеров в пекло и выкатили подробные инструкции по созданию как статичных картинок, так и видеороликов. Если человек никогда не работал с нейросетями, полезность гайдов множится на 2.
API. KLING AI интегрируется со сторонними приложениями. Список не утвержден: чтобы подключиться, нужно заполнить анкету.
Интеграции пригодятся тем, кто планирует генерить контент в промышленных масштабах.
Негативные промты. Через негативные промты можно описать предметы, которые не должны попасть в кадр.
Инструмент минимизирует вероятность галлюцинаций и факапов.
Без недостатков тоже не обошлось. Например, нейросеть:
- не поддерживает никакие языки, кроме английского;
- не разрешает юзерам оплачивать подписку картами, выпущенными российскими банками;
- предлагает только 5 настраиваемых ползунков.
KLING AI — молодая нейросеть. Возможно, разработчики прислушаются к мнению юзеров и пофиксят недостатки. Даже если этого не произойдет, плюсы нейросети все равно перекрывают недостатки.
Как зарегистрироваться в KLING AI и сколько это стоит
Если вбить в поисковик KLING AI, вылезут копии и подделки. Чтобы не попасть на мошенников, идем на официальный сайт.
На главной странице жмем Sign In: кнопка находится в правом верхнем углу интерфейса.
Откроется меню авторизации: в этой вкладке жмем клавишу Sign up for free.
Заполняем мини-анкету: имейл и пароль, кликаем по кнопке Next.
Активируется проверка на робота через пазл.
На указанную почту придет код верификации: вводим цифры в поле Verification Code и жмем клавишу Sign In.
Регистрация завершена, осталось изучить азы работы с KLING AI и выбрать подписку.
Оплатить банковской картой, которая выпущена банками России, не получится: нужен зарубежный пластик.
Купив подписку, картинки и видео можно будет генерировать без водяных знаков, а также получить доступ к улучшенной детализации.
Как генерировать видео через KLING AI
Нейросеть предлагает 2 режима работы:
- генерация статичных фото;
- генерация видеороликов.
Разберем каждый режим по настраиваемым ползункам и сделаем парочку примеров.
Генерация картинок
KLING AI заточена именно под видеоролики, поэтому набор ползунков в этом режиме скудный:
- Promt: описание будущей картинки.
- Reference Image: картинка-пример.
- Settings: соотношение сторон.
Вписываем промт на английском языке: для примера сгенерируем Гомера Симпсона в мультяшном стиле, бегущего на фоне советских панелек.
Загружаем картинку-референс через кнопку с плюсом, если такая есть на примете.
Далее выбираем соотношение сторон и количество картинок.
По окончании жмем на клавишу Generate.
KLING AI генерировал одну картинку 3 часа, хотя просили 4 штуки. Наверняка любители экономии находятся в конце очереди и ждут, пока платники наиграются с нейронкой. KLING AI не до конца понял промт, но картинка получилась вполне достойной.
Генерация видео
В этом режиме набор настраиваемых ползунков внушительнее, чем для статичных картинок:
- Promt: описание будущего видео.
- Creativity: чем выше значение параметра, тем больше отсебятины добавит нейросеть.
- Mode: Standard и Professional с повышенной детализацией графики, второй доступен только платникам.
- Length: длительность 5 и 10 секунд.
- Aspect Ratio: соотношение сторон.
- Camera Movement: настройка ракурса, высоты и ширины объектива.
- Negative Promt: описание того, чего не должно быть на картинке.
Заполняем поля по своему усмотрению и жмем кнопку Generate.
Помимо генерации через текстовые запросы, KLING AI умеет создавать видео через картинки-референсы в режиме Image to Video.
Алгоритм режима такой же: плюсом к базовым настройкам и текстовым запросам здесь добавляются графические референсы.
Чтобы протестить KLING AI, сгенерируем видео через идентичный промт: Гомера Симпсона в мультяшном стиле, бегущего на фоне советских панелек.
Если учесть, что поле Negative Promt осталось пустым, результат вполне сносный.
Как составлять промты: советы для юзеров
С графическими промтами все понятно: загрузил картинку и готово. Если ошибиться с текстовым запросом, результат оставит желать лучшего. Чтобы сэкономить ваше время, делимся советами по составлению промтов.
- Не скупитесь на подробности. «Собака в красной шляпе, гуляющая по ночному городу» лучше, чем «Собака гуляет по городу».
- Избегайте длинных фраз. Разбивайте промт на составные части.
Пример диалога с ИИ:
- твоя первая задача: нарисовать черную кошку, сидящую на подоконнике;
- твоя вторая задача: нарисовать пасмурный пейзаж за окном;
- твоя третья задача: ………..
Чем больше подробностей на картинке или видео, тем больше этажей у промта.
Одна сцена — один запрос. Подробности промта нужно разбивать на этажи, но не сцены.
- Годный промт: дельфин едет на велосипеде и улыбается.
- Плохой промт: дельфин едет на велосипеде и улыбается, а на дорогу выскакивает медведь-полицейский.
Генерируйте последовательные фрагменты по 5 или 10 секунд, а потом собирайте кусочки в единое целое через видеоредактор.
- Избегайте замысловатых и эмоциональных фраз. Нейросети плохо понимают эмоции: «человек с сигаретой в зубах и грозным выражением лица гуляет по пляжу» лучше, чем «грозный человек курит сигарету и озадаченно смотрит вдаль».
- Экспериментируйте с уровнем креативности. Чем больше значение ползунка Creativity, тем больше отсебятины добавит ИИ: это правило работает и в обратную сторону.
- Не забывайте описывать действия. Китайская нейросеть распознает действия, движения и поведение героев.
Например, KLING AI без проблем сгенерирует гифку по промту: «Спортсмен быстро бежит по дорожке под ярким солнцем».
Не забывайте, что нейросеть не понимает по-русски. Чтобы избежать галлюцинаций, пользуйтесь переводчиком.
Какие перспективы у KLING AI
Разработчики не планируют останавливаться на достигнутом. Если присмотреться к главной странице, увидим анонс видеоредактора. Когда прикрутят фичу, неизвестно. Видеоредактор облегчит трудовые будни рилсмейкерам и перекроет недостаток с одновременной генерацией нескольких сцен.
KLING AI — молодая, но перспективная нейросеть, которая генерирует реалистичные фото и видеоролики. Разрабы не стали копировать именитых коллег, а добавили уникальные фичи: например, настройку объектива. Если разработчики не забросят детище и прикрутят к ИИ больше настраиваемых ползунков, KLING AI создать серьезную конкуренцию на рынке нейросетей.