Кратко

О чём эта статья

Seedance 2.0 оказалась лучшей ИИ-моделью для видео в этом тесте. Она полнее всех следовала промпту про парашют от первого лица, сохранила ощущение нашлемной камеры, добавила звук и стоила примерно $2.43. Veo 3.1 выглядела премиально, но отклонила исходный промпт и потеряла вид от первого лица при повторе; Kling v3 Pro выглядела хорошо, но движение было слабым; Wan 2.7 была дешёвой, но непригодной к использованию.

  • Тестовый промпт: BASE-прыжок от первого лица с заброшенной 150-метровой дымовой трубы в одну мутную лужу.
  • Сравниваемые модели: Seedance 2.0, Kling v3 Pro, Veo 3.1 и Wan 2.7 на fal.ai.
  • Победитель: Seedance 2.0, потому что она следовала всей идее с наименьшей путаницей.
  • Примерная стоимость рабочих клипов: Seedance $2.43, Kling $1.34, Veo $3.20, Wan $1.20.

У меня была одна сложная идея для ИИ-видео: BASE-джампер прыгает с заброшенной 150-метровой заводской дымовой трубы, снято с его собственной нашлемной камеры, и приземляется в единственную мутную лужу в остальном сухого двора. Я дал ровно один и тот же промпт четырём ИИ-моделям для видео и проверил две вещи — насколько реалистично это выглядело и сколько стоило.

Тест

Всё я запускал на fal.ai. Он позволяет использовать множество видеомоделей из одного места, в одной очереди. Так что каждая модель получила один и тот же промпт, а цены легко было сравнивать бок о бок.

Промпт был сложным намеренно. Один длинный кадр от первого лица, чёткое ощущение высоты, парашют, промышленный двор и грязное приземление. Лёгкие промпты делают любую модель красивой. Сложные промпты показывают, где модель ломается.

Я выбрал четыре модели, каждую по своей причине:

  • Seedance 2.0 (ByteDance) — мой эталон чистой, кинематографичной картинки.
  • Kling v3 Pro (Kuaishou) — известна экшеном и умным планированием кадра.
  • Veo 3.1 (Google) — премиальный вариант.
  • Wan 2.7 (Alibaba) — более дешёвая модель, способная рендерить в 1080p.
Промпт в одну строку: длинный экшен-кадр от первого лица — реальная высота, парашют, промышленный двор и грязное приземление.

Точный промпт

Я превратил черновую идею в один ясный промпт, который могла прочитать каждая модель. Вот он, слово в слово:

Промпт

A cinematic first-person POV action-camera shot from the helmet of a fictional BASE jumper standing on the top edge of a 150-meter abandoned industrial concrete smokestack. The location is a deserted factory complex with cracked asphalt, rusted metal structures, dry concrete ground, and only one large dirty muddy puddle on a road far below. The jumper's gloved hands appear at the edge, looking down over the massive chimney, then leaps forward. A fast stomach-dropping descent along the side of the tall concrete smokestack, wind noise, subtle camera shake, dramatic height and scale. The parachute opens quickly, suspension lines briefly visible, the camera glides toward the mostly dry industrial yard. The landing target becomes clear: one muddy puddle in the middle of the road. The jumper lands directly into the dirty puddle with a huge muddy splash covering the lens. Realistic physics, gritty documentary style, overcast light, cinematic color grading, wide-angle GoPro lens, intense but safe stunt, no injury, no gore, no text, no logos.

Большинство моделей также приняли негативный промпт — короткий список того, что нужно держать вне кадра:

Негативный промпт

injury, blood, gore, death, broken body, cartoon, animation, text, subtitles, captions, logos, watermark, low quality, blur, distorted camera

Seedance 2.0 Победитель

ByteDance · кинематографичный эталон

Это был лучший результат. Она сохранила ощущение нашлемной камеры, руки, стропы парашюта и ритм истории. Она поняла всю идею целиком, а не только её части. Единственная моя настоящая претензия была к приземлению — падение в лужу выглядело не вполне реальным. Звук был включён без доплаты.

Эндпоинтhttps://queue.fal.run/bytedance/seedance-2.0/text-to-video
Настройки720p · 8s · звук вкл
Рендер~150s · seed 44209696
Стоимость≈ $2.43 173.7 × $0.014

Kling v3 Pro

Kuaishou · создана для экшена

Картинка выглядела хорошо. Движение — нет. Я даже включил её «интеллектуальное» планирование кадра, которое должно само разбивать сцену на фазы — край, падение, парашют, приземление, — но действия всё равно ощущались неправильно и нереалистично, хотя Kling и создана для экшена.

Эндпоинтhttps://queue.fal.run/fal-ai/kling-video/v3/pro/text-to-video
Настройки8s · звук вкл · shot_type "intelligent" · cfg_scale 0.5
Рендер~129s
Стоимость≈ $1.34 9.6 × $0.14

Veo 3.1

Google · премиальный выбор

С этой было непросто. Моя первая попытка использовала точный промпт и была отклонена — fal.ai вернул ошибку контентной политики. Большие премиальные модели часто имеют более строгие фильтры безопасности, и трюк, который выглядит опасно (прыжок с 150-метровой башни), может их спровоцировать. Я смягчил формулировку и отправил снова. На этот раз она отрендерилась, но потеряла вид от первого лица ради кадра от третьего лица. Выглядело всё равно отлично.

Эндпоинтhttps://queue.fal.run/fal-ai/veo3.1
Настройки1080p · 8s · звук вкл · safety_tolerance 4
ОригиналОтклонён — content_policy_violation (422)
ПовторСмягчённая формулировка → кадр от третьего лица
Стоимость≈ $3.20 8 × $0.40

Wan 2.7

Alibaba · дешёвый претендент

Wan приняла промпт, но результат рассыпался. Он выглядел как странное видео, собранное из не стыкующихся склеек. Это был самый дешёвый запуск в 1080p, но клип оказался непригоден. В отличие от Veo, она сцену не заблокировала.

Эндпоинтhttps://queue.fal.run/fal-ai/wan/v2.7/text-to-video
Настройки1080p · 8s · без звука · prompt expansion вкл
Рендер~186s · seed 2131596831
Стоимость≈ $1.20 12 × $0.10

Стоимость и победитель

Считая второй запуск Veo, рабочие клипы обошлись примерно в $8.17 суммарно. Модели тарифицируются по-разному — одни по длине клипа, другие по времени вычислений, — так что самый дешёвый рендер не всегда самая дешёвая идея. Победителем оказалась не самая дешёвая. Это была Seedance 2.0 — модель, которая следовала всей идее с наименьшей путаницей.

Урок: лучшая модель — не самая дешёвая и не та, у которой самый красивый одиночный кадр. Это та, что следует всей вашей идее.

Если хотите попробовать сами

  1. Начните с одной ясной, сложной идеи. Трудный промпт показывает настоящий разрыв между моделями.
  2. Напишите полный промпт один раз и отправьте один и тот же текст каждой модели, чтобы тест был честным.
  3. Используйте одну платформу, чтобы расходы совпадали — и помните, что одни тарифицируют по длине, другие по времени вычислений.
  4. Ожидайте фильтры безопасности у премиальных моделей. Если промпт заблокирован, смягчите его и попробуйте снова.
  5. Судите по всему клипу, а не по одному красивому кадру. Движение и история важнее.

Краткий FAQ

Какая ИИ-модель для видео выиграла тест с промптом про парашют?

Seedance 2.0 выиграла, потому что лучше всех сохранила камеру от первого лица, действие с парашютом, ритм истории и общий замысел промпта.

Была ли самая дешёвая ИИ-модель для видео лучшим выбором?

Нет. Wan 2.7 дала самый дешёвый рабочий рендер примерно за $1.20, но клип не сложился в целое. Seedance 2.0 стоила дороже, но дала самый пригодный результат.

Почему Veo 3.1 не победила?

Исходный запуск Veo 3.1 был заблокирован ошибкой контентной политики. Смягчённый повтор отрендерил красивый клип, но превратил промпт от первого лица в кадр от третьего лица.