Модели Givon AI API
Видео
24gemini-omni-videoGoogleМультимодальная модель Google: собирает ролик из текста, изображений и видео и правит готовый клип в диалоге. Бери, когда надо трансформировать снятое или смешать разные входы, а не снять кадр с нуля как Veo. Нативный звук, до 4K.
grok-imagine-videoxAIБыстрое короткое видео с нативным синхронным звуком и точным следованием промпту. Продолжает клип с последнего кадра — удобно склеивать сцены. 480p/720p.
grok-imagine-video-1.5xAIImage-to-video от xAI: оживляет один исходный кадр с нативным звуком и сильным следованием промпту, тянет клипы до 15 секунд. №1 на арене image-to-video.
hailuo-2.3MiniMaxЛучшая в классе мимика, эмоции и микровыражения, плюс достоверная физика движений тела. Бери для эмоциональных кадров с лицом.
happyhorse-1.0AlibabaТоповая видео-модель Alibaba: за один проход выдаёт клип с синхронным звуком и липсинком. Бери для кинематографичных мультишотов с готовой озвучкой — из текста, кадра, набора референсов или правки исходного видео. 720p/1080p.
heygen-photo-avatarHeyGenГоворящий аватар из одного фото: модель читает тон и ритм голоса и сама лепит живую мимику и жесты рук. Синхронизация по тексту или готовой озвучке.
kling-2.6KlingНативный звук одним проходом — речь, эмбиент и эффекты сразу в кадре, без отдельного дубляжа. Бери для бюджетных клипов и говорящих голов, когда мультисцена не нужна.
kling-2.6-motionKlingДоступный motion-control: переносит движение с видео-референса на твоего персонажа. Бери для несложной моторики, когда не нужна точность тира 3.0.
kling-3.0KlingФлагман Kling: до 15с и 4K с удержанием образа персонажей между сценами, многосценовая режиссура и нативный многоязычный звук.
kling-3.0-motionKlingПереносит записанное движение, танец или жест с видео-образца на твоего персонажа целиком — с фиксацией лица и захватом сложной моторики. Бери, когда нужен точный повтор хореографии с лучшей консистентностью внешности.
kling-3.0-omniKlingМногосценовое видео с нативным звуком: переносит образ и голос персонажа с видео-образца в новые сцены, но с этим образцом звук недоступен. Бери для связного нарратива с одним героем.
kling-digital-humanKlingОживляет человека с фото по озвучке: липсинк, естественная мимика и жесты. Подойдёт, когда нужен говорящий или поющий ведущий с одного портрета.
kling-lip-syncKlingПерекладывает движение губ на готовом видео под новую звуковую дорожку. Бери, когда ролик снят и нужен только дубляж, локализация или замена речи.
kling-o1KlingСливает до 7 ракурсов одного субъекта (Elements) и держит его внешний вид строго консистентным через весь клип. Бери для разворотов персонажа, повторяющихся героев и демо продукта.
seedance-2.0BytePlusОтвечает на режиссёрские команды — ракурс, движение камеры, смена планов — через описание, со звуком в одном проходе. Бери для кинематографичных кадров по референсам, вплоть до 1080p.
seedance-2.0-fastBytePlusТа же кинематографичность и контроль камеры, но заметно быстрее — для итераций и объёма. Нативный звук и референсы, до 720p.
seedance-2.0-fast-relaxedBytePlusБыстрый режим с менее строгой модерацией — для итераций по сложным референс-сценам с изображениями, видео и аудио. Нативный звук, до 720p.
seedance-2.0-relaxedBytePlusМенее строгий по модерации режим Seedance 2.0: когда стандартная проверка режет сложную сцену с персонажами и референсами — картинками, видео и звуком. С нативным аудио и роликами до 1080p.
switchx-videoBeebleМеняет в уже снятом видео фон, объект или свет по тексту, одному референсу и опциональной маске, сохраняя субъект — его форму, движение и мимику. Длительность берётся из исходника, на выходе 720p или 1080p.
veo-3.1GoogleФлагман Google для премиальных кинокадров: изображение до 4K с нативным синхронным звуком — диалог, звуки и эмбиенс из коробки. До 3 референсов держат персонажа и стиль стабильными.
veo-3.1-fastGoogleТа же чёткость до 4K и нативный звук, что у флагмана, но заметно быстрее и дешевле. Рабочая лошадка для итераций и большинства продакшен-задач.
veo-3.1-liteGoogleСамый доступный тир Veo: до 1080p (без 4K) и нативный звук, который можно включать и выключать. Бери, когда нужен большой объём контента для соцсетей, а 4K ни к чему.
wan-2.7-r2vAlibabaБерёт до 5 референсов — изображения, видео или аудио — и фиксирует внешность и голос героев между шотами, чтобы делать сериальный контент с одними и теми же персонажами.
wan-2.7-videoAlibabaГенерация и редактирование видео в одном движке: из текста, из фото, с заданным финальным кадром или правкой готового клипа по описанию. До 1080p.
Изображения
11gpt-image-2OpenAIImage-модель OpenAI, которая «думает» над композицией: почти безупречный текст внутри картинки на десятках языков и точное следование инструкции. Бери под инфографику, слайды и многоязычные постеры; 1K/2K/4K, правки по всей картинке.
grok-imaginexAIБазовый image-тир от xAI: генерация и редактирование всей картинки по тексту без маски, сборка из нескольких референсов. Бери для быстрых концептов и диалоговых правок, когда не нужна точность тира Pro.
grok-imagine-proxAIСтарший тир Grok Imagine: больше детализации и аккуратный текст в кадре, точно держит композицию по подробному описанию. Бери, когда базовому тиру не хватает качества картинки.
nano-bananaGoogleВходной тир семейства Google: самая доступная генерация изображений в 1K. Диалоговое редактирование и слияние референсов — для объёма и быстрых черновиков.
nano-banana-2GoogleПочти флагманское качество Google на скорости Flash: до 4K, аккуратный текст и консистентность персонажей по референсам. Бери, когда хочешь результат уровня Pro, но быстрее и дешевле.
nano-banana-proGoogleФлагман Google: максимум детализации и самый чёткий в линейке текст прямо внутри кадра. Бери для сложных бренд-сцен по референсам (до 8) и многоэлементных композиций — вплоть до 4K.
seedream-4.5BytePlusКинематографичный свет и стабильный образ персонажа между генерациями. Бери для продуктовых каталогов, чарактер-сетов и правок по референсу — стабильная рабочая модель: 2K/4K, до 14 референсов.
seedream-5BytePlusРассуждает над сложным промптом и сама ищет в сети — собирает многоэлементные сцены и кадры по актуальной повестке. Правит по примеру-референсу, тянет до 3K.
switchx-imageBeebleРелайтинг и композитинг от Beeble: переносит на исходное фото объект, фон или свет по тексту, одному референсу и опциональной маске — с физически корректным светом, не генерируя картинку с нуля. 720p и 1080p.
wan-2.7-imageAlibabaУпор на портреты и лица: черты, макияж и причёску задаёшь через референсы. Бери для аватаров, бьюти и консистентных серий персонажей. Разрешение до 2K.
wan-2.7-image-proAlibaba4K-тир Wan с режимом рассуждения над промптом: точнее держит сложные многошаговые инструкции и текст внутри кадра — вплоть до таблиц и формул. Бери для тяжёлых деливериблов вроде постеров и упаковки.