Модели Givon AI API

Один контракт для всех моделей: { type, model, input }. У каждой модели — своя схема входа, цена и готовые сниппеты на cURL, Python и JS. Генерация асинхронная.

Видео

24
Gemini Omni Flashот 20 токенов
gemini-omni-videoGoogle

Мультимодальная модель Google: собирает ролик из текста, изображений и видео и правит готовый клип в диалоге. Бери, когда надо трансформировать снятое или смешать разные входы, а не снять кадр с нуля как Veo. Нативный звук, до 4K.

Grok Imagine Videoот 1 токенов/с
grok-imagine-videoxAI

Быстрое короткое видео с нативным синхронным звуком и точным следованием промпту. Продолжает клип с последнего кадра — удобно склеивать сцены. 480p/720p.

Grok Imagine Video 1.5от 2 токенов/с
grok-imagine-video-1.5xAI

Image-to-video от xAI: оживляет один исходный кадр с нативным звуком и сильным следованием промпту, тянет клипы до 15 секунд. №1 на арене image-to-video.

Hailuo 2.3от 8 токенов
hailuo-2.3MiniMax

Лучшая в классе мимика, эмоции и микровыражения, плюс достоверная физика движений тела. Бери для эмоциональных кадров с лицом.

HappyHorse 1.0от 6 токенов/с
happyhorse-1.0Alibaba

Топовая видео-модель Alibaba: за один проход выдаёт клип с синхронным звуком и липсинком. Бери для кинематографичных мультишотов с готовой озвучкой — из текста, кадра, набора референсов или правки исходного видео. 720p/1080p.

HeyGen Avatar IV3 токенов/с
heygen-photo-avatarHeyGen

Говорящий аватар из одного фото: модель читает тон и ритм голоса и сама лепит живую мимику и жесты рук. Синхронизация по тексту или готовой озвучке.

Kling 2.6от 3 токенов/с
kling-2.6Kling

Нативный звук одним проходом — речь, эмбиент и эффекты сразу в кадре, без отдельного дубляжа. Бери для бюджетных клипов и говорящих голов, когда мультисцена не нужна.

Kling 2.6 Motion8 токенов/с
kling-2.6-motionKling

Доступный motion-control: переносит движение с видео-референса на твоего персонажа. Бери для несложной моторики, когда не нужна точность тира 3.0.

Kling 3.0от 3 токенов/с
kling-3.0Kling

Флагман Kling: до 15с и 4K с удержанием образа персонажей между сценами, многосценовая режиссура и нативный многоязычный звук.

Kling 3.0 Motion7 токенов/с
kling-3.0-motionKling

Переносит записанное движение, танец или жест с видео-образца на твоего персонажа целиком — с фиксацией лица и захватом сложной моторики. Бери, когда нужен точный повтор хореографии с лучшей консистентностью внешности.

Kling 3.0 Omniот 6,4 токенов/с
kling-3.0-omniKling

Многосценовое видео с нативным звуком: переносит образ и голос персонажа с видео-образца в новые сцены, но с этим образцом звук недоступен. Бери для связного нарратива с одним героем.

Kling Avatar 2.0от 6 токенов/с
kling-digital-humanKling

Оживляет человека с фото по озвучке: липсинк, естественная мимика и жесты. Подойдёт, когда нужен говорящий или поющий ведущий с одного портрета.

Kling Lip-Sync6 токенов/с
kling-lip-syncKling

Перекладывает движение губ на готовом видео под новую звуковую дорожку. Бери, когда ролик снят и нужен только дубляж, локализация или замена речи.

Kling O1от 5,5 токенов/с
kling-o1Kling

Сливает до 7 ракурсов одного субъекта (Elements) и держит его внешний вид строго консистентным через весь клип. Бери для разворотов персонажа, повторяющихся героев и демо продукта.

Seedance 2.0от 4,5 токенов/с
seedance-2.0BytePlus

Отвечает на режиссёрские команды — ракурс, движение камеры, смена планов — через описание, со звуком в одном проходе. Бери для кинематографичных кадров по референсам, вплоть до 1080p.

Seedance 2.0 Fastот 3,5 токенов/с
seedance-2.0-fastBytePlus

Та же кинематографичность и контроль камеры, но заметно быстрее — для итераций и объёма. Нативный звук и референсы, до 720p.

Seedance 2.0 Fast Relaxedот 4,5 токенов/с
seedance-2.0-fast-relaxedBytePlus

Быстрый режим с менее строгой модерацией — для итераций по сложным референс-сценам с изображениями, видео и аудио. Нативный звук, до 720p.

Seedance 2.0 Relaxedот 5,5 токенов/с
seedance-2.0-relaxedBytePlus

Менее строгий по модерации режим Seedance 2.0: когда стандартная проверка режет сложную сцену с персонажами и референсами — картинками, видео и звуком. С нативным аудио и роликами до 1080p.

SwitchX Videoот 9 токенов/с
switchx-videoBeeble

Меняет в уже снятом видео фон, объект или свет по тексту, одному референсу и опциональной маске, сохраняя субъект — его форму, движение и мимику. Длительность берётся из исходника, на выходе 720p или 1080p.

Veo 3.1от 14 токенов
veo-3.1Google

Флагман Google для премиальных кинокадров: изображение до 4K с нативным синхронным звуком — диалог, звуки и эмбиенс из коробки. До 3 референсов держат персонажа и стиль стабильными.

Veo 3.1 Fastот 2 токенов/с
veo-3.1-fastGoogle

Та же чёткость до 4K и нативный звук, что у флагмана, но заметно быстрее и дешевле. Рабочая лошадка для итераций и большинства продакшен-задач.

Veo 3.1 Liteот 3 токенов/с
veo-3.1-liteGoogle

Самый доступный тир Veo: до 1080p (без 4K) и нативный звук, который можно включать и выключать. Бери, когда нужен большой объём контента для соцсетей, а 4K ни к чему.

Wan 2.7 R2Vот 6 токенов/с
wan-2.7-r2vAlibaba

Берёт до 5 референсов — изображения, видео или аудио — и фиксирует внешность и голос героев между шотами, чтобы делать сериальный контент с одними и теми же персонажами.

Wan 2.7 Videoот 6 токенов/с
wan-2.7-videoAlibaba

Генерация и редактирование видео в одном движке: из текста, из фото, с заданным финальным кадром или правкой готового клипа по описанию. До 1080p.

Изображения

11
ChatGPT Images 2.0от 1 токенов
gpt-image-2OpenAI

Image-модель OpenAI, которая «думает» над композицией: почти безупречный текст внутри картинки на десятках языков и точное следование инструкции. Бери под инфографику, слайды и многоязычные постеры; 1K/2K/4K, правки по всей картинке.

Grok Imagine2 токенов
grok-imaginexAI

Базовый image-тир от xAI: генерация и редактирование всей картинки по тексту без маски, сборка из нескольких референсов. Бери для быстрых концептов и диалоговых правок, когда не нужна точность тира Pro.

Grok Imagine Pro2 токенов
grok-imagine-proxAI

Старший тир Grok Imagine: больше детализации и аккуратный текст в кадре, точно держит композицию по подробному описанию. Бери, когда базовому тиру не хватает качества картинки.

Nano Banana2 токенов
nano-bananaGoogle

Входной тир семейства Google: самая доступная генерация изображений в 1K. Диалоговое редактирование и слияние референсов — для объёма и быстрых черновиков.

Nano Banana 2от 3 токенов
nano-banana-2Google

Почти флагманское качество Google на скорости Flash: до 4K, аккуратный текст и консистентность персонажей по референсам. Бери, когда хочешь результат уровня Pro, но быстрее и дешевле.

Nano Banana Proот 6 токенов
nano-banana-proGoogle

Флагман Google: максимум детализации и самый чёткий в линейке текст прямо внутри кадра. Бери для сложных бренд-сцен по референсам (до 8) и многоэлементных композиций — вплоть до 4K.

Seedream 4.5от 2 токенов
seedream-4.5BytePlus

Кинематографичный свет и стабильный образ персонажа между генерациями. Бери для продуктовых каталогов, чарактер-сетов и правок по референсу — стабильная рабочая модель: 2K/4K, до 14 референсов.

Seedream 5от 2 токенов
seedream-5BytePlus

Рассуждает над сложным промптом и сама ищет в сети — собирает многоэлементные сцены и кадры по актуальной повестке. Правит по примеру-референсу, тянет до 3K.

SwitchX Imageот 6 токенов
switchx-imageBeeble

Релайтинг и композитинг от Beeble: переносит на исходное фото объект, фон или свет по тексту, одному референсу и опциональной маске — с физически корректным светом, не генерируя картинку с нуля. 720p и 1080p.

Wan 2.7 Imageот 3 токенов
wan-2.7-imageAlibaba

Упор на портреты и лица: черты, макияж и причёску задаёшь через референсы. Бери для аватаров, бьюти и консистентных серий персонажей. Разрешение до 2K.

Wan 2.7 Image Proот 6 токенов
wan-2.7-image-proAlibaba

4K-тир Wan с режимом рассуждения над промптом: точнее держит сложные многошаговые инструкции и текст внутри кадра — вплоть до таблиц и формул. Бери для тяжёлых деливериблов вроде постеров и упаковки.