Modelos API de Givon AI

Un contrato para todos los modelos: { type, model, input }. Cada modelo tiene su propio esquema de entrada, precio en tokens y snippets listos para cURL, Python y JS. La generación es asíncrona.

Video

24
Gemini Omni Flashdesde 20 tokens
gemini-omni-videoGoogle

Мультимодальная модель Google: собирает ролик из текста, изображений и видео и правит готовый клип в диалоге. Бери, когда надо трансформировать снятое или смешать разные входы, а не снять кадр с нуля как Veo. Нативный звук, до 4K.

Grok Imagine Videodesde 1 tokens/s
grok-imagine-videoxAI

Быстрое короткое видео с нативным синхронным звуком и точным следованием промпту. Продолжает клип с последнего кадра — удобно склеивать сцены. 480p/720p.

Grok Imagine Video 1.5desde 2 tokens/s
grok-imagine-video-1.5xAI

Image-to-video от xAI: оживляет один исходный кадр с нативным звуком и сильным следованием промпту, тянет клипы до 15 секунд. №1 на арене image-to-video.

Hailuo 2.3desde 8 tokens
hailuo-2.3MiniMax

Лучшая в классе мимика, эмоции и микровыражения, плюс достоверная физика движений тела. Бери для эмоциональных кадров с лицом.

HappyHorse 1.0desde 6 tokens/s
happyhorse-1.0Alibaba

Топовая видео-модель Alibaba: за один проход выдаёт клип с синхронным звуком и липсинком. Бери для кинематографичных мультишотов с готовой озвучкой — из текста, кадра, набора референсов или правки исходного видео. 720p/1080p.

HeyGen Avatar IV3 tokens/s
heygen-photo-avatarHeyGen

Говорящий аватар из одного фото: модель читает тон и ритм голоса и сама лепит живую мимику и жесты рук. Синхронизация по тексту или готовой озвучке.

Kling 2.6desde 3 tokens/s
kling-2.6Kling

Нативный звук одним проходом — речь, эмбиент и эффекты сразу в кадре, без отдельного дубляжа. Бери для бюджетных клипов и говорящих голов, когда мультисцена не нужна.

Kling 2.6 Motion8 tokens/s
kling-2.6-motionKling

Доступный motion-control: переносит движение с видео-референса на твоего персонажа. Бери для несложной моторики, когда не нужна точность тира 3.0.

Kling 3.0desde 3 tokens/s
kling-3.0Kling

Флагман Kling: до 15с и 4K с удержанием образа персонажей между сценами, многосценовая режиссура и нативный многоязычный звук.

Kling 3.0 Motion7 tokens/s
kling-3.0-motionKling

Переносит записанное движение, танец или жест с видео-образца на твоего персонажа целиком — с фиксацией лица и захватом сложной моторики. Бери, когда нужен точный повтор хореографии с лучшей консистентностью внешности.

Kling 3.0 Omnidesde 6,4 tokens/s
kling-3.0-omniKling

Многосценовое видео с нативным звуком: переносит образ и голос персонажа с видео-образца в новые сцены, но с этим образцом звук недоступен. Бери для связного нарратива с одним героем.

Kling Avatar 2.0desde 6 tokens/s
kling-digital-humanKling

Оживляет человека с фото по озвучке: липсинк, естественная мимика и жесты. Подойдёт, когда нужен говорящий или поющий ведущий с одного портрета.

Kling Lip-Sync6 tokens/s
kling-lip-syncKling

Перекладывает движение губ на готовом видео под новую звуковую дорожку. Бери, когда ролик снят и нужен только дубляж, локализация или замена речи.

Kling O1desde 5,5 tokens/s
kling-o1Kling

Сливает до 7 ракурсов одного субъекта (Elements) и держит его внешний вид строго консистентным через весь клип. Бери для разворотов персонажа, повторяющихся героев и демо продукта.

Seedance 2.0desde 4,5 tokens/s
seedance-2.0BytePlus

Отвечает на режиссёрские команды — ракурс, движение камеры, смена планов — через описание, со звуком в одном проходе. Бери для кинематографичных кадров по референсам, вплоть до 1080p.

Seedance 2.0 Fastdesde 3,5 tokens/s
seedance-2.0-fastBytePlus

Та же кинематографичность и контроль камеры, но заметно быстрее — для итераций и объёма. Нативный звук и референсы, до 720p.

Seedance 2.0 Fast Relaxeddesde 4,5 tokens/s
seedance-2.0-fast-relaxedBytePlus

Быстрый режим с менее строгой модерацией — для итераций по сложным референс-сценам с изображениями, видео и аудио. Нативный звук, до 720p.

Seedance 2.0 Relaxeddesde 5,5 tokens/s
seedance-2.0-relaxedBytePlus

Менее строгий по модерации режим Seedance 2.0: когда стандартная проверка режет сложную сцену с персонажами и референсами — картинками, видео и звуком. С нативным аудио и роликами до 1080p.

SwitchX Videodesde 9 tokens/s
switchx-videoBeeble

Меняет в уже снятом видео фон, объект или свет по тексту, одному референсу и опциональной маске, сохраняя субъект — его форму, движение и мимику. Длительность берётся из исходника, на выходе 720p или 1080p.

Veo 3.1desde 14 tokens
veo-3.1Google

Флагман Google для премиальных кинокадров: изображение до 4K с нативным синхронным звуком — диалог, звуки и эмбиенс из коробки. До 3 референсов держат персонажа и стиль стабильными.

Veo 3.1 Fastdesde 2 tokens/s
veo-3.1-fastGoogle

Та же чёткость до 4K и нативный звук, что у флагмана, но заметно быстрее и дешевле. Рабочая лошадка для итераций и большинства продакшен-задач.

Veo 3.1 Litedesde 3 tokens/s
veo-3.1-liteGoogle

Самый доступный тир Veo: до 1080p (без 4K) и нативный звук, который можно включать и выключать. Бери, когда нужен большой объём контента для соцсетей, а 4K ни к чему.

Wan 2.7 R2Vdesde 6 tokens/s
wan-2.7-r2vAlibaba

Берёт до 5 референсов — изображения, видео или аудио — и фиксирует внешность и голос героев между шотами, чтобы делать сериальный контент с одними и теми же персонажами.

Wan 2.7 Videodesde 6 tokens/s
wan-2.7-videoAlibaba

Генерация и редактирование видео в одном движке: из текста, из фото, с заданным финальным кадром или правкой готового клипа по описанию. До 1080p.

Imágenes

11
ChatGPT Images 2.0desde 1 tokens
gpt-image-2OpenAI

Image-модель OpenAI, которая «думает» над композицией: почти безупречный текст внутри картинки на десятках языков и точное следование инструкции. Бери под инфографику, слайды и многоязычные постеры; 1K/2K/4K, правки по всей картинке.

Grok Imagine2 tokens
grok-imaginexAI

Базовый image-тир от xAI: генерация и редактирование всей картинки по тексту без маски, сборка из нескольких референсов. Бери для быстрых концептов и диалоговых правок, когда не нужна точность тира Pro.

Grok Imagine Pro2 tokens
grok-imagine-proxAI

Старший тир Grok Imagine: больше детализации и аккуратный текст в кадре, точно держит композицию по подробному описанию. Бери, когда базовому тиру не хватает качества картинки.

Nano Banana2 tokens
nano-bananaGoogle

Входной тир семейства Google: самая доступная генерация изображений в 1K. Диалоговое редактирование и слияние референсов — для объёма и быстрых черновиков.

Nano Banana 2desde 3 tokens
nano-banana-2Google

Почти флагманское качество Google на скорости Flash: до 4K, аккуратный текст и консистентность персонажей по референсам. Бери, когда хочешь результат уровня Pro, но быстрее и дешевле.

Nano Banana Prodesde 6 tokens
nano-banana-proGoogle

Флагман Google: максимум детализации и самый чёткий в линейке текст прямо внутри кадра. Бери для сложных бренд-сцен по референсам (до 8) и многоэлементных композиций — вплоть до 4K.

Seedream 4.5desde 2 tokens
seedream-4.5BytePlus

Кинематографичный свет и стабильный образ персонажа между генерациями. Бери для продуктовых каталогов, чарактер-сетов и правок по референсу — стабильная рабочая модель: 2K/4K, до 14 референсов.

Seedream 5desde 2 tokens
seedream-5BytePlus

Рассуждает над сложным промптом и сама ищет в сети — собирает многоэлементные сцены и кадры по актуальной повестке. Правит по примеру-референсу, тянет до 3K.

SwitchX Imagedesde 6 tokens
switchx-imageBeeble

Релайтинг и композитинг от Beeble: переносит на исходное фото объект, фон или свет по тексту, одному референсу и опциональной маске — с физически корректным светом, не генерируя картинку с нуля. 720p и 1080p.

Wan 2.7 Imagedesde 3 tokens
wan-2.7-imageAlibaba

Упор на портреты и лица: черты, макияж и причёску задаёшь через референсы. Бери для аватаров, бьюти и консистентных серий персонажей. Разрешение до 2K.

Wan 2.7 Image Prodesde 6 tokens
wan-2.7-image-proAlibaba

4K-тир Wan с режимом рассуждения над промптом: точнее держит сложные многошаговые инструкции и текст внутри кадра — вплоть до таблиц и формул. Бери для тяжёлых деливериблов вроде постеров и упаковки.