Modelos API de Givon AI

Un contrato para todos los modelos: { type, model, input }. Cada modelo tiene su propio esquema de entrada, precio en tokens y snippets listos para cURL, Python y JS. La generación es asíncrona.

Obtener clave API

Video

Gemini Omni Flashdesde 20 tokens

gemini-omni-videoGoogle

Мультимодальная модель Google: собирает ролик из текста, изображений и видео и правит готовый клип в диалоге. Бери, когда надо трансформировать снятое или смешать разные входы, а не снять кадр с нуля как Veo. Синхронный звук, до 4K.

Grok Imagine Videodesde 1 tokens/s

grok-imagine-videoxAI

Быстрое короткое видео с синхронным звуком и точным следованием промпту. Продолжает клип с последнего кадра — удобно склеивать сцены. 480p/720p.

Grok Imagine Video 1.5desde 3 tokens/s

grok-imagine-video-1.5xAI

Image-to-video от xAI: оживляет один исходный кадр с синхронным звуком и сильным следованием промпту, тянет клипы до 15 секунд. В топ-3 арены image-to-video.

HappyHorse 1.0desde 6 tokens/s

happyhorse-1.0Alibaba

Топовая видео-модель Alibaba: за один проход выдаёт клип с синхронным звуком и речью. Бери для кинематографичных многосценовых роликов с готовой озвучкой — из текста, кадра, набора референсов или правки исходного видео. 720p/1080p.

HappyHorse 1.1desde 5,5 tokens/s

happyhorse-1.1Alibaba

Новый режим для роликов из текста, изображения или референсов: до 15 секунд, до 9 изображений-референсов, 720p/1080p. Звук создаётся автоматически и не выключается отдельно.

HeyGen Avatar IV3 tokens/s

heygen-photo-avatarHeyGen

Говорящий аватар из одного фото: модель читает тон и ритм голоса и сама лепит живую мимику и жесты рук. Синхронизация по тексту или готовой озвучке.

Kling 2.6desde 3 tokens/s

kling-2.6Kling

Синхронный звук одним проходом — речь, эмбиент и эффекты сразу в кадре, без отдельного дубляжа. Бери для бюджетных клипов и говорящих голов, когда несколько сцен не нужны.

Kling 2.6 Motion8 tokens/s

kling-2.6-motionKling

Доступный motion-control: переносит движение с видео-референса на твоего персонажа. Бери для несложной моторики, когда не нужна точность тира 3.0.

Kling 3.0desde 3 tokens/s

kling-3.0Kling

Флагман Kling: до 15с и 4K с удержанием образа персонажей между сценами, многосценовая режиссура и синхронный многоязычный звук.

Kling 3.0 Motion7 tokens/s

kling-3.0-motionKling

Переносит записанное движение, танец или жест с видео-образца на твоего персонажа целиком — с фиксацией лица и захватом сложной моторики. Бери, когда нужен точный повтор хореографии с лучшей консистентностью внешности.

Kling 3.0 Omnidesde 6,4 tokens/s

kling-3.0-omniKling

Многосценовое видео с синхронным звуком: переносит образ и голос персонажа с видео-образца в новые сцены, но с этим образцом звук недоступен. Бери для связного нарратива с одним героем.

Kling 3.0 Turbodesde 5,5 tokens/s

kling-3.0-turboKling

Быстрый режим для роликов из текста или изображения: до 15 секунд, 720p/1080p. Последний кадр и звук не поддерживаются.

Kling Avatar 2.0desde 6 tokens/s

kling-digital-humanKling

Оживляет человека с фото по озвучке: синхронизирует речь, мимику и жесты. Подойдёт, когда нужен говорящий или поющий ведущий с одного портрета.

Kling Lip-Sync6 tokens/s

kling-lip-syncKling

Перекладывает движение губ на готовом видео под новую звуковую дорожку. Бери, когда ролик снят и нужен только дубляж, локализация или замена речи.

Kling O1desde 5,5 tokens/s

kling-o1Kling

Сливает до 7 ракурсов одного субъекта (Elements) и держит его внешний вид строго консистентным через весь клип. Бери для разворотов персонажа, повторяющихся героев и демо продукта.

MiniMax H318 tokens/s

minimax-h3MiniMax

2K-видео со стереозвуком из текста, первого и последнего кадра или набора изображений и аудио-референсов. Бери для выразительного движения, точного текста в кадре и сложных мультимодальных сцен до 15 секунд.

Seedance 2.0desde 4,2 tokens/s

seedance-2.0BytePlus

Отвечает на режиссёрские команды — ракурс, движение камеры, смена планов — через описание, со звуком в одном проходе. Бери для кинематографичных кадров по референсам, вплоть до 4K.

Seedance 2.0 Fastdesde 3,5 tokens/s

seedance-2.0-fastBytePlus

Та же кинематографичность и контроль камеры, но заметно быстрее — для итераций и объёма. Синхронный звук и референсы, до 720p.

Seedance 2.0 Minidesde 1,5 tokens/s

seedance-2.0-miniBytePlus

Самый доступный режим для быстрых генераций из текста, изображения или референсов: 480p/720p, длительность 4–15 секунд. Видео- и аудио-референсы доступны не во всех режимах.

SwitchX Videodesde 9 tokens/s

switchx-videoBeeble

Меняет в уже снятом видео фон, объект или свет по тексту, одному референсу и опциональной маске, сохраняя субъект — его форму, движение и мимику. Длительность берётся из исходника, на выходе 720p или 1080p.

Topaz Astradesde 1 tokens

topaz-astraTopaz

Creative Video Upscale & Enhancement от Topaz: улучшает уже готовый GenAI-ролик, дорисовывая детали и текстуру при апскейле до 4K. Это workflow исходное видео → улучшенное видео, без текстового промпта.

Veo 3.1desde 14 tokens/s

veo-3.1Google

Флагман Google для премиальных кинокадров: изображение до 4K с синхронным звуком — диалог, звуки и эмбиенс из коробки. До 3 референсов держат персонажа и стиль стабильными.

Veo 3.1 Fastdesde 2 tokens/s

veo-3.1-fastGoogle

Та же чёткость до 4K и синхронный звук, что у флагмана, но заметно быстрее и дешевле. Рабочая лошадка для итераций и большинства продакшен-задач.

Veo 3.1 Litedesde 3 tokens/s

veo-3.1-liteGoogle

Самый доступный тир Veo: до 1080p (без 4K) и звук, который можно включать и выключать. Бери, когда нужен большой объём контента для соцсетей, а 4K ни к чему.

Wan 2.7 R2Vdesde 6 tokens/s

wan-2.7-r2vAlibaba

Берёт до 5 референсов — изображения, видео или аудио — и фиксирует внешность и голос героев между сценами, чтобы делать сериальный контент с одними и теми же персонажами.

Wan 2.7 Videodesde 6 tokens/s

wan-2.7-videoAlibaba

Генерация и редактирование видео в одном движке: из текста, из фото, с заданным финальным кадром или правкой готового клипа по описанию. До 1080p.

Imágenes

ChatGPT Images 2.0desde 1 tokens

gpt-image-2OpenAI

Флагман OpenAI для сложных изображений: точно держит длинные инструкции, многоэлементную композицию и текст внутри кадра на разных языках. Бери под инфографику, слайды, упаковку и многоязычные постеры; 1K/2K/4K, правки по всей картинке.

Grok Imagine2 tokens

grok-imaginexAI

Базовый image-тир от xAI: генерация и редактирование всей картинки по тексту без маски, сборка из нескольких референсов. Бери для быстрых концептов и диалоговых правок, когда не нужна точность тира Pro.

Grok Imagine Pro2 tokens

grok-imagine-proxAI

Старший тир Grok Imagine: больше детализации и аккуратный текст в кадре, точно держит композицию по подробному описанию. Бери, когда базовому тиру не хватает качества картинки.

Nano Banana2 tokens

nano-bananaGoogle

Входной тир семейства Google: самая доступная генерация изображений в 1K. Диалоговое редактирование и слияние референсов — для объёма и быстрых черновиков.

Nano Banana 2desde 3 tokens

nano-banana-2Google

Универсальный Flash-тир Google: до 4K, аккуратный текст, низкая задержка и консистентность по референсам. Бери для быстрых итераций и объёмной генерации, когда нужен сильный результат дешевле Pro.

Nano Banana 2 Lite2 tokens

nano-banana-2-liteGoogle

Самый быстрый и лёгкий тир Nano Banana 2 для 1K-черновиков, быстрых визуальных итераций и недорогих правок. Бери для объёмных идей, референсных набросков и маркетинговых вариантов, когда не нужен 2K/4K.

Nano Banana Prodesde 2 tokens

nano-banana-proGoogle

Премиальный Google-тир для сложных бренд-сцен: хорошо держит style guide, референсы, свет и фактуры материалов. Бери для отполированных продуктовых и портретных визуалов, многоэлементных композиций и 4K-финалов.

Seedream 4.5desde 2 tokens

seedream-4.5BytePlus

Кинематографичный свет и стабильный образ персонажа между генерациями. Бери для продуктовых каталогов, чарактер-сетов и правок по референсу — стабильная рабочая модель: 2K/4K, до 14 референсов.

Seedream 5.0 Lite2 tokens

seedream-5BytePlus

Лёгкий Seedream 5.0: рассуждает над сложным промптом и сама ищет в сети — собирает многоэлементные сцены и кадры по актуальной повестке. Правит по примеру-референсу, тянет до 3K.

Seedream 5.0 Prodesde 2 tokens

seedream-5-proBytePlus

Seedream для фотореалистичных коммерческих hero-кадров, товарной фотографии и правок по размеченному референсу. Сильна в естественном свете, коже и материалах, хорошо держит явно заданный арт-дирекшн; 1K/2K, до 10 референсов.

SwitchX Imagedesde 6 tokens

switchx-imageBeeble

Релайтинг и композитинг от Beeble: переносит на исходное фото объект, фон или свет по тексту, одному референсу и опциональной маске — с физически корректным светом, не генерируя картинку с нуля. 720p и 1080p.

Wan 2.7 Image3 tokens

wan-2.7-imageAlibaba

Упор на портреты и лица: черты, макияж и причёску задаёшь через референсы. Бери для аватаров, бьюти и консистентных серий персонажей. Разрешение до 2K.

Wan 2.7 Image Pro6 tokens

wan-2.7-image-proAlibaba

4K-тир Wan с режимом рассуждения над промптом: точнее держит сложные многошаговые инструкции и текст внутри кадра — вплоть до таблиц и формул. Бери для тяжёлых деливериблов вроде постеров и упаковки.