← Все модели

Gemini Omni Flash

Мультимодальная модель Google: собирает ролик из текста, изображений и видео и правит готовый клип в диалоге. Бери, когда надо трансформировать снятое или смешать разные входы, а не снять кадр с нуля как Veo. Нативный звук, до 4K.

Стоимость

от 20 токенов

ВидеоПровайдер: Google
Запустить генерацию
curl -X POST https://api.givon.ai/api/v1/generations \
  -H "Authorization: Bearer $GIVON_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"type":"video","model":"gemini-omni-video","input":{"prompt":"кинематографичный пролёт дрона над ночным городом","aspectRatio":"9:16","resolution":"720p","duration":4}}'

Входные поля

* — обязательное
prompt*string

Scene / motion description.

до 5000 симв.

aspectRatiostring

деф. 9:16·9:16, 16:9

resolutionstring

деф. 720p·720p, 1080p, 4k

durationnumber

деф. 4·4, 6, 8, 10

Стоимость

от 20 токенов
720p · 4 секпо умолчанию20 тк
720p · 6 сек23 тк
720p · 8 сек28 тк
720p · 10 сек35 тк
1080p · 4 сек20 тк
1080p · 6 сек22.5 тк
1080p · 8 сек28 тк
1080p · 10 сек32.5 тк
4K · 4 сек37.5 тк
4K · 6 сек42.5 тк
4K · 8 сек90 тк
4K · 10 сек52.5 тк
Video input · 720p42.5 тк
Video input · 1080p42.5 тк
Video input · 4K90 тк

Вариант подбирается по полям запроса автоматически — указывать его не нужно.

Возможности

Режимыtext_to_video
Слоты ассетовstartImage:imagesourceVideo:videoreferences:image[]<=7

Запустить Gemini Omni Flash

Получи API-ключ — и этот же запрос заработает для любой модели каталога.