Gemini Omni API 模型解析指南
快速结论
- 定位偏 Flash,优先满足快速生成、低延迟反馈和高频迭代场景。
- 适合概念验证、社媒短视频和批量出片,不必一开始就走重制作流程。
- 使用异步视频任务接口,先提交任务,再通过状态接口轮询结果。
核心能力
- 低延迟出片:更适合需要快速看到结果并频繁调整提示词的工作流。
- 短视频批量生成:适合短时长内容、多版本测试和批量社媒素材生产。
- 统一视频任务契约:沿用 ToAPIs 通用视频任务接口,方便从验证迁移到生产接入。
适用场景
- 需要快速验证创意、脚本或镜头思路时。
- 需要批量生成社媒短视频或多版本素材时。
- 需要低延迟反馈来支撑高频提示词迭代时。
不适用场景
- 需要更强调展示级画面稳定性或高制作感的重质视频时。
- 需要同步即时返回结果而不是异步任务流时。
运行特性
- 按异步视频任务模式运行,提交后先返回任务状态而不是直接返回视频文件。
- 更适合短时长、快速反馈和多轮参数调整的创意流程。
- 可以沿用通用视频任务轮询逻辑接入服务端队列与生产流程。
最小请求示例
{
"model": "gemini_omni",
"prompt": "一只猫在霓虹雨夜中奔跑,电影感镜头",
"aspect_ratio": "16:9",
"duration": 6,
"resolution": "720P"
}
最小响应示例
{
"id": "video_01JZEXAMPLE",
"object": "generation.task",
"model": "gemini_omni",
"status": "queued",
"created_at": 1779247407
}
关键参数
| 参数 | 类型 | 必填 | 默认值 | 范围 | 说明 |
|---|
| model | string | 是 | gemini_omni | - | 模型标识,固定使用 gemini_omni。 |
| prompt | string | 是 | - | - | 描述目标视频的主体、动作、场景与风格。 |
| aspect_ratio | string | 否 | 16:9 | 16:9 | 9:16 |
| duration | integer | 否 | 6 | 6 | 10 |
| resolution | string | 否 | 720P | 720P | 输出分辨率,当前仅支持 720P;不传时按默认值处理。 |
常见错误
| HTTP | Code | 触发条件 | 修复建议 | 重试策略 |
|---|
| 400 | invalid_request_error | 请求体缺少必填字段或字段类型不匹配。 | 校验 model、mode、input 的字段完整性与类型。 | 修正参数后重试,不建议直接盲重试。 |
| 401 | authentication_error | 缺少 Authorization 头或 API Key 无效。 | 确认 Bearer Token 与密钥权限范围。 | 修复鉴权后重试;连续失败请轮换密钥。 |
| 429 | rate_limit_exceeded | 请求频率、并发或当前额度命中上游限流策略。 | 先做指数退避重试,并检查当前请求节奏、并发设置和额度使用情况。 | 建议指数退避(例如 1s/2s/4s)+ 抖动;连续触发时再收紧提交节奏。 |
| 500 | internal_error | 上游服务瞬时异常或内部处理失败。 | 记录 request id 并触发重试链路。 | 可短间隔重试 2-3 次,持续失败请升级人工排查。 |
FAQ
- Gemini Omni 更适合什么场景?
更适合概念验证、社媒短视频、批量出片和需要低延迟反馈的高频创意迭代场景。
- 图像视频模型报错:invalid apitype: -1
这类错误通常说明接口走错了。图像和视频模型一般不走 chat 接口,而是按对应文档发起 HTTP 任务请求,并通过任务状态接口轮询结果。排查时建议先看用户的实际请求代码、请求地址和请求体。
- 用户进行生成图片/视频的任务时出现任务失败,但是扣款
先让用户提供任务日志或截图,重点看是否出现了输入或输出 token 统计。如果有这类 token 记录,大概率是用户把图片/视频模型走成了 chat 接口;这不是正确用法。图片和视频模型通常是异步任务接口,需要通过 HTTP 请求先提交任务,再拿到任务 ID 轮询状态,详细以对应文档为准。
相关 API