GPT-4o Image API 模型解析指南

快速结论

支持 prompt 文生图，适合营销、电商和创意视觉生产。
支持 reference_images（最多 5 张）进行图生图与风格约束。
支持 mask_url 做局部编辑，便于精修和定向修改。

核心能力

高质量文生图：通过统一接口快速生成可交付图像素材。
参考图一致性：通过 reference_images 提升风格和构图稳定性。
局部编辑能力：通过 mask_url 对指定区域进行细粒度改图。

适用场景

需要快速生成商品图、广告图、活动视觉等素材。
需要在已有图片基础上做风格统一或局部重绘。

不适用场景

需要长视频生成或时间序列镜头控制时。
需要复杂多轮逻辑推理对话时。

运行特性

统一走图片生成接口，结果通常以异步任务形式返回并通过任务状态查询。
reference_images 最多 5 张，单张文件大小与格式需满足文档约束。
mask_url 可选，用于局部编辑和替换。

最小请求示例

{
  "model": "gpt-4o-image",
  "prompt": "高质感产品广告图，柔和主光，极简背景，商业摄影风格",
  "size": "1:1",
  "n": 1
}

最小响应示例

{
  "id": "task_img_xxxxxxxx",
  "object": "generation.task",
  "model": "gpt-4o-image",
  "status": "queued",
  "progress": 0,
  "created_at": 1703884800,
  "metadata": {}
}

关键参数

参数	类型	必填	默认值	范围	说明
model	string	是	gpt-4o-image	-	模型标识，必须使用 ToAPIs 提供值。
prompt	string	是	-	-	图片描述文本。
size	string	否	1:1	1:1	2:3
n	integer	否	1	1-4	单次请求生成张数。
reference_images	file[]	否	-	max 5	参考图片数组，用于图生图与风格控制。
mask_url	string	否	-	-	遮罩图 URL，用于局部编辑。

常见错误

HTTP	Code	触发条件	修复建议	重试策略
400	invalid_request_error	字段缺失、类型错误或参数取值不在允许范围。	校验 model/prompt/size/n/reference_images/mask_url 参数。	修正请求体后重试。
401	authentication_error	API Key 缺失或无效。	确认 Authorization 头和密钥权限。	修复鉴权后重试。
429	rate_limit_exceeded	请求频率、并发或当前额度命中上游限流策略。	先做指数退避重试，并检查当前请求节奏、并发设置和额度使用情况。	建议 1s/2s/4s + 抖动；连续触发时再收紧提交节奏。

FAQ

GPT-4o Image 适合什么场景？
适合高频创意出图、品牌视觉扩展、以及在已有素材上进行局部编辑。
为什么图生图效果不稳定？
请检查 reference_images 质量与数量，并在 prompt 中明确保留元素和风格约束。
图像视频模型报错：invalid apitype: -1
这类错误通常说明接口走错了。图像和视频模型一般不走 chat 接口，而是按对应文档发起 HTTP 任务请求，并通过任务状态接口轮询结果。排查时建议先看用户的实际请求代码、请求地址和请求体。
用户进行生成图片/视频的任务时出现任务失败，但是扣款
先让用户提供任务日志或截图，重点看是否出现了输入或输出 token 统计。如果有这类 token 记录，大概率是用户把图片/视频模型走成了 chat 接口；这不是正确用法。图片和视频模型通常是异步任务接口，需要通过 HTTP 请求先提交任务，再拿到任务 ID 轮询状态，详细以对应文档为准。

GPT-4o Image 完整解析（Markdown）

GPT-4o Image API 模型解析指南

快速结论

核心能力

适用场景

不适用场景

运行特性

最小请求示例

最小响应示例

关键参数

常见错误

FAQ

相关 API