8月15日,Google在海外社交媒体X上(原Twitter)宣布,正式升级文生图大模型Imagen 4,并推出新版本:Imagen 4 Fast。
与今年5月Google I/O上发布的Imagen 4/4 Ultra相比,新模型更快、更强、更便宜:
生图速度从1~5秒,稳定到1~3秒;
保留极强的现实风格细节之外,实现了超强的英文字体生成,支持多种艺术字体;
从0.06美金/单图的平均价格,下降到0.02美金。
不过让人失望的是,新服务仍然没能直接在Gemini APP内上线,想要体验需要使用Google AI Studio、Vertex AI以及Gemini API。
与OpenAI、xAI竞品相比,Imagen 4 Fast最大的优势就是,生成图片细节极强,现实物理世界规律对齐层面做到了最优,做到了以假乱真。
基准测试 | Imagen 4 (标准版) | Imagen 4 Ultra (高级版) | 说明 |
---|---|---|---|
GenAI-Bench (人类评估得分) |
|
|
|
FID Score (COCO 数据集) |
|
|
|
Image Arena (ELO 排名) |
|
|
|
CLIP Score (提示一致性) |
|
|
|
生成速度 (秒/图像) |
|
|
|
分辨率支持 |
|
|
|
幻觉率 (复杂场景) |
|
|
|
GPT-5图像生成基于集成GPT-Image-1,专注多模态;Grok 4 Imagine强调创意和速度。
基准测试 | Imagen 4 Ultra | GPT-5 (Image Gen) | Grok 4 Imagine | 差异分析 |
---|---|---|---|---|
GenAI-Bench (人类评估得分) |
|
|
|
|
FID Score (COCO 数据集) |
|
|
|
|
Image Arena (ELO 排名) |
|
|
|
|
CLIP Score (提示一致性) |
|
|
|
|
生成速度(秒/图像) |
|
|
|
|
分辨率支持 |
|
|
|
|
幻觉率 (复杂场景) |
|
|
|
|