行业权威
行业权威
当前位置:首页 > MJ动态 > 行业权威

阿里再放大招!开源神器 Qwen-Image-Edit,AI 一句话搞定图像编辑!



2025 年 8 月 19 日,由阿里通义千问(Qwen)团队重磅开源的新模型 Qwen-Image-Edit 正式发布。

这是一款基于 20B 参数规模 的 Qwen-Image 模型升级而来,专注于图像编辑。它不仅继承了之前模型在文字渲染上的强大能力,还加入了图片语义与外观的“双控”机制,支持中英文文字编辑、局部修改、风格迁移、视角旋转等高级功能。

一、三大技术亮点,带来内容创作新可能

技术亮点
描述
语义 & 外观 双重编辑
输入图像同时进入 Qwen2.5-VL(语义控制)与 VAE 编码器(外观控制),实现高层语义理解 + 低层细节保真。
精准文字操作
支持中英文双语文字编辑,可在不改变字体、字号、风格的情况下对图中文字进行增、删、改,适配海报、电商图、书法、段落布局等复杂场景,中文单字渲染准确率高达 97%。
优秀性能,SOTA 表现
在公开基准 GEdit、ImgEdit、GSO 等测试上达到顶级成绩,并且开源许可采用 Apache-2.0,商业友好。

此外,它具备“链式编辑”能力,能够逐步调整错误处,适用于迭代修正场景,如书法纠错。

官方示例

二、ComfyUI 安装使用

本地安装

ComfyUI 已原生支持 Qwen-Image-Edit模型,更新ComfyUI到最新版,下载相应模型文件工作流即可使用。

另外我已经将相关所有模型放大网盘了,复制下方链接获取。

百度网盘接: https://pan.baidu.com/s/1fgvOQ2j0v2AlLcB7AXwwCQ?pwd=xprb 提取码: xprb 

在线使用

 

三、体验测评

  • 文字编辑

    •  
    将文字“Hope”替换为“Qwen”,保持相同的字体、大小和样式。
     
    •  
    •  

 

  •  
将"春日出逃计划" 改为"夏日出走计划",保持字体风格不变
 

这里有点不好了,虽然顶部的字改过来了,但对图片其他地方的改动还是蛮大的

  •  
将“龙”字改为“虎”字,保持相同的书法风格和笔触质感
 
  • 视角变化

  •  
旋转汽车以显示前视图,同时保持相同的沙漠背景。
 
  •  
把图中的人物生成背面视角
 
  • 风格转换

  •  
从吉卜力风格转变为油画风格,笔触强烈。
 
  •  
将茶室改造成赛博朋克霓虹灯风格的夜晚氛围
 
  • 局部调整:

  •  
把图中女子的衣服换成蓝色
 
  • 物体消除

  •  
移除图片中的人物,保持背景不变
 
  • 换背景:

  •  
背景换成草原,保持人物特征不变
 
  • 线稿上色:

  •  
用充满活力的色彩填充英雄骑士的干净漫画线条艺术:银色盔甲与蓝色反射,金色镶边,红色布料细节,自然的肤色,柔和的阴影,幻想的插图风格,高分辨率8K。
 
  •  
为魔幻城堡的建筑线条画添加色彩:浅米色的石墙,深绿色的屋顶,暖色调的窗户,用柔和的阴影强调深度,奇幻的插画风格。
 
  • 重打光:

  •  
把房间的光线改成只有桌上一盏台灯亮着的效果,周围变暗
 

以上就是我初步测试的案例,整体感觉还不错,完了和kontext做一个对比测试看一下结果咋样。

四、结语

以上就是关于 Qwen-Image-Edit 编辑模型的一次体验和分享。从整体来看,它的功能覆盖已经相当全面,文字、局部修改、风格迁移等能力都表现得不错。虽然在复杂场景下依然可能存在一定的成功率问题,但随着社区生态的发展,特别是 LoRA 等个性化扩展的完善,体验只会越来越好。开源生态在国内的发展速度已经非常惊人,更新迭代的频率也越来越快。

技术的浪潮滚滚向前,唯有持续关注,才能不被时代落下。

创作

手机

手机扫一扫使用手机移动端
顶部