真如摄影、细至发丝!阿里开源新一代图像生成模型Qwen-Image,阿里云 模型训练

12月31日,阿里正式开源新一代图像生成模型Qwen-Image-2512,实现人物肌肤质感、自然纹理还原与复杂文字渲染的大幅提升。仅需输入文字指令,新模型即可生成“零AI味”的高质量图片,人物发丝都清晰可见,堪比专业摄影师拍的真实照片。同时,千问新模型支持流畅生成漫画风格PPT、数据信息图等复杂图像,可满足专业设计场景下的多样化需求。

Qwen-Image-2512是8月发布的Qwen-Image图像生成基座模型的迭代版本,实现了性能的大幅提升。在聚焦文生图的AI Arena评测中,开发者对模型进行了超万轮盲测,Qwen-Image-2512位居开源模型榜首。具体测试结果显示,该模型在图像生成的真实度,语义遵循的准确度上表现卓越,不仅大幅领先其他开源模型,更在与多个闭源商用模型的对比中展现出强劲竞争力。


图说:Qwen-Image-2512在AI Arena上的模型盲测结果

从模型效果上看,全新的Qwen-Image-2512大幅降低了大模型生成图像的“AI感”。在人物面部细节、皮肤纹理、发丝刻画上,新模型效果显著,无论是人物眼角的细纹、风吹起发丝的方向,还是宠物柔软蓬松的毛发、湖面折射的环境倒影,千问新模型都能精准还原,效果接近相机实拍。不仅如此,新模型还能轻松驾驭复杂的视觉创作需求,一键生成媲美专业设计师水准的四格漫画风PPT、高质量信息图等。


图说:Qwen-Image新旧两版生成图像对比(左为上一代,右为新版本)

据了解,目前千问图像模型已形成多款多功能的完整矩阵,包含基座模型Qwen-Image、图像编辑模型Qwen-Image-Edit、图层编辑模型Qwen-Image-Layered等,涵盖不同场景与精度需求。三大模型系列均已在魔搭社区和HuggingFace开源,开发者和企业可免费下载商用,也可通过阿里云百炼调用模型API服务,普通用户可以在千问APP直接体验新模型,感受“零AI感”的高保真图像生成体验。


图说:用Qwen-Image-2512一键生成的PPT(文字、排版、风格为直出)

截至2025年底,阿里总共开源近400个千问Qwen模型,全球下载量超7亿,衍生模型数量突破18万,是全球第一开源大模型。阿里千问大模型服务超100万家客户,在中国企业级大模型调用市场中位居第一,是中国企业选择最多的大模型。


nginx