站长之家(ChinaZ.com)1月26日 消息:今日,腾讯混元正式宣布,混元图像3.0图生图(HunyuanImage3.0- Instruct)模型闪亮登场,该模型支持图片编辑与多图融合功能,为用户带来全新的图像创作体验。
目前,此模型已在元宝同步上线,基于它,用户能够直接开展表情包制作、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制以及创意图片制作等多样化操作。
混元图像3.0图生图模型具备强大的技术实力。其总参数量达80亿(激活参数约13亿),采用混合专家(MoE)架构,以混元图像3.0的原生多模态架构基础模型为依托,引入图生图的多任务数据。通过指令微调和后训练,该模型能够深度理解并处理用户输入的图像和编辑指令。
在指令遵循效果方面,混元图像3.0图生图表现稳定。它生成的图片一致性高、真实感强、情绪表现力佳,而且生成速度显著提升。当模型收到用户输入的图片和提示词后,会先理解图像内容,再依据提示词进行推理,精准确定需要编辑的区域、详细编辑步骤以及要保留的图像区域,进而形成更详细的编辑指令,确保输出效果良好。
在功能支持上,混元图像3.0图生图十分丰富多样。它支持增、删、改、风格变换、老照片修复、人物与文字修改等多种图片编辑能力,还能把多张照片中的人物或元素提取出来合成合照、生成新图片,实现多图融合。