新京报贝壳财经讯(记者罗亦丹)3月4日,智谱发布了“2025开源年”的第一个模型:首个支持生成汉字的开源文生图模型——CogView4,其在DPG-Bench基准测试中的综合评分排名第一,该模型也是首个遵循Apache 2.0协议的图像生成模型。
CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是一款能够在画面中生成汉字的开源文生图模型,能更好地满足广告、短视频等领域的创意需求。在技术实现上,CogView4将文本编码器从纯英文的T5 encoder换为具备双语能力的GLM-4 encoder,并通过中英双语图文进行训练,使CogView4模型具备双语提示词输入能力。
CogView4生成的图片
校对 穆祥桐
领取专属 10元无门槛券
私享最新 技术干货