腾讯科技讯 5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。
这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。升级后的混元文生图大模型采用了与 sora 一致的DiT架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。
评测数据显示,最新的腾讯混元文生图模型效果远超开源的 Stable Diffusion 模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。
技术架构:
本来打算下载代码玩一玩,看了下 系统要求:
翻译成中文:
最低:所需的最小 GPU 内存为 11GB。
推荐:我们建议使用具有 32GB 内存的 GPU,以获得更好的生成质量。
看了看自己的电脑配置,有点卡啊。
领取专属 10元无门槛券
私享最新 技术干货