首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Stability AI发布新一代图像生成模型:Stable Cascade

近日,全球领先的AI研究实验室Stability AI震撼发布了一款名为“Stable Cascade”的全新一代文本生成图像模型。

这款基于创新Würstchen架构研发的模型,以其卓越性能与极致效率颠覆了现有文生图技术的认知边界,引发了业界广泛关注。

在官方发布的新闻通稿中,Stability AI明确指出,Stable Cascade旨在将高端图像生成能力引入消费级硬件平台,允许用户在常规设备上进行便捷的训练与微调操作。

相较于当前市场上的主力产品SDXL,Stable Cascade在整体效能和生成图片内容质量方面均实现了显著提升。

据了解,Stable Cascade的独特之处在于其新颖的数据处理流程。

当接收到用户输入的文字描述时,该模型会将其转化为一组24x24像素的小型数据集合,随后通过解码这些微小图像单元进而生成高分辨率的最终图像。

这种模块化设计使得模型能够在每个步骤独立运作,并能够针对特定环节进行灵活而细致的优化训练。

更值得关注的是,Stable Cascade因其“模块化”设计理念,在保持输出质量的同时,大大降低了对显存资源的需求。

官方宣称,即便仅配备20GB显存,此模型也能流畅运行,从而为更多开发者和普通用户提供更为亲民的使用环境。

Stability AI进一步对比展示了Stable Cascade与其他业内主流竞品如Playground v2、SDXL、SDXL Turbo以及Würstchen v2的性能差异。

据称,无论是在提示词对齐精度还是生成图片细节丰富度上,Stable Cascade的表现几乎独占鳌头。

原图

重建图像

尤其引人注目的是,尽管Stable Cascade的最大模型参数量较Stable Diffusion XL增加了14亿之多,但推理速度仍展现出令人惊叹的优势,实现实质性的突破。

综合以上比较,Stability AI坚信Stable Cascade在架构设计层面已经达到了一个崭新的高度。

它不仅保持了高质量图像生成的标准,还在此基础上成功地提升了推理效率,为文生图技术领域树立了新的里程碑。

随着Stable Cascade相关数据及代码已在GitHub上公开(仅供非商业用途),这一革命性的技术创新势必将引领新一轮的文生图应用热潮,并激发全球范围内的AI研究者们继续探索这一领域的无限潜力。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OMgF9kl45GMGSFIDtMgzXhRw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券