首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >基于DiT的身份保持图像生成技术突破

基于DiT的身份保持图像生成技术突破

原创
作者头像
用户11764306
发布2025-08-25 06:23:34
发布2025-08-25 06:23:34
2110
举报

InfiniteYou:在保持身份的同时实现灵活照片重塑

实现灵活且高保真的身份保持图像生成仍然是一项艰巨挑战,特别是在使用如FLUX等先进扩散变换器(DiT)时。本文介绍InfiniteYou(InfU),这是最早利用DiT完成此任务的鲁棒框架之一。

InfU解决了现有方法的显著问题,包括身份相似度不足、文本-图像对齐差、生成质量和美学效果低等。InfU的核心是InfuseNet组件,它通过残差连接将身份特征注入DiT基础模型,在保持生成能力的同时增强身份相似性。

采用多阶段训练策略,包括使用合成单人多样本(SPMS)数据进行预训练和监督微调(SFT),进一步改善了文本-图像对齐度,提升了图像质量,并缓解了人脸复制粘贴问题。大量实验证明,InfU实现了最先进的性能,超越了现有基线方法。

此外,InfU的即插即用设计确保了与各种现有方法的兼容性,为更广泛的研究社区提供了宝贵贡献。

ICCV 2025(亮点论文)。项目页面:https://example.com 代码和模型:https://example.com

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • InfiniteYou:在保持身份的同时实现灵活照片重塑
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档