前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI绘画专栏之statble diffusion 放大图片 (九)

AI绘画专栏之statble diffusion 放大图片 (九)

原创
作者头像
疯狂的KK
发布2023-11-09 18:18:41
3930
发布2023-11-09 18:18:41
举报
文章被收录于专栏:Java项目实战Java项目实战

在数字时代,拍照、截图、保存美景已经成为我们生活中的常态。然而,有时候我们会遇到一些问题:图像过于模糊、细节不清晰、像素低,这些都可能影响我们欣赏和分享美好瞬间的体验。幸运的是,如今有免费的AI图像高清放大工具可以帮助我们解决这些问题,让我们能够享受更清晰、更精彩的图像。

1.是什么

  1. 高保真图像放大
    1. 不修改人物脸部的同时添加非常细致的细节和纹理
    2. 适合大多数图片(真实或动漫,摄影作品或AIGC,SD 1.5或Midjourney图片...)
  2. 较少的显存消耗
    1. 我移除了官方实现中显存消耗高的模块。
    2. 剩下的模型比ControlNet Tile模型小得多,需要的显存也少得多。
    3. 当结合Tiled Diffusion & VAE时,你可以在有限的显存(例如,<12GB)中进行4k图像放大。
  3. 注意,sdp可能会不明原因炸显存。建议使用xformers。
  4. 小波分解颜色修正
    1. StableSR官方实现有明显的颜色偏移,这一问题在分块放大时更加明显。
    2. 我实现了一个强大的后处理技术,有效地匹配放大图像与原图的颜色。

2.怎么下

⚪ 方法 1: 官方市场

  • 打开Automatic1111 WebUI -> 点击“扩展”选项卡 -> 点击“可用”选项卡 -> 找到“StableSR” -> 点击“安装”

⚪ 方法 2: URL 安装

3.怎么玩

我们目前有两个版本。它们产生的细节相似,但是768版本的边缘更自然。

  • 您必须使用 StabilityAI 提供的 Stable Diffusion V2.1 768 EMA 检查点(约5.21GB)
    • 将其放入 stable-diffusion-webui/models/Stable-Diffusion/ 文件夹中
  • 下载提取后的 StableSR 模块
    • 将 StableSR 模块(约400MB)放入 stable-diffusion-webui/extensions/sd-webui-stablesr/models/ 文件夹中

  • 您必须使用 StabilityAI 提供的 Stable Diffusion V2.1 512 EMA 检查点(约5.21GB)
    • 将其放入 stable-diffusion-webui/models/Stable-Diffusion/ 文件夹中
  • 下载提取后的 StableSR 模块
    • 将 StableSR 模块(约400MB)放入 stable-diffusion-webui/extensions/sd-webui-stablesr/models/ 文件夹中

虽然我们使用了 SD2.1 的检查点,但您仍然可以放大任何图片(甚至来自 SD1.5 或 NSFW)。您的图片不会被审查,输出质量也不会受到影响。

  • 安装 Tiled diffusion 和VAE扩展
    • 原始的 StableSR 对大于 512 的大图像容易出现 OOM。
    • 为了获得更好的质量和更少的 VRAM 使用,我们建议使用 Tiled Diffusion & VAE。
  • 使用官方 VQGAN VAE
    • 把VQVAE(约750MB大小)放在你的 stable-diffusion-webui/models/VAE 中
  • 在 WebUI 的顶部,选择你下载的 v2-1_512-ema-pruned 模型。
  • 切换到 img2img 标签。在页面底部找到 "Scripts" 下拉列表。
    • 选择 StableSR 脚本。
    • 点击刷新按钮,选择你已下载的 StableSR 检查点。
    • 选择一个放大因子。
  • 上传你的图像并开始生成(无需提示也能工作)。
  • 推荐使用 Euler a 采样器,CFG值=7,步数 >= 20。
    • 尽管StableSR不需要提示词也能工作,我们发现负面提示词能显著增强细节。比如使用3d, cartoon, anime, sketches, (worst quality:2), (low quality:2)
    • 点击查看有/没有prompt的对比
  • 如果生成图像尺寸 > 512,我们推荐使用 Tiled Diffusion & VAE,否则,图像质量可能不理想,VRAM 使用量也会很大。
  • 这里是官方推荐的 Tiled Diffusion 设置。
    • 方法 = Mixture of Diffusers
    • 隐空间Tile大小 = 64,隐空间Tile重叠 = 32
    • Tile批大小尽可能大,直到差一点点就炸显存为止。
    • Upscaler必须选择None。
  • 下图是24GB显存的推荐设置。
    • 对于4GB的设备,只需将Tiled Diffusion Latent tile批处理大小改为1,Tiled VAE编码器Tile大小改为1024,解码器Tile大小改为128。
    • SDP注意力优化可能会导致OOM(内存不足),因此推荐使用xformers。
    • 除非你有深入的理解,否则你不要改变Tiled Diffusion & Tiled VAE中的其他设置。这些参数对于StableSR基本上是最优解。
  • 什么是 "Pure Noise"?
    • Pure Noise也就是纯噪声,指的是从完全随机的噪声张量开始,而不是从你的图像开始。这是 StableSR 论文中的默认做法。
    • 启用这个选项时,脚本会忽略你的重绘幅度设置。产出将会是更详细的图像,但也会显著改变颜色和锐度。
    • 禁用这个选项时,脚本会开始添加一些噪声到你的图像。即使你将去噪强度设为1,结果也不会那么的细节(但可能更和谐好看)。
    • 如果禁用Pure Noise,推荐重绘幅度设置为1
  • 什么是"颜色修正"?
    • 这是为了缓解来自StableSR和Tile处理过程中的颜色偏移问题。
    • AdaIN简单地匹配原图和结果图的颜色统计信息。这是StableSR官方算法,但常常效果不佳。
    • Wavelet将原图和结果图分解为低频和高频,然后用原图的低频信息(颜色)替换掉结果图的低频信息。该算法对于不均匀的颜色偏移非常强力。算法来自GIMP和Krita,对每张图像需要几秒钟的时间。
    • 启用颜色修正时,原图也会出现在您的预览窗口中,但不会被自动保存。

为什么我的结果和官方示例不同?

  • 这不是你或我们的错。
    • 如果正确安装,这个扩展有与 StableSR 相同的 UNet 模型权重。
    • 如果你安装了可选的 VQVAE,整个模型权重将与融合权重为 0 的官方模型相同。
  • 但是,你的结果将不如官方结果,因为:
    • 采样器差异:
      • 官方仓库进行 100 或 200 步的 legacy DDPM 采样,并使用自定义的时间步调度器,采样时不使用负提示。
      • 然而,WebUI 不提供这样的采样器,必须带有负提示进行采样。这是主要的差异。
    • VQVAE 解码器差异:
      • 官方 VQVAE 解码器将一些编码器特征作为输入。
      • 然而,在实践中,我发现这些特征对于大图像来说非常大。 (>10G 用于 4k 图像,即使是在 float16!)
      • 因此,我移除了 VAE 解码器中的 CFW 组件。由于这导致了对细节的较低保真度,我将尝试将它作为一个选项添加回去

4.怎么办

显存问题

12 SD自带放大

通过这些免费的AI图像高清放大工具,我们能够轻松将模糊、低分辨率的图像转化为高清的作品,细节和纹理都能得到显著提升。无论是个人使用还是运营自媒体,我们都可以从中受益,提升我们的图像内容质量。

我正在参与2023腾讯技术创作特训营第三期有奖征文,组队打卡瓜分大奖!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.是什么
  • 2.怎么下
  • 3.怎么玩
  • 4.怎么办
相关产品与服务
大模型图像创作引擎
大模型图像创作引擎是一款提供 AI 图像生成与处理能力的 API 技术服务,可以结合输入的文本或图片智能创作出与输入相关的图像内容,具有更强大的中文理解能力、更多样化的风格选择,更好支持中文场景下的建筑风景生成、古诗词理解、水墨剪纸等中国元素风格生成,以及各种动漫、游戏风格的高精度图像生成和风格转换,为高质量的内容创作、内容运营提供技术支持。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档