公众号机器学习与AI生成创作

文章/答案/技术大牛

发布

LV0

发表了文章 2024-04-182024-04-18 18:48:52

CVPR 2024 | 绝了！！最新 diffusion 扩散模型梳理！100+篇论文、40+研究方向！

扩散概率模型（DPMs）在高分辨率图像生成方面显示出显著性能，但由于通常需要大量采样步骤，其采样效率仍有待提高。高阶ODE求解在DPMs中的应用的最新进展使得能...

公众号机器学习与AI生成创作 2024-04-182024-04-18 18:48:53

性能、论文、模型、视频、数据

发表了文章 2024-04-182024-04-18 18:47:30

CVPR 2024 | 可控文生图11篇汇总！基于扩散模型diffusion的text-to-image

3D资产生成正受到大量关注，受到最近文本引导的2D内容创建成功的启发，现有的文本到3D方法使用预训练文本到图像扩散模型来解决优化问题，或在合成数据上进行微调，这...

公众号机器学习与AI生成创作 2024-04-182024-04-18 18:47:30

image、text、布局、模型、数据

发表了文章 2024-04-122024-04-12 14:31:58

世界上第一位AI程序员Devin的诞生，我们人类程序员要如何看待和了解他？

全球首个完全自主的 AI 软件工程师上线，它是来自 Cognition 这家初创公司的产品——Devin，这个名字也随即引爆了科技圈。话说 Devin 有多能...

公众号机器学习与AI生成创作 2024-04-122024-04-12 14:31:59

模型、LLM、程序员、工作、架构

发表了文章 2024-04-122024-04-12 14:28:09

CVPR 2024 | 图像检测类（目标、deepfake、异常）！AIGC扩散模型diffusion解决detection任务

多目标跟踪（Multiple Object Tracking，MOT）是计算机视觉领域中一个关键领域，有广泛应用。当前研究主要集中在跟踪算法的开发和后处理技术的...

公众号机器学习与AI生成创作 2024-04-122024-04-12 14:28:09

aigc、detection、模型、数据、异常

发表了文章 2024-04-122024-04-12 14:26:16

CVPR 2024 | 图像超分、图像恢复汇总！用AIGC扩散模型diffusion来解决图像low-level任务的思路

超分辨率（SR）和图像生成是计算机视觉中重要的任务，在现实应用中得到广泛采用。然而，大多数现有方法仅在固定放大倍数下生成图像，并且容易出现过平滑和伪影。此外，在...

公众号机器学习与AI生成创作 2024-04-122024-04-12 14:26:16

模型、数据、性能、aigc、解决方案

发表了文章 2024-04-122024-04-12 14:25:38

CVPR 2024 | 风格迁移和人像生成汇总！扩散模型diffusion用于经典AIGC方向

基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而，当前基于编码器的方法在迁移风格时显著损害了文本到图像模型的文本可控性。本文提出DEADiff来解决这...

公众号机器学习与AI生成创作 2024-04-122024-04-12 14:25:38

迁移、aigc、开发、模型、重构

发表了文章 2024-04-122024-04-12 14:25:11

CVPR 2024 | 从6篇论文看扩散模型diffusion的改进方向

公众号机器学习与AI生成创作 2024-04-122024-04-12 14:25:11

优化、论文、模型、数据、性能

发表了文章 2024-03-262024-03-26 17:50:19

CVPR 2024 | 前沿而相对小众！几个AIGC扩散模型diffusion应用一览

扩散模型已展示在机器人轨迹规划方面的潜力。然而，从高级指令生成连贯的轨迹仍具有挑战性，特别是对于需要多个序列技能的长距离组合任务。

公众号机器学习与AI生成创作 2024-03-262024-03-26 17:50:19

模型、设计、数据、网络、aigc

发表了文章 2024-03-182024-03-18 19:47:50

CVPR2024｜DragGAN并不需要点跟踪！FreeDrag：无需点跟踪即可稳定拖动语义内容

Code：https://github.com/LPengYang/FreeDrag

公众号机器学习与AI生成创作 2024-03-182024-03-18 19:47:50

handle、point、框架、搜索、异常

发表了文章 2024-03-182024-03-18 19:46:10

Stable Diffusion 3技术报告出炉：揭露Sora同款架构细节

所以，SD3这比DALL·E 3和Midjourney v6都要强的文字以及指令跟随技能，究竟怎么点亮的？

公众号机器学习与AI生成创作 2024-03-182024-03-18 19:46:11

模型、性能、渲染、测试、架构

发表了文章 2024-03-072024-03-07 16:47:25

场景文字生成遥遥领先！Ideogram这块暴打Midjourney+DALL·E 3

文生图领域作为一个跑出「10人团队年收入过亿美金初创公司」的赛道，已经成了AI创业公司掘第一桶金的最佳起点。

公众号机器学习与AI生成创作 2024-03-072024-03-07 16:47:25

行业、Midjourney、渲染、测试、工具

发表了文章 2024-02-292024-02-29 15:12:50

ICCV 2023 | 最全AIGC梳理，5w字30个diffusion扩散模型方向，近百篇论文！

内容和风格（Content and style disentanglement，C-S）解耦是风格迁移的一个基本问题和关键挑战。基于显式定义（例如Gram矩阵）...

公众号机器学习与AI生成创作 2024-02-292024-02-29 15:12:50

数据、aigc、论文、模型、视频

发表了文章 2024-01-302024-01-30 13:18:27

ICCV 2023 | 9篇论文看扩散模型diffusion用于图像恢复任务：超分、恢复、增强、去模糊、去阴影

尽管高光谱图像(hyperspectral image，HSIs)在执行各种计算机视觉任务中的重要性已被证明，但由于在空间域中具有低分辨率(LR)属性，其潜力受...

公众号机器学习与AI生成创作 2024-01-302024-01-30 13:18:27

系统、论文、模型、数据、网络

发表了文章 2024-01-172024-01-17 14:24:53

ICCV 2023 | 巡礼10篇论文，看扩散模型diffusion的可控生成

经典再回顾！ICCV 2023最佳论文ControlNet，用于向大型预训练的文本到图像扩散模型添加空间条件控制。ControlNet锁定了就绪的大型扩散模型，...

公众号机器学习与AI生成创作 2024-01-172024-01-17 14:24:53

论文、模型、数据、开源、对象

发表了文章 2024-01-102024-01-10 16:37:11

ICCV 2023 | 从14篇论文看如何改进扩散模型diffusion ？

文本到图像扩散模型，使得生成多样且高质量的图像成为可能。然而，这些图像往往在描绘细节方面不够精细，并且容易出现由于输入文本的歧义导致的错误。缓解这些问题的一种方...

公众号机器学习与AI生成创作 2024-01-102024-01-10 16:37:12

论文、模型、数据、开源、架构

发表了文章 2024-01-102024-01-10 16:35:42

ICCV 2023 视频AIGC（编辑/生成/转换）论文 7 篇

基于大规模图像库训练的图像扩散模型已成为质量和多样性方面最为通用的图像生成模型。它们支持反转真实图像和条件生成（例如，文本生成），使其在高质量图像编辑应用中具有...

公众号机器学习与AI生成创作 2024-01-102024-01-10 16:35:42

音频、aigc、论文、模型、视频

发表了文章 2023-12-282023-12-28 14:46:49

控制图像中的文字！AIGC应用子方向之图像场景文本的编辑与生成

公众号机器学习与AI生成创作 2023-12-282023-12-28 14:46:53

aigc、框架、模型、数据、网络

发表了文章 2023-12-142023-12-14 12:33:06

X-Dreamer ：扩散模型的高质量3D生成

本篇分享论文X-Dreamer: Creating High-quality 3D Content by Bridging the Domain Gap Bet...

公众号机器学习与AI生成创作 2023-12-142023-12-14 12:33:08

渲染、对象、论文、模型、优化

发表了文章 2023-12-142023-12-14 12:33:05

X-Dreamer ：扩散模型的高质量3D生成

本篇分享论文X-Dreamer: Creating High-quality 3D Content by Bridging the Domain Gap Bet...

公众号机器学习与AI生成创作 2023-12-142023-12-14 12:33:08

渲染、对象、论文、模型、优化

发表了文章 2023-12-112023-12-11 13:40:59

RCG：何恺明新作，无条件图像生成新SOTA

这个框架结构非常简单但效果拔群，直接在ImageNet-1K数据集上实现了无条件图像生成的新SOTA。

公众号机器学习与AI生成创作 2023-12-112023-12-11 13:41:03

监督学习、计算机科学、架构、框架、模型

12 3 4 5 6 7 8...13 下一页

个人简介

火锅店 | 炼卖萌丹
关注公众号：机器学习与AI生成创作，分享AI科技、程序员面试内推，一起做有趣前沿的人
图像处理人工智能
皇家理工 | 卖萌
https://www.zhihu.com/people/ke-zhan-shen
广东省 | 广州市
加入社区时间：2020-04-27

个人成就

获得 528 次赞同
文章被阅读 409.9K 次

关注了：1关注者：69