首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头

IT之家 6 月 28 日消息,近日来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN,只要点击拖拽,用户就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。目前该项目已经在 GitHub 中开源,有兴趣的IT之家小伙伴们可以前往了解。

▲ 视频源 DragDAN,微博视频转录由 科普君 XueShu

DragGAN 是一个直观的图像编辑工具,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,所以用户可以在生成图像之后再进行重新编辑,而不必重新生成一个新的图像。

▲ 图源 DragGAN

▲ 图源 DragGAN

研究论文中展示了一些演示案例,包括增加山峰的高度,改变模特的姿势和衣服的长度和形状,张开或闭合狮子的嘴巴,以及将一个人的表情从平淡变成微笑。

研究人员表示,他们的方法在基于 GAN 的操作中优于 SOTA,并为图像编辑开辟了新方向。在接下来的几个月里,他们希望将基于点的编辑扩展到 3D 生成模型。

虽然公布了源代码,但源代码有严格的限制:

本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定,英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此,"非商业" 是指仅用于研究或评估目的。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230628A03TU600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券