学界 | AI 自动生成二次元妹子?或将替代插画师部分工作

AI科技评论按:最近二次元爱好者们可能会感觉到了一阵兴奋流遍全身。来自复旦大学、同济大学、卡内基梅隆大学和石溪大学共6位学生(其实本科都在复旦)搭建了一个利用人工智能自动生成精美动漫角色的网站 MakeGirls.moe。

对于用户来说操作非常简单,只需要选择自己喜爱的头发、眼睛、微笑、张嘴等等特征,然后点击“genrate”就可以通过训练出的AI模型来生成一个动漫人物。该网站上线后数天,访问量便增加到10k+每小时。其repo在github trending上也一度排到第四位。该网站所使用的技术在其论文「Create Anime Characters with A.I. !」中进行了详细说明。

其实这并不是第一个将AI应用到动漫当中的模型。2015年Soumith Chintala等人开发DCGAN后不久,就有人将DCGAN应用到了生成动漫角色当中,出现了ChainerDCGAN、IllustrationGAN和AnimeGAN等,三者分别使用了Chainer、TensorFlow和PyTorch的框架,它们本质上都是DCGAN,只是实现方式不同。但这些模型的效果并不是很好,尤其是会出现面部头像模糊和扭曲的问题。在MakeGirls.moe的模型中,作者针对这些问题做出了两方面的改进。

一、使用更高质量的图像库

之前几家,他们训练模型所使用的数据集大多数是使用爬虫从网络上爬下来的,这类图片在质量和画风上参差不齐,甚至还有一些背景。训练数据集质量的低下会给训练造成很大的影响。本文的作者则通过从日本的游戏贩卖商Getchu购买了高质量的图像,这些图像基本出于专业画师之手,同时背景统一。

除了高质量的图像外为了训练网络模型,作者使用了一种基于CNN的图像分析工具Illustration2Vec,对图像中动漫人物的属性,如头发颜色、眼睛颜色、发型和表情等做标记。

此外,在训练的过程中他们还发现发布时间越晚的图片,训练出的模型效果越好。这不难理解,随着游戏角色制作和CG技术的发展,越是现代的图片,细节越丰富,如阴影和头发。所以作者舍弃了2005年之前的全部数据,并过滤掉分辨率低于128*128的图像,用剩下的31255张高质量图像进行训练。

二、模型结构

作者采用了今年5月份发表的DRAGAN模型(https://arxiv.org/pdf/1705.07215.pdf),这种模型所使用的计算量相对较少,收敛较快而且能够产生更稳定的结果。而在优化生成器的过程中,受ACGAN的启发,不仅向生成器提供了标签数据,连“噪声”数据也一并提供,之后再为判别器增加多标签分类功能。

下面展示一下效果——

虽然训练出的模型大多数时候都比较好,但该模型仍然存在一些缺点。问题仍出在数据集中,由于训练数据中各个属性(发色、发型、眼镜、帽子等)的数量分布不均匀,某些属性的生成并不理想(例如眼镜和帽子常常不能生成) ,如果将某些罕见的属性组合,生成的图片甚至会崩溃(例如帽子+眼镜)。也许当增加数据集的数量,训练出的模型生成图片质量可以进一步提高。雷锋网认为,按照此趋势AI或许在不久将替代掉插画师的一部分工作。

访问网站:http://make.girls.moe/(已有训练好的模型,打开就可以尝试生成)

据 AI 科技评论了解,由于突然之间巨大的访问量,网站目前托管在Preferred Networks所提供的AWS上。AWS嘛,你懂的,国内基本就是不能访问的……随后作者可能会做出一定调整。

查看论文:https://makegirlsmoe.github.io/assets/pdf/technical_report.pdf

Github:https://github.com/makegirlsmoe/makegirlsmoe.github.io(目前只有网站的js源码,看介绍训练模型的代码会在近期放出)

本文参考了:「AI可能真的要代替插画师了……」 https://zhuanlan.zhihu.com/p/28488946

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-08-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技大本营的专栏

别瞎搞!对自己定位不准,看再多机器学习资料也是白搭(附资源)

找资料也是门学问,别抓着机器学习就一拥而上。 作者 | Jason Brownlee 编译 | AI100(ID:rgznai100) 来看个小故事:机器学习火...

2998
来自专栏新智元

MIT最新研究:新算法通过学习折纸模型,生成任意3D结构

【新智元导读】计算机折纸是计算机科学长期研究的一个问题,MIT的新论文提出一种新的通用折纸算法,能在保证最小的折缝数量的情况下折出几乎任何东西,包括1000种简...

35011
来自专栏安恒信息

安恒信息两篇核心AI异常检测论文入选IEEE DSC国际会议

6月18日-21日,“第三届IEEE网络空间数据科学国际会议”在广州召开。业界代表及专家齐聚一堂,并就网络空间数据科学的科研和前沿发展方向进行交流。而安恒信息的...

1174
来自专栏数据派THU

独家 | 全解用Python建立能源市场算法交易的机器学习框架(附链接)

人工智能的新突破每天都成为头条新闻。在金融领域,机器学习的广泛运用和强大的应用,客户们并不了解。事实上,很少有像金融行业那样具有深厚历史、清楚明了和结构化数据的...

853
来自专栏AI科技评论

CNCC | 李飞飞最新演讲:视觉智慧是人类和计算机合作沟通的桥梁 | CNCC2017

AI 科技评论报道:中国计算机学会 CCF 举办的中国计算机大会CNCC 2017已于10月26日在福州市海峡国际会展中心开幕。参加会议的人数众多,主会场座无虚...

34912
来自专栏企鹅号快讯

第一篇:模仿游戏

有一部科幻电影叫《超体》,主题是人类一直以来的一个传说,“人类目前只开发了大脑10%的潜能。如果大脑潜能被进一步开发,那么人类将拥有更强的能力。”具体有哪些能力...

1886
来自专栏玉树芝兰

文科生用机器学习做论文,该写些什么?

从“价值、必要、讨论和工具”这四个角度,把一些容易踩的坑提示给你,助你顺利完成研究论文撰写。

592
来自专栏钱塘大数据

从普通程序员到AI大神,跨界的正确方式

本文的目的是给出一个简单的,平滑的,易于实现的学习方法,帮助 “普通” 程序员踏入AI领域这个门。

621
来自专栏AI科技评论

中科院赵军:开放域事件抽取 | CCF-GAIR 2018

AI 科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了...

1204
来自专栏量子位

“众矢之的”马库斯回应14个问题,将深度学习质疑到底

安妮 维金 李杉 编译自 Medium 量子位 出品 | 公众号 QbitAI 深度学习的质疑者中有位战士。 他有底气与大牛Yann LeCun激辩AI是否需要...

34910

扫码关注云+社区