前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人工智能服装设计,这是什么黑科技?

人工智能服装设计,这是什么黑科技?

作者头像
mixlab
发布2019-05-05 15:22:56
1.3K0
发布2019-05-05 15:22:56
举报
文章被收录于专栏:MixLab科技+设计实验室

def AI_fashion_design ( ):

项目介绍

我搜集了当季一线大牌最新服装发布会的照片,用人工智能技术学习其中的服装设计风格,建立一套自动给服装线稿添加配色、材质纹理的算法,可以在几秒之内生成任意数量的颜色材质搭配方案,帮助服装设计师更好更快的抓住潮流趋势

效果演示

先放个视频看下人工智能如何来生成无限量的服装设计方案的。录屏自ubuntu16.04系统,没声音。视频大致意思是,设计师画了一堆服装线稿图(视频画面左侧的图),然后AI程序会根据这些线稿图自动配色(包括材质),可以手动指定每张线稿出几套方案(可以任意数量,视频中设置数量为6,即一张线稿出6个方案)。

图片示意如下

实现方法

那么这是如何实现的呢?其实很简单,利用的是英伟达出品的“MUNIT: Multimodal UNsupervised Image-to-image Translation”算法,这个算法很神奇,可以看成是cyclegan的进化版,我之前给汽车线稿上色的案例就是用cyclegan做的,但cyclegan对于每个输入的线稿只能生成一个上色结果,而MUNIT则会产生一堆可能的上色结果。原因在于MUNIT分离了图片内容编码(服装的款式)与图片风格编码(服装的颜色材质纹理),所以可以用同一个内容编码配上不同的风格编码,生成无数套方案。

听到这里,设计师朋友们内心OS:简单个屁!根本听不懂你在说什么好吗?

既然算法已经有开源现成的了,那么问题就只剩两个了,这个服装图片和服装线稿从哪里来?首先来讲服装图片的来源:从全球最大的流行趋势预测网站WGSN上的图库上爬来的,里面有个分类齐全的图片库,内有几乎所有大牌服装的所有发布会上的照片,非常适合作为图片训练素材。由于爬虫多多少少有些不道德,所以不讲具体做法了,反正我也不会,花钱找人爬的(滑稽)。

爬到的图片内容种类繁多,有的全身照,有的半身照,有鞋类特写,有妆容特写,参差不齐,如下图所示。

适合拿来用的

只有脸,没有服装

足控福利

那显然需要做下数据清洗工作,挑出其中T台走秀的全身照,其他的不要。思路其实也很简单,对图片做人脸检测,然后挑选出只有一个人脸的图,并按人脸和全图的比例大小进行排序,再来点手工筛选,就获得了一批可以用的图片,如下图所示:

文件名开头数字代表人脸占全图比例

但这些图还不能直接拿来训练,因为图片中背景变化太大,会影响训练效果,需要把背景去掉。这似乎是件很困难的事,几万张图片难道要一张一张去扣吗?不用,Adobe爸爸在photoshop 2018 cc 19.1.0版本更新中,增添了一键智能抠出图片主体的功能,位于菜单栏选择-主体,然后录制个批处理动作,就可以喝茶看戏了。当然你也可以去找开源的主体检测的代码,自己写个脚本来处理,但本着能用就行的程序员精神,我选择PS批处理。

用PS批处理遇到个小BUG,每张图片都要手动按下回车,但机智的我完美解决了这个小BUG,如下面视频所示。(视频中处理的是给汽车图片批量抠图,在上上上个项目中拍的视频)

完成后得到白色背景,只剩人物的干净图片

得到服装实际图片后,按照直接在之前文章[设计师的AI自学之路] 设计线稿AI上色中介绍的提取线稿的方法,提取出对应的线稿图片,最后就把真人图片和线稿图片(其实这里疏忽了一步,忘记把图片处理成正方形了,导致最后训练得到的人全变矮了)按MUNIT代码的官方文档,放到指定目录,启动程序输入相应参数,就开始训练神经网络了。训练完成后就得到了文章开头视频中的效果。

return

给设计师无尽的灵感,用AI算法帮你捕捉最新流行趋势,避免熬夜出方案掉头发还被甲方吐槽设计不够fashion。

欢迎在MixLab讨论相关内容、技术实现,

MixLab是一所面向未来的实验室
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-04-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • MixLab是一所面向未来的实验室
相关产品与服务
图片处理
图片处理(Image Processing,IP)是由腾讯云数据万象提供的丰富的图片处理服务,广泛应用于腾讯内部各产品。支持对腾讯云对象存储 COS 或第三方源的图片进行处理,提供基础处理能力(图片裁剪、转格式、缩放、打水印等)、图片瘦身能力(Guetzli 压缩、AVIF 转码压缩)、盲水印版权保护能力,同时支持先进的图像 AI 功能(图像增强、图像标签、图像评分、图像修复、商品抠图等),满足多种业务场景下的图片处理需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档