猫脸辨识没这么容易!GPU加持深度学习才突破瓶颈

本篇献给奋战在深度学习领域里的铲屎官们!

奇群科技执行长宋牧奇一直想为旗下团队熟悉的先进GPU技术研发实力,找到一个杀手级的应用,经过多次碰壁后,没想到最后却是在家中得到答案,爱猫的意外激发他为多猫家庭打造智慧喂食器的点子。

2008年宋牧奇从美国IBM离职,便与另一位创办人共同创立奇群科技,他们一开始专注于GPU技术,并将之应用于开发多人在线游戏服务器平台,尽管当时各大在线游戏厂商也认为,能让服务器效能提升百倍是一项很厉害的技术,不过,因为服务器的花费对于一款在线游戏整体营运成本来说,比例低的不足一提,厂商不愿花费额外的开发资源转换平台,使的原本宋牧奇引以为傲的技术,因为疏于对于市场的了解,而导致这项产品最终以失败收尾。

在2014年,奇群科技却又因这项GPU技术的应用,获得了许多市场的关注,其智慧猫咪喂食器CATFi在群众募资网站Indiegogo受到超出预期的欢迎,3天内就达到原先募款目标的10万美元,最终吸引来自80个国家1,400名赞助者,共募得25万美元。CATFi这个看似有趣的商品,其后端所使用的技术并不简单,是运用现在当红的深度学习技术。

CATFi出发点只为解决自己的问题

而CATFi这个点子,来自宋牧奇饲养宠物的亲身惨痛经验,他家中总共养了5只猫,其中有一只猫一个星期都没吃东西喝水,但是他却不知道,因为5只猫都共享食物以及水的容器,当他下班回家,看到食物跟水都有减少,直觉认为每只猫都有正常吃喝,直到有天回家发现其中一只猫趴在地上不能动,送去医院才知道这只猫因为胰脏炎,导致身体不舒服没有食欲,没有进食引发血栓两只脚瘫痪,最后只好截肢。

宋牧奇的妹妹是兽医,常常碰到饲主将家中宠物带来就医的时候,健康状况已经非常糟糕,但如果能纪录宠物的饮食习惯,对于诸如糖尿病会导致猫咪进食喝水频率改变的疾病,就能提早发现,而不至于严重到无法挽回的地步。

宋牧奇表示,设计猫咪喂食器CATFi一开始的目的,只是想解决自己遇到的问题而已。CATFi的应用特别适合多猫家庭,有养猫的家庭,通常都不只养一只猫而已,宋牧奇提到,美国有多达一半以上的养猫家庭都是多猫家庭。

CATFi的功能不只能够纪录家中每只猫日常的喝水以及进食的状况,主人也能用手机看到家中爱猫吃东西的实时影像,或是过去的统计资料,而根据每只猫长期的饮食纪录,便能粗略掌握爱猫日常的健康变化。

在刚开始使用的时候,主人需要先在App中,标记几张家中猫咪的照片以及相对应的名字,以训练CATFi学习分辨猫咪间的差异,之后当猫靠进装置要吃东西时,踏板下不只有感测器能测得猫咪的重量,还能启动摄影机,实时将猫咪影像串流回后端服务器,经过辨识知道是哪一只猫咪要吃饭,再根据预先设定的喂食策略,给予猫个别化喂食。

至于猫咪会不会乖巧的使用喂食器,让摄影机拍摄脸部影像,或是同时有两只猫挤进喂食器的情况又该怎么办,宋牧奇说:「CATFi在装置硬件上做了很多猫体工学的努力」,以尽量避免意料之外的事情发生。

把喂食器设计的让猫方便使用固然是重要的,不过,CATFi之所以被称为智慧喂食器,是因为它能对每只猫给予不同的喂食策略,而要分辨出家中每一只猫并非易事,需要应用如同人脸辨识的机器学习技术,才能够不只让计算机知道什么是猫,甚至进一步知道每一只猫的不同之处。

深度学习让机器精准辨识猫

CATFi不只使用了GPU技术,还使用了机器学习中当红的算法深度学习(Deep Learning),

深度学习算法会从学习样本中最小的单位(Primitive)开始,例如样本是图片,为了优化学习效果,须将资料处理单位拆解到像素等级,算法会从每个画素出发,计算画素与画素之间的线段关系,线段与线段的连接形成边的关系,而边与边相连则会形成轮廓关系等,每一阶段的处理都是一种特征萃取,计算机进而找出具有哪些特征的图片是代表猫。

适当的将深度学习算法运用在辨识工作上,能取得良好的结果,但由于深度学习是复杂数学模型,且要使用足够多的训练样本,才能得到够好的结果。计算上又需从样本的最小单位(Primitive)开始计算,并且经过多层特征萃取,因此非常耗费运算资源,当用来训练模型(Model)的运算能力有限的时候,训练一个可用的模型所需时间可能高达数周,这样的时间成本,在很多情况的应用上可用性便大打折扣,更何况并非任何人都能拥有千台服务器等级的运算资源。

CATFi是一款智慧猫咪喂食器,后端使用深度学习技术,能够辨识家中每一只猫,并根据不同的喂食策略喂食,主人还能透过App实时看到猫吃东西的画面。

产品大约有以下几个重点:

1、具猫脸辨识,能够辨别不同的长相。可以得知是哪只猫在吃东西

2、所站的地方具体重测量功能,可以测知猫的体重

3、喂食器的部分,一边是放水,一边是饲料,藉由重量的变化,可以得知每天所吃的份量

4、猫吃的地方有摄影机,除了刚谈到的辨识技术外,另一方面也可以让你在远端看到他。

所以能够在你不在家的时候,帮你顾好家中的猫小孩。当家中猫咪食欲有异常状况时,会透过app通知宠物主。

不止精准,GPU加持让辨识更快

为了克服深度学习训练模型动辄以天计算的问题,工程师开始把脑筋动到GPU上,利用其平行运算的特性加速整个过程。但在GPU以及分散式系统执行机器学习都会遭遇相同的问题,由于机器学习在取得最终结果之前,中间过程需要经过多次迭代,而这两种平行运算的系统在设计上,便需要建立互相沟通的机制,让机器互相交流信息,宋牧奇说,由于在GPU上每个执行绪是共享存储器,所以耗费在沟通的成本非常低几乎可忽略。

GPU与深度学习的结合,使得技术可用程度得以大幅提高。因为即便深度学习的辨识率很高,但是当计算时间需要过长的时间,那终究是无用,毕竟使用者利用象是Google Now的语音搜寻服务,便会想要立即得到结果,对于回应延迟的容忍度随着科技发展而降低。

最后Lady衷心祝大家G年行大运!

原文发布于微信公众号 - 吉浦迅科技(gpusolution)

原文发表时间:2017-01-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

黄仁勋教主再发威:刚刚推出GPU服务器标准平台

1542
来自专栏机器人网

罗塞塔探测器与彗星的“第一次亲密接触”

"罗塞塔"彗星探测器于格林尼治时间8月6日9时29分(北京时间17时29分)成功进入环绕"丘留莫夫-格拉西缅科"彗星的轨道,这也标志着欧洲航天局投入多年的彗星探...

3345
来自专栏新智元

从英特尔支持DE超声机器人开发,看人工智能在医疗影像领域的价值和机遇

【新智元导读】医疗影像智能分析在智能医疗各领域中都属于发展较快的一支。国内外涌现了一批将 AI 技术应用于医疗影像识别和分析的初创公司。然而,在具体的技术落地过...

3397
来自专栏镁客网

美物理学家颠覆现有全息技术,使走进3D电影的世界成为可能 | 黑科技

1163
来自专栏镁客网

拔刺 | 如何通过人工神经网络实现图像识别?

人工神经网络作为一个新技术正不断融入各个学科,其独有的优势在数字图像处理中也得到了不错的运用。针对卷积神经网络做图像识别,则是一个相当火的方向,如腾讯云识别,只...

1354
来自专栏机器人网

中国人在人工智能领域很牛,究竟有多牛?

这两天,自媒体没少炒作这个报告;我自己呢,倒是特别地对这个报告中的两张趋势图感兴趣。报告中说,从2013年到2015年,SCI收录的论文里,提到“深度学习”的文...

3638
来自专栏新智元

AI设计出超高速自行车,冲击133迈跑赢汽车

【新智元导读】EPFL衍生公司开发了一款软件,利用深度学习自动设计符合空气动力学的自行车。现在AI设计出的这辆自行车有望打破现在人类设计的自行车行驶的世界纪录。

950
来自专栏AI科技评论

观点 | 从CVPR'18谈谈华人研究者的Leadership

AI 科技评论按:本文作者周博磊,首发于作者的知乎主页,AI 科技评论获其授权转载。

1142
来自专栏量子位

大限将至?Google先知

在古代,总有高人夜观天象,预测某人行将就木。个中玄学,无法解释,准确与否更无从得知。

953
来自专栏机器之心

学界 | 看车识党派:斯坦福大学李飞飞团队发表计算机视觉人口统计新方法

选自Stanford News 机器之心编译 参与:刘晓坤、李泽南 斯坦福大学的研究者们正在使用计算机视觉系统,利用谷歌街景图片上街边汽车的型号来识别给定社区的...

37513

扫码关注云+社区