前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >猫脸辨识没这么容易!GPU加持深度学习才突破瓶颈

猫脸辨识没这么容易!GPU加持深度学习才突破瓶颈

作者头像
GPUS Lady
发布2018-04-02 11:13:55
8780
发布2018-04-02 11:13:55
举报
文章被收录于专栏:GPUS开发者GPUS开发者
本篇献给奋战在深度学习领域里的铲屎官们!

奇群科技执行长宋牧奇一直想为旗下团队熟悉的先进GPU技术研发实力,找到一个杀手级的应用,经过多次碰壁后,没想到最后却是在家中得到答案,爱猫的意外激发他为多猫家庭打造智慧喂食器的点子。

2008年宋牧奇从美国IBM离职,便与另一位创办人共同创立奇群科技,他们一开始专注于GPU技术,并将之应用于开发多人在线游戏服务器平台,尽管当时各大在线游戏厂商也认为,能让服务器效能提升百倍是一项很厉害的技术,不过,因为服务器的花费对于一款在线游戏整体营运成本来说,比例低的不足一提,厂商不愿花费额外的开发资源转换平台,使的原本宋牧奇引以为傲的技术,因为疏于对于市场的了解,而导致这项产品最终以失败收尾。

在2014年,奇群科技却又因这项GPU技术的应用,获得了许多市场的关注,其智慧猫咪喂食器CATFi在群众募资网站Indiegogo受到超出预期的欢迎,3天内就达到原先募款目标的10万美元,最终吸引来自80个国家1,400名赞助者,共募得25万美元。CATFi这个看似有趣的商品,其后端所使用的技术并不简单,是运用现在当红的深度学习技术。

CATFi出发点只为解决自己的问题

而CATFi这个点子,来自宋牧奇饲养宠物的亲身惨痛经验,他家中总共养了5只猫,其中有一只猫一个星期都没吃东西喝水,但是他却不知道,因为5只猫都共享食物以及水的容器,当他下班回家,看到食物跟水都有减少,直觉认为每只猫都有正常吃喝,直到有天回家发现其中一只猫趴在地上不能动,送去医院才知道这只猫因为胰脏炎,导致身体不舒服没有食欲,没有进食引发血栓两只脚瘫痪,最后只好截肢。

宋牧奇的妹妹是兽医,常常碰到饲主将家中宠物带来就医的时候,健康状况已经非常糟糕,但如果能纪录宠物的饮食习惯,对于诸如糖尿病会导致猫咪进食喝水频率改变的疾病,就能提早发现,而不至于严重到无法挽回的地步。

宋牧奇表示,设计猫咪喂食器CATFi一开始的目的,只是想解决自己遇到的问题而已。CATFi的应用特别适合多猫家庭,有养猫的家庭,通常都不只养一只猫而已,宋牧奇提到,美国有多达一半以上的养猫家庭都是多猫家庭。

CATFi的功能不只能够纪录家中每只猫日常的喝水以及进食的状况,主人也能用手机看到家中爱猫吃东西的实时影像,或是过去的统计资料,而根据每只猫长期的饮食纪录,便能粗略掌握爱猫日常的健康变化。

在刚开始使用的时候,主人需要先在App中,标记几张家中猫咪的照片以及相对应的名字,以训练CATFi学习分辨猫咪间的差异,之后当猫靠进装置要吃东西时,踏板下不只有感测器能测得猫咪的重量,还能启动摄影机,实时将猫咪影像串流回后端服务器,经过辨识知道是哪一只猫咪要吃饭,再根据预先设定的喂食策略,给予猫个别化喂食。

至于猫咪会不会乖巧的使用喂食器,让摄影机拍摄脸部影像,或是同时有两只猫挤进喂食器的情况又该怎么办,宋牧奇说:「CATFi在装置硬件上做了很多猫体工学的努力」,以尽量避免意料之外的事情发生。

把喂食器设计的让猫方便使用固然是重要的,不过,CATFi之所以被称为智慧喂食器,是因为它能对每只猫给予不同的喂食策略,而要分辨出家中每一只猫并非易事,需要应用如同人脸辨识的机器学习技术,才能够不只让计算机知道什么是猫,甚至进一步知道每一只猫的不同之处。

深度学习让机器精准辨识猫

CATFi不只使用了GPU技术,还使用了机器学习中当红的算法深度学习(Deep Learning),

深度学习算法会从学习样本中最小的单位(Primitive)开始,例如样本是图片,为了优化学习效果,须将资料处理单位拆解到像素等级,算法会从每个画素出发,计算画素与画素之间的线段关系,线段与线段的连接形成边的关系,而边与边相连则会形成轮廓关系等,每一阶段的处理都是一种特征萃取,计算机进而找出具有哪些特征的图片是代表猫。

适当的将深度学习算法运用在辨识工作上,能取得良好的结果,但由于深度学习是复杂数学模型,且要使用足够多的训练样本,才能得到够好的结果。计算上又需从样本的最小单位(Primitive)开始计算,并且经过多层特征萃取,因此非常耗费运算资源,当用来训练模型(Model)的运算能力有限的时候,训练一个可用的模型所需时间可能高达数周,这样的时间成本,在很多情况的应用上可用性便大打折扣,更何况并非任何人都能拥有千台服务器等级的运算资源。

CATFi是一款智慧猫咪喂食器,后端使用深度学习技术,能够辨识家中每一只猫,并根据不同的喂食策略喂食,主人还能透过App实时看到猫吃东西的画面。

产品大约有以下几个重点:

1、具猫脸辨识,能够辨别不同的长相。可以得知是哪只猫在吃东西

2、所站的地方具体重测量功能,可以测知猫的体重

3、喂食器的部分,一边是放水,一边是饲料,藉由重量的变化,可以得知每天所吃的份量

4、猫吃的地方有摄影机,除了刚谈到的辨识技术外,另一方面也可以让你在远端看到他。

所以能够在你不在家的时候,帮你顾好家中的猫小孩。当家中猫咪食欲有异常状况时,会透过app通知宠物主。

不止精准,GPU加持让辨识更快

为了克服深度学习训练模型动辄以天计算的问题,工程师开始把脑筋动到GPU上,利用其平行运算的特性加速整个过程。但在GPU以及分散式系统执行机器学习都会遭遇相同的问题,由于机器学习在取得最终结果之前,中间过程需要经过多次迭代,而这两种平行运算的系统在设计上,便需要建立互相沟通的机制,让机器互相交流信息,宋牧奇说,由于在GPU上每个执行绪是共享存储器,所以耗费在沟通的成本非常低几乎可忽略。

GPU与深度学习的结合,使得技术可用程度得以大幅提高。因为即便深度学习的辨识率很高,但是当计算时间需要过长的时间,那终究是无用,毕竟使用者利用象是Google Now的语音搜寻服务,便会想要立即得到结果,对于回应延迟的容忍度随着科技发展而降低。

最后Lady衷心祝大家G年行大运!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档