前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

对话美团AI视觉专家:GPU计算平台全面升级,AI效率提高百倍

作者头像
美团无人配送
发布2019-09-24 15:48:15
2.1K1
发布2019-09-24 15:48:15
举报
文章被收录于专栏:美团无人配送美团无人配送

看点:不仅仅是无人配送,美团的AI视觉能力已经渗透到其业务的方方面面。

不知不觉间,AI已经渗透到了生活的方方面面,甚至包括我们所熟知的餐饮外卖。

从商家的菜单录入、招牌识别、到促销时AI自动生成的广告首图优选、外卖骑手的身份验证……美团的AI视觉能力已经渗透到其业务的方方面面。

▲美团视觉图像中心图像视频组负责人魏晓明

近日,智东西来到美团北京总部,与美团视觉图像中心图像视频组负责人魏晓明进行了一次深度对话,全面地解读了美团的视觉AI能力、美团视觉AI平台发展历程、与美团视觉AI背后的“发电厂”。

从菜单录入到AI选图,AI无处不在

魏晓明说,与其他很多企业不同,美团的AI技术有着强烈的业务导向特色。

当前,美团的AI技术主要分为四大类,分别为:基于AI的语音/语义理解技术、基于AI的视觉处理技术、基于运筹学为主的配送调度优化、以及基于自动驾驶相关的无人配送技术。

魏晓明是美团视觉图像中心图像视频组负责人,有着超过9年视觉领域研发和技术管理经验,此前曾经就职于佳能研究院和三星研究院。

魏晓明2015年加入美团后,主导了超过50个AI视觉项目。在采访中,魏晓明分别从商户、骑手、用户、平台四个角度,对于美团的典型AI视觉应用场景进行了介绍。

▲AI菜单拍照录入

对于商户而言,美团AI能够让其通过拍照录入菜单,通过文字检测、语义分割、视觉关系学习等技术抽取纸质菜单上的结构化信息,让商户菜单录入的时间由小时级降至一分钟以内。

▲AI招牌识别

随着OCR技术的不断发展,菜单识别、招牌识别等细分场景成为了当前OCR领域的研究热点。在今年的 ICDAR 2019 上,美团主办了业界首个中文门脸招牌文字识别比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards),并公开的业界首个真实场景招牌图像数据集。

此外,商户的证件资质认证、骑手的刷脸认证、用户所使用的AI菜品识别小程序、广告首图优选、骑手抽检等等应用背后,都有着美团AI视觉的加持。

魏晓明说,当前,美团的技术人员有上万人,美团AI视觉中心的团队规模也不断扩展当中。

GPU计算平台全面升级,效率提高百倍

美团的AI视觉团队从2015年开始建立,为美团各项业务提供AI视觉能力(比如图像审核、智能选图等),2015-2016年可以看作是美团AI视觉平台的第一个发展阶段。

随着集团内部对于AI算力的需求飙升,2017年,美团进行了企业层面的计算平台全面升级,将从CPU为主的计算平台升级为以英伟达GPU为主的集群化AI计算平台,2017-2018年可以看作是美团AI视觉平台的第二个发展阶段。

在升级为以英伟达Tesla V100 GPU为主的集群化AI计算平台后,美团AI在文字检测、人脸识别、商品识别的离线训练(Training)环节能够达到上百倍的效率提升。

而在应用推理(Inference)方面,当前,美团基于英伟达Tesla P4 GPU + TensorRT的搭配能让计算效率提高数十倍。而且,美团目前使用的是FP32精度,未来如果使用英伟达T4 Tensor Core GPU进行FP16精度的推理计算,性能将进一步提升。这种低时延、高实时性的计算性能对于用户与配送员的体验非常重要。

举个例子,为了保障用户的安全,当前美团日活的70万名骑手都已经全面覆盖了“刷脸认证”功能。但是这项功能为骑手多增加了一道验证工序,对于效率与体验都有影响。

因此,为了保证骑手的人脸比对效率,美团使用了基于GPU并行+TensorRT的方案进行大规模人脸比对的骑手身份验证。相比于基于CPU方案,这套方案可以加速20倍以上,速度的提升能让外卖小哥“刷脸认证”的过程更快捷、体验更优秀。

魏晓明说,当前,美团服务器集群的AI视觉服务的日均调用已经达到了上亿次。

美团AI的下一步

2018年,结合美团的计算平台升级,美团AI视觉得到了超大规模的落地,覆盖了上文提到的菜单识别、人脸认证、刷脸支付、广告生成等众多集团内部应用场景。

▲美团在CVPR2019-FGVC6商品识别比赛获得第二名

从2019年开始,美团的AI视觉团队已经不仅仅只支持集团内部的AI需求,还逐步在国际大型比赛上进行发声。2019年,美团AI视觉团队在CVPR、ICME等视觉届知名比赛上都取得了Top3名次。

魏晓明认为,当前AI算法依旧在快速迭代的过程中。对于美团这种大型平台来说,持续对TensorFlow、Caffe、MXNet等多个深度学习框架进行迭代能够提高计算并行化效率,对于美团特定AI场景的优化十分重要。

下一步,美团AI视觉团队还将对视频理解、门店数字化、无人配送系统等更多AI场景落地进行拓展。

结语:AI应用全面爆发,实时性要求不断提高

随着AI应用的爆发,众多企业都在进行AI计算平台的升级,尤其是涉及刷脸认证、拍照信息检索等实时性要求较高的AI推理应用,传统计算平台已经不能满足需求。

不知不觉间,AI已经逐渐渗透到了我们生活的方方面面,在你不经意间,也许已经享受到了AI带来的生活便利。

本文授权转载自公众号:智东西(zhidxcom)

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 美团无人配送 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从菜单录入到AI选图,AI无处不在
  • GPU计算平台全面升级,效率提高百倍
  • 美团AI的下一步
  • 结语:AI应用全面爆发,实时性要求不断提高
相关产品与服务
多因子身份认证
多因子身份认证(Multi-factor Authentication Service,MFAS)的目的是建立一个多层次的防御体系,通过结合两种或三种认证因子(基于记忆的/基于持有物的/基于生物特征的认证因子)验证访问者的身份,使系统或资源更加安全。攻击者即使破解单一因子(如口令、人脸),应用的安全依然可以得到保障。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档