中国AI公司公开击败谷歌微软,这次是Yi+AI视觉团队

本文转载自Yi+AI团队

2018年7月,在国际权威计算机视觉竞赛PASCAL VOC comp4目标检测竞赛中,Yi+AI团队获得了目标检测单模型第一名,超越了现有排行榜中的微软研究院、谷歌 、阿里达摩院、Face++等国内外众多知名公司,以精度90.7%的成绩打破了世界记录,成为世界第一家总成绩突破90%计算机视觉企业。同时在Pascal VOC “comp3”中,首次突破80%,刷新世界纪录。

Pascal VOC comp4是众多国内外企业物体检测团队证明自己实力的地方,此次Yi+力压群雄,取得了90.7%的成绩,比第二名的阿里达摩院高了1.5个百分点,在物体检测领域,1.5个百分点意味着需要比对方“多”检测正确6000多个框,同时值得注意的是,此次Yi+AI团队使用的是难度更高的单模型,而第二名的方法是多模型融合。

PASCAL VOC可谓视觉识别类竞赛的鼻祖,包含了物体分类、目标检测、图像分割等任务。PASCAL VOC对计算机视觉的发展具有深远而巨大的影响,后续的ImageNet竞赛的任务设置就基本沿用了它的设定。此前,微软、英特尔、CMU、Facebook、UC Berkeley等国际顶尖研发团队先后在这个排行榜上刷新纪录。

Yi+AI的负责人表示,在此次Pascal VOC comp4竞赛中,Yi+AI团队使用的方法叫做FXRCNN,其中“X”,代表“多元”的意思,意味着Yi+AI使用的结构不仅仅是高准确率的模型,同时也适用多元场景,包括移植到移动端(通过更改Backbone和Head),实现图像分割(增加Mask分支),实现人体关键点(增加Key point分支),实现人脸检测(增加Face分支)。

Yi+提交的深度学习模型,虽然采用了Faster RCNN的基本结构,但有很多不同之处:

1)采用ResNeXt作为基础网络,结合FPN实现多尺度特征融合;

2)在后处理阶段,采用SoftNMS和多框投票融合;

3)通过Yi+海量数据进行预训练;

4)多尺度训练,进一步加强数据增强。本次提交的模型,是Yi+多年来技术积累的结果,是通过不断的攻克实际问题的结果,是Yi+内部模型不断优化的结果,Yi+ AI的FXRCNN在速度,内存,精度,应用范围等多维度进行了全面的优化。

在人工智能领域,目标检测技术应用广泛,是Yi+AI场景落地的关键性技术之一。

Yi+将目标检测技术应用在图像搜索引擎和图片视频结构化引擎中,Yi+图像搜索引擎可检测类目超100类,覆盖服饰、3C商超、家居、日用品、交通工具等;Yi+图片视频结构化引擎则采用目前业界最领先的基于深度学习的通用目标检测算法,支持超过300类常用物体的目标检测、识别,可实现对视频和图像中的场景、人、车辆、物体(轮廓)检测、识别、分割、跟踪;可识别近10,000种物品,400种场景。

近年来,Yi+对人工智能、大数据等方向进行了大量的新技术研发和应用,除了目标检测技术以外,Yi+在人脸识别方向同样取得了骄人的成绩。

2018年3月,国际权威人脸识别公开测试集LFW(LabeledFaces in the Wild)最新公布的测试结果,Yi+人脸识别技术以99.83%的识别精度和较低的波动幅度为位居世界第一,超越了现有LFW排行榜中的谷歌、腾讯优图、百度、商汤、Face++等国内外众多知名公司。

人脸识别是Yi+AI的核心产品之一,Yi+人脸识别能快速准确完成人脸检测、关键点检测及人脸属性检测。实现识别出画面中人物的性别、年龄、种族、情绪、颜值、性感、时尚等属性,支持中外娱乐明星的识别;基于深度学习的人脸对比技术,实现大规模人脸查找比对,可用于人脸聚类、敏感人物监控等场景。

目前Yi+AI已将人脸识别和目标检测技术应用在多个使用场景中,包括“智能硬件”、“营销”、“新零售”、“智慧城市”等解决方案,具体则应用在场景广告平台、新零售平台、大屏AI助手、智慧安防、智慧交通、智慧社区等多项领域之中。

下一步,Yi+将结合现有技术优势,让计算机看懂世界,用科技提供人工智能服务,帮助人们看见非凡,see different。

Yi+已获得阿里巴巴等B轮融资,服务众多500强客户。团队成员大多来自顶尖企业与高校,如哥伦比亚大学、帝国理工、耶鲁、普林斯顿、普渡、新加坡国大、南洋理工、清华、北大等及微软、IBM、英特尔、阿里巴巴、腾讯、百度、华为等企业。

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云加头条

王磊:AI 时代物流行业的 OCR 应用

OCR 是人工智能里面非常重要的基础能力之一。腾讯云人工智能产品总监王磊,结合物流场景解读了OCR技术。“OCR文本识别能够优化物流行业流程,解放人力降低成本。...

1.1K90
来自专栏AI科技评论

重磅 | Yann LeCun清华演讲:讲述深度学习与人工智能的未来

半个月前,Yann LeCun要来清华演讲的消息在国内AI圈一经传开,各位AI界人士便坐不住了。作为Facebook人工智能研究院院长、纽约大学终身教授、卷积神...

352100
来自专栏目标检测和深度学习

谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破

雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于...

418110
来自专栏专知

等你在2118:探索机器学习算法生命周期

【导读】1月22日,统计学家Venkat Raman发布了一篇比较有意思的博文,作者探讨了到2118年,即未来一百年中机器学习中一些算法可能的兴衰存亡。具体分析...

384120
来自专栏AI研习社

谷歌开启 Naturalist 2018 挑战赛,大型物种分类技术有望突破

雷锋网 AI 研习社按:计算机视觉技术从 70 年代到现在,40 多年时间得到迅速发展,许多计算机视觉的应用出现在了生产生活领域。尤其是到了 2012 年,基于...

416110
来自专栏ATYUN订阅号

GANs学会掌握你的时尚品味,并定制出了你的下一套服装

人工智能(AI)可能会催生一种全新的时尚潮流:称之为“预测性时尚”。在ArXiv上发表的一篇论文中,来自加州大学圣地亚哥分校的研究人员和Adobe概述了人工智能...

37840
来自专栏ATYUN订阅号

IBM的新系统可以自动选择最佳的AI算法

深度学习系统可以摄取数据,转换数据,输出数据并传递数据,但并非所有的都能等同。没有算法适用于每个任务,找到最佳的算法可能是一个漫长而令人沮丧的过程。幸运的是,I...

8620
来自专栏AI科技评论

阅面科技在FDDB平台拔得头筹,全新算法突破人脸检测极限

5月20日,根据人脸检测评测平台FDDB公布的数据排名显示,来自中国的人工智能公司阅面科技(ReadSense)在众多的优秀竞争者中拔得头筹。 ? ? 如图为F...

34480
来自专栏AI科技大本营的专栏

AI是万能的吗?当前AI仍面临的难题是什么?

【导读】谈到人工智能(特别是计算机视觉领域),大家关注的都是这一领域不断取得的进步,然而人工智能到底发展到什么程度了?AI 已经成为万能的了吗?Heuritec...

12120
来自专栏应兆康的专栏

开发集和测试集应该来自同一分布

10910

扫码关注云+社区

领取腾讯云代金券