专访腾讯“优图团队”:腾讯内部的核心技术团队是这样服务产品团队的

一个偶然的机会,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校的博士、硕士组成。

腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为QQ空间、腾讯地图、腾讯游戏、等50多款产品提供图像技术支持。每天QQ空间有2亿上传图片的活跃用户,团队单日最多处理照片达6亿张,累计已经分析处理了超过300亿张照片

36氪:作为纯粹的技术团队,怎么平衡技术和产品之间的矛盾?

我们首先会对一些关键技术,如人脸识别、图像识别、深度学习等做前瞻性的技术,进行提前布局,保证相关产品能在市面上能够稳定领跑。

例如我们在进行人脸图像对比研发中,衍生发展出比对两张普通图像相似度的方法,当时并没有立即挖掘出具体的应用场景,处于储备状态。但过了3个月,电商部门急需商品图像对比技术以实现自动价格分析,这个技术迅速落地了。

另外腾讯旗下产品线比较多,尤其是图片类的产品,所以我们在图像处理上的技术一般都能比较快落地;其他产品线也会和我们保持长期沟通,也会根据产品和用户的需求,及时调整技术方向。

36氪:Amazon最近发布了Fire Phone,将图像识别技术运用到电商领域,腾讯内部有类似的技术,以及在和京东合作类似的产品没?

我们认为Amazon的Fire Phone是一个非常好的产品,可以打造Amazon的用户闭环,这是个不错的尝试,给用户带来的体验值得期待。

至于腾讯有没有做,还不大方便评价。

36氪:既然是腾讯内部的“图像技术”核心,为什么之前微信对外开放的“图像识别技术”却不是出自你们部门?这个是因为微信属于更为独立的产品部门,还是说“研究院”这样的组织结构,在腾讯内部也会有多个团队竞争的情况?

虽然图像识别是一门比较垂直的技术,但是由于应用场景不同、用户需求的差异会使得该技术从研发和实施方案都存在很大的差异,所以由于产品的定位、功能及面向的用户不同。微信拥有自己的模式识别团队,以便更好地对针对微信相关功能进行图像技术的研发和落地。

我们他们并不是竞争关系,而是各自专注于不同产品需求的技术研究。而在日常,我们也会与微信图像团队之间保持良好的沟通。

36氪:微信开放了自己的“图像识别”技术,那优图团队有没有对外开放的打算,如果开放,相关的标准是什么呢?

因为在腾讯内部,像QQ空间等产品对图像技术有着大量的需求。所以短期内我们还是专注于公司内部业务的需要,投入到精品技术的深挖上面。当然我们也为腾讯的战略合作伙伴,如大众点评、京东商城等提供了关键的图像技术。

未来有合适的机会,我们也愿意开放关键图像技术提供给有需要的互联网产品团队使用。

36氪:大家都觉得图像识别和人脸技术很有未来,但是没有特别好的落地场景?对于具体落地应用场景、未来规划和实现路径,腾讯是怎么想的?

图像识别和人脸技术一直都是学术界、工业界、互联网行业的未来技术发展热点,其应用范围、落地场景非常广泛。举例来说,互联网安全就是一个很好的人脸技术具体落地场景。用户提前预留人脸照片,那么当用户密码被盗时,可以设置人脸自动验证步骤,只有照片本人操作才能取回自己的密码,这样可以做到更有效保护用户数据。

但是尽管人脸识别在类似LFW的标准测试集上的精度不断提升,仍然无法满足一般场景的要求。我们认为当前图像识别技术没有特别好的落地场景的原因,除了技术上还是无法消除光线、角度等环境因素的影响,还在于信息通道没有打通,即需要信息的用户与图像信息之间的连接没有有效建立。

36氪:你们在在图像分析、人脸识别、人像美颜、图片美化等领域都有比较核心的技术,但为什么这些领域比较成功的产品,都没有出自腾讯之手?

我们主要精力在解决QQ空间等基础产品对图像技术的需求,一开始并没有做独立的移动端图像应用这样的规划。确实目前一些细分的图像处理市场上已经有了优势产品。

我们其实也有一些产品还不错,例如我们之前推出的“水印相机”,同样属于腾讯内部的战略级产品。未来我们也会基于差异化的角度进行图像类移动应用创新,推动相关技术和产品的发展。

36氪:腾讯目前在这方面的技术积累如何?水印相机等产品只是实验性产品?还有没有其它内部研发的产品?

我们拥有图像压缩和美化、图像识别、人脸分析识别等全套技术,并且这些技术都已经达在公司内部数十个业务中广泛使用。我们的压缩技术每年为公司节省带宽50G以上,节省成本数千万。例如易迅电商采用我们的图像压缩技术,可以节省28%流量。

另外我们的压缩、裁剪、锐化、人脸检测在Qzone全面落地,日处理照片2亿张,拥有几亿用户数据;优图SDK 做为TFS的基础组件,服务于全公司各业务如地图、微信、微博、QQ等。

公司发布的产品都是经过严格测试的正式产品,水印相机并不是实验性产品而是可称之为创新性产品。目前总装机数千万,活跃用户近千万,拥有相当好的用户口碑。

36氪:目前人脸技术在移动端的体验如何?是否可以做到实时?以及具体精度、APK大小?

我们有全平台的人脸技术,人脸检测800x600图像,普通手机处理时间150ms,精度99%,召回率95%, APK大小209KB。可以达到实时要求,技术指标优于系统自带人脸检测器。

人脸配准器在普通手机上可以达到40ms / 帧的处理速度,平均像素误差2.47像素,平均误差小于2和3像素的样本比例分别为33%, 86%。

36氪:有没有使用深度学习技术?

我们已经在研发应用具有很大潜力的深度学习技术,并已经搭建海量计算平台,同时完成了基于CNN的图像分类和人脸识别框架。现正在建立更大规模的数据库,以充分发挥深度学习的优势。

36氪:现在很多大公司的“研究院”通常都直接设立在硅谷,为什么腾讯的研究院都在国内,是否意味在图像识别这个领域,国内的相关技术已经走在世界的前沿?

硅谷人才素质普遍很高,但是随着国内互联网技术的飞速发展,本土的技术实力正逐渐接近甚至可以与世界同步。在一些关键的技术指标上,包括人脸和图像识别准确率等等,我们确实都已经达到国际水准。例如图像分类,在国际标准测试集CIFAR-10上,我们的识别率可以达到90%。

同时本土团队也更加了解国内用户的需求。在互联网大数据时代,除了优秀的技术研发能力,技术所依托的平台及其拥有的数据库的重要性也逐渐凸显。

腾讯拥有国内最大的社交网络平台——QQ空间,拥有海量的图像大数据和海量用户需求、反馈。放眼海内外,这块优势资源可以说是我们团队独有的,这为我们的研究提供了很大的支持。

36氪:那你们怎么看百度轻拍、魔图等同样采用了图像识别技术的产品,以及如何看待百度的IDL的技术?

我们对这些技术很有兴趣并保持关注,和腾讯一样,百度的图像技术较多地依托大数据。可以看到图像处理引入大数据能力将会成为互联网图像处理的一个趋势,并对行业带来深远的影响。

36氪:你们幸福吗?

我们鼓励技术人员自发驱动各种创新与探索,鼓励大家提创新的想法,经过评估,提出者会作为短期研究项目的负责人,给与各方面的支持,最终做出一个具有产品化潜力的demo;在平时,团队也会定期进行team building,比如参加真人CS,踏青、篮球、足球、斯洛克等活动。

所以我们觉得很幸福。

文章转载自36氪

原文发布于微信公众号 - 腾讯大讲堂(TX_DJT)

原文发表时间:2014-07-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

CrowdFlower数据科学家17年调查报告:情愿断腿也不想丢数据

2936
来自专栏机器之心

业界 | 谷歌TPU之后还有高通,人工智能芯片竞赛已经展开

选自Wired 作者:Cade Metz 机器之心编译 参与:黄小天、李泽南 作为机器学习的领军人物,Yann LeCun(杨立昆)曾在 25 年前开发过一块...

35711
来自专栏人工智能头条

语音识别真的比肩人类了?听听阿里 iDST 初敏怎么说

1452
来自专栏腾讯高校合作

36氪专访腾讯“优图团队”:腾讯内部的核心技术团队是这样服务产品团队的

近日,36氪和“优图团队”进行了接触,他们是腾讯内部专注于图像处理、模式识别、机器学习、数据挖掘等领域的核心技术团队,由毕业自清华、北大、中科院、上海交大等院校...

3506
来自专栏机器之心

业界 | 腾讯「AI In All」的背后,是开放AI技术能力,探索腾讯内外的应用场景

3248
来自专栏企鹅号快讯

先知:人工智能助力Fintech反欺诈

本文内容节选自第六届全球软件案例研究峰会宜人贷数据科学家王婷分享的《先知:人工智能助力Fintech反欺诈》实录,本文主要分享互联网金融反欺诈,通过人工智能与人...

53511
来自专栏CDA数据分析师

13招神技 让你在数据科学和数据分析工作中脱颖而出

我有幸在很早参与了一个大数据科学项目,我非常喜欢其中的工作,甚至我意识到我的努力可以增加一些公司的价值。 然而,可悲的是,只有不到30%的数据科学项目最终实施了...

1848
来自专栏数据科学与人工智能

【机器学习】“机器深度学习”的未来:读懂人类的情感

“机器学习”的概念自上世纪50年代出来以来就备受科技界的关注,而近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神...

2736
来自专栏AI科技评论

李佳担任谷歌 AI 中国中心负责人:改善人类生活需要 AI,而 AI 需要「四步走」

AI 科技评论按:12 月 13 日,谷歌开发者大会 2017 在上海召开,多名谷歌工程师和重量级嘉宾登台演讲,宣布了许多振奋人心的消息,美国工程师的中文演讲也...

3446
来自专栏AI科技评论

现场 | 英特尔中国研究院认知计算实验室主任陈玉荣博士:如何“享用”视觉识别技术的低廉化大潮

英特尔中国研究院认知计算实验室: 致力于视觉认知和机器学习前沿领域的科技创新,开发视觉内容理解和视觉内容创建的领先技术,从而在英特尔平台上实现视觉数据的智能处理...

2839

扫码关注云+社区