商汤(现在)是一家怎样的公司?

李根 发自 清华科技园 量子位 报道 | 公众号 QbitAI
刚完成B轮4.1亿美元融资的商汤科技

刚宣布4.1亿美元B轮融资的商汤科技,是一家令人熟悉又陌生的AI公司。

人们在他单轮巨额融资时议论,在他科研论文刷屏CVPR时议论,在ImageNet五项比拼三项夺冠时议论。但又鲜有“编外”人员准确贴切地给商汤一个定义,这真是一家“人尽皆知”而又距离感明显的公司。

为了讲清楚商汤现在是一家什么样的公司,薛音在北京清华科技园的办公室里耗费了半小时。在不超过20平的展厅内,这位代表商汤讲解业务的员工不仅需要“说”,还要“动”。

薛音展示SenseAR应用

每一个小型业务展示台的相同标配是摄像头和屏幕,摄像头记录薛音的一言一行,屏幕相应做出实时反馈。

不同则是反馈的表现和目的,有的是为了识别,有的出于动态追踪,有的用于娱乐比颜值,有的则让直播网红们通过手机交互就能更炫酷一些,比如主播动手比个心,屏幕就真的出现了爱心——你或许不陌生,但多半不知道原来微博直播等背后的技术提供方是商汤。

所以商汤究竟是一家怎么样的公司?

从现有业务上看

在这场搜狐科技组织的观察活动来看,至少我们不难知道商汤正在做什么,每一个小展台都是一项具体落地业务的直观展示,可以归结为四大模块:

第一是软件的、系统的应用,如监控视频实现智能分析,主要应用在安防领域。

在目前落地的业务中,人脸布控、视图情报研判、人脸比对和视频结构化服务等成为落地重点。

商汤联合创始人杨帆还举例说,比如在成都太古里等密集商圈,商汤的智能视频分析技术,已经在帮助警察减轻反扒压力,并且具体作用不止于案发后对比追踪,更在于实时甚至是事前的研判预警。在此应用中,人脸识别、动作行为检测、人群分析,合理布控等技术被综合集成使用。

商汤智能视频分析应用展示

第二是偏软硬件一体的智能前端设备应用,涵盖人脸识别闸机、身份验证一体机、商户娱乐营销使用的互动广告机之类的软硬件落地业务。

第三则基于智能手机,这也是目前商汤最容易被“视而不见”的落地业务。小米、OPPO、vivo,华为等智能手机中均已纷纷上马。比如拍照时的人脸监测、相册相片的智能归类、美肤美颜,以及OPPO等宣传广告中铺天盖地的双摄解决方案。

实际上,第四项业务与智能手机也密不可分。不过这项名为SenseAR(增强显示感绘)的技术之所以被单独列出,一方面原因是核心技术上,最近商汤把人脸关键点定位技术从106点,提高到240点;另一方面则是因为该技术最为“亲民”,在FaceU、美图、一直播、小咖秀,熊猫直播等火热的视频类App中,AR交互基本源自该方案。

此外,还有一些基于识别的身份验证和文字识别技术相关的业务,它们更多被落地在金融相关的业务场景中,构成商汤400多家B端合作方的一部分。

不过通过以上四大主要业务模块,只能定义商汤的此时此地此身,这或许还不是全部。

从即将进入的领域看

在B轮4.1亿美元的官宣消息中,商汤还宣布将进入自动驾驶领域,这无疑为已经火热不已的无人车行业又添了一把火,不过具体如何进入、进入多深,期望如何,商汤并未展开。

在此次采访中,商汤科技创始人及CEO徐立向量子位给出了回答。

徐立说,商汤在自动驾驶方面的开拓进展,会和OEM厂商合作来进行。

他解释了具体原因:首先,现今无人车行业可以大致分为三大群体——1)做地图,无论是3D地图还是高精度地图;2)整体运营车辆及其部署;3)OEM厂商。

在这三大方向上选择,徐立认为当前最稀缺的资源在于OEM厂商,他们拥有在数据收集方面的绝对优势。比如完全以商汤自主来做,造1万辆车,全部上路收集数据,不谈可能性可行性,也已经看到极限。但OEM厂商,比如上汽一年出货量400多万,每台车上收集一个数据,就已经相当于商汤1万台车做400年……

所以在徐立看来,与车厂的结合是更高效更现实的方案,商汤在自动驾驶领域会结合双方优势,采取与OEM厂商合作的模式,无论是ADAS还是L4以上的完全无人驾驶,只要OEM厂商想做、能做,商汤都会在技术方案模块上去参与。

徐立最后还强调,与OEM厂商的合作,可能是将来自动驾驶实现的必由之路。

另一新领域将是零售。

在商汤现有的展示中,已然可以看出他们利用智能视频分析,把宜家等商超里的视频变成结构化数据,形成了分析和辅助决策的方案模型。

商汤方面透露称,零售方面具体的、落地的合作将在不久后宣布,他们的目的非常明确,即利用视频分析能力,结合线下零售场景,让线下商超具备精准营销和定向挖掘反馈的能力。

这还不止于线下零售。

徐立以近期火热的电视剧《我的前半生》为试验,在视频画面中,每一个物体,不论是茶杯、衣服、西装,只要出现,都被识别。然后进一步赋予链接也变得顺其自然。

在这位商汤创始人看来,这会让整个电商增加一个全新的空间,诸如阿里京东一样的电商公司,会在现有的规模上发挥更大效应和累积。

当然,自动驾驶和零售也不会成为商汤的业务边界。在被问及商汤的计划时,徐立给出了答案。

这位商汤创始人说,商汤科技想要做的事情,本身在打造一个人工智能为核心的底层架构,可以和很多垂直行业进行结合,在结合过程中,需要结合各个合作伙伴,把应用场景定义清楚。

所以商汤科技未来会展现出怎样的业务?某种意义上是从个人的芯片到端,手机社交,再加上家居商业,再到整个城市的链条,提供驱动行业发展的AI方案及模块。

商汤科技创始人及CEO徐立

商汤=1+1+X

除了直观表述,徐立甚至给还出了公式。他认为“1+1+X”就是商汤。

其中,“1”代表商汤科技本身,包含商汤的所有技术和能力;“+1”表示与产业进行结合,实现产研一体化;“+X”则意味着技术赋能。通过三者作用,实现产业的效率、效益和价值最大化。

如果按比喻来说,徐立认为商汤科技是卖深度学习的“乐高积木”,而且这个积木会通过与合作伙伴的联合,有更为明确的落地应用,可以搭无人车,可以搭人脸闸机,而商汤通过这套积木,就能卖很好的价钱,恰如特斯拉的自动驾驶模块——有需求就额外付费使用。

但说易行难,这种直接掏钱使用的价值模块,不仅要好用,还能持久,这对创立刚满3年的商汤不可谓不是挑战。

徐立回应称,这也是B轮4.1亿美元最核心的用途所在。他认为归根结底,商汤的核心竞争力现在基于三方面。

首先是垂直行业的结合与延伸,可以不断丰富产品线,实现公司的商业运转和进一步创新。

其次是基础核心应用平台。自创立以来,商汤出现在大众印象中的公司图片是一间服务器机房,这实际是商汤耗时费力后搭建起的深度学习专用的高性能GPU集群,也是商汤各类AI系统的基础层面的保障。

在这间机房里,拥有近3000块英伟达的GPU计算芯片,共有4个GPU集群。目前,如此规模的深度学习计算平台算得上全球罕见,也是商汤巨额融资背后的原因之一。

徐立告诉量子位,他们内部常调侃称,这样的平台上调整一次参数后出结果,就能耗费50万,而按照现在公司120名博士数目来计,每天按下的“按钮”——其实就是点击鼠标,都是大额支出,而且这也会是常态。不过徐立也表示,也是由于这些支出,保证了商汤跑得更快,技术护城河更深更厚。

最后也是最核心的竞争力,是人才。这位商汤创始人称,公司创立之初的18位教授和120位顶尖博士,正在产研结合中成为“导师”级人才,商汤未来更多会从学生中挑选,让导师带队,培养起自己的人才梯队,并打造真正的可持续的造血机制。

商汤科技创始人徐立、联合创始人杨帆

OMT:商汤心得:从学术界到工业界的建议

最后,作为从学术界到工业界的创业代表,商汤也向我们分享了相关看法:(综合了商汤科技创始人徐立和商汤联合创始人杨帆的观点)

从学术圈出来,很多人喜欢做命题作文,学术圈一定要成为某个行业的世界第一,才能发表出好的文章。在学术的概念当中,你一定要解决现有存在的问题,然后来做。甚至可以从现有的问题,把这个范围不停的缩小,缩小到这个范围不能再缩小为止。

比如我们以视觉为研究对象,而视觉里一个比较有意思的就是跟踪,就是通用的物体跟踪,我跟踪一个物体,结果发现全世界有100名顶级学者,你要做到世界顶级第一,你相对比较难,因为你要超过100个人。

其中研究更细分的利用视觉技术把物体变形,也有50个人来做,要成为50个人里面第一还是很难。

于是更细分,可以解决半透明的物体跟踪,全世界只有十个人干,相对竞争少了一些,但是要做全球第一还是有难度。最后,你可能研究的论题就变成了一个热的、非钢体的半透明的物体,全世界只有你一个人能做,然后你发表一个论文。

最后不难发现,在命题情况下,只能缩小它的应用范围,使得这个应用范围在切实情况下最终落到一个实际的点来实现解决。

然而,工业界完全不是这样的,工业界要有一个实际运营场景,我要解决开水放在这个透明玻璃瓶里。我要解决我家猫的动作跟踪,而且这个猫的动作可能牵扯到非常多的变化——光线的变化,皮毛的变化,于是你需要重新定义这件事情,不管是从猫的四肢开始解决,还是猫的脸开始解决,或者是整个猫的部分开始解决,这个问题的重定义,会变得非常关键。

然后在解决过程中,还需要把问题拆解称若干步骤,最后再拼接、落地应用,而且要高效、性能消耗合理。

大家看商汤的很多产品,比如SenseFace,其实就是人脸识别——这可能只是表象。你光讲一个人脸识别,在非场景中怎么去做人脸识别?这个事情可不可行?在实际的抓逃中,就会产生场景问题,所以我们还需要对模糊增强、比对,最后一系列技术问题解决后,才能只展现一个人脸识别系统。

看起来简单直白的场景应用,背后可能牵涉到一个系统的工程,涉及无数小问题和小方案,在工业界,研究和工程是并行的,无法分割,而对问题的重新定义,优先且最关键。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-08-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

强行科普|错过这些性价比极高的VR相机,仿佛损失了一个亿

3267
来自专栏企鹅号快讯

今日头条遭最严整顿 智能算法显瓶颈

猎云注:近日,今日头条遭遇“最严整改”,在被网信办约谈、暂停更新部分频道内容后,它宣布关闭社会频道,新时代频道同时被设置为默认频道,并于12月31号集中清理了1...

2046
来自专栏知晓程序

博鳌亚洲论坛今天开幕,为何再次引发 AI 替代人类的一场虚惊? | 晓访

1632
来自专栏量子位

英伟达AI行业布局动态:早已涉足石油能源行业

Root 编译整理 量子位 出品 | 公众号 QbitAI 之前给大家介绍过英伟达出品长期的深入AI行业专题。 昨天,英伟达官网上发文称,已将AI技术落地石油制...

3728
来自专栏VRPinea

翘首盼望“改变游戏规则”的产品?但AR眼镜的老问题苹果恐怕也难解决

按照苹果的设计风格和“追求完美、极简主义”的理念来看,大家对苹果AR眼镜的外形倒真的值得期待下。

891
来自专栏腾讯大讲堂的专栏

腾讯拿出超一亿资源,请你想个好创意

1453
来自专栏CSDN技术头条

HPC技术趋势:HPDA、深度学习、软件定义和机柜即HPC

百度首席科学家吴恩达(Andrew Ng)曾经说,深度学习的前沿正转移到高性能计算(HPC),NVIDIA、AMD及Google、阿里巴巴等公司也确实都在为深度...

2975
来自专栏云计算D1net

惠普云:打造不捆绑用户的Helion开源云平台

惠普云战略前景更加清晰 梅格 惠特曼任职惠普后,提出打造“IT新型态”理念,其中,云计算占据着重要地位。 近两年多时间,惠普似乎颇沉得住气,在云方面没有推出过实...

3116
来自专栏京东技术

【解读】京东智能冰箱图像识别技术

? 李鲁 曾经负责京东智能冰箱硬件产品定义、设计开发、供应链管理、厂商合作等方面工作 ? 曾祥云 京东智能冰箱业务组资深产品研发工程师,图像识别技术专家 目...

5275
来自专栏罗超频道

爱奇艺号上线!视频网站想吃“新内容”的螃蟹能成功吗?

12月20日,爱奇艺合伙人大会在北京举办,爱奇艺宣布升级PGC合伙人计划,并将联合IDG资本、中国文化产业基金、经纬投资三大著名投资机构,成立创投金额达10亿的...

2995

扫码关注云+社区

领取腾讯云代金券