前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DNSPod十问黄欢:为什么互联网大厂都要去造车?

DNSPod十问黄欢:为什么互联网大厂都要去造车?

作者头像
腾讯云DNSPod团队
发布2022-02-08 12:42:24
4810
发布2022-02-08 12:42:24
举报

荆虹科技创始人,3D TOF视觉领域专家,六西格玛黑带大师,天津大学工业工程硕士。曾就职于台湾扬信与盛泰光学,领导并服务过Moto、Nokia、苹果手机摄像头项目。

人称奶罩,腾讯云中小企业中心总经理,DNSPod创始人,洋葱令牌创始人,网络安全专家,域名及DNS技术专家,知名个人站长,中欧国际工商学院EMBA。

1

吴洪声:你之前曾就职于台湾扬信科技和富士康,后来担任了盛泰光学总经理,一直都从事手机摄像头相关的工作。这些年的工作经历对你后续的创业有什么帮助?为什么荆虹科技最后选择专注在3D TOF这个领域?

黄欢:从1827年世界上第一张照片诞生到现代手机的照片,屏幕从TFT屏到8K屏,通讯从2G到5G,分辨率从8万像素到1亿像素,我们看到从二维到三维是一个不可逆的趋势,所以创业的时候坚定地选择了三维领域。

《勒格哈的窗外景色》是目前已知世界上第一张可以永久固定影像的照片,该照片由法国摄影先驱约瑟夫·尼塞福尔·尼埃普斯于1826年(一说1827年)拍摄

尽管2017年创业的时候苹果推出了结构光手机,引领了结构光的风潮,但我们考虑到里面有很多专利风险,最后通过分析比较认为TOF会更具前瞻性

我们的基因在于做整个三维的模组方案和标定的算法,后来创业的时候把后端算法补齐,现在荆虹科技已经成为软硬件结合的3D全栈公司,能满足不同产品和客户的需求。

2

吴洪声:3D sensing 技术主要分为三种方案,包括结构光、TOF和双目测距法,目前比较成熟的是结构光和TOF技术。结构光和TOF技术的区别在哪里?在哪些领域的应用上,TOF使用得更加广泛,或者更具优势?

黄欢:为什么大家会比较关注结构光,是因为苹果率先推出了结构光,然后大家纷纷跟进。

结构光 (Structured Light)是通过红外激光器,将具有一定结构特征的光线投射到被拍摄物体上,再由专门的红外摄像头进行采集反射的结构光图案,根据三角测量原理进行深度信息的计算。

ToF(Time of Flight,飞行时间)是通过红外发射器发射调制过的光脉冲,遇到物体反射后,用接收器接收反射回来的光脉冲,并根据光脉冲的往返时间计算与物体之间的距离。

对比结构光,TOF有以下几点优势:

第一,结构光的近距离效果非常好,例如用于人脸识别,但它有一些抗光性的问题,就是我们所谓的“鲁棒性”没有那么好,对日光的适应性没有那么强。而TOF在各种场景、各种日光下的适应性都比结构光好,因此现在很多结构光的厂家也逐步转型去做TOF。

第二,结构光其实比TOF多了光发射准直镜,所以我们在量产制造时,结构光就会多一个环节,这就意味着会多一个工人,多一个制造的设备,多一个制造的工艺,那么成本就会上升。而TOF没有准直镜,制造工艺的链条相对结构光更简单,在大量量产的情况下,同等级的产品成本可以比结构光低30%左右,性价比更高

第三,结构光主要应用在近距离的刷脸,在中远距离、远距离的优势并不大。TOF应用领域更广,包括工业领域和消费领域。

除了手机和汽车,机器人视觉也会往RGB-D发展,这个D是深度,都会向TOF走。机器人以前用激光雷达只能接收到二维信息,能测量出物品的距离但无法做VSLAM,导致有的扫地机器人会很“笨”。TOF的数据多了一个维度,会让机器人更加智能,我们只需要解决TOF成本的问题就能实现大规模应用,实际上现在的扫地机器人头部厂商石头科技、科沃斯、小米等的旗舰机或中高端机全部都是用3D TOF。

扫地机器人(示意图)

3

吴洪声:3D TOF其实也是近五六年才兴起的市场,在华为 P30 Pro、华为 Mate 30 Pro系列手机的应用下让更多人认识到了3D TOF,荆虹科技宣称拥有世界领先的TOF的2D/3D人脸识别技术,你们的技术优势体现在哪里?

黄欢:首先,从材料方面来说,我们有镜头的光学设计镜头的光学设计会影响图像的还原效果。举个例子:光有发射与接收的环节,发光发出去是100分,回来至少也要有80、90分才不会导致数据失真得太厉害,否则就会造成空洞,需要有更大的三维模型去把空洞补上,而这将严重占用后端资源,影响体验。我们在光学镜头的设计方面拥有大量的量产经验能够从设计端就做好品质的管控,品质是设计出来的,而不是检验和制造出来的

其次,光学设计完后需要很强的工业制造能力。就像大家都知道的芯片头部代工厂商台积电,强大的制造能力和工艺能力形成了它的技术壁垒。而我们的镜头交给我们的股东惠州星聚宇光学来做,他们在光学领域积累了15年经验,在手机摄像头领域出货已经做到全世界第三,星聚宇光学拥有非常强的制程能力、制造能力,保证了源头的镜头input数据的质量,那么我们才能输出优质的output。

最后,我们是一家软硬件结合的3D全栈公司,有上游的光学设计能力、中游的硬件设计高精密制造能力、下游的核心算法能力,能够“知其然而知其所以然”。比如当我们配合华为、小米等客户时,他们会指定应用场景,那么我们很快就能根据应用场景反过来去设计前端,修改镜头的参数,修改硬件的设计,并优化算法参数。而当我们得到与更多大客户的合作机会,就有更多的数据来完成迭代,由此慢慢形成闭环,搭建起我们的技术壁垒。

荆虹科技创始人黄欢

4

吴洪声:3D TOF的一大应用就是人脸识别。但相信有很多人都有这种体验:小区或写字楼的人脸识别要么识别不出来,要么只要你长了一张“大众脸”,随便就能进出门禁。这些人脸识别不精准的“乌龙”情况是怎么造成的?

黄欢:出现这样的问题是因为数据训练量不够,一般出现在小公司的产品或还不成熟的产品。如果发现有“大众脸”的情况,那么就需要通过数据学习来不断修正,避免报错。

要更好地解决这个问题,还需要通过TOF的深度活体算法。人脸识别靠的是特征点,以前是二维信息,可以用一张照片去做识别;而TOF则多了一维。举个例子,3D TOF能够通过例如鼻尖、耳朵等深度信息去判断具体的差异,因此识别结果更加准确。

大家有时候做身份验证需要头左转右转,或者张嘴眨眼,这其实是双目测距法,属于被动判断,背后是因为数据量不够,需要人去配合做一些动作才能判断是不是活体。

常见的双目测距法

而3D TOF根本不需要人去动,例如在智能座舱里你正常上车,中间不用停下来对着某个地方刷脸,就能检测你是不是车主。摇头晃脑要人配合的人脸识别一点都不“智能”,真正的“智能”就是要做到与人“心有灵犀”,根据用户的使用习惯做出智能的选择

5

吴洪声:去年七月,荆虹科技的3D TOF深度相机及人脸识别(活体检测)算法,通过了由中国人民银行批准成立的国家金融行业权威检测机构——国家金融科技测评中心(BCTC)的技术认证,达到国家认证的金融支付级安全标准。金融支付非常讲究高效与安全,你们在金融支付场景下的3D TOF会跟其他场景下的有什么不同吗?网上经常看到有戴面具,甚至还使用deepfake技术等来冒充人脸,你们如何通过技术手段甄别出来?

黄欢:我们是深圳第一家通过BCTC认证的公司。如果一家创业公司要证明自己TOF的技术能力,最好的方法就是去获得金融支付认证。真正能够量产和做到高等级水平的公司,在全国范围内都是凤毛麟角。

金融支付场景下的3D TOF非常看重精度。做避障的话,一般需要5-6米的标定,而做人脸识别则需要到1米以内(约50-70公分),然后根据不同的场景、使用习惯去做标定和整体的调试。此外,还需要用精准的头膜进行测试。除了普通二维照片、三维人脸模型,还要用到不同材质、多模态去训练学习。

支付的安全性不讲求100%安全,而是讲究一个阈值,只要破解概率能达到例如百万分之一,那么就能进行商用(因为我们的6位数密码就是百万分之一)。

在实际的场景中,真正破解的情况是非常少的。你需要非常了解算法模型的漏洞,然后再专门做一个头模才能破解,deepfake相当于是花30万做一个高精密的头像去偷1000块的手机,这是完全不符合商业逻辑的。而且这些高精密的3D头像也都会在进行BCTC认证的时候做验证,只要我们有足够多的数据,我们就能通过算法的学习提前避免破解的发生。

特朗普的deepfake(深度伪造)已经能以假乱真

6

吴洪声:除了少部分手机前置摄像头的人脸识别解锁,3D TOF技术现在还被用在后置摄像头,可以在辅助对焦、3D 拍照、手机“尺子”、体感游戏等发挥一定作用。但很多评论认为3D TOF用在手机后置很鸡肋,处于一种专业人士看不上,但普通用户也不需要的窘境。一方面,很多新机会选择搭载一亿像素CMOS而不是TOF,且用激光传感器就可以解决辅助对焦问题;另一方面,AR应用还未成气候,同时专业人士手上也不缺专业的空间测距设备。你怎么看待这个所谓的3D TOF“窘境”?

黄欢:说实话,现在确实是非常“鸡肋”

尽管苹果13在带头用3D TOF摄像头,但是苹果是一个开创者的角色,引领新的风潮,而一般的手机厂商,即使装了3D TOF打开频率也非常低,双目摄像头已经能完全满足日常使用。

荆虹科技创始人黄欢

但在未来,3D TOF摄像头会配合VR眼镜应用于不同的场景。举个例子,今天你弄了一个非常酷炫的发型,穿了一身很帅的衣服,那么你用3D TOF的手机绕着自己扫描一圈,在王者荣耀里就能生成你的三维形象,然后跟朋友们一起去玩。再比如,现在微信只能传图片和视频,未来就能用3D TOF把物品扫描一圈,就能发送一个三维的物品给对方。

现在基础设施已经搭建完毕了,我们就是其中提供底层引擎算法的一员,相信在5年内,腾讯等公司就会带头落地更多应用,打造出越来越多的生态,用三维技术极大地提高工作和生活效率。

7

吴洪声:TOF技术的另一大终端应用在于车载电子,荆虹科技也积极地把TOF技术服务于智能座舱,也成为去年华为智能汽车解决方案的优秀合作伙伴。TOF技术具体是如何成为打造智能座舱的重要一环?目前已经实现了的关键应用有哪些?你曾说“TOF是AI视觉中最具想象力的传感器”,为什么是“最具想象力”?

黄欢:第一,人脸识别。3D TOF的人脸识别,不仅能够刷脸开车门,还能根据识别出来的身份进行个性化调节,例如根据人员的身高自动调节座椅,一进入车内就能坐上最舒服的位置。现在非常多主机厂和品牌厂都需要这样能够体现“奢华”的功能。

第二,HUD抬头显示。现在的HUD没办法实时跟踪调整驾驶员的位置,但用TOF技术就能根据眼睛和身高调整抬头位置,提供一个更好的驾驶体验和场景。

第三,驾驶安全辅助。基于TOF的DMS(驾驶员监测系统)用于货车,就能实时监控驾驶员的状态,检查司机是否疲劳驾驶、是否有儿童被落在车里等。

最新的Euro NCAP(Euro New Car Assessment Program,欧盟新车安全评价规程)规定:DMS在2022年7月份强制执行“司机瞌睡和注意警告”DDAW(Driver Drowsiness and Attention Warning)法规;“儿童生命体检测”CPD (Child Presence Detection)是Euro NCAP对于OMS(乘客监测系统)的一个加分引导。我们中国在新车辆的法规上预计会在2023年跟进Euro NCAP的DMS强制,在2025年跟进CPD的检测要求。(这个要看具体国家政策时间)

第四,汽车中控。宝马、特斯拉以及一些造车新势力的汽车都在用大屏,但现在的交互其实非常不安全、不智能:大屏里还有二级菜单,调个音乐可能还需要翻页、下拉、点击。未来在TOF的支持下可以用手势或多模态解决交互,既安全又优雅。

之所以充满想象力,是因为汽车是一个封闭的第三空间

汽车跟手机一样会占用很多用户时间,人们将来可以在每天2-3小时的通勤里打开自动驾驶,自己在车里办公或刷视频,把节约的2-3小时自由分配到其它地方将产生巨大的价值。

另一个是汽车空间里的沉浸式体验,这手机是完全无法带来的,例如你可以戴着VR眼镜看一场电影,自由地放声大哭,沉浸在自己的世界里。

汽车还会成为社交的工具,车里的摄像头可以记录出行、记录美好生活。例如我去新疆旅游,现在不可能边开车边拍风景,有了视觉摄像头就能每到一个地方自动在朋友圈里发送定位、风景照片、视频。

我非常认同“汽车是装了四个轮子的手机”的观点,实现自动驾驶后,基于云端服务会产生各种内容和应用,例如办公、音视频、卡拉OK、存储等都能在汽车里实现。

8

吴洪声:实际上,TOF技术还能服务于自动驾驶,比如采用了TOF技术的倒车系统可同时侦测多个不同距离障碍物,当检测到有行人或者障碍物靠近,通过影像显影或声音警示距离,进一步辅助驾驶路况。无论从市场热度还是体量来看,自动驾驶比智能座舱更吃香,为什么你们没有选择做自动驾驶这个细分领域?

黄欢:我们的基因不在智能驾驶,因此当前我们更适合配合车内提供产品。车外主要是长远距离的激光雷达,而我们擅长的是中短距离的TOF在车内场景更具优势。当然,纯视觉的自动驾驶摄像头车外的应用方案我们也在和自动驾驶公司积极配合中。

另外,视觉市场比激光雷达的市场大。日本东京商工研究所(TSR)的权威报告显示,整个汽车车内视觉市场大约占比63%,车外包含超声波雷达、毫米波波雷达、激光雷达等市场只占30%左右,且为负增长或仅40%左右的增长,而车内视觉则呈100%增长,2020年的市场是153亿美金,2030年将达到400亿美金,2040年则是840亿美金,每隔10年就能实现3倍速的增长。

毕竟激光雷达全车只需要几个,顶多再增加2-4个就完全足够了。但是摄像头的数量可以非常多,现在的小鹏、蔚来、理想等汽车车内平均装有10个摄像头,自动驾驶则更多,裹动智驾等汽车装有28个以上摄像头,所以说视觉市场的增长是无比巨大的。

同时,刚刚也提到欧洲已经有法规要对车内的遗留物进行检测,防止不小心把小孩留在车里导致意外发生等情况,因此用TOF配合做车内活体检测将成为强制标准和造车刚需

9

吴洪声:数据显示,2020年全球智能座舱主要产品达396亿美元,2018-2022年市场CAGR(复合年均增长率)为8.8%。从市场角度来看,你认为智能座舱凭什么能支撑起千亿市场规模?

黄欢:根据我们最新看到的数据,智能座舱的市场已经达到2万亿。为什么市场这么大?首先就是我刚刚提到的“装了四个轮子的手机”,汽车一定会有手机的功能,更重要的是提供了一个私密空间。

另外,越来越多玩家进入汽车领域。为什么大厂们在各自的领域都做得很好了,依然还要来造车?比如小米,在手机、电视、IoT领域已经非常优秀,但依然要去造车。

小米创始人雷军微博

第一,要形成闭环。人类文明的进程就是效率的提高和时间的再次利用,谁占据了时间,谁就获得流量。汽车能够让人在里面消耗大量时间,拿下汽车这块,就能形成支付、娱乐、社交整条数据链的闭环。这也可以解释为什么汽车厂家也在做手机,同样也是为了形成这个闭环。

第二,对于造车来说,未来属于数据内容,重要的不仅是汽车漂亮的外壳,还有沉浸在汽车里的各种体验,所以内容生态和云端数据是又一核心所在

在此背景之下,我个人不成熟地认为像腾讯云、阿里云、华为云等的云玩家最有可能掌握最终的话语权,把数据带进汽车,甚至会诞生一款像微信一样所有人都会使用的车内应用,连接车里的VR眼镜、办公、娱乐等等。

自动驾驶是有标准的,当未来每家公司都生产出“国家标准”的智能汽车,那么除了拥有核心技术的造车厂,其他汽车的品牌忠诚度将不复存在,整个汽车市场特别是中国传统车企会面临一场大洗牌

10

吴洪声:现在国内的智能座舱慢慢火热起来,有的评论甚至认为在智能座舱表现方面,中国的汽车已经超过了特斯拉,你认同这个观点吗?现在国内的智能座舱趋向于跨界、融合、集成的网状产业结构,新兴互联网公司与传统整车、零部件企业三方势力角逐,这样的格局会继续延续吗?智能座舱以及TOF技术未来还有哪些发展空间?

黄欢:与特斯拉对比的话,我觉得在某些应用方面确实是超越了,例如车里的语音交互系统,特斯拉的核心优势在于自动驾驶和电池技术,我们在智能座舱这块则稍微走在前面一点点,但还是要长远地来看。

当然,智能座舱的前提还是需要实现自动驾驶,才能把生活场景引入汽车里。L5级别的自动驾驶还有很长一段路要走,即使最理想的情况5年内能解决技术问题,再花10年也难以解决伦理问题

美国汽车工程师学会(SAE)对自动驾驶汽车的分级

目前奔驰在德国已经有了相关的自动驾驶法规,但依然需要有人坐在驾驶位置。在极端情况下,如果无人驾驶的汽车撞到了人,那么是车主负责,还是写代码的公司负责?自动驾驶是选择撞小孩还是撞老人,这是代码的伦理问题;选择不撞人而自己车毁人亡,这是个购买问题。所以无人驾驶目前主要还是应用在物流,智能规划好最优路线,极大提升运输效率。

就现在的格局来看,主机厂、互联网公司、传统车企都已经入场,我个人不成熟地认为拥有云的互联网企业会因为拥有个性化数据而最有可能在未来成为主导者,拥有自身独特品牌力的公司才能占领用户心智,走得更远。像特斯拉这样本质是能源公司/SaaS公司的玩家也能继续留在牌桌上,但中国传统车厂未来很有可能会走向整合,或者逐步被自己革命

TOF技术的发展空间肯定是非常巨大的,包括人脸识别、活体检测等等。当量足够大,性价比足够高,TOF技术就能大规模应用。就像指纹芯片那样,刚开始需要25美金,两年后只需要不到1美金。实际上,智能汽车的三维人脸识别,在未来两年就能做到高性价比。三维是一个不可逆的趋势,那么我们就不要逆势而行,但这里面肯定是需要时间的,也请相信未来三维空间的生活不会太遥远。

* 图片来源:荆虹科技、北京日报、搜狐网、知乎、灵犀AR、哔哩哔哩@视知、摄图网、微博、SAE

 END  

栏目统筹 | 赵九州

责任编辑 | 黄绮婷  庄雅捷 张洁

栏目顾问 | 草禾言

你对自动驾驶/智能座舱的了解有多少?你看好自动驾驶/智能座舱的发展吗?你看好互联网大厂去造车吗?欢迎在评论区分享你的看法~点亮“在看”+评论区留言,阿D将在2月8日(周一)下午15:00随机抽取2位粉丝,送出DNSPod定制笔记本~

《DNSPod十问》是由腾讯云企业中心推出的一档深度谈话栏目,通过每期向嘉宾提出十个问题,带着广大读者站在这些行业精英的肩膀上,俯瞰各大行业发展趋势和前沿技术革新。

栏目嘉宾的领域在逐渐扩大,从最初的域名圈、站长圈到程序员圈、创业者圈、投资圈。腾讯副总裁丁珂、CSDN董事长蒋涛、Discuz!创始人戴志康、知识星球吴鲁加、腾讯安全学院副院长杨卿等技术大咖和行业领军人物都在这个栏目留下了他们的真知灼见。

《DNSPod十问》在腾讯云生态圈也极具影响力和活跃度。我们在腾讯内部平台——DNSPod公众号、Discuz! Q公众号、腾讯中小企业服务公众号、腾讯云公众号、腾讯云主机公众号、腾讯云服务器公众号、腾讯云助手、腾讯乐问、腾讯码客圈、腾讯KM平台、腾讯云+社区、腾讯云+大学等平台累计关注度高达数十万,同时我们积极开拓与外部媒体的合作,如腾讯科技、腾讯新闻、新浪微博机构号、CSDN社区技术专栏、知乎机构号、企鹅号、搜狐号、头条号、开源中国技术社区、IT之家、InfoQ社区资讯站点、Twitter机构号、Facebook机构号等媒体阅读总量逾百万。

未来,我们希望这个栏目的影响力会覆盖更加多元的受众,把更多正确的理念对外传递出去。欢迎各位读者在评论区留下你想看到的嘉宾和想问的问题,我们邀请你共同成为《DNSPod十问》栏目的提问者与发声者。

合作联系:

qitinghuang@tencent.com

▼点击直达DNSPod官方社区

▼扫码加入DNSPod官方用户群

点“在看”给我一朵小黄花

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-01-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DNSPod 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档