首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

INDEMIND 首席科学家:从技术出发,打造可见光视觉SLAM最佳方案

大家好,我是M哥。

上周,M哥带大家了解了INDEMIND在技术领域的探索,很多小伙伴后台留言想更深入、更详细的了解INDEMIND在技术层面做了哪些工作。今天,M哥邀请到INDEMIND首席科学家金明磊博士来解答一些大家关注的问题。

先向大家介绍一下金博士。金明磊,北京理工大学光学工程博士,曾任职于中国航天科技集团,多次参加国家级预研项目,在计算机视觉领域有着丰富的研究成果与工作经验,2017年加入INDEMIND,担任首席科学家职位,主要负责INDEMIND算法研发与调试,带领研发团队接连攻克技术难点,在不到一年的时间中完成研发任务。

以下为梳理后的M哥与金博士(以下简称金博)交流内容:

M哥:目前市面上基于视觉的定位技术方案有很多,像激光雷达、红外结构光、可见光及TOF都能实现空间定位,INDEMIND为什么选择做双目可见光的定位技术?

金博:M哥问题中的几种定位技术虽然都能实现空间定位,但他们却是分别基于不同传感器实现的,每种传感器都有自身的优势及劣势。INDEMIND从自身技术实力出发,对可见光方案进行全面评估后,认为我们有实力打造出超越当下主流的可见光视觉空间定位技术方案。

首先,可见光定位技术的数据源—可见光图像,与物体语义识别的数据源存在交叉,定位技术可为人工智能应用提供包含物体语义的3D数据集,拓展人工智能的应用场景。

其次,CMOS可见光图像传感器成本低,减少定位技术在各行业中落地的成本,集思广益利用大家的智慧来推动定位技术在各行业的发展。

因此,考量了可见光定位技术的优势与前景,INDEMIND结合团队的技术优势,着力解决了该技术中存在的如计算量大、处理延迟高等行业痛点问题,拓宽技术应用场景,提升了技术的应用前景。

M哥:INDEMIND既然选择可见光视觉空间定位方案,那么团队在研发过程中一定遇到过很多棘手问题吧?

金博:INDEMIND自主研发的可见光双目惯性定位方案以多传感器标定技术、多传感器融合技术为基础,方案前端采用视觉+惯性的里程计、已知物体的识别及定位,后端有局部地图优化、全局地图优化等非线性优化手段,建图方面完成了稠密点云地图的建立,同时实现了有限物体的语义识别及定位,整个方案实现了已知目标定位、高精度的SLAM、已知语义的物体定位,功能十分齐全,这个庞大的系统中各功能的预研、开发和调试处处存在困难,在一年中能够完成,这与INDEMIND研发团队的努力与实力密不可分。

M哥:我们都知道基于可见光的视觉SLAM技术有计算量大,处理延迟高两大致命问题,研发团队是如何处理这些问题的?

金博:可见光视觉SLAM方案计算量大、延迟高是困扰行业已久的问题,INDEMIND为此投入了大量研发精力。首先我们在SLAM架构上做了大量的优化工作,以功能性为前提,结合实时性需求,设计SLAM前后端各部分处理算法的架构及处理流程,其次前后端各部分算法在不断迭代提升性能,无论是前端图像特征点的识别及匹配,还是后端的优化处理都进行了大量的算法研发及优化工作。

框架设计及算法优化两部分同时进行,保障性能同时降低计算量及处理延迟,保证研发周期内完成工作。同时INDEMIND也在着手进行SLAM算法在FPGA等处理平台的实现及仿真验证,彻底解决由计算量大导致的处理延迟高的问题

M哥:除了SLAM定位方向,INDEMIND在目前比较前沿的语义SLAM上有没有做过工作或准备?

金博:我们认为结合物体语义识别的SLAM将会给用户一个更好的交互体验,但是目前深度学习领域实现的基于二维图像的物体语义识别难以满足实时交互需求,同时还存在现实世界物体识别不全、真实位置无法准确感知等问题。

人识别物体不仅仅停留在二维上,举个最简单的例子,汽车和汽车模型在二维图像上很接近,只靠图像很难正确识别,但是在真实世界中人看到两个物体的3D尺寸就可以立刻做出正确的识别,所以3D空间上的物体语义识别我们认为具有很好的前景,我们现阶段开发的精确稠密建图就是我们实现物体语义识别和语义SLAM的基础。

M哥:今天聊了这么多技术细节,请金博您从技术角度为我们介绍一下INDEMIND即将推出的双目视觉惯性模组?

金博:目前市面上已有的双目惯性模组在多传感器同步及图像预处理上距离我们的要求有一定的差距,因此我们自主开发了这款全新的双目模组。这款模组中双目图像严格时间同步,满足双目定位需求;3A预处理并且曝光时间短,满足快速移动需求;水平110度大视场,满足大空间定位需求;双目与IMU精确时间同步,满足多传感器数据融合需求。同时基于我们自研的多传感器标定技术,提供已经严格标定好的双目相机内外参,相机与IMU的外参,还可满足非SLAM底层技术研发人员使用需求。不仅如此,后期INDEMIND将提供多种SDK开发套件,满足非SLAM从业人员的使用需求。

这款模组的应用场景十分广阔,我们也是期望通过这样的产品满足多行业的模组需求,推动整个计算机视觉行业的发展。

通过与金博的交流,我们不难发现,INDEMIND从技术出发,着力解决了可见光视觉SLAM的计算量大、延迟性高两大行业痛点难题,使INDEMIND自主研发的可见光视觉SLAM技术向行业实际应用落地奠定了坚实基础;同时,INDEMIND也在积极探索未来技术发展与SLAM应用方向。在未来,正如金博所言,INDEMIND将通过技术革新与产品迭代不断解决行业痛点,满足行业需求,推动整体行业发展。

由于时间有限,今天M哥只与金博交流了INDEMIND核心技术与算法上的问题,而大家同样关注的INDEMIND产品研发及详细硬件技术细节等问题,下周INDEMIND CTO 闫东坤博士为大家一一解答。

敬请期待……

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180607G1EOO100?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券