专栏首页arxiv.org翻译专栏从语义特征预测对象之间的相对深度(cs,AI)

从语义特征预测对象之间的相对深度(cs,AI)

视觉和语言任务,如视觉关系检测和视觉问题回答,受益于语义特征,并且为语言提供适当的基础。二维图像中描绘的物体的三维深度就是这样一个特征。然而,如果不学习与场景相关的适当特征,很难获得准确的深度信息。这个领域的先进技术是在立体图像数据上训练的复杂的神经网络模型,以预测每个像素的深度。幸运的是,在某些项目中,只需要对象之间的相对深度。本文研究了语义特征可以预测课程相对深度的程度。将问题转换为分类法,计算基于对象边界框、对象标签和场景属性的几何特征,并将其用作模式识别模型的输入,以预测相对深度,即后置、前置和中性。将结果与代表艺术状态的单深度神经网络模型的平均输出结果进行比较。根据单深度模型得出的结果,相对深度精度总体上比相对深度高出14%。

原文标题:Predicting Relative Depth between Objects from Semantic Features

原文:Vision and language tasks such as Visual Relation Detection and Visual Question Answering benefit from semantic features that afford proper grounding of language. The 3D depth of objects depicted in 2D images is one such feature. However it is very difficult to obtain accurate depth information without learning the appropriate features, which are scene dependent. The state of the art in this area are complex Neural Network models trained on stereo image data to predict depth per pixel. Fortunately, in some tasks, its only the relative depth between objects that is required. In this paper the extent to which semantic features can predict course relative depth is investigated. The problem is casted as a classification one and geometrical features based on object bounding boxes, object labels and scene attributes are computed and used as inputs to pattern recognition models to predict relative depth. i.e behind, in-front and neutral. The results are compared to those obtained from averaging the output of the monodepth neural network model, which represents the state-of-the art. An overall increase of 14% in relative depth accuracy over relative depth computed from the monodepth model derived results is achieved.

原文链接:http://cn.arxiv.org/abs/2101.04626

原文作者:Stefan Cassar, Adrian Muscat, Dylan Seychell

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI 的深度强化学习调配交通信号灯

    聊起 AI,画面都充斥着机械语言:精密高级的芯片,光怪陆离的智能产业……你眼中的 AI 有什么样的能力?能给传统行业带来哪些变革与发展?基于此,云加社区联手知乎...

    云加社区
  • AI vs 深度学习 vs 机器学习:人工智能的 12 大应用场景

    【新智元导读】在本文中,作者先探讨了深度学习的特点和优势,然后介绍了12种类型的AI问题,即:在哪些场景下应该使用人工智能(AI)?作者强调企业AI问题,因为他...

    新智元
  • 谷歌AI:根据视频生成深度图,效果堪比激光雷达

    目前自动驾驶的核心技术是LiDAR(激光雷达),一种运用雷达原理,采用光和激光作为主要传感器的汽车视觉系统。LiDAR传感器赋予了自动驾驶汽车能够看到周边环境的...

    新智元
  • 2015伦敦深度学习峰会笔记:来自DeepMind、Clarifai等大神的分享

    上周,我有机会参加在伦敦举行的第三届深度学习峰会,上两届分别在旧金山和波士顿举行。 深度学习峰会由 RE.WORK主办,汇集了从工业领域到学术领域不同背景的专业...

    CSDN技术头条
  • 2015伦敦深度学习峰会:来自DeepMind、Clarifai、雅虎等大神的分享

    用户1737318
  • 标题:重磅 | ICML 2017 开幕,华人再获最佳论文奖(附历届引用量最高论文解读)

    翻译 | AI科技大本营(rgznai100) 参与 | 尚岩奇、周翔 8 月 6 日,为期 6 天的国际机器学习大会 ICML 在澳大利亚悉尼正式拉开帷幕。据...

    AI科技大本营
  • 机器有了综合感官?新研究结合视觉和听觉进行情感预测 | 一周AI最火论文

    呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

    大数据文摘
  • 学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲

    Yann LeCun 开场介绍说,当前几乎所有的机器学习从业者在实践中使用的都是监督式学习:向机器展示大量的样本,然后告诉机器正确的答案与内部参数,然后就能做图...

    机器之心
  • 提速20倍!谷歌AI发布TensorFlow 3D,智能汽车场景亲测好用

    随着自动驾驶汽车与机器人的深入发展,激光雷达、深度传感摄像机、雷达等3D传感器已经成为了获取道路数据的必要设备。

    新智元
  • XAI系列二:模型可解释性技术概览

    传统网络安全威胁分析依赖专家知识及基本的数据分析,然而随着攻击技术的复杂化、安全数据接入的多元化,高性能人工智能技术越来越多的应用到威胁分析中,试图解放安全行业...

    绿盟科技研究通讯
  • 写给想要填报CS/AI志愿的考生们

    国内CS/AI方向又有很多新的变化,最明显的是各大高校纷纷设立人工智能学院,开始招收人工智能专业本科生。最近又要开始新的一轮填报志愿,我又来蹭个热点,花了些时间...

    昱良
  • 大会 | 腾讯AI Lab 21篇CVPR 18录用论文详解

    AI 科技评论按:CVPR 2018 日前已公布录用名单,腾讯 AI Lab 共有 21 篇论文入选。本文转载于「腾讯 AI 实验室」, AI 科技评论经授权转...

    AI科技评论
  • Yoshua Bengio访谈笔记:用意识先验糅合符号主义与联结主义

    「对表征(representation)空间的依赖贯穿计算机科学乃至日常生活的始终。在计算机科学中,如果数据有精当的结构,辅以智能化的索引,那么搜索任务的速度可...

    机器之心
  • 1+1>2:MIT&IBM提出结合符号主义和连接主义的高效、准确新模型

    人工智能应该复制人脑的哪一部分功能?这个问题的答案反映了一场辩论的焦点,这场辩论和 AI 的历史一样久远。20 世纪 50 年代,人类开始探索如何创建可以思考的...

    磐创AI
  • CNCC2017梳理

    早上的论坛可以在爱奇艺下载视频 下午的分论坛是多个同时进行的,我也只去了一部分,这里先按时间顺序写自己的一些收获,之后会从另外的角度做一个总结。 ...

    梦里茶
  • 人工智能 、机器学习、深度学习、神经网络,都有什么区别?

    人工智能(AI) 、机器学习(ML)、深度学习(DL)、神经网络(CNN)这些术语通常可以互换使用,但有它们之间都有什么区别?如何区分它们?

    TSINGSEE青犀视频
  • DAN改进视觉参考分辨率,DRLIH实现图像复刻 | AI一周学术

    呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

    大数据文摘
  • CVPR 2018 | 腾讯AI Lab入选21篇论文详解

    腾讯AI Lab共有21篇论文入选,位居国内企业前列,我们将在下文进行详解,欢迎交流与讨论。

    腾讯技术工程官方号
  • CCAI 2019 | 郑南宁:“直觉性AI技术”可助力无人驾驶

    2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于在...

    马上科普尚尚

扫码关注云+社区

领取腾讯云代金券