首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

伯克利智能体观看视频片段学习动作技能,无需手动标注

无论是像洗手这样的日常动作还是惊人的杂技技能,人类都可以通过观察其他人来学习。随着YouTube等来源的公开视频数据的激增,现在比以往任何时候都更容易找到我们感兴趣的任何技能的视频剪辑。每分钟都会有300小时视频上传到YouTube。不幸的是,我们的机器从大量的视觉数据中学习技能仍然非常具有挑战性。大多数模仿学习方法都需要简洁的表征,例如从动作捕捉(mocap)记录的表征。但获取mocap数据可能非常麻烦,通常需要大量的仪器。Mocap系统也往往局限于室内环境,闭塞程度最小,这可以限制可记录的技能类型。如果我们的智能体也可以通过观看视频片段来学习技能,那就相当好了。

05

机器人视觉听觉融合的感知操作系统

摘要:智能机器人面对复杂环境的操作能力一直是机器人应用领域研究的前沿问题,指称表达是人类对指定对象定位通用的表述方式,因此这种方式常被利用到机器人的交互当中,但是单一视觉模态并不足以满足现实世界中的所有任务。因此本文构建了一种基于视觉和听觉融合的机器人感知操作系统,该系统利用深度学习算法的模型实现了机器人的视觉感知和听觉感知,捕获自然语言操作指令和场景信息用于机器人的视觉定位,并为此收集了12类的声音信号数据用于音频识别。实验结果表明:该系统集成在UR机器人上有良好的视觉定位和音频预测能力,并最终实现了基于指令的视听操作任务,且验证了视听数据优于单一模态数据的表达能力。

03

重磅丨直击“人机大战”第二轮:声纹识别百度小度1:1战平人类,比赛的背后究竟发生了什么?

如果说在上一轮人机大战的人脸识别对决中,由于小度对阵了并不擅长人脸识别的王峰,令比赛意义打了折扣,那么昨天进行的第二轮声音识别的人机大战,虽然最终只是战平,但对于AI 界的意义却似乎更大。 原因有两点:一、公认实力顶尖的对手;二、业界公认困难的比赛内容。 在对手上,此次迎战百度小度的是名人堂公认最擅长声音辨别的选手孙亦廷,他辨别声音细节的能力在名人堂无出其右,能通过水球从0~70米高空坠地破碎的声音,来准确辨别水球下落时的高度。这相当于在一根70米长的琴弦上拉奏任意位置,他都通过音高准确辨别拉弦的位置,甚至

05

给我一根棍子,就能撬动图灵测试 | MIT用AI自动生成声音(论文)

【新智元导读】MIT计算机科学与人工智能实验室一项最新的研究表明,机器通过深度学习可以制造出和物理世界中相似度极高的声音,达到以假乱真的水平,并通过了“声音图灵测试”。这项研究的对象是“看得到的声音”,也就是视频中所展示的实际生活中物体间相互作用产生的声音。未来,这一领域的研究将提升机器人与周围环境交互的能力。 机器人如果想在现实世界中寻找方向,首先需要能够对周围的环境和一系列连续发生的事件中可能会遇到的情况做出合理评估。 人类通过声音来获得对周围情况的评估能力。敲击物体有时候并不仅仅是为了娱乐,一些 研

06
领券