腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
一点人工一点智能
专栏成员
举报
301
文章
332555
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(301)
机器人(78)
自动驾驶(72)
深度学习(69)
人工智能(62)
计算机视觉(54)
无人驾驶(52)
神经网络(50)
数据(42)
模型(38)
算法(38)
机器学习(35)
编程算法(32)
图像处理(28)
性能(23)
图像识别(18)
论文(17)
卷积神经网络(16)
函数(16)
NLP 服务(15)
网络安全(15)
https(15)
地图(14)
网络(14)
优化(13)
强化学习(12)
系统(12)
点云建模(11)
数据库(10)
知识图谱(10)
学习方法(10)
机器人视觉(10)
渲染(9)
sql(8)
视频(8)
对象(7)
pytorch(6)
框架(6)
github(5)
开源(5)
自动化(5)
监督学习(5)
大数据(5)
数据结构(5)
工作(5)
设计(5)
数据挖掘(4)
python(4)
git(4)
腾讯云测试服务(4)
测试(4)
动态规划(4)
架构(4)
搜索(4)
深度强化学习(4)
语音识别(3)
tensorflow(3)
语音合成(3)
存储(3)
数据处理(3)
点云压缩(3)
汽车(3)
编码(3)
配置(3)
搜索引擎(2)
linux(2)
文件存储(2)
催收机器人(2)
金融(2)
企业(2)
分布式(2)
opencv(2)
决策树(2)
kernel(2)
数据分析(2)
processing(2)
分类算法(2)
迁移(2)
图像分析(2)
mesh(2)
network(2)
yolo(2)
基础(2)
教程(2)
连接(2)
增强现实(2)
图像分割(2)
人脸识别(1)
ios(1)
打包(1)
ubuntu(1)
容器镜像服务(1)
批量计算(1)
态势感知(私有云)(1)
机器翻译(1)
视频处理(1)
vr 视频解决方案(1)
智能硬件(1)
http(1)
游戏(1)
正则表达式(1)
tcp/ip(1)
模式识别(1)
迁移学习(1)
安全(1)
windows(1)
数据可视化(1)
系统架构(1)
机器学习平台(1)
聚类算法(1)
性能测试(1)
智能识别(1)
联邦学习(1)
智能硬件 AI 语音助手(1)
3d(1)
analytics(1)
cell(1)
chatgpt(1)
error(1)
frame(1)
gps(1)
gpt(1)
hover(1)
im(1)
image(1)
lines(1)
list(1)
live(1)
map(1)
mask(1)
nlp(1)
parent(1)
precision(1)
rank(1)
rgb(1)
scale(1)
self(1)
torch(1)
transparent(1)
vr(1)
百度(1)
变量(1)
程序(1)
后端(1)
计算机(1)
内存(1)
前端(1)
实践(1)
事件(1)
数据采集(1)
同步(1)
通信(1)
效率(1)
芯片(1)
压缩(1)
音频(1)
重定向(1)
自然语言处理(1)
机器学习算法(1)
语义分析(1)
搜索文章
搜索
搜索
关闭
HOVER:人形机器人的多功能神经网络全身控制器
数据
性能
神经网络
机器人
hover
论文《HOVER: Versatile Neural Whole-Body Controller for Humanoid Robots》提出了一种新型的多模态神经网络控制器HOVER,旨在解决人形机器人全身控制中不同任务模式(如导航、操作、桌面操控等)的兼容性问题。现有方法通常为每个控制模式单独训练策略,导致控制器缺乏通用性。HOVER通过引入运动模仿和策略蒸馏技术,将多个控制模式整合到一个统一策略中,实现了跨模式的技能共享与无缝切换。实验表明,HOVER不仅在单一模式上超越专家策略,还能在仿真和真实硬件中实现鲁棒的多模态控制。
一点人工一点智能
2025-03-07
58
0
基于视觉的仿人机器人灵巧操作:从模拟到现实的强化学习
设计
强化学习
机器人
迁移
对象
本文聚焦于通过**Sim-to-Real强化学习(RL)**实现仿人机器人基于视觉的灵巧操作任务。灵巧操作(如抓取、搬运、双手交接)是机器人领域长期以来的技术难点,传统方法依赖人工编程或示教,难以适应复杂多变的物体属性和动态环境。论文提出一种系统化方法,通过解决环境建模、奖励设计、策略学习与感知迁移四大挑战,构建了一个可扩展的Sim-to-Real框架。其核心目标是通过模拟环境中的高效训练,将策略无缝迁移至真实硬件,实现对多样化物体的鲁棒操作。
一点人工一点智能
2025-03-07
82
0
ChatVLA:基于视觉-语言-动作模型的统一多模态理解与机器人控制
设计
数据
机器人
架构
模型
该部分系统性地阐述了当前视觉-语言-动作模型(VLA)存在的关键问题:虚假遗忘(Spurious Forgetting)和任务干扰(Task Interference)。前者指在机器人控制任务训练过程中,原有视觉-语言对齐关系被覆盖,导致多模态理解能力退化;后者指控制与理解任务因共享参数空间而相互抑制。
一点人工一点智能
2025-03-04
105
0
AnyDexGrasp: 通用灵巧抓取方法的创新与应用
性能
机器人
模型
数据
效率
论文地址:https://graspnet.net/anydexgrasp/assets/files/AnyDexGrasp.pdf
一点人工一点智能
2025-03-03
65
0
Harmon | 从语言描述中生成人形机器人的全身动作
机器人
模型
配置
数据
重定向
项目地址:https://ut-austin-rpl.github.io/Harmon/
一点人工一点智能
2025-02-26
84
0
FLARES:基于LiDAR多范围语义分割的快速准确方法深度解析
数据
网络
性能
优化
模型
LiDAR作为自动驾驶感知系统的核心传感器,其点云数据的语义分割是实现3D场景理解的关键。然而,LiDAR点云的不规则性、稀疏性,以及大规模数据处理的实时性需求,使得高效且准确的语义分割成为技术难点。
一点人工一点智能
2025-02-25
103
1
Dream to Drive:基于解析世界模型的自动驾驶车辆控制
自动驾驶
模型
数据
性能
优化
本文提出了一种基于可微分仿真器的自动驾驶车辆控制方法,首次将可微分仿真应用于世界模型(World Model)的训练。通过引入解析世界模型(Analytic World Models, AWMs),作者设计了三种新任务——相对里程计预测、最优状态规划和逆最优状态估计,旨在解决传统基于策略的模型(如APG)在规划能力与可解释性上的不足。
一点人工一点智能
2025-02-25
69
0
VR-Robo:视觉机器人导航和运动的Real-Sim-Real框架
论文
模型
机器人
vr
框架
本文介绍了一种名为VR-Robo的框架,该框架能够为视觉导航和机器人运动学习提供真实感强、物理交互性强的数字孪生仿真环境。该方法利用多视图图像进行基于3DGS的场景重建,并将这些环境整合到支持自我中心视觉感知和网格基物理交互的模拟器中。
一点人工一点智能
2025-02-18
52
0
MapFusion:一种新的多模态BEV特征融合方法
性能
优化
自动驾驶
地图
论文
本文介绍了一种名为MapFusion的新方法,用于多模态地图构建任务中的特征融合。该方法采用鸟瞰视角(Bird's-Eye View,BEV)特征作为输入,并通过引入交叉模态交互和双动态融合模块来解决不同传感器之间的语义不匹配问题。实验结果表明,与现有方法相比,MapFusion在高清地图建设和BEV地图分割任务中分别取得了3.6%和6.2%的绝对提升,证明了其优越性。
一点人工一点智能
2025-02-18
104
0
VR-Robo:视觉机器人导航和运动的Real-Sim-Real框架
计算机视觉
机器人视觉
机器人
地址:https://mp.weixin.qq.com/s/Mlik8mEHYSb2XmJXqXlKNQ
一点人工一点智能
2025-02-17
90
0
CogACT:一种新的VLA模型架构
机器人
架构
论文
模型
性能
论文地址:https://cogact.github.io/CogACT_paper.pdf
一点人工一点智能
2025-01-20
103
0
强化学习中的可解释性问题
论文
模型
事件
数据
强化学习
本文主要探讨了强化学习中的可解释性问题,并提出了一个新的方法——时间策略分解(TPD),用于解释个体动作的预期未来结果。
一点人工一点智能
2025-01-16
101
0
DeeR-VLA:用于高效机器人执行的多模态大语言模型的动态推理
架构
模型
内存
性能
机器人
项目地址:https://github.com/yueyang130/DeeR-VLA
一点人工一点智能
2025-01-09
67
0
HGSFusion:用于3D目标检测的雷达-相机融合网络
同步
网络
性能
论文
数据
项目地址:https://github.com/garfield-cpp/HGSFusion
一点人工一点智能
2025-01-08
129
0
港大&上海AI实验室 | GPT4Scene:使用视觉语言模型理解视频中的3D场景
论文
模型
视频
性能
对象
本文介绍了一种名为GPT4Scene的新方法,用于训练和推理视觉语言模型(VLM),以帮助其理解三维空间中的场景。传统的VLM在处理三维空间知识时存在局限性,主要原因是缺乏全局局部对应关系。
一点人工一点智能
2025-01-07
189
0
如何高效地从任意一张图像中创建高质量、广泛视角的3D场景?
变量
论文
模型
视频
数据
项目地址:https://snap-research.github.io/wonderland/
一点人工一点智能
2025-01-07
115
0
CoCap:多机器人协同运动捕捉法
算法
系统
机器人
论文
搜索
本文介绍了一种名为CoCap的多机器人协同运动捕捉方法,用于在户外环境中捕捉多个演员的动作。传统的运动捕捉方法往往无法应对复杂的环境和遮挡等问题,而CoCap通过协调相机规划来确保多视角推理,并且在高遮挡率和障碍物密集的情况下表现出色。此外,CoCap还提供了一种单个机器人的实时搜索方法,适用于密集环境下的应用。该方法的成功应用为计算机动画、虚拟现实、生物信息学和人形训练等领域的运动捕捉提供了新的思路和技术支持。
一点人工一点智能
2025-01-03
78
0
WalkVLM:如何通过VLM来辅助盲人行走?
论文
模型
视频
数据
测试
这篇论文主要研究了如何利用视觉语言模型(Vision-Language Models,简称VLMs)来帮助视障人士行走。目前全球有大约两亿人患有不同程度的视力障碍,因此开发AI技术提供行走辅助变得尤为重要。
一点人工一点智能
2025-01-03
102
0
大模型引导的深度强化学习在自动驾驶决策中的应用
自动驾驶
论文
模型
算法
深度强化学习
项目地址:https://bitmobility.github.io/LGDRL/
一点人工一点智能
2024-12-31
199
0
DrivingGPT:使用多模态自回归Transformers统一驾驶世界建模和规划
视频
数据
性能
自动驾驶
模型
项目地址:https://rogerchern.github.io/DrivingGPT/
一点人工一点智能
2024-12-27
158
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档