腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
arXiv每日学术速递
专栏作者
举报
513
文章
386373
阅读量
61
订阅数
订阅专栏
申请加入专栏
全部文章(513)
https(441)
linux(435)
网络安全(426)
机器学习(109)
学习方法(96)
NLP 服务(74)
机器人(68)
python(63)
批量计算(60)
数据库(58)
神经网络(53)
编程算法(52)
sql(38)
图像处理(37)
深度学习(30)
模型(28)
数据挖掘(22)
人工智能(19)
数据(19)
语音识别(17)
性能(17)
网站(16)
论文(14)
强化学习(10)
网络(10)
php(9)
mac os(8)
联邦学习(8)
语音合成(7)
tcp/ip(7)
数据分析(7)
工作(7)
访问管理(6)
框架(6)
系统(6)
自动驾驶(5)
爬虫(5)
图像识别(5)
优化(5)
聚类算法(4)
架构(4)
bash(3)
jquery ui(3)
ide(3)
文件存储(3)
express(3)
开源(3)
监督学习(3)
编码(3)
对象(3)
工具(3)
函数(3)
视频(3)
算法(3)
腾讯(3)
对象存储(2)
c++(2)
node.js(2)
css(2)
html(2)
maven(2)
短视频(2)
SSL 证书(2)
数据加密服务(2)
渲染(2)
缓存(2)
卷积神经网络(2)
大数据(2)
安全(2)
数据结构(2)
processing(2)
chatgpt(2)
开发(2)
开发者(2)
量化(2)
数学(2)
效率(2)
音频(2)
其他(1)
数字货币(1)
tensorflow(1)
java(1)
scala(1)
r 语言(1)
react(1)
android(1)
arm(1)
oracle(1)
vba(1)
bash 指令(1)
spring(1)
数据库一体机 TData(1)
机器翻译(1)
腾讯云测试服务(1)
视频处理(1)
双螺旋(1)
金融(1)
医疗(1)
数据安全(1)
http(1)
babel.js(1)
serverless(1)
存储(1)
运维(1)
面向对象编程(1)
dns(1)
推荐系统(1)
asp(1)
keras(1)
pytorch(1)
微信(1)
物联网(1)
架构设计(1)
hbase(1)
腾讯云开发者社区(1)
云计算(1)
5g(1)
汽车(1)
cs(1)
gan(1)
next(1)
reddit(1)
set(1)
word2vec(1)
yolo(1)
youtube(1)
表格(1)
测试(1)
产品(1)
程序员(1)
代码质量(1)
地图(1)
动画(1)
翻译(1)
服务(1)
后端(1)
基础(1)
技巧(1)
计算机科学(1)
计算机视觉(1)
解决方案(1)
科技(1)
可视化(1)
连接(1)
面试(1)
苹果(1)
设计(1)
统计(1)
图表(1)
压缩(1)
研发(1)
异常(1)
重构(1)
图像分割(1)
LLM(1)
搜索文章
搜索
搜索
关闭
苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?
产品
苹果
机器人
汽车
next
苹果公司的电动汽车项目在今年二月份取消了,他们还决定放弃为 Apple Watch 自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外,混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下,苹果面临着巨大的收入压力。
公众号-arXiv每日学术速递
2024-04-11
110
0
MinkUNeXt诞生 | UNet结合Transformer,再进行GeM广义均值池化,复杂问题简单化,性能SOTA
数据
网络
性能
架构
模型
在许多应用中,移动机器人必须在特定的环境中执行自主导航。在移动过程中,机器人应能够识别或区分环境中的不同区域。这个行为相当于在其当前的传感器观测与存储数据库的一部分之间找到对应关系。这种能力通常被称为地点识别。为了加快这一过程,作者们经常专注于通过不变描述子来描述环境的一些部分。通过这种方式,机器人应该能够通过在数据库中找到与其当前观测相关联的描述子最相似的描述子来识别环境的一部分。地点识别的概念在诸如定位、建图和导航等任务中至关重要。
公众号-arXiv每日学术速递
2024-04-11
103
0
量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!
性能
地图
数据
网络
系统
在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一,现有的算法在远距离范围下的感知表现依然较差。为此,我们提出了P-MapNet,其中的“P”强调我们专注于融合地图先验以提高模型性能。具体来说,我们利用了SDMap和HDMap中的先验信息:一方面,我们从OpenStreetMap中提取了弱对齐的SDMap数据,并将其编码为单独的条件分支输入。尽管改输入与实际HD Map存在弱对齐的问题,我们基于Cross-attention机制的架构能够自适应地关注SDMap骨架,并带来显著的性能提升;另一方面,我们提出了一种用MAE来捕捉HDMap的先验分布的refine模块,该模块有助于让生成的HD Map更符合实际Map的分布,有助于减小遮挡、伪影等影响。我们在nuScenes和Argoverse2数据集上进行了广泛的的实验。
公众号-arXiv每日学术速递
2024-04-11
148
0
211高校教授被质疑用 AI 写 SCI,还成功发表在影响因子6.2期刊上
效率
人工智能
工具
论文
数据
本文募格学术撰写。参考资料:潇湘晨报记者 孙庆云、学术会议资讯、募格学术此前报道等。
公众号-arXiv每日学术速递
2024-03-25
107
0
Science调查:家里太穷,读博更容易迷茫!
在知乎上有一个非常热门的提问:“为什么有的研究生导师喜欢问学生家境?是想了解什么?”
公众号-arXiv每日学术速递
2024-02-05
98
0
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
重构
程序员
代码质量
开发者
数据
最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。
公众号-arXiv每日学术速递
2024-02-05
125
0
Aim新大型视觉模型预训练 | 直接阐明了视觉特征的性能与模型容量和数据量都有关
数据
网络
性能
工作
模型
作者通过预先训练一个70亿参数的Aim模型在20亿图像上的结果来解释这些发现,该模型在ImageNet-1k上的性能达到84.0%,且Backbone网络保持冻结。 有趣的是,即使在这个规模上,作者并未观察到性能出现饱和的迹象,这表明Aim可能代表了一种新的大型视觉模型训练的前沿。Aim的预训练类似于LLMs的预训练,不需要任何针对图像的特定策略来在规模上稳定训练。
公众号-arXiv每日学术速递
2024-01-23
136
0
可体外杀死肿瘤细胞!北航团队《Small》发布铁磁流体机器人,用于窗口肿瘤光热治疗
机器人
开发
模型
数据
系统
得益于优异变形能力、可控性和驱动方式灵活性,可以在外部施加的磁场影响下实现精确形状改变的微型磁性软体机器人近年来已被开发用于诊断和治疗各种疾病。
公众号-arXiv每日学术速递
2024-01-23
178
0
颠覆认知:1升瓶装水,竟有24万个塑料颗粒
系统
数据分析
测试
论文
统计
已有研究证实,从一次性纸杯、塑料奶瓶,到人类母乳、人类胎盘,再到北极、珠穆朗玛峰,对人体有害的微塑料已经无处不在。
公众号-arXiv每日学术速递
2024-01-12
100
0
北京大学 | 联合篡改定位和版权保护的多功能图像水印
安全
编码
框架
模型
网络
本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ,联合篡改定位和版权保护的多功能图像水印研究。
公众号-arXiv每日学术速递
2023-12-28
131
0
word2vec作者爆料:seq2seq是我的想法、GloVe抄袭技巧,反击来了
word2vec
翻译
技巧
论文
数据
随着 NeurIPS 2023 获奖论文的公布,十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Compositionality」由当时都还在谷歌的 Tomas Mikolov、Ilya Sutskever、Kai Chen、Greg Corrado、Jeffrey Dean 撰写。
公众号-arXiv每日学术速递
2023-12-21
163
0
Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了
keras
pytorch
后端
开发者
模型
经过5个月的公开Beta测试,深度学习框架Keras 3.0终于面向所有开发者推出。
公众号-arXiv每日学术速递
2023-11-30
206
0
医疗版SAM开源!医学影像的通用分割模型来了!
医疗
开源
论文
模型
性能
医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒,随着近期SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域,各式通用医学图像分割模型也随之涌现。
公众号-arXiv每日学术速递
2023-11-15
512
0
arXiv每日学术速递2023.11.15
金融
cs
数学
系统
音频
计算机视觉与模式识别(cs.CV) | 自然语言处理(cs.CL) | 人工智能(cs.AI) | 机器学习(cs.LG) | 机器人相关(cs.RO) | 语音/音频处理(cs.SD/eess.AS)
公众号-arXiv每日学术速递
2023-11-15
241
0
大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难
量化
模型
性能
压缩
LLM
来自Transformer家族的预训练生成模型,通常被称为GPT或OPT,已经在复杂语言建模任务中取得了突破性的性能,引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本,这些成本在已知模型中排名最高。例如,性能最好的模型变种,例如GPT3-175B,具有约1750亿参数,需要数十到数百个GPU年进行训练。甚至在作者本文中,对预训练模型进行推理的更简单任务也非常具有挑战性:例如,以紧凑的FP16格式存储时,GPT3-175B的参数占用326GB的内存。这超出了甚至最高端的单个GPU的容量,因此推理必须使用更复杂和昂贵的设置,如多GPU部署。
公众号-arXiv每日学术速递
2023-11-15
823
0
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
渲染
编码
框架
模型
数据
前者使用文本的字符、位置和掩码图像等输入来为文本生成或编辑生成潜在特征。后者采用OCR模型将笔划数据编码为嵌入,与来自分词器的图像描述嵌入相结合,以生成与背景无缝融合的文本。作者在训练中采用了文本控制扩散损失和文本感知损失,以进一步提高写作准确性。据作者所知,AnyText是第一个解决多语言视觉文本生成的工作。 值得一提的是,AnyText可以与社区现有的扩散模型相结合,用于准确地渲染或编辑文本。经过广泛的评估实验,作者的方法在明显程度上优于其他所有方法。 此外,作者还贡献了第一个大规模的多语言文本图像数据集AnyWord-3M,该数据集包含300万个图像-文本对,并带有多种语言的OCR注释。基于AnyWord-3M数据集,作者提出了AnyText-benchmark,用于评估视觉文本生成准确性和质量。 代码:https://github.com/tyxsspa/AnyText
公众号-arXiv每日学术速递
2023-11-15
632
0
北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!
框架
视频
数据
腾讯
音频
北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!
公众号-arXiv每日学术速递
2023-11-14
500
0
诺奖闹乌龙!3位得主提前揭晓,炫彩「量子点」摘桂冠
工作
科技
论文
模型
性能
今年,MIT的Moungi G. Bawendi、哥伦比亚大学的Louis E. Brus,以及纳米晶体科技公司Alexey I. Ekimov共同拿下大奖。
公众号-arXiv每日学术速递
2023-10-06
193
0
Chinchilla之死:只要训练足够长时间,小模型也能超过大模型
论文
模型
数据
图表
效率
2022 年 3 月,DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论:大模型存在训练不足的缺陷,模型大小和训练 token 的数量应该以相等的比例扩展。也就是说模型越大,所使用的训练 token 也应该越多。
公众号-arXiv每日学术速递
2023-10-06
281
0
以3D视角洞悉矩阵乘法,这就是AI思考的样子
动画
工具
可视化
论文
模型
如果能以 3D 方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。
公众号-arXiv每日学术速递
2023-10-06
283
0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档