首页
学习
活动
专区
工具
TVP
发布

arXiv每日学术速递

专栏作者
513
文章
383992
阅读量
61
订阅数
苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?
苹果公司的电动汽车项目在今年二月份取消了,他们还决定放弃为 Apple Watch 自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外,混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下,苹果面临着巨大的收入压力。
公众号-arXiv每日学术速递
2024-04-11
1050
MinkUNeXt诞生 | UNet结合Transformer,再进行GeM广义均值池化,复杂问题简单化,性能SOTA
在许多应用中,移动机器人必须在特定的环境中执行自主导航。在移动过程中,机器人应能够识别或区分环境中的不同区域。这个行为相当于在其当前的传感器观测与存储数据库的一部分之间找到对应关系。这种能力通常被称为地点识别。为了加快这一过程,作者们经常专注于通过不变描述子来描述环境的一些部分。通过这种方式,机器人应该能够通过在数据库中找到与其当前观测相关联的描述子最相似的描述子来识别环境的一部分。地点识别的概念在诸如定位、建图和导航等任务中至关重要。
公众号-arXiv每日学术速递
2024-04-11
970
量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!
在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一,现有的算法在远距离范围下的感知表现依然较差。为此,我们提出了P-MapNet,其中的“P”强调我们专注于融合地图先验以提高模型性能。具体来说,我们利用了SDMap和HDMap中的先验信息:一方面,我们从OpenStreetMap中提取了弱对齐的SDMap数据,并将其编码为单独的条件分支输入。尽管改输入与实际HD Map存在弱对齐的问题,我们基于Cross-attention机制的架构能够自适应地关注SDMap骨架,并带来显著的性能提升;另一方面,我们提出了一种用MAE来捕捉HDMap的先验分布的refine模块,该模块有助于让生成的HD Map更符合实际Map的分布,有助于减小遮挡、伪影等影响。我们在nuScenes和Argoverse2数据集上进行了广泛的的实验。
公众号-arXiv每日学术速递
2024-04-11
1320
211高校教授被质疑用 AI 写 SCI,还成功发表在影响因子6.2期刊上
本文募格学术撰写。参考资料:潇湘晨报记者 孙庆云、学术会议资讯、募格学术此前报道等。
公众号-arXiv每日学术速递
2024-03-25
960
Science调查:家里太穷,读博更容易迷茫!
在知乎上有一个非常热门的提问:“为什么有的研究生导师喜欢问学生家境?是想了解什么?”
公众号-arXiv每日学术速递
2024-02-05
970
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。
公众号-arXiv每日学术速递
2024-02-05
1150
Aim新大型视觉模型预训练 | 直接阐明了视觉特征的性能与模型容量和数据量都有关
作者通过预先训练一个70亿参数的Aim模型在20亿图像上的结果来解释这些发现,该模型在ImageNet-1k上的性能达到84.0%,且Backbone网络保持冻结。 有趣的是,即使在这个规模上,作者并未观察到性能出现饱和的迹象,这表明Aim可能代表了一种新的大型视觉模型训练的前沿。Aim的预训练类似于LLMs的预训练,不需要任何针对图像的特定策略来在规模上稳定训练。
公众号-arXiv每日学术速递
2024-01-23
1350
可体外杀死肿瘤细胞!北航团队《Small》发布铁磁流体机器人,用于窗口肿瘤光热治疗
得益于优异变形能力、可控性和驱动方式灵活性,可以在外部施加的磁场影响下实现精确形状改变的微型磁性软体机器人近年来已被开发用于诊断和治疗各种疾病。
公众号-arXiv每日学术速递
2024-01-23
1660
颠覆认知:1升瓶装水,竟有24万个塑料颗粒
已有研究证实,从一次性纸杯、塑料奶瓶,到人类母乳、人类胎盘,再到北极、珠穆朗玛峰,对人体有害的微塑料已经无处不在。
公众号-arXiv每日学术速递
2024-01-12
990
北京大学 | 联合篡改定位和版权保护的多功能图像水印
本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ,联合篡改定位和版权保护的多功能图像水印研究。
公众号-arXiv每日学术速递
2023-12-28
1260
word2vec作者爆料:seq2seq是我的想法、GloVe抄袭技巧,反击来了
随着 NeurIPS 2023 获奖论文的公布,十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Compositionality」由当时都还在谷歌的 Tomas Mikolov、Ilya Sutskever、Kai Chen、Greg Corrado、Jeffrey Dean 撰写。
公众号-arXiv每日学术速递
2023-12-21
1610
Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了
经过5个月的公开Beta测试,深度学习框架Keras 3.0终于面向所有开发者推出。
公众号-arXiv每日学术速递
2023-11-30
1990
医疗版SAM开源!医学影像的通用分割模型来了!
医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒,随着近期SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域,各式通用医学图像分割模型也随之涌现。
公众号-arXiv每日学术速递
2023-11-15
4950
arXiv每日学术速递2023.11.15
计算机视觉与模式识别(cs.CV) | 自然语言处理(cs.CL) | 人工智能(cs.AI) | 机器学习(cs.LG) | 机器人相关(cs.RO) | 语音/音频处理(cs.SD/eess.AS)
公众号-arXiv每日学术速递
2023-11-15
2360
大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难
来自Transformer家族的预训练生成模型,通常被称为GPT或OPT,已经在复杂语言建模任务中取得了突破性的性能,引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本,这些成本在已知模型中排名最高。例如,性能最好的模型变种,例如GPT3-175B,具有约1750亿参数,需要数十到数百个GPU年进行训练。甚至在作者本文中,对预训练模型进行推理的更简单任务也非常具有挑战性:例如,以紧凑的FP16格式存储时,GPT3-175B的参数占用326GB的内存。这超出了甚至最高端的单个GPU的容量,因此推理必须使用更复杂和昂贵的设置,如多GPU部署。
公众号-arXiv每日学术速递
2023-11-15
7910
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
前者使用文本的字符、位置和掩码图像等输入来为文本生成或编辑生成潜在特征。后者采用OCR模型将笔划数据编码为嵌入,与来自分词器的图像描述嵌入相结合,以生成与背景无缝融合的文本。作者在训练中采用了文本控制扩散损失和文本感知损失,以进一步提高写作准确性。据作者所知,AnyText是第一个解决多语言视觉文本生成的工作。 值得一提的是,AnyText可以与社区现有的扩散模型相结合,用于准确地渲染或编辑文本。经过广泛的评估实验,作者的方法在明显程度上优于其他所有方法。 此外,作者还贡献了第一个大规模的多语言文本图像数据集AnyWord-3M,该数据集包含300万个图像-文本对,并带有多种语言的OCR注释。基于AnyWord-3M数据集,作者提出了AnyText-benchmark,用于评估视觉文本生成准确性和质量。 代码:https://github.com/tyxsspa/AnyText
公众号-arXiv每日学术速递
2023-11-15
6170
北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!
北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!
公众号-arXiv每日学术速递
2023-11-14
4640
诺奖闹乌龙!3位得主提前揭晓,炫彩「量子点」摘桂冠
今年,MIT的Moungi G. Bawendi、哥伦比亚大学的Louis E. Brus,以及纳米晶体科技公司Alexey I. Ekimov共同拿下大奖。
公众号-arXiv每日学术速递
2023-10-06
1910
Chinchilla之死:只要训练足够长时间,小模型也能超过大模型
2022 年 3 月,DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论:大模型存在训练不足的缺陷,模型大小和训练 token 的数量应该以相等的比例扩展。也就是说模型越大,所使用的训练 token 也应该越多。
公众号-arXiv每日学术速递
2023-10-06
2740
以3D视角洞悉矩阵乘法,这就是AI思考的样子
如果能以 3D 方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。
公众号-arXiv每日学术速递
2023-10-06
2800
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档