腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

arXiv每日学术速递

专栏作者

513

文章

383992

阅读量

61

订阅数

苹果终止电车项目后大裁员，押注家用机器人，这会是Next Big Thing吗？

产品苹果机器人汽车 next

苹果公司的电动汽车项目在今年二月份取消了，他们还决定放弃为 Apple Watch 自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外，混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下，苹果面临着巨大的收入压力。

公众号-arXiv每日学术速递

2024-04-11

1050

MinkUNeXt诞生 | UNet结合Transformer，再进行GeM广义均值池化，复杂问题简单化，性能SOTA

数据网络性能架构模型

在许多应用中，移动机器人必须在特定的环境中执行自主导航。在移动过程中，机器人应能够识别或区分环境中的不同区域。这个行为相当于在其当前的传感器观测与存储数据库的一部分之间找到对应关系。这种能力通常被称为地点识别。为了加快这一过程，作者们经常专注于通过不变描述子来描述环境的一些部分。通过这种方式，机器人应该能够通过在数据库中找到与其当前观测相关联的描述子最相似的描述子来识别环境的一部分。地点识别的概念在诸如定位、建图和导航等任务中至关重要。

公众号-arXiv每日学术速递

2024-04-11

970

量产杀器！P-Mapnet：利用低精地图SDMap先验，建图性能暴力提升近20个点！

性能地图数据网络系统

在线HD Map生成算法是当前自动驾驶系统摆脱对高精地图依赖的方法之一，现有的算法在远距离范围下的感知表现依然较差。为此，我们提出了P-MapNet，其中的“P”强调我们专注于融合地图先验以提高模型性能。具体来说，我们利用了SDMap和HDMap中的先验信息：一方面，我们从OpenStreetMap中提取了弱对齐的SDMap数据，并将其编码为单独的条件分支输入。尽管改输入与实际HD Map存在弱对齐的问题，我们基于Cross-attention机制的架构能够自适应地关注SDMap骨架，并带来显著的性能提升；另一方面，我们提出了一种用MAE来捕捉HDMap的先验分布的refine模块，该模块有助于让生成的HD Map更符合实际Map的分布，有助于减小遮挡、伪影等影响。我们在nuScenes和Argoverse2数据集上进行了广泛的的实验。

公众号-arXiv每日学术速递

2024-04-11

1320

211高校教授被质疑用 AI 写 SCI，还成功发表在影响因子6.2期刊上

效率人工智能工具论文数据

本文募格学术撰写。参考资料：潇湘晨报记者孙庆云、学术会议资讯、募格学术此前报道等。

公众号-arXiv每日学术速递

2024-03-25

960

Science调查：家里太穷，读博更容易迷茫！

在知乎上有一个非常热门的提问：“为什么有的研究生导师喜欢问学生家境？是想了解什么？”

公众号-arXiv每日学术速递

2024-02-05

970

全球代码质量骤降，罪魁祸首竟是AI！1.53亿行代码深度分析报告出炉

重构程序员代码质量开发者数据

最近，GitClear发布的一项调查报告显示，用AI写代码，会让代码的质量和可维护性不断下降。

公众号-arXiv每日学术速递

2024-02-05

1150

Aim新大型视觉模型预训练 | 直接阐明了视觉特征的性能与模型容量和数据量都有关

数据网络性能工作模型

作者通过预先训练一个70亿参数的Aim模型在20亿图像上的结果来解释这些发现，该模型在ImageNet-1k上的性能达到84.0%，且Backbone网络保持冻结。有趣的是，即使在这个规模上，作者并未观察到性能出现饱和的迹象，这表明Aim可能代表了一种新的大型视觉模型训练的前沿。Aim的预训练类似于LLMs的预训练，不需要任何针对图像的特定策略来在规模上稳定训练。

公众号-arXiv每日学术速递

2024-01-23

1350

可体外杀死肿瘤细胞！北航团队《Small》发布铁磁流体机器人，用于窗口肿瘤光热治疗

机器人开发模型数据系统

得益于优异变形能力、可控性和驱动方式灵活性，可以在外部施加的磁场影响下实现精确形状改变的微型磁性软体机器人近年来已被开发用于诊断和治疗各种疾病。

公众号-arXiv每日学术速递

2024-01-23

1660

颠覆认知：1升瓶装水，竟有24万个塑料颗粒

系统数据分析测试论文统计

已有研究证实，从一次性纸杯、塑料奶瓶，到人类母乳、人类胎盘，再到北极、珠穆朗玛峰，对人体有害的微塑料已经无处不在。

公众号-arXiv每日学术速递

2024-01-12

990

北京大学 | 联合篡改定位和版权保护的多功能图像水印

安全编码框架模型网络

本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ，联合篡改定位和版权保护的多功能图像水印研究。

公众号-arXiv每日学术速递

2023-12-28

1260

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

word2vec 翻译技巧论文数据

随着 NeurIPS 2023 获奖论文的公布，十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Compositionality」由当时都还在谷歌的 Tomas Mikolov、Ilya Sutskever、Kai Chen、Greg Corrado、Jeffrey Dean 撰写。

公众号-arXiv每日学术速递

2023-12-21

1610

Keras 3.0一统江湖！大更新整合PyTorch、JAX，全球250万开发者在用了

keras pytorch 后端开发者模型

经过5个月的公开Beta测试，深度学习框架Keras 3.0终于面向所有开发者推出。

公众号-arXiv每日学术速递

2023-11-30

1990

医疗版SAM开源！医学影像的通用分割模型来了！

医疗开源论文模型性能

医学影像行业，一直以数据和高成本标注而筑起非常高的领域壁垒,随着近期SAM和SegGPT等通用的CV大模型的提出，大模型和通用模型这把火也逐渐烧到的CV领域，特别是图像分割领域，各式通用医学图像分割模型也随之涌现。

公众号-arXiv每日学术速递

2023-11-15

4950

arXiv每日学术速递2023.11.15

金融 cs 数学系统音频

计算机视觉与模式识别(cs.CV) | 自然语言处理(cs.CL) | 人工智能(cs.AI) | 机器学习(cs.LG) | 机器人相关(cs.RO) | 语音/音频处理(cs.SD/eess.AS)

公众号-arXiv每日学术速递

2023-11-15

2360

大模型落地的必经之路 | GPTQ加速LLM落地，让Transformer量化落地不再困难

量化模型性能压缩 LLM

来自Transformer家族的预训练生成模型，通常被称为GPT或OPT，已经在复杂语言建模任务中取得了突破性的性能，引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本，这些成本在已知模型中排名最高。例如，性能最好的模型变种，例如GPT3-175B，具有约1750亿参数，需要数十到数百个GPU年进行训练。甚至在作者本文中，对预训练模型进行推理的更简单任务也非常具有挑战性：例如，以紧凑的FP16格式存储时，GPT3-175B的参数占用326GB的内存。这超出了甚至最高端的单个GPU的容量，因此推理必须使用更复杂和昂贵的设置，如多GPU部署。

公众号-arXiv每日学术速递

2023-11-15

7910

文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题，完成视觉文本生成和编辑

渲染编码框架模型数据

前者使用文本的字符、位置和掩码图像等输入来为文本生成或编辑生成潜在特征。后者采用OCR模型将笔划数据编码为嵌入，与来自分词器的图像描述嵌入相结合，以生成与背景无缝融合的文本。作者在训练中采用了文本控制扩散损失和文本感知损失，以进一步提高写作准确性。据作者所知，AnyText是第一个解决多语言视觉文本生成的工作。值得一提的是，AnyText可以与社区现有的扩散模型相结合，用于准确地渲染或编辑文本。经过广泛的评估实验，作者的方法在明显程度上优于其他所有方法。此外，作者还贡献了第一个大规模的多语言文本图像数据集AnyWord-3M，该数据集包含300万个图像-文本对，并带有多种语言的OCR注释。基于AnyWord-3M数据集，作者提出了AnyText-benchmark，用于评估视觉文本生成准确性和质量。代码：https://github.com/tyxsspa/AnyText

公众号-arXiv每日学术速递

2023-11-15

6170

北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架，刷新多个榜单！

框架视频数据腾讯音频

北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架，刷新多个榜单！

公众号-arXiv每日学术速递

2023-11-14

4640

诺奖闹乌龙！3位得主提前揭晓，炫彩「量子点」摘桂冠

工作科技论文模型性能

今年，MIT的Moungi G. Bawendi、哥伦比亚大学的Louis E. Brus，以及纳米晶体科技公司Alexey I. Ekimov共同拿下大奖。

公众号-arXiv每日学术速递

2023-10-06

1910

Chinchilla之死：只要训练足够长时间，小模型也能超过大模型

论文模型数据图表效率

2022 年 3 月，DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论：大模型存在训练不足的缺陷，模型大小和训练 token 的数量应该以相等的比例扩展。也就是说模型越大，所使用的训练 token 也应该越多。

公众号-arXiv每日学术速递

2023-10-06

2740

以3D视角洞悉矩阵乘法，这就是AI思考的样子

动画工具可视化论文模型

如果能以 3D 方式展示矩阵乘法的执行过程，当年学习矩阵乘法时也就不会那么吃力了。

公众号-arXiv每日学术速递

2023-10-06

2800

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态