首页
学习
活动
专区
工具
TVP
发布

arXiv每日学术速递

专栏作者
509
文章
370826
阅读量
60
订阅数
Science调查:家里太穷,读博更容易迷茫!
在知乎上有一个非常热门的提问:“为什么有的研究生导师喜欢问学生家境?是想了解什么?”
公众号-arXiv每日学术速递
2024-02-05
930
全球代码质量骤降,罪魁祸首竟是AI!1.53亿行代码深度分析报告出炉
最近,GitClear发布的一项调查报告显示,用AI写代码,会让代码的质量和可维护性不断下降。
公众号-arXiv每日学术速递
2024-02-05
990
Aim新大型视觉模型预训练 | 直接阐明了视觉特征的性能与模型容量和数据量都有关
作者通过预先训练一个70亿参数的Aim模型在20亿图像上的结果来解释这些发现,该模型在ImageNet-1k上的性能达到84.0%,且Backbone网络保持冻结。 有趣的是,即使在这个规模上,作者并未观察到性能出现饱和的迹象,这表明Aim可能代表了一种新的大型视觉模型训练的前沿。Aim的预训练类似于LLMs的预训练,不需要任何针对图像的特定策略来在规模上稳定训练。
公众号-arXiv每日学术速递
2024-01-23
1290
可体外杀死肿瘤细胞!北航团队《Small》发布铁磁流体机器人,用于窗口肿瘤光热治疗
得益于优异变形能力、可控性和驱动方式灵活性,可以在外部施加的磁场影响下实现精确形状改变的微型磁性软体机器人近年来已被开发用于诊断和治疗各种疾病。
公众号-arXiv每日学术速递
2024-01-23
1360
颠覆认知:1升瓶装水,竟有24万个塑料颗粒
已有研究证实,从一次性纸杯、塑料奶瓶,到人类母乳、人类胎盘,再到北极、珠穆朗玛峰,对人体有害的微塑料已经无处不在。
公众号-arXiv每日学术速递
2024-01-12
900
北京大学 | 联合篡改定位和版权保护的多功能图像水印
本篇文章分享论文EditGuard: Versatile Image Watermarking for Tamper Localization and Copyright Protection ,联合篡改定位和版权保护的多功能图像水印研究。
公众号-arXiv每日学术速递
2023-12-28
1180
word2vec作者爆料:seq2seq是我的想法、GloVe抄袭技巧,反击来了
随着 NeurIPS 2023 获奖论文的公布,十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Representations of Words and Phrases and their Compositionality」由当时都还在谷歌的 Tomas Mikolov、Ilya Sutskever、Kai Chen、Greg Corrado、Jeffrey Dean 撰写。
公众号-arXiv每日学术速递
2023-12-21
1530
Keras 3.0一统江湖!大更新整合PyTorch、JAX,全球250万开发者在用了
经过5个月的公开Beta测试,深度学习框架Keras 3.0终于面向所有开发者推出。
公众号-arXiv每日学术速递
2023-11-30
1860
医疗版SAM开源!医学影像的通用分割模型来了!
医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒,随着近期SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域,各式通用医学图像分割模型也随之涌现。
公众号-arXiv每日学术速递
2023-11-15
4200
arXiv每日学术速递2023.11.15
计算机视觉与模式识别(cs.CV) | 自然语言处理(cs.CL) | 人工智能(cs.AI) | 机器学习(cs.LG) | 机器人相关(cs.RO) | 语音/音频处理(cs.SD/eess.AS)
公众号-arXiv每日学术速递
2023-11-15
2230
大模型落地的必经之路 | GPTQ加速LLM落地,让Transformer量化落地不再困难
来自Transformer家族的预训练生成模型,通常被称为GPT或OPT,已经在复杂语言建模任务中取得了突破性的性能,引起了广泛的学术和实际兴趣。它们的一个主要障碍是计算和存储成本,这些成本在已知模型中排名最高。例如,性能最好的模型变种,例如GPT3-175B,具有约1750亿参数,需要数十到数百个GPU年进行训练。甚至在作者本文中,对预训练模型进行推理的更简单任务也非常具有挑战性:例如,以紧凑的FP16格式存储时,GPT3-175B的参数占用326GB的内存。这超出了甚至最高端的单个GPU的容量,因此推理必须使用更复杂和昂贵的设置,如多GPU部署。
公众号-arXiv每日学术速递
2023-11-15
6900
文生图文字模糊怎么办 | AnyText解决文生图中文字模糊问题,完成视觉文本生成和编辑
前者使用文本的字符、位置和掩码图像等输入来为文本生成或编辑生成潜在特征。后者采用OCR模型将笔划数据编码为嵌入,与来自分词器的图像描述嵌入相结合,以生成与背景无缝融合的文本。作者在训练中采用了文本控制扩散损失和文本感知损失,以进一步提高写作准确性。据作者所知,AnyText是第一个解决多语言视觉文本生成的工作。 值得一提的是,AnyText可以与社区现有的扩散模型相结合,用于准确地渲染或编辑文本。经过广泛的评估实验,作者的方法在明显程度上优于其他所有方法。 此外,作者还贡献了第一个大规模的多语言文本图像数据集AnyWord-3M,该数据集包含300万个图像-文本对,并带有多种语言的OCR注释。基于AnyWord-3M数据集,作者提出了AnyText-benchmark,用于评估视觉文本生成准确性和质量。 代码:https://github.com/tyxsspa/AnyText
公众号-arXiv每日学术速递
2023-11-15
5450
北大联手腾讯提出LanguageBind  | 更直接的多模态对齐框架,刷新多个榜单!
北大联手腾讯提出LanguageBind | 更直接的多模态对齐框架,刷新多个榜单!
公众号-arXiv每日学术速递
2023-11-14
3460
诺奖闹乌龙!3位得主提前揭晓,炫彩「量子点」摘桂冠
今年,MIT的Moungi G. Bawendi、哥伦比亚大学的Louis E. Brus,以及纳米晶体科技公司Alexey I. Ekimov共同拿下大奖。
公众号-arXiv每日学术速递
2023-10-06
1880
Chinchilla之死:只要训练足够长时间,小模型也能超过大模型
2022 年 3 月,DeepMind 一篇论文《Training Compute-Optimal Large Language Models》通过构建的 Chinchilla 模型得出了一个结论:大模型存在训练不足的缺陷,模型大小和训练 token 的数量应该以相等的比例扩展。也就是说模型越大,所使用的训练 token 也应该越多。
公众号-arXiv每日学术速递
2023-10-06
2630
以3D视角洞悉矩阵乘法,这就是AI思考的样子
如果能以 3D 方式展示矩阵乘法的执行过程,当年学习矩阵乘法时也就不会那么吃力了。
公众号-arXiv每日学术速递
2023-10-06
2520
诺奖前夜,Nature发文ChatGPT终极预测!mRNA疫苗能否锁定大奖
Nature最新文章称,微调后的大模型,包括ChatGPT在内,都能大大增强预测诺奖得主的能力。
公众号-arXiv每日学术速递
2023-10-06
1550
姚期智领衔提出大模型「思维」框架!逻辑推理正确率达98%,思考方式更像人类了
不仅要让大模型一步步推理,还要让它们学会“步步为营”,记住推理中间的所有正确过程。
公众号-arXiv每日学术速递
2023-09-29
3210
ICCV23|速度提高 500 倍,让 Encoder 在 3D gan Inversion 中大显身手!
本文介绍了一种基于 EG3D的新颖的基于编码器的反演框架,利用 EG3D 潜在空间的固有属性来设计鉴别器和背景深度正则化,能够训练一个几何感知编码器,将输入图像转换为相应的潜在代码。本文方法取得了与基于优化的方法相当的令人印象深刻的结果,同时运行速度提高了 500 倍。
公众号-arXiv每日学术速递
2023-09-21
3780
高校副教授因职称晋升失败在实验室自缢身亡,残酷的非升即走!
据中国台湾当地媒体《联合新闻网》报道,张副教授留下遗书表示,因教职工作学术升等压力太大,加上身体健康亮红灯,自觉生无可恋。
公众号-arXiv每日学术速递
2023-09-21
2060
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档