首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

2019年 10 精彩论文,哪篇论文打动了你?

除此之外,我们还准备了一篇「2019 年十新奇论文」,总结了这一年中尤其新颖有趣、甚至出格招致批评的论文。...这篇论文用了很巧妙的方法,一方面,作者们把 YouTube 上用户们自己上传的「时间静止」视频作为数据集,它们提供了海量的、天然的、带有人物的三维空间回放,经过传统方法还原之后就可以作为标注数据,免去了采集之苦...2019 ) https://arxiv.org/abs/1905.08743 面向任务的多轮对话系统通常会为不同的任务设计预定义的模版,但不同模版之间的数据共享、数据迁移是一难点。...也就是说,设计一个模型容易,但还要想办法确定是否已经训练够了。...论文发表在 Nature 杂志。 以上就是我们总结的十精彩学术论文(以及同样值得看看的另外十篇备选)。如果你有什么不同的见解,欢迎留言和我们讨论。

83330
您找到你想要的搜索结果了吗?
是的
没有找到

论文解读】多模态模型综述

一、简要介绍 多模态语言模型(MLLM)是近年来一个新兴的研究热点,它利用强大的语言模型(LLM)作为大脑进行多模态研究。...因此,论文对一个概念的说明也可能涉及到其他概念。 论文根据四个主要类别组织调查,并按顺序进行介绍。论文首先详细介绍了M-IT(3.1),以揭示LLM如何从两个方面来适应多模态:架构和数据。...然后构造剩余的内容,如图2所示:论文首先介绍M-IT数据的收集方式(3.1.4),然后详细讨论MLLM的模型自适应,即弥合不同模式之间差距的各种方法(3.1.5)。...论文依次说明这三种方法。 基准自适应(Benchmark Adaptation) 基准数据集是高质量数据的丰富来源。因此,大量的研究工作利用现有的基准数据集来构建指令格式的数据集。...论文提供了一个VQA数据集的指令模板示例,如表2所示。其他的工作是人工设计一些种子指令,并使用这些指令提示GPT生成更多内容。

22910

DOTA数据论文

Introduction1.1 区别航空图像区别于传统数据集,有其自己的特点,面临很大的数据集偏差问题,例如导致数据集的泛化能力差:尺度变化性更大(很好理解,如车辆和机场;而且很可能一张图就一个目标,...数据集包含2806张航空图像,尺寸大约为4kx4k,包含15个类别共计188282个实例。...下图是与NWPU数据集相比实例数目。可以看出这个的样本不均衡问题还是稍微好一点的。?标注方式 没有选择(x,y,w,h)和(x,y,w,h.θ),而是标记四个顶点八个坐标得到不规则四边形。...数据集划分 1/6验证集,1/3测试集,1/2训练集。目前发布了训练集和验证集,测试集不会发布。3....还有一个问题,就是DOTA数据集的尺寸太大了,普通检测网络输入会计算过慢,实际测试会进行图片的裁剪,得到1024*1024的patch,stride=512。

1.7K40

综述论文 | 多模态视觉模型

本文系统回顾了多模态LLMs中最新的视觉语言指令调优设置和数据集,并总结了高质量视觉语言调优数据应具备的特征。...将这些特征视为构建视觉语言指令数据的基本原则,并提出一个完整的构建流水线,包括数据收集、指令生成和质量控制模块,其中融入了精心设计的指令属性评估指标。...: A Comprehensive Survey on Multimodal Large Language Model https://arxiv.org/pdf/2311.07594.pdf 本综述论文探讨了多模态大型语言模型...本研究将MLLMs中现有的模态对齐方法分为四组进行调查:(1)多模态转换器,将数据转换为LLMs可以理解的形式;(2)多模态感知器,改进LLMs感知不同类型数据的能力;(3)工具辅助,将数据转换为一种常见格式...,通常是文本;(4)数据驱动方法,教导LLMs理解数据集中特定类型的数据

37810

德睿论文Bioinformatics | 生物数据挖掘领域的AI语言模型Benchmark研究

为此,本论文研究团队开发出一项全面的基准测试流程,以评估各种AI语言模型在生物医学数据挖掘上的性能。 研究应用 该基准测试流程已应用于「德睿智药」内部PharmKG平台中AI语言模型研发。...该模型主要用于生物医药数据的快速高质量提取,构建更高质量生物知识网络,以赋能靶点评估立项等新药研发关键流程。...4 结论 本研究构建了一项将AI语言模型应用于生物医学NLP任务的基准研究流程。实验数据显示,基于GPT-3.5构建的ChatGPT模型在一些生物医学NLP基准数据集上表现欠佳。...该基准研究有助于指导和优化AI语言模型研发流程,加速高质量的生物医药领域模型研发进展。...论文链接: https://doi.org/10.1093/bioinformatics/btad557 数据来源: https://microsoft.github.io/BLURB/index.html

26320

【arXiv】2015 深度学习年度十论文

重要的是,这种适应的计算可以用很少的代价在线进行,无需向后迭代全部数据。 Hugo的点评: 我觉得作者们准确无误地击中了在线学习面临的挑战。...我也非常喜欢他们在卷积神经网络中应用这种空间变换的想法,这也是那篇DRAW论文中所没有的。 对于这篇论文我实在挑不出什么问题,它太严谨了!...这与现在深度学习中的一种想法吻合:虽然深度学习领域最近应用于大体量已标记数据集的研究进展都不依赖于任何非监督式学习方法(不像深度学习2000年代中期“起步”的时候),半监督式环境下的非监督式学习可能才是最适合少量已标记数据数据集的方法...不幸的是,作者们提到了实验中有一个小问题:虽然训练时他们没有使用多少标记好的数据,模型选择时仍然用到了验证集中全部10k个标记。这当然是不够理想的。...Hugo的点评: 我是这篇文章的粉丝。它指出了现行序列预测模型的重要缺陷,而且最重要的是,它提供了一个简单却有效的解决方法。

62950

系统学习模型的20篇论文

在大型数据集上预训练的语言模型表现出了新兴能力,并在各种任务中表现良好,包括语言翻译、摘要、编码和问答。然而,如果想要提高Transformer在特定领域数据和专业任务上的能力,值得进行微调。...这篇论文也描述了ChatGPT背后思想,ChatGPT是InstructGPT的一个更大数据集微调的升级版。...哪种方法更有前途,是人类生成的指令数据集还是自我指导的数据集?可能两者都有前途。...结论与扩展阅读 模型的研究日新月异,这里重点关注语言模型的设计、约束和演变,包括前10篇论文(以及3篇关于RLHF的论文)。我们可以跟随上述论文中的参考文献进行更深入的学习。...机器学习与微分方程的浅析 神经网络中常见的激活函数 老码农眼中的模型(LLM) 《深入浅出Embedding》随笔 机器学习系统架构的10个要素 清单管理?

1.8K30

每日论文速递 | InterrogateLLM: 模型幻觉检测框架

深度学习自然语言处理 分享 整理:pp 摘要:尽管语言模型(LLMs)取得了许多进步,并以前所未有的速度迅速发展,但由于种种原因,它们对我们日常生活方方面面的影响和整合仍然有限。...论文提出了一种名为InterrogateLLM的新方法,用于检测LLMs生成的答案中的幻觉,并在多个数据集和LLMs上进行了广泛的评估,以证明该方法的有效性。 Q2: 有哪些相关研究?...实验评估:论文通过在多个数据集和LLMs上进行广泛的实验评估,来验证InterrogateLLM方法的有效性。实验结果表明,该方法能够有效地检测出幻觉,并在不同的数据集和模型上取得了较高的准确率。...为了解决这一问题,论文提出了以下主要内容: 问题背景:论文首先讨论了LLMs在日常生活中的广泛应用以及幻觉现象对这些模型可信度的影响。...总的来说,这篇论文为提高LLMs在实际应用中的可靠性提供了一种新的视角,并为未来的研究和开发工作奠定了基础。 以上内容均由KimiChat生成,深入了解论文内容仍需精读论文

11710

arXiv升级,论文网页版本直接看

机器之心报道 机器之心编辑部 很快就将扩展到所有论文。 今年 10 月,著名预印版论文平台 arXiv 宣布获得 1000 万元捐款,现在版本升级来了。...一直以来,arXiv 上论文的显示方式都以 pdf 格式为主,用户通常需要「下载 PDF(Download PDF)」来查看论文内容。...现在,arXiv 宣布为以 TeX/LaTeX 提交的所有论文生成 HTML 格式版本(要求论文是在 2023 年 12 月 1 日或之后提交的)。...论文提交者将被邀请在提交期间预览其论文的 HTML 版本,就像 PDF 版本一样。...目前,arXiv 提供 HTML 格式版本论文的功能仍处于实验测试阶段,并非所有论文都能正确转换为 HTML。研发团队正在努力使转换更加准确。

14310

模型时代,南周志华埋头做学件,最新论文上线

不仅如此,数据隐私和所有权问题也阻碍开发者之间共享经验,并限制了模型在很多数据敏感场景中的能力发挥。事实上,大多数研究分别针对这些问题开展,而大多数问题在实践中往往同时出现并相互影响。...另外,在自然语言处理和计算机视觉领域取得显著成就的主流模型发展范式也没有解决上述问题。...由于计划外任务和场景的无限性、环境的不断变化性、灾难性遗忘、极高的资源需求、隐私问题、本地化部署需求以及个性化和定制化的要求,为每个潜在的任务构建对应的模型显然不切实际。...相关论文已经公布,足足有 37 页。...论文标题:Beimingwu: A Learnware Dock System 论文地址:https://arxiv.org/pdf/2401.14427.pdf 北冥坞主页:https://bmwu.cloud

9210

发表论文不用愁,十技巧治秃头

STEP 3:分析好文章们是怎样炼成的 看论文不仅要看思想。 研究优秀论文的结构、表述方式,看看别人的摘要、介绍、结论都是怎么写的,这也是重要的学习过程。...扎实的工作是好论文的基础,但如何展示也是非常重要的一门学问。 STEP 4:选定合适期刊,深入了解它 选择一个合适的期刊,对于发表论文来说是最重要的决定之一。 ?...要知道,期刊可不仅仅是随机的论文集,其中的内容反映了当前编辑及其受众的观点和兴趣。...所以期刊论文都会对文章的创新性有所要求。 在论文当中,一定要把自己的创新点表达清楚。是你有新的观点?还是你的方法技术有独到之处?你的工作能进一步完善该领域的知识体系吗?...这些问题都将影响到你的论文能否见刊。 不要一稿多投,不要一稿多投,不要一稿多投。重要的事情说三遍。 STEP 10:保持耐心,贵在坚持 最后一步,或许有些老生常谈,但确实是发表论文的必学技能。

30510

9月型语言模型研究论文总结

本文总结9-10月期间发布了一些重要的LLM论文。 这些论文涵盖了一系列语言模型的主题,从模型优化和缩放到推理、基准测试和增强性能。最后部分讨论了有关安全训练并确保其行为保持有益的论文。...论文表明,优化响应长度是RLHF在这些设置中报告的改进背后的重要因素。他们研究了在三个开源的数据集上训练的奖励模型的奖励和长度之间的关系。...MathCoder模型在MATH(45.2%)和GSM8K(83.9%)数据集上获得了最先进的分数,大大优于其他开源替代方案。...论文提出了一个隐式自我完善(PIT)框架,该框架从人类偏好数据中隐式学习改进目标。PIT只需要用于训练奖励模型的偏好数据,而无需额外的人力。...在两个真实数据集和一个合成数据集上的实验表明,该方法明显优于基于提示的方法。

40821

数据机遇还是忽悠?

持反方观点,为技术时代的到来欢呼的,一位是北京大学光华管理学院新媒体营销研究中心副主任苏萌,另一位是日本政治家、内阁成员山本一太。...他提出“一台电脑论”,即科学家们研究所需的数据,最好用一台电脑就能装下,否则数据处理会过于繁琐,无助于解决问题。他结合自身经验说,随着数据量的增大,研究的准确性一开始会随之上升,但很快就会趋平。...这有三个原因:一是因为不同机构间的数据还未真正流动起来,目前还只是数据“孤岛”;二是完整的生态产业链还未形成,尽管通过行为数据分析已能够分辨出一个消费者的喜好,但从供应到购买的链条还没建成;三是因为数据分析人才仍然极度匮乏...一位听众挑战正方,说,你们认为大数据过于庞杂纷繁,反而解决不了问题,那是不是说,当处理数据的计算工具变得足够好时,大数据就会变得有用?...正如Howard在发表“失败感言”时所说,“我们并非反对数据,只是反对大而无当的数据数据本身当然非常重要”。人类已经并将继续产生日益庞大的数据,或许不论我们接受与否,大数据时代都已到来。

3.5K81

分析过688篇模型论文,这篇论文综述了LLM的当前挑战和应用

LLM 研究热的现状也在这篇综述论文的参考文献中得到了体现 —— 总共 22 页参考文献,引用了 688 篇论文!...论文:https://arxiv.org/abs/2307.10169 整体而言,这篇综述论文聚焦于两主题:(1) 挑战:哪些问题仍未解决?(2) 应用:LLM 当前的应用以及这些应用面临哪些挑战?...研究者声明,这篇论文梳理的内容带有个人倾向性,并且假定读者已经熟悉 LLM 的工作方式。此外,他们更关注基于文本数据训练的模型。...挑战 难以理解的数据集 对于 LLM 而言,其预训练数据集的规模非常,任何个人都无法彻底阅读其中的文档或评估这些文档的质量。...图 4:根据预训练目标进行自监督式的数据构建,来自 Tay et al. 微调开销 需要大量内存:对整个 LLM 进行微调时需要预训练时一样的内存,但很多从业者无法办到。

75450

4位咖Keynote、12篇论文分享,CVPR 2022论文分享会全日程来了

本次分享会设置了 Keynote、 论文分享、企业招聘等环节,就业内关注的 CV 热门主题邀请顶级专家、论文作者与观众做学术交流。...今日,「CVPR 2022线上论文分享会」全日程正式公布,欢迎大家线上学习。...遗憾的是,这些大规模 GAN 的创建和部署需要高性能计算平台和大型标注数据集。常用的数据集如 ImageNet 和 LSUN 等需要人工标注数百万张图片。...在本次演讲中,我将介绍两种数据高效的 GAN 训练技术可微数据增强以及集成现成的计算机视觉模型。总的来说,这两种方法使得我们只需一百张图片就能学习一个高质量的 GAN 模型。...他参与的作品曾获得过英伟达先锋研究奖和 SIGGRAPH 2019 实时直播秀的最佳表演奖和观众选择奖、入选了 Popular Science 颁发的 2019 年度百最伟大创新。

69840
领券