自然语言处理(NLP)论文速递

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

如何运用「云、端融合的数智化安全体系」高效护航数据安全

左手AI，右手安全 —— 一汽丰田数字化转型之路

OpenAI 的 Sora、Stability AI 的 Stable Video Diffusion 以及许多其他已经发布或未来将出现的文本生成视频模型，是继大语言模型 (LLM) 之后 2024 年最流行的 AI 趋势之一。

模型实操 | 从零开始，用英伟达T4、A10训练小型文生视频模型

本⽂介绍由清华等⾼校联合推出的⾸个开源的⼤模型⽔印⼯具包 MarkLLM。MarkLLM 提供了统⼀的⼤模型⽔印算法实现框架、直观的⽔印算法机制可视化⽅案以及系统性的评估模块，旨在⽀持研究⼈员⽅便地实验、理解和评估最新的⽔印技术进展。通过 MarkLLM，作者期望在给研究者提供便利的同时加深公众对⼤模型⽔印技术的认知，推动该领域的共识形成，进⽽促进相关研究的发展和推⼴应⽤。 

清华等| 推出首个开源大模型水印工具包：MarkLLM，10种水印算法

随着ChatGPT的发布，大语言模型的关注度和数量都在不断上升,它引领了人类进入了大模型时代，并且随着一轮一轮的迭代，最新模型已经进化到了GPT-4o。在众多大语言模型中，GPT系列因其代表性而备受关注，其发展历程和技术革新值得深入探讨。那么今天带大家回顾一下近年来GPT系列模型的发展。【参考中国人民大学《大语言模型》】

长文梳理！近年来GPT系列模型的发展历史：从GPT-1到GPT-4o（前世、今生）

对于非结构化文本，大模型 (LLM) 比较擅长回答简单（单跳）问题。然而，随着问题的复杂性增加，LLM 的性能会下降。本文作者认为其主要原因是，大模型在理解复杂问题和从原始文本中筛选、聚合非结构化信息过程中出现了性能问题。

ACL 2024 | 构建超关系知识图谱（KG），增强大模型多跳/Multi-hop QA问答能力！

面对快速生成的新知识，大模型存储的预训练知识往往具有滞后性。为了能够让大模型具备最新的知识，当前主要方法是对新的知识文档进行持续预训练，然而LLM在文档中提取知识时，往往会面临困难。

港大&腾讯 | 提出SELF-TUNING学习框架，让LLM自学获取新知识，表现出色！

LLM-based Agent，已经不再需要人类监督者的帮助，开始实现「自我进化」！

复旦 | 推出通用大模型Agent平台：AgentGym，提供一条龙服务！

数字化时代，大模型以其卓越的数据处理和智能决策能力，当前应用已经渗透至了各行各业。那么，今天给大家盘点了几个比较有趣的大模型（LLMs）应用场景，其中主要包括招聘面试、代码精细化、物联网感知、金融决策、战术分析、假新闻检测、检索QA问答等。这些有趣的应用不仅展现了大模型的多面性，更预示着人工智能在未来社会中的无限可能。本文论文获取，回复：LLM场景 

分享几个有趣的大模型（LLMs）应用场景，涉及金融分析、物联网、招聘、战术分析等

Transformer模型虽然在NLP领域取得了巨大成功，但其Self-Attention机制在处理长序列时会导致计算和内存需求急剧增加，这限制了其在资源受限环境中的实用性。为此，本文作者提出了Block Transformer架构，通过分层的全局到局部建模方法，有效地平衡了全局上下文的捕获和局部依赖关系，减少了推理过程中的内存访问和计算需求，从而实现了高效的语言模型推理。实验结果表明，与一般的Transformer相比，在推理吐量上最高可实现了20倍的增益。

KAIST-AI | 提出Block Transformer架构，大幅提升推理速度和内存效率，20倍增益！

Attention机制是大模型的核心组件，但该机制并不包含顺序信息，需要进行位置编码。当前位置编码（PE）主要是通过Token计数来定位，这限制了其泛化能力。例如无法针对特定的句子、名词进行定位。以下是在Kimi上测试结果，明显统计错误！

Meta| 提出上下文位置编码：CoPE，解决当前模型「普遍存在的问题」，含GPT-4o！

随着大模型应用的不断推广，面对不同应用场景模型的定制化需求也不断增涨。但参数高效微调 (PEFT) 方法，比如LoRA及其变体会产生大量的参数存储和传输成本。为此，本文提出了一种超级参数高效微调方法：VB-LoRA，该方法采用“分而共享（divide-and-share）”范式，通过向量库进行全局参数共享，在保证模型性能的同时，实现了极高的参数效率。在对 Llama2-13B 模型进行微调时，VB-LoRA 仅使用了 LoRA 存储参数的 0.4%就超过了LoRA微调效果，可见实力强悍。

恐怖如斯！GSU | 提出VB-LoRA，仅需LoRA参数的0.4%，就超越了LoRA微调效果

在大模型实际部署落地的过程中，如何赋予大模型持续学习的能力是一个至关重要的挑战。这使其能够动态适应新的任务并不断获得新的知识。大模型的持续学习主要面临两个重大挑战，分别是灾难性遗忘和知识迁移。灾难性遗忘是指模型在学习新任务时，会忘记其已掌握的旧任务。知识迁移则涉及到如何在学习新任务时有效地应用旧任务的知识来提升新任务学习的效果。【作者主页：https://circle-hit.github.io】

哈工大 | 提出共享Attention框架：SAPT，提升LLM持续学习性能

大模型训练需要高质量数据集，这对于代码生成任务来说尤其重要。为此本文提出了一种新型大规模代码指令数据集标注方法：AIEV-INSTRUCT，得到了一个高质量代码指令数据集：AutoCoder-AIEV-Instruct，基于该数据集，作者训练了代码生成大模型：AutoCoder，该模型在HE基准测试集上的pass@1指标超过了GPT-4 Turbo和GPT-4o，并且还提供了一个可自动安装外部依赖包的代码解释器。

牛叉！UConn | 提出代码生成大模型：AutoCoder，性能超越GPT-4o！

在当今快速发展的金融领域，数据分析和决策制定的重要性日益凸显。随着人工智能技术的不断进步，尤其是大模型（LLMs）的出现，金融专业人士和普通用户都面临着一个共同的挑战：如何有效地利用这些先进的技术来提高分析的准确性和决策的质量。

开源金融领域AI Agent平台：FinRobot，利用多源LLMs进行高级金融分析、市场预测

在 CV 领域，研究者一直把李飞飞等人创建的 ImageNet 奉为模型在下游视觉任务中能力的试金石。

细数：大模型评估基准的「七宗罪」

键值 (KV) 缓存能够显著提升Transformer大模型的解码速度。但是当面对长序列的时候，键值 (KV) 缓存需要大量的内存资源。当前减少键值 (KV) 缓存的两个主要方法分别为：Multi-Query Attention(MQA)和Grouped-Query Attention (GQA)。这两种方法主要是修改了Attention块，使得多头请求头共享单个KV头，从而大大减少了不同KV的数量。

麻省理工(MIT) | 提出跨层Attention，减少Transformer大模型键值(KV)缓存，加快LLM推理！

手语对于听障人士的交流至关重要。然而，手语数据的获取和处理非常复杂，这限制了手语生成模型的发展。为推动手语生成领域的发展，本文作者提出了一个多语种手语数据集Prompt2Sign，并以此训练了手语生成大模型：SignLLM，该模型可并行生成多种手语，同时理解复杂自然语言输入。实验结果表明，SignLLM在8种手语的SLP任务上达到了最先进的性能，展示了其在多语种手语生成上的强大实力。

RU | 提出手语生成大模型：SignLLM，支持8种手语生成，且均达到SOTA！

本文深入探讨了当前主流大模型高效微调方法——低秩适应（LoRA）。在代码编程、数学推理两个领域，对比了LoRA和全微调在不同数据规模下的性能。结果表明：LoRA在大多数情况下性能不如全微调，但作为一种正则化手段，LoRA能够保证在源领域上的性能（遗忘问题），并减少对新任务的学习成本。最后作者还给出了使用LoRA的最佳实践，来方便大家更有效地利用LoRA进行大模型微调。

学的少，忘的少！UC | LoRA最新研究：总结LoRA最佳实践，实现LLMs高效微调！

5 月 14 日，腾讯宣布旗下混元文生图大模型全面升级并全面开源，目前已在 Hugging Face 平台及 GitHub 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

全面开源，免费商用！腾讯| 发布混元文生图大模型，采用业内首个中文原生DiT架构！

大模型（LLM）主要依赖于分词器（Tokenizer ）将文本转换为Tokens，目前主流开源大模型基本上都是基于英文数据集训练得到的，然而，此类模型当处理其它语言时效率会降低。为此，为了能够将原始 LM 分词器替换为任意分词器，而不会降低性能，本文作者定义了一个新挑战：零样本分词器迁移(ZeTT，Zero-Shot Tokenizer Transfer），训练了一个适配各种模型的超网络（Hypernetwork），解耦LLM分词器(Tokenizer)，增强LLM跨语言处理性，实验表明：在跨语言和编码任务上可媲美原始模型。

剑桥 | 提出Hypernetwork，解耦LLMs分词器(Tokenizer)，提高LLMs跨语言处理性能！

大模型数学推理评测基本上都绕不开GSM8k测试基准，当前很多大模型在该数据集上都展现出较强的性能。然而，本文作者怀疑此类模型在训练过程种可能包含了与测试题目相似的问题，而不是模型真正具备推理能力。

数据污染迫在眉睫！GSM8k测试基准 将不再可靠，Mistral、Phi等系列模型出现过拟合！

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了自然语言处理(NLP)论文速递专栏，为你提供了自然语言处理(NLP)论文速递的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐