腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
深度学习自然语言处理
专栏成员
举报
1035
文章
1349030
阅读量
164
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
NLP 服务(293)
深度学习(232)
神经网络(222)
机器学习(207)
模型(190)
编程算法(181)
人工智能(135)
数据(128)
https(122)
网络安全(96)
论文(84)
性能(83)
其他(60)
python(43)
开源(43)
LLM(39)
测试(37)
linux(36)
github(34)
机器翻译(33)
腾讯云开发者社区(31)
知识图谱(29)
监督学习(28)
框架(28)
批量计算(26)
git(24)
强化学习(23)
数据结构(23)
优化(22)
系统(21)
pytorch(20)
http(19)
卷积神经网络(19)
tcp/ip(19)
css(18)
工作(18)
决策树(17)
图像处理(15)
数据分析(15)
ide(14)
迁移学习(14)
设计(14)
大数据(13)
nlp(13)
基础(12)
架构(12)
内存(12)
微信(11)
chatgpt(11)
token(11)
数学(11)
html(10)
图像识别(10)
学习方法(10)
gpt(10)
函数(10)
算法(10)
腾讯云测试服务(9)
LoRa(9)
云直播(8)
游戏(8)
编码(8)
代理(8)
工具(8)
tensorflow(7)
数据库(7)
网站(7)
推荐系统(7)
无监督学习(7)
机器人(7)
量化(7)
搜索(7)
网络(7)
效率(7)
sql(6)
缓存(6)
正则表达式(6)
教育(6)
agent(6)
视频(6)
语音识别(5)
数据挖掘(5)
go(5)
node.js(5)
apache(5)
文件存储(5)
processing(5)
meta(5)
openai(5)
word(5)
区块链(4)
bash(4)
api(4)
unix(4)
医疗(4)
存储(4)
nat(4)
nest(4)
data(4)
embedding(4)
function(4)
prompt(4)
self(4)
部署(4)
排序(4)
压缩(4)
自然语言处理(4)
java(3)
.net(3)
硬件开发(3)
搜索引擎(3)
bash 指令(3)
电商(3)
分布式(3)
自动化(3)
shell(3)
spark(3)
gui(3)
线性回归(3)
keras(3)
grep(3)
安全(3)
数据处理(3)
windows(3)
架构设计(3)
迁移(3)
联邦学习(3)
ls(3)
lstm(3)
memory(3)
model(3)
程序(3)
翻译(3)
华为(3)
解决方案(3)
路由(3)
苹果(3)
索引(3)
图表(3)
语法(3)
人脸识别(2)
官方文档(2)
数字货币(2)
自动驾驶(2)
javascript(2)
jquery ui(2)
android(2)
NAT 网关(2)
大数据处理套件 TBDS(2)
企业(2)
爬虫(2)
无人驾驶(2)
numpy(2)
信息流(2)
云计算(2)
对话机器人(2)
特征工程(2)
聚类算法(2)
隐私计算(2)
智能客服机器人(2)
entity(2)
error(2)
label(2)
mean(2)
network(2)
object(2)
sample(2)
sequence(2)
target(2)
tree(2)
变量(2)
服务(2)
集合(2)
技巧(2)
入门(2)
实践(2)
事件(2)
统计(2)
音频(2)
费用中心(1)
云点播(1)
对象存储(1)
负载均衡(1)
腾讯云学堂(1)
c 语言(1)
c++(1)
perl(1)
lua(1)
scala(1)
r 语言(1)
react(1)
json(1)
ajax(1)
oracle(1)
打包(1)
matlab(1)
中文分词(1)
apt-get(1)
mapreduce(1)
黑石物理服务器(1)
短视频(1)
访问管理(1)
SSL 证书(1)
数据加密服务(1)
文字识别(1)
内容理解(1)
金融(1)
kubernetes(1)
ssh(1)
面向对象编程(1)
opencv(1)
unity(1)
自动化测试(1)
二叉树(1)
单元测试(1)
kernel(1)
scikit-learn(1)
模式识别(1)
物联网(1)
微服务(1)
raft(1)
云课堂(1)
智能音乐(1)
基础教育(1)
alarm(1)
analysis(1)
apple(1)
bat(1)
behavior(1)
bit(1)
blender(1)
branch(1)
cat(1)
chat(1)
com(1)
decode(1)
distance(1)
dst(1)
encoding(1)
eval(1)
fixed(1)
glm(1)
google(1)
graph(1)
hidden(1)
history(1)
input(1)
it(1)
jupyter(1)
kaggle(1)
layer(1)
lift(1)
lisp(1)
lm(1)
marker(1)
microsoft(1)
modeling(1)
models(1)
next(1)
pdf(1)
perfect(1)
pivot(1)
plot(1)
position(1)
prediction(1)
ps(1)
random(1)
ssm(1)
state(1)
table(1)
tabular(1)
text(1)
title(1)
torch(1)
translation(1)
twitter(1)
video(1)
vr(1)
youtube(1)
编程(1)
表格(1)
并发(1)
程序设计(1)
创业(1)
动画(1)
二维码(1)
工程师(1)
公众号(1)
工作流(1)
行业(1)
集群(1)
兼容性(1)
接口(1)
开发(1)
开发者(1)
科技(1)
可视化(1)
连接(1)
漏洞(1)
面试(1)
配置(1)
数据存储(1)
数据科学(1)
思维导图(1)
通信(1)
协议(1)
研发(1)
异常(1)
语音(1)
重构(1)
城市交通(1)
搜索文章
搜索
搜索
关闭
BERT的逆袭:揭秘如何在无需额外训练下释放语言模型的生成能力
工作
论文
模型
机器翻译
存储
文章探讨了掩码语言模型(MLMs,例如BERT和DeBERTa)在上下文学习(in-context learning)方面的能力,挑战了普遍观点,即这种能力在这些模型中不会“显现”。作者意图证明,即使没有额外的训练,MLMs也能够展现出与著名的GPT-3相当的生成能力。
zenRRan
2024-06-18
155
0
上下文学习和指令微调之间到底有什么关系?
机器翻译
监督学习
it
基础
模型
上下文学习(ICL)和指令调优(IT)是将大型语言模型(LLM)应用于下游应用的两种主要范式。ICL推理时提供了一组示例(demonstrations),但LLM的参数没有更新。而IT的示例用于在训练时调整LLM的参数,但在推理时没有使用。虽然越来越多的文献探讨了ICL和IT,但这两种范式之间仍然是脱节的。本文通过研究LLM的隐藏状态在这两种范式中如何变化,来探索ICL和IT之间的关系。
zenRRan
2023-11-23
749
0
开源数据 | X-RiSAWOZ: 高质量端到端多语言任务型对话数据集
机器翻译
开源
翻译
数据
系统
X-RiSAWOZ: High-Quality End-to-End Multilingual Dialogue Datasets and Few-shot Agents
zenRRan
2023-08-22
468
0
ACMMM 2022 | 首个针对跨语言跨模态检索的噪声鲁棒研究工作
机器翻译
虽然目前传统的跨模态检索工作已取得了巨大的进展,但由于缺少低资源语言的标注数据,这些工作通常关注于高资源语言(比如英语),因此极大地限制了低资源语言在该领域的发展。为了解决这一问题,作者针对跨语言跨模态检索任务(CCR)展开了研究,该任务旨在仅使用人工标注的视觉-源语言(如英语)语料库对模型进行训练,使其可以适用于其他目标语言(非英语)进行评估【如下图所示】。
zenRRan
2023-01-07
727
0
CCMT讲习班 | NLP中的神经网络设计与学习|附338页ppt与讲解文章
卷积神经网络
架构设计
自动化
机器翻译
NLP 服务
每天给你送来NLP技术干货! ---- 神经网络技术是现代人工智能的关键技术,在自然语言处理、图像处理等领域表现出优异效果。来自东北大学自然语言处理实验室、小牛翻译团队的肖桐教授、博士生李垠桥、李北在CCMT 2022会议所进行的《自然语言处理中的神经网络设计与学习》演讲报告,从神经网络架构在自然语言处理中的发展、人工神经网络设计和自动化架构设计三个方面对该领域技术发展进行了全面梳理,同时也对方向的未来发展进行了分析和探讨。 近些年来,人工神经网络方法已经成为了自然语言处理中最重要的范式之一。但是,大量依
zenRRan
2022-09-22
643
0
【赠书】熊德意老师的一部不止于技术的神经机器翻译“百科全书”
机器翻译
NLP 服务
深度学习
神经网络
每天给你送来NLP技术干货! ---- 2022年7月,Meta(原Facebook)AI 发布了一个大规模机器翻译模型NLLB-200,该模型在神经网络架构上混合了稠密和稀疏神经网络,参数规模达545亿,在覆盖202种语言、2440个语向的180亿平行句对上进行训练,训练后的单一模型可支持所有覆盖语言之间的的自动翻译(即202X201=40602个语向的互译)。 该模型的名字是英文No Language Left Behind的缩写,体现了机器翻译实现世界上所有语言互译的美好愿景。 历经70载,机器翻
zenRRan
2022-08-26
653
0
全世界都在说中国话?2022国际大数据竞赛首次以“中文”命题
大数据
机器翻译
NLP 服务
https
每天给你送来NLP技术干货! ---- 8月10日, IKCEST第四届“一带一路”国际大数据竞赛暨第八届百度&西安交大大数据竞赛(以下简称“国际大数据竞赛”)正式启动,本届赛题聚焦“低资源语言机器翻译”行业难题,向全球开发者发出邀请。 百度发布稀缺语种任务 挑战机器翻译难题 截至今年5月,我国签署的“一带一路”合作文件涉及110多种语言,沿线国家和地区在经济发展、民生改善等方面的合作日趋深入,对多语言翻译的需求快速增长。 本届大赛赛题——“一带一路”低资源语言翻译,重点关注法、俄、泰、阿与中文的互译,突破
zenRRan
2022-08-26
249
0
腾讯AI Lab的NLP博士崔乐阳回忆在西湖大学读博期间和张岳导师之间的故事
编程算法
机器学习
机器翻译
NLP 服务
每天给你送来NLP技术干货! ---- 我在西湖读博士 printf("hello world!"); #include <西湖大学文本智能实验室PI张岳; 博士毕业生崔乐阳> cout<<"导语" 从腾讯深圳办公大楼42层往下看 车水马龙,纷纷攘攘 与崔乐阳之前的生活环境大相径庭 几个月前 他还顶着不事稼穑的“博士生”头衔 偏安杭州转塘,而今 他已正式迈入职场 成为腾讯AI Lab的高级研究员 腾讯AI Lab 这是腾讯内部极少数的“非盈利”部门 由100多位来自世界知名院校的科学家 以及300
zenRRan
2022-08-26
676
0
ICML 2022 | 清华、字节大幅刷新并行文本生成 SoTA 性能,超越 Transformer
nat
NAT 网关
机器翻译
每天给你送来NLP技术干货! ---- 转自 | 新智元 编辑 | 好困 清华&字节联合提出的DA-Transformer摆脱了传统并行模型依赖知识蒸馏的问题,在翻译任务中大幅超越了之前所有并行生成模型,最高提升 4.57 BLEU。同时也首次达到、甚至超越了自回归 Transformer 的性能,在最高提升 0.6 BLEU 的同时,能够降低7倍的解码延迟。|还在纠结会不会错过元宇宙和web3浪潮?清华大学科学史系副教授胡翌霖,这次给你讲个透! 并行文本生成模型(非自回归模型)是一种新的文本生成范
zenRRan
2022-07-27
716
0
ACL2022 | 基于神经标签搜索的零样本多语言抽取式文本摘要
NLP 服务
机器翻译
机器学习
神经网络
深度学习
每天给你送来NLP技术干货! ---- ©作者 | 机器之心编辑部 来源 | 机器之心 这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务,并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。 抽取式文本摘要目前在英文上已经取得了很好的性能,这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言,目前很难得到大规模的标注数据。 中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使
zenRRan
2022-07-04
647
0
近200篇文章汇总而成的机器翻译非自回归生成最新综述,揭示其挑战和未来研究方向
nat
NAT 网关
机器翻译
每天给你送来NLP技术干货! ---- 作者:杜林鸽 学校:苏州大学人工智能实验班 方向:自然语言处理 论文标题:A Survey on Non-Autoregressive Generation for Neural Machine Translation and Beyond 论文链接:https://arxiv.org/abs/2204.09269 概要 以Transformer为基础的自回归生成(auto-regressive generation,AR)模型,已经被广泛应用到各类机器学习和自然语
zenRRan
2022-06-27
730
0
李航:做本质的、严谨的、有意思的研究,纪念我的导师长尾真教授
机器翻译
NLP 服务
机器学习
深度学习
每天给你送来NLP技术干货! ---- 编辑:机器之心 作者:李航 本文为清明之际,字节跳动人工智能实验室总监李航纪念导师之作。 2021年5月24日收到师弟的邮件,告知我们的导师、原京都大学教授长尾真先生于5月23日不幸去世,享年84岁。看到邮件时简直不敢相信自己的眼睛,确认是事实后,内心感到无比的悲痛。最后一次见到长尾老师是2012年11月,当时他看上去身骨硬朗,说经常去打高尔夫球,觉得他身体状况应该很好。本想疫情结束之后,再去京都看望他,汇报近况,聆听他的指导。没想到那次见面变成了永别。 长尾老师
zenRRan
2022-04-08
421
0
解决训练难题,1000层的Transformer来了,训练代码很快公开
http
css
编程算法
机器翻译
昨日出炉的论文《DeepNet: Scaling Transformers to 1,000 Layers》在研究社区引起了热议,作者来自微软亚洲研究院。
zenRRan
2022-03-10
878
0
【ACL 2020】腾讯AI Lab解读三大前沿方向及入选的20篇论文
https
网络安全
机器翻译
NLP 服务
自然语言理解是腾讯 AI Lab 的主要研究方向之一,研究能力也一直处于业界领先水平。总体而言,腾讯 AI Lab 的研究内容囊括从自然语言理解到生成的整个链条,另外还涉及到对 AI 系统可解释性以及算法底层机制等理论研究。相关研究成果也一直在通过研究论文、开放数据集和开源代码的形式向 NLP 及 AI 社区分享。
zenRRan
2020-07-09
1.1K
0
【论文解读】EMNLP2019-多粒度自注意力机制
机器翻译
机器学习
神经网络
深度学习
人工智能
Multi-Granularity Self-Attention for Neural Machine Translation[1]
zenRRan
2020-03-05
917
0
NLP的12种后BERT预训练方法
机器翻译
NLP 服务
论文:A Robustly Optimized BERT Pretraining Approach.
zenRRan
2020-02-24
1.2K
0
【NLP】综述 | 跨语言自然语言处理笔记
编程算法
NLP 服务
机器翻译
跨语言自然语言处理是当下研究的热点。其中,跨语言词向量(Cross-lingual Word Embedding)可以帮助比较词语在不同语言下的含义,同时也为模型在不同语言之间进行迁移提供了桥梁。[Ruder et al., 2017] 详细描述了跨语言词向量学习方法和分类体系,将跨语言词向量按照对齐方式分为了基于词对齐、基于句子对齐、基于文档对齐的方法。其中基于词对齐的方法是所有方法的核心和基础。在基于词对齐的方法中,又有基于平行语料的方法,基于无监督的方法等。近些年,无监督方法成为研究热点。本文主要记录一些跨语言词向量的相关论文。
zenRRan
2019-12-10
2.1K
0
【眼界】NLP 迎来了黄金时代
NLP 服务
机器翻译
特征工程
深度学习
机器学习
那一年,我以机器翻译方向的博士毕业,到几家单位应聘。当年,毕业的博士还很少。因此,应聘单位对我似乎还是网开一面,这导致我经历的应聘过程都十分轻松短暂。几个单位基本只关心两个问题:第一,“你是博士?“,第二,“你会 C++ 吗?“ 当得到肯定的答复之后,对方就给了 offer。虽然这么容易拿到了 offer,但其实我并不开心,因为他们并不关心我的博士研究方向,也不关心我今后做什么。我自己很不甘心也觉得不太靠谱,毕竟在专业方向上做了这么多年,丢掉实在可惜,于是我拒绝了这些 offer,选择留在了研究所继续从事 NLP 相关的科研工作。
zenRRan
2019-12-09
440
0
【NLP】EMNLP 2019 参会小结及最佳论文解读
NLP 服务
深度学习
机器翻译
https
2019年EMNLP自然语言处理实证方法会议11月3日至7日在中国香港召开。作为自然语言处理领域的顶级会议之一,在本次大会中,中国被接收的论文数量在所有国家和地区中位居第二。本届大会举办了18场 Workshops 、多个Tutorials和主题丰富的会议活动,吸引了超过1922人参会。
zenRRan
2019-12-06
1.1K
0
【ACL2019】最佳长论文阅读笔记,降低机器翻译中的exposure bias
oracle
apache
机器翻译
腾讯云测试服务
文章知乎链接 https://zhuanlan.zhihu.com/p/92654122
zenRRan
2019-11-21
1.4K
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档