腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
程序员一一涤生
同步自“程序员一一涤生”公众号。
专栏作者
举报
118
文章
199895
阅读量
43
订阅数
订阅专栏
申请加入专栏
全部文章(118)
深度学习(18)
编程算法(17)
网站(14)
神经网络(13)
人工智能(13)
机器学习(12)
http(12)
python(11)
sql(11)
数据库(10)
NLP 服务(9)
java(9)
机器人(9)
oracle(8)
html(7)
linux(7)
网络安全(7)
ide(6)
json(5)
tomcat(5)
图像识别(5)
https(5)
bash(4)
xml(4)
access(4)
bash 指令(4)
开源(4)
决策树(4)
php(3)
git(3)
github(3)
官方文档(2)
tensorflow(2)
node.js(2)
ajax(2)
flask(2)
打包(2)
apt-get(2)
spring(2)
GPU 云服务器(2)
批量计算(2)
访问管理(2)
机器翻译(2)
腾讯云测试服务(2)
mongodb(2)
微服务(2)
map(2)
费用中心(1)
人脸识别(1)
c++(1)
javascript(1)
jsp(1)
jquery(1)
android(1)
mvc(1)
api(1)
jar(1)
全文检索(1)
容器镜像服务(1)
NAT 网关(1)
云推荐引擎(1)
运维(1)
jdk(1)
卷积神经网络(1)
erp(1)
面向对象编程(1)
dns(1)
opencv(1)
jdbc(1)
hashmap(1)
ftp(1)
keras(1)
pytorch(1)
tcp/ip(1)
scikit-learn(1)
uml(1)
windows(1)
数据可视化(1)
nat(1)
虚拟化(1)
sdk(1)
ghost(1)
add(1)
char(1)
database(1)
ddl(1)
error(1)
executorservice(1)
key(1)
next(1)
precision(1)
rank(1)
sample(1)
size(1)
threadpoolexecutor(1)
队列(1)
线程池(1)
注解(1)
字符串(1)
搜索文章
搜索
搜索
关闭
想研究BERT模型?先看看这篇文章吧!
机器翻译
NLP 服务
序列转换方式由基于复杂递归神经网络(RNN)和卷积神经网络(CNN)的编码器和解码器模型主导。表现最佳的模型也只是通过一个注意力机制来连接了编码器和解码器。我们提出一个新的简单网络架构——Transformer。相比表现最佳的模型,该架构仅仅基于注意力机制,完全摒弃了递归和卷积。从两个机器翻译任务的实验结果显示,Transformer的效果更优秀,同时有更好的并行性,显著的减少了训练的时间。我们的模型在WMT2014年发布的“英-德”翻译任务上达到了28.4 BLEU【注解1】,超越了该任务上现有的最好的记录2个BLEU,包括总体效果。在英-法翻译任务上,我们的模型在8块GPU上训练了3.5天,并创造了单模型最好BLEU分数——41.8。相比文献中的最佳模型,这个训练成本不高。Transformer在其它任务上也有好的泛化能力,我们将其应用于English constituency parsing(英语成分句法分析),无论在大量的训练数据上还是有限的训练数据上都获得了成功。
程序员一一涤生
2019-09-29
877
0
想研究BERT模型?先看看这篇文章
机器翻译
NLP 服务
序列转换方式由基于复杂递归神经网络(RNN)和卷积神经网络(CNN)的编码器和解码器模型主导。表现最佳的模型也只是通过一个注意力机制来连接了编码器和解码器。我们提出一个新的简单网络架构——Transformer。相比表现最佳的模型,该架构仅仅基于注意力机制,完全摒弃了递归和卷积。从两个机器翻译任务的实验结果显示,Transformer的效果更优秀,同时有更好的并行性,显著的减少了训练的时间。我们的模型在WMT2014年发布的“英-德”翻译任务上达到了28.4 BLEU【注解1】,超越了该任务上现有的最好的记录2个BLEU,包括总体效果。在英-法翻译任务上,我们的模型在8块GPU上训练了3.5天,并创造了单模型最好BLEU分数——41.8。相比文献中的最佳模型,这个训练成本不高。Transformer在其它任务上也有好的泛化能力,我们将其应用于English constituency parsing(英语成分句法分析),无论在大量的训练数据上还是有限的训练数据上都获得了成功。
程序员一一涤生
2019-09-23
699
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档