首页
学习
活动
专区
工具
TVP
发布

AI研习社

专栏成员
1755
文章
2197928
阅读量
197
订阅数
Facebook开源最大规模并行语料,45亿语料,覆盖576种语言对,或成为NMT评估标准
当前自然语言处理中的大多数方法都是数据驱动的,大多数多语言模型(特别是神经机器翻译系统)都需要并行语料库进行训练。大多数的并行文本都只是适用于几个主要语言(例如英语、汉语),且限制于特定的领域。
AI研习社
2020-02-21
1.2K0
春节对联哪家强,人工智能对得狂!
春联传统源远流长,一幅写春联的需要极高的文学素养,不仅要求平仄齐整、意境对称,还要表达辟邪除灾、迎祥纳福的美好愿望。
AI研习社
2020-02-21
3.3K0
谷歌发布含 7 种语言的全新数据集:有效提升 BERT 等多语言模型任务精度高达 3 倍!
近日,谷歌发布了包含 7 种语言释义对的全新数据集,即:PAWS 与 PAWS-X。BERT 通过该数据集的训练,在释义对问题上的精度实现了约为 3 倍的提升;其它先进的模型也能够利用该数据集将精度提高到 85-90%。谷歌希望这些数据集将有助于推动多语言模型的进一步发展,并发布了相关文章介绍了该数据集,我们将其整理编译如下。
AI研习社
2019-10-10
9990
深度 | 周明:自然语言处理的未来之路 | CCF-GAIR 2019
2012年至今,自然语言处理进入神经网络时代已经7年,未来发展之路朝向何方?我们来看ACL 2019主席、微软亚洲研究院副院长周明博士如何解读~
AI研习社
2019-07-16
7130
Github项目推荐 | Google发布序列到序列建模模块化可扩展框架Lingvo
https://www.arxiv-vanity.com/papers/1902.08295/
AI研习社
2019-03-14
7610
试译宝:一个文科生和一个理科生打开的黑盒子
学计算机的人通常有着比较系统的思维方式,按编程模式来看,即分为定义,分解,以及优化迭代的思路来解决问题。学语言的,极少数上过逻辑课,没有经过推理训练,一般偏向于模糊感性的思维方式。 机器翻译,则是理科
AI研习社
2018-03-29
1.1K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档