前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新:涵盖140种语言组合

一口气发布1008种机器翻译模型,GitHub最火NLP项目大更新:涵盖140种语言组合

作者头像
磐创AI
发布2020-05-25 18:12:51
8460
发布2020-05-25 18:12:51
举报
鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI

磐创AI分享

来源 | 量子位(QbitAI)

作者 | 鱼羊、发自、凹非寺

【导言】PyTorch现在,你可以用 GitHub 上最火的 NLP 项目做机器翻译了。没错,就是 Hugging Face (抱抱脸)标星26.9k的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1008 种模型,正式涉足机器翻译领域。

模型涵盖 140 种不同语言组合,中文翻英文,英文译法语,法语翻阿拉伯语……还能一对多翻译。

就像这样:

抱抱脸创始人 Clement Delangue 表示:

全世界有那么多人在使用我们的开源项目,越来越多使用不同语言的人聚集在NLP社区。 这让我们意识到,应该在模型中提供更多其他语言的接入,同时也提供翻译。

1008种机器翻译模型

据抱抱脸介绍,这1000+模型,是研究人员使用无监督学习和OPUS数据集训练的。

OPUS 项目来自赫尔辛基大学及其全球合作伙伴,旨在收集和开源各种语言数据集,尤其是低资源(小语种)语言数据集。

部分模型

并且,抱抱脸也在 Transformer 项目中增加了喜闻乐见的 Seq2Seq 模型。

比如谷歌 AI 的T5,Facebook 的BART

使用方法,一如既往的简单。

比如用opus-mt-en-ROMANCE这个模型同时进行英语翻法语、英语翻葡萄牙语和英语翻西班牙语,一个 API 就搞定了。

就有网友评价道:节约时间的利器。

关于 Hugging Face Transformer

抱抱脸的 Transformer Python 库目前已有超过 50 万 pip 安装量,SQuAD排行榜上的最佳语言模型们通通被收编其中。

比如谷歌 AI 的 BERT、XLNet,Facebook AI 的 RoBERTa,OpenAI 的 GPT-2。

使用简单,只需一个 import。

支持 TensorFlow 2.0 和 PyTorch 之间的深度互操作

还有在线 Demo 供你实时调戏。

这样的万星项目,NLPer 用了都说好。

这就用起来?

传送门

GitHub 项目: https://github.com/huggingface/transformers

作者系网易新闻·网易号“各有态度”签约作者

- End -

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-05-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 磐创AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI
  • 磐创AI分享
    • 【导言】PyTorch现在,你可以用 GitHub 上最火的 NLP 项目做机器翻译了。没错,就是 Hugging Face (抱抱脸)标星26.9k的 Transformer 项目。在最新更新的版本里,抱抱脸发布了 1008 种模型,正式涉足机器翻译领域。
    相关产品与服务
    NLP 服务
    NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档