开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用BLEU评分将您的模型与现有模型进行比较？

BLEU（Bilingual Evaluation Understudy）是一种常用的机器翻译评估指标，用于衡量机器翻译系统生成的译文与参考译文之间的相似度。使用BLEU评分可以帮助我们比较不同模型的翻译质量，以下是使用BLEU评分进行模型比较的步骤：

准备参考译文：首先，需要准备一组参考译文，这些译文是由人工翻译专家完成的，作为对比的标准。每个源语言句子都应该有一个或多个参考译文。
准备候选译文：使用待评估的模型对相同的源语言句子进行翻译，生成候选译文。
计算N-gram匹配：BLEU评分基于N-gram的匹配，其中N表示N-gram的长度。对于每个N-gram，计算候选译文中出现的次数，并与参考译文中出现的次数进行比较。这样可以衡量候选译文与参考译文之间的相似度。
计算BLEU分数：根据N-gram匹配的结果，计算BLEU分数。BLEU分数是通过计算候选译文中N-gram匹配的准确率，并考虑N-gram的长度权重得出的。通常，BLEU分数的范围在0到1之间，越接近1表示翻译质量越好。

使用BLEU评分进行模型比较时，需要注意以下几点：

更高的BLEU分数并不一定意味着更好的翻译质量，因为BLEU只是一种自动评估指标，无法完全代替人工评估。
BLEU分数对于较长的句子可能会有偏差，因为较长的句子中匹配的N-gram数量相对较少。
BLEU分数只能衡量翻译质量的一部分，无法捕捉到语法、流畅性等其他方面的问题。

腾讯云提供了一系列与机器翻译相关的产品和服务，例如腾讯云翻译（https://cloud.tencent.com/product/tmt）可以帮助用户实现高质量的机器翻译，用户可以根据自己的需求选择适合的产品和服务。

请注意，本回答中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商。

相关搜索:Django将外键值与另一个模型的属性进行比较 Mongoose模型如何将包含与父级相同模型的数组作为属性使用ModelForm将模型实例与不同模型的实例链接使用模型插件将django url与视图进行匹配如何与使用python pickle模块保存的ML模型进行交互？如何使用定制训练的keras模型进行预测如何使用循环将数组的元素与标量进行比较？如何使用现有的Tastypie资源将Django模型实例转换为JSON？如何在odoo中将一个模型的字段与另一个模型的字段进行比较如何将Helm模板与现有部署/版本进行比较？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

机器翻译质量评测算法-BLEU

本文介绍机器翻译领域针对质量自动评测的方法-BLEU，让你理解为什么BLEU能够作为翻译质量评估的一种指标，它的原理是什么，怎么使用的，它能解决什么问题，它不能解决什么问题。什么是BLEU？ BLEU (Bilingual Evaluation Understudy) is an algorithm for evaluating the quality of text which has been machine-translated from one natural language to anothe

03

Bleu：此'蓝'非彼蓝

来源像seq2seq这样的模型，输入一个序列，输出一个序列，它的评分不像文本分类那样仅仅通过label是否一样来判断算出得分。比如机器翻译，它既要考虑语义，还要考虑语序。所以，在2002年一位国外的大牛（是的，没错基本木有中国人。。）Papineni et.al. 提出了Bleu方法，在Bleu:A method for automatic evaluation of machine translation中。 Bleu维基百科：BLEU (Bilingual Evaluation Understudy)

06

浅谈用Python计算文本BLEU分数

BLEU，全称为Bilingual Evaluation Understudy（双语评估替换），是一个比较候选文本翻译与其他一个或多个参考翻译的评价分数。

技术 | 动图详解：Google翻译背后的机器学习算法与神经网络模型

Google翻译、百度翻译、有道翻译……我们使用过各种各样的在线翻译服务，但你清楚机器翻译背后的原理吗？在线翻译为什么要用深度学习？不同的神经网络模型在翻译过程中所起的作用有什么不同？相比通用的模型，为什么支持103种语言的Google的翻译算法，可以实现任意两种语言之间的翻译转换？它独特的LSTM-RNN结构在其中所起的作用又是什么？让我们从头来学习一番。作者 | Daniil Korbut 译者 | JeyZhang 图片来源：谷歌机器翻译算法许多年前，想要对一种陌生的语言进行翻译是一件

05

图解神经网络机器翻译原理：LSTM、seq2seq到Zero-Shot

【新智元导读】这篇刊登在 blog.statsbot.co 上的博文，通过对 LSTM、BRNN、seq2seq、Zero-Shot Translation 和 BLEU 的简要阐释和图示，深入浅出地

NLP输出文本评估：使用BLEU需要承担哪些风险？

刚接触 NLP 时常有个疑问，就是如何评估这样一个系统——其输出为文本，而非对输入分类。当把一些文本输入系统，得到的输出也为文本时，这类问题称为 seq2seq 或字符串转导（string transduction）问题。

03

如何在Chatbot中应用深度学习？ | 赠书

本书节选自图书《深度学习算法实践》文末评论赠送本书，欢迎留言！人类其实从很早以前就开始追求人类和机器之间的对话，早先科学家研发的机器在和人对话时都是采用规则性的回复，比如人提问后，计算机从数据库中找出相关的答案来回复。这种规则性的一对一匹配有很多限制。机器只知道问什么答什么，却不知道举一反三，比如你问它：“今天天气怎么样？”它会机械地把今天的天气告诉你。这不像人与人之间的对话，人是有各种反应的，这类反应的产生是基于人的知识结构和对话场景的。那么，你觉得这类机器是否真的具有智能了？图灵测试是这样判断机器

02

基于 Python 的自动文本提取：抽象法和生成法的比较

本博客是对文本摘要的简单介绍，可以作为当前该领域的实践总结。它描述了我们（一个RaRe 孵化计划中由三名学生组成的团队）是如何在该领域中对现有算法和Python工具进行了实验。

02

神经网络机器翻译技术及应用（上）

简单来说，机器翻译就是把一种语言翻译成另外一种语言，在这里，我用的例子都是从中文翻译成英文。上面的句子用Source标记，即源语言，下面用Target标记，即目标语言，机器翻译任务就是把源语言的句子翻译成目标语言的句子。

03

一种机器翻译的评价准则——Bleu

在牵涉到语句生成尤其是机器翻译的应用领域，如何衡量生成语句与参考语句之间的相似性是一个很重要的问题，而在2002年Kishore Papineni et al.就提出了一个经典的衡量标准Bleu，如今这篇文献已经引用量过万，因此是NLP领域必读文章之一。

02

专访 | 监管机器翻译质量？且看阿里如何搭建翻译质量评估模型

阿里机器翻译团队在本次比赛中，参加了英语到德语和德语到英语两个语向的句子级别和词级别的七项质量评估任务，收获了六项世界冠军。其中，德语到英语的统计机器翻译评估任务中（German-English SMT)，句子级别和词级别的预测任务分别取得第一名；英语到德语的统计机器翻译评估任务中 (English-German SMT)，句子级别取得第一名，词级别的词预测和漏词预测分别取得第一名。同时，英语到德语的神经网络机器翻译评估任务中 (English-German NMT)，词级别的词预测取得第一名。

01

专访｜网易有道段亦涛：丁磊亲自过问的神经网络翻译技术到底是什么？

AI科技评论按：很多读者在思考，“我和AI科技评论的距离在哪里？”答案就是：一封求职信。近日，网易有道正式对外公布：由网易公司自主研发的神经网络翻译（ Neural Machine Translat

学习笔记TF067:TensorFlow Serving、Flod、计算加速，机器学习评测体系，公开数据集

本文介绍了TensorFlow的发展历史、生态系统、基本概念、原理、实战案例、性能测试、与其他框架的对比以及未来的发展方向。作者希望通过对TensorFlow的深入剖析，使读者能够快速掌握TensorFlow的核心思想和功能。

01

业界 | 搜狗机器翻译团队获得 WMT 2017 中英机器翻译冠军

搜狗语音交互技术中心机器之心报道每年的第三季度都是机器学习相关的顶级学术会议密集召开的时期，今年也不例外。其中，作为自然语言处理领域顶级国际会议之一的 EMNLP 2017 将于今年 9 月在丹麦首都哥本哈根举行，与此同时，第二届机器翻译大会（WMT 2017）将会作为本次会议的分论坛同时召开。今年的一大亮点是，WMT 首次增设了中文和英文间的新闻数据翻译任务。搜狗语音交互技术中心代表搜狗参加了这次含金量极高的比赛，该中心研发的搜狗神经网络机器翻译（Sogou Neural Machine Trans

有道周枫：未来三年，神经网络翻译将满足90%以上的翻译需求

耶和华说：“看哪，他们都是一样的人，说着同一种语言，如今他们既然能做起这事（建造巴别塔），以后他们想要做的事就没有不成功的了。”——《圣经》《圣经》用巴别塔的故事解释了人类语言复杂性的起源，但是，千百年来，虽然面临重重阻碍，人类从未放弃过建造巴别塔的愿望，从职业翻译的出现到国际语的出现都是如此。智能时代为跨语言交流提供了有力的武器——AI。机器翻译大大降低了翻译的门槛，并且，当下众多科技公司都是免费提供这一服务。如果要评选一个离大众最近的人工智能产品，机器翻译绝对不能忽略。以时下用户量较大的微信为例

视频 | NIPS 2017线上分享第二期：利用价值网络改进神经机器翻译

在 NIPS 2017 大会正式开始前，机器之心将选出数篇优质论文，邀请论文作者来做线上分享，聊聊理论、技术和研究方法。上周，我们进行了线上分享的第二期，邀请到了中国科大—微软亚洲研究院联合培养博士生

09

中到英新闻翻译媲美人类，微软机器翻译新突破

机器之心报道参与：机器之心编辑部今日，微软研究团队表示，微软和微软亚研创造了首个在质量与准确率上匹配人类水平的中英新闻机器翻译系统。黄学东告诉机器之心，他们采用专业人类标注与盲测评分代替 BLEU 分值而具有更高的准确性，且新系统相比于现存的机器翻译系统有非常大的提升。因此，根据人类盲测评分，微软机器翻译取得了至少和专业翻译人员相媲美的效果。微软亚洲与美国实验室的研究者称，其中英新闻机器翻译系统在常用的新闻报道测试集 newstest 2017 上达到了人类水平。该测试集由来自业界和学界的团队共同开发

05

基于语言模型的拼写纠错

本文则针对中文拼写纠错进行一个简要的概述，主要分享基于n-gram语言模型和困惑集来做中文拼写纠错的方法。

08

一文梳理NLP之机器翻译和自动摘要的发展现状

2 NLP入门：CNN,RNN应用文本分类，个性化搜索，苹果和乔布斯关系抽取(2)

03

Facebook 自然语言处理新突破：新模型能力赶超人类 & 超难 NLP 新基准

自然语言理解（NLU）和语言翻译是一系列重要应用的关键，包括大规模识别和删除有害内容，以及连接世界各地不同语言的人们。尽管近年来基于深度学习的方法加速了语言处理的进展，但在处理大量标记训练数据不易获得的任务时，现有系统的处理水平仍然是有限的。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭