如何创建多语言调查_如何创建和维护多语言项目？_多语言音视频字幕如何创建 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

《跨语言大模型》最新综述

跨语言大模型（MLLMs）能够利用强大的大型语言模型处理和回应多种语言的查询，在多语言自然语言处理任务中取得了显著的成功。尽管取得了这些突破，但仍然缺乏一份全面的调查总结该领域现有方法和最新发展。因此，在本文中，我们进行了深入的综述，并提供了一个统一的视角，总结了多语言大型语言模型领域的最新进展和新兴趋势。本文的贡献可以总结如下：（1）首次综述：据我们所知，我们首次按照多语言对齐的方式对MLLMs研究领域进行了深入综述；（2）新分类法：我们提供了一个新的统一视角，总结了MLLMs的当前进展；（3）前沿与挑战：我们重点介绍了几个新兴领域并讨论了相应的挑战；（4）丰富资源：我们收集了丰富的开源资源，包括相关论文、数据语料库和排行榜。我们希望我们的工作能够推动MLLMs领域的突破性研究。

01

vivo全球商城全球化演进之路——多语言解决方案

随着经济全球化的深入，许多中国品牌纷纷开始在海外市场开疆扩土。实现全球化意味着你的产品或者应用需要能够在全球各地的语言环境使用，我们在进行海外业务的推进时，需要面对的最大挑战就是多语言问题。实现好多语言系统的本地化，更方便快捷的修改多语言文案能让你的产品在各个国家地区里有更强的产品竞争力和更好的用户体验以及更低的维护成本。以此为目标，在vivo外销项目的发展过程中我们经过多次迭代，最终结合公司中间件的能力，实现了一套完整的多语言解决方案。

02

您找到你想要的搜索结果了吗？

是的

没有找到

物联网开发的三大编程语言

虽然Java是物联网开发中使用最多的语言，但是JS和Python在物联网开发的不同子领域中紧随Java之后。物联网发展的未来可能仍然是多语种的。

00

纸壳CMS可视化建站系统创建多语言网站

纸壳CMS已经从架构上支持多语言。但是多语言功能默认是没有开启的。您可以从设置中开启多语言，或者随时关闭它，您可以随时进行切换。

00

AI在金融领域的应用：从移动平均到生成式人工智能(AIGC)

在AI盛起的当下，各类AI应用不断地出现在人们的视野中，AI正在重塑着各行各业。相信现在各大公司都在进行着不同程度的AI布局。笔者致力于对行业内优秀的AI项目和创意进行调研，在进行知识梳理的同时也能达成对大多数人进行AI知识科普的目的。本文主要介绍一下AI的发展给金融领域带来的一些改变，十分中肯。

02

用PyTorch和预训练的Transformers 创建问答系统

问题回答是信息检索和自然语言处理（NLP）中的一项任务，该任务调查可以回答人类以自然语言提出的问题的程序。在“提取性问题解答”中，提供了一个上下文，以便模型可以引用该上下文并预测答案在段落中的位置。

01

iOS本地化国际化多语言支持

虽说大多数人开发的应用都是在中国区发布吧，但也有人喜欢把手机设成英语呀，不管是为了练英语还是出国需要，也有外国友人在我国使用呀。所以如果用户中可能包括这些人的话，那么多语言支持是个很重要的课题，这个功能直译是本地化，意译是国际化，通俗地说就是多语言支持了，本文为了通俗就叫多语言支持。iOS开发实现多语言是件特别方便的事儿，本文就讲解实现的方法，分为App名称多语言支持、内容文本多语言支持、获取当前设备所使用的语言三个方面。

01

【Unity 实用工具篇】| 游戏多语言解决方案，官方插件Localization 实现本地化及多种语言切换

Localization是Unity官方推出的本地化插件，它可以帮助开发者在Unity项目中实现多语言支持。

01

WordPress多语言WPMLv4.6.3插件自动翻译多国语言

WPML是WordPress的一个插件。简单来说，插件扩展了基本的WordPress CMS功能。在我们的情况下，WPML让WordPress支持多语言。请注意！自动翻译功能不是这个插件的一部分，但你可以直接从开发者那里购买作为单独的付费服务。 WPML允许作者使用不同的语言编写内容并进行翻译。它还包括高级功能，用于翻译管理和专业内容翻译的接口。使用WPML不需要任何技术或编程技能。网站管理员可以安装它并将其转换为多语言网站，而无需编码。WPML包括完整的API，用于与其他插件和翻译系统集成。这样，开发人员就可以轻松地使用WPML并将其产品转换为多语言。

01

造轮子之多语言管理

多语言也是我们经常能用到的东西，asp.net core中默认支持了多语言，可以使用.resx资源文件来管理多语言配置。但是在修改资源文件后，我们的应用服务无法及时更新，属实麻烦一些。我们可以通过扩展IStringLocalizer，实现我们想要的多语言配置方式，比如Json配置，PO 文件配置，EF数据库配置等等。这里我们选用数据库配置的方式，直接查询数据库的多语言配置进行转换。

06

Vue3响应式助你轻松实现国际化

如上图所示，主要就是提供了三个方法，不过在了解具体实现前先看一下组件中是如何使用多语言的。

02

【ACL 2019】预训练语言模型的最新探索

ACL 2019 将于 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举办。机器之心技术分析师曾祥极挑选了 ACL 2019 收录的与语言模型相关的三篇文章，分别从可变长度 Transformer、BERT 表征学习的深层次解析以及多语言迁移学习 BERT 三方面来介绍预训练语言模型的最新进展。

03

ACL 2019提前看：预训练语言模型的最新探索

ACL，英文全称是 The Association for Computational Linguistics，中文全称是国际计算语言学协会。ACL 于 1962 年成立，主要致力于为研究自然语言处理或者计算语言学的专业人士提供服务。为了促进自然语言处理领域的学术交流，ACL 每年都会举办学术会议，如 ACL、EMNLP 和 NAACL 等。ACL 2019（第 57 届会议）即将于 2019 年 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举办。

05

ASP.NET MVC5+EF6+EasyUI 后台管理系统（89）-国际化，本地化，多语言应用

比如用户请求的时语言是zh-CN,即中文，通过下面3行代码可设置改变当前的请求语言

02

使用 E5 嵌入模型进行多语言向量搜索

近年来，向量搜索席卷了搜索和信息检索领域。它能够将查询的语义与文档相匹配，合并文本的上下文和含义，并为用户提供前所未有的自然语言查询能力。向量搜索是促进大型语言模型 (LLM) 的重要上下文来源，它为生成式 AI 时代越来越多的现代搜索体验提供动力。

03

Meta AI科学家专访 – 我们离世界上每个人都能实时理解每种语言还有多远?

Meta（facebook）采访了菲利普·科恩(Philipp Koehn)，他是一位Meta人工智能研究科学家，现代基于短语的机器翻译方法的发明者之一，著有《Statistical Machine Translation》和《Neural Machine Translation》。他谈到了机器翻译领域的最新进展，该领域面临的最新挑战，以及走向通用翻译道路上有希望的方向。

03

【愚公系列】2023年02月 WMS智能仓储系统-002.多语言功能实现

互联网时代的到来，企业的需要与国际接轨。这就面临一个问题不是所有的人都能看懂网上语言，如果你的网站仅仅使用中文，根据用户使用母语的搜索习惯，那些不以中文为母语的客户们，将很难在你的网站上做过多的停留，所以网站做多语言适配的重要性不言而喻。

02

跨越语言障碍！哈工大联合MSRA提出多任务、多模态、多语言的统一预训练模型M3P (CVPR 2021)

在本文中，作者提出了M3P，一个多任务、多语言、多模态预训练模型，通过多任务预训练目标将多语言预训练和多模态预训练结合到一个统一的框架中。M3P的目标是学习通用的表示，可以将以不同方式出现的对象或以不同语言表达的文本映射到一个公共语义空间。

02

win10 uwp 自定义标记扩展

在 UWP 使用的 Binding 或 StaticResource 这些都是标记扩展，在 Windows 10 Fall Creators Update 版本号是 10.0.16299.0 和以上支持在 UWP 自定义标记扩展，也就是定义了一个可以在 xaml 使用的标记的方法

01

达摩院发布大模型测试基准：GPT-4勉强及格，其他模型悉数落败

随着大模型的发展，尤其是近来各种开源大模型的发布，如何对各种模型进行充分并且准确的评估变得越来越重要。其中一个越来越受到认可的方向就是利用人类考题来检验模型，从而可以测试模型的知识及推理能力。例如对于英文模型，MMLU 已经被广泛用来评估模型在多个学科上的表现。类似的，最近中文社区也涌现了例如 C-Eval 以及 GAOKAO 这种利用中文试题来测试模型，特别是中文模型的表现。

03

基于Vue2.x的前端架构，我们是这么做的

通过Vue CLI可以方便的创建一个Vue项目，但是对于实际项目来说还是不够的，所以一般都会根据业务的情况来在其基础上添加一些共性能力，减少创建新项目时的一些重复操作，本着学习和分享的目的，本文会介绍一下我们Vue项目的前端架构设计，当然，有些地方可能不是最好的方式，毕竟大家的业务不尽相同，适合你的就是最好的。

02

浅析大规模多语种通用神经机器翻译方法

目前，神经机器翻译（NMT）已经成为在学术界和工业界最先进的机器翻译方法。最初的这种基于编码器-解码器架构的机器翻译系统都针对单个语言对进行翻译。近期的工作开始探索去扩展这种办法以支持多语言之间的翻译，也就是通过只训练一个模型就能够支持在多个语言之间的翻译。

01

单语言表征如何迁移到多语言去？

论文：On the Cross-lingualTransferability of Monolingual Representations

01

干货 | 别以为语言学家就整天咬文嚼字，其实他们代码也很 6

AI科技评论按：统计 NLP 已取得巨大成果，但其极度依赖统计手段，相比之下深入的语言学思考少很多。当今研究遇到瓶颈，许多 NLP 的研究者都在引入一些语言学的知识来帮助他们提取更多的训练特征，提供更靠谱的思维角度。同时也有很多语言学家开始供职于科技公司，计算心理语言学家 Tal Linzen 近日就对语言学家在科技公司的具体职责进行了调查，并写了一篇统计博客。AI 科技评论对博客内容编译如下。

02

别以为语言学家就整天咬文嚼字，其实他们代码也很 6

AI 研习社按：统计 NLP 已取得巨大成果，但其极度依赖统计手段，相比之下深入的语言学思考少很多。当今研究遇到瓶颈，许多 NLP 的研究者都在引入一些语言学的知识来帮助他们提取更多的训练特征，提供更靠谱的思维角度。同时也有很多语言学家开始供职于科技公司，计算心理语言学家 Tal Linzen 近日就对语言学家在科技公司的具体职责进行了调查，并写了一篇统计博客。AI 科技评论对博客内容编译如下。

02

「首席架构师推荐」文本挖掘软件列表

文本挖掘，也称为文本数据挖掘，大致相当于文本分析，是指从文本中获取高质量信息的过程。高质量的信息通常是通过设计模式和趋势通过统计模式学习等手段获得的。

03

清华系「自然语言编程神器」上新！支持100+种编程语言，效率upup

模型用起来太繁琐？没关系，除了模型本身的更新，CodeGeeX的插件版本很快也将全面升级至新版。

02

SpringBoot 多语言 – 国际化 – i18n

快速小结：LocaleResolver接口的实现类获得Locale对象，Locale对象告诉MessageSource从哪个配置文件获得消息！

00

ACL 2019 | 多语言BERT的语言表征探索

这篇论文的作者是来自于Google Research的Telmo Pires，Eva Schlinger和Dan Garrette。既然BERT能够在每一层都学习到特殊的表层、句法以及语义特征表示，那么多语言BERT（M-BERT）在上面学到了什么呢？多语言BERT在零样本迁移学习上又表现如何呢？

03

助力项目快捷实现国际化，造个多语言轮子

本项目主打一个一处配置多语言，多处使用的想法。助力项目方便快捷实现国际化（多语言）。主要解决的问题：

01

Paper | 机器翻译里程碑，多语言机器翻译模型 M2M-100

论文：Beyond English-Centric Multilingual Machine Translation

03

谷歌最强NLP模型BERT官方中文版来了！多语言模型支持100种语言

上周，谷歌AI团队开源了备受关注的“最强NLP模型”BERT的TensorFlow代码和预训练模型，不到一天时间，收获3000多星！

04

SFFAI分享 | 王亦宁：Multilingual Neural Machine Translation【附PPT与视频资料】

随着神经网络机器翻译的快速发展，为了实现多语言之间的相互翻译，通常需要构建多个一对一的翻译模型。一方面每个翻译模型需要大规模存储和计算资源，从而多语言翻译的存储和计算消耗非常巨大；另一方面多语言翻译在独立模型下无法实现知识共享。近年来，使用一套框架解决多语言机器翻译任务受到人们越来越多的关注。多语言机器翻译不仅可以有效的解决资源消耗和知识共享问题，同时由于参与翻译语言对的扩充，对于低资源和零资源翻译任务上有了一定程度的提升。本次分享会上我们：

03

[自然语言处理|NLP] 多语言处理中的应用：从原理到实践

随着全球化的推进，多语言处理成为自然语言处理（NLP）领域的一个关键挑战。本文将深入研究NLP在多语言处理中的应用，探讨其原理、常见技术和面临的挑战。通过详细解析多语言处理的实践，我们将了解如何有效地处理不同语言的文本数据。

NAACL 2022 Findings | 字节提出MTG：多语言文本生成数据集

作者丨陈怡然论文地址：https://openreview.net/pdf?id=Heggj7GSZ5 网页地址：https://mtg-benchmark.netlify.app/ 1 前言随着

02

开发 | Facebook 开源增强版 LASER 库：可实现 93 种语言的零样本迁移

为了加速 NLP 应用在更多语言上的部署，Facebook 对 LASER （Language-Agnostic SEntence Representations）工具包进行了扩展和改进。LASER 是首个可探索多语言句子表示的工具包，Facebook 日前对其实现了开源并共享在 NLP 社区。该工具包现在可应用于使用 28 种不同的字符串编写的 90 多种语言也就是说，它将所有语言一同嵌入到一个独立的共享空间中（而不是为每一种语言都创建一个单独的模型），从而实现在 90 多种语言中的应用。此外，一同开源的还有多语言编码器、PyTorch 代码，以及面向 100 多种语言的多语言测试集。

03

Joomla功能介绍

Joomla!是一套自由、开放源代码的内容管理系统，以PHP撰写，用于发布内容在万维网与内部网，通常被用来搭建商业网站、个人博客、信息管理系统、Web 服务等，还可以进行二次开发以扩充使用范围。其功能包含可提高性能的页面高速缓存、RSS馈送、页面的可打印版本、新闻摘要、博客、投票、网站搜索、与语言国际化。Joomla!是一套自由的开源软件，使用GPL授权，任何人随时都能下载 Joomla! 并立即使用它。

03

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

来源：机器之心本文约2500字，建议阅读5分钟本文介绍了基于神经标签搜索情况下，中科院和微软亚研的实验进展。这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本

02

Multilingual预训练的那些套路

Multilingual是NLP中的研究热点之一，其中的一个研究方向是如何构建多语言预训练语言模型，实现不同语言的在隐空间的对齐，一个模型支持多语种的NLP任务，同时利用数据丰富的语言提升数据较少的语言效果。这篇文章就为大家整理了Multilingual多语言预训练语言模型的套路，包括XLM、XLM-R、ERNIE-M、Unicoder、ALM等5个经典模型，以及这些模型之间的演进关系。

02

一次搞定多种语言：Facebook展示全新多语言嵌入系统

选自code.facebook 作者：Ves Stoyanov、Necip Fazil Ayan 机器之心编译传统的自然语言处理系统只能对应于特定语言，如果想要让其应用支持多种语言，则需要从头开始构建相应数量的新系统。Facebook 最近提出的多语言嵌入方法可以在一些「已知」语言上训练 Classifier，应用于「未知」语言上，成功解决了社交平台中 AI 应用的多语言支持问题。本文将向你简要介绍这一技术背后的原理。在 Facebook 上，超过一半的用户使用非英语语言。整个平台上，人们使用的语言超过

07

150亿参数大杀器！Facebook开源机器翻译新模型，同传人员或失业

当把中文翻译成法文时，以前最好的多语种模型的方式是把中文翻译成英文，把英文翻译成法文，因为英语的训练数据是最多的。

02

未来十年，AI 语音识别将朝着这五个方向发展

作者 | Migüel Jetté 编译 | bluemin 编辑 | 陈彩娴在过去的两年中，自动语音识别（Automatic Speech Recognition, ASR）在商用上取得了重要的发展，其中一个衡量指标就是：多个完全基于神经网络的企业级 ASR 模型成功上市，如 Alexa、Rev、AssemblyAI、ASAPP等。 2016年，微软研究院发表了一篇文章，宣布他们的模型在已有25年历史的“Switchboard”数据集上，达到了人类水平（通过单词错误率来衡量）。 ASR 的准确性仍在不

01

Android 国际化之多语言适配小记

甲方要求实现 App 国际化多语言,正好抽个时间弄了下,害,被自己蠢到死,特意记录下.

01

All In One！Meta发布SeamlessM4T，支持100种语言，35种语音、开源、在线体验！

多语言识别翻译的研究一直都是学术界研究的重点。目前全球有几千种语言，在全球化背景下不同语言人群之间的交流越来越密切，然而学习一门外语的成本是非常大的。前两年的研究主要集中在一对一、一对多的研究，然而当面对这么多的语言时，既需要「考虑模型准确率，还需要考虑语种的识别」。最近，随着人工智能大型自然语言模型的发展，利用统一模型实现多语种识别翻译来实现不同语种之间交流逐渐的变成了可能。

02

不以英语为中心，百种语言互译，FB开源首个单一多语言MT模型

机器之心报道机器之心编辑部 Facebook AI 近日开源了多语言机器翻译模型 M2M-100，该模型不依赖以英语为中心的数据，可以实现 100 种语言之间的相互翻译。机器翻译（MT）打破了人类之间的语言障碍。如今，平均每天需要在 Facebook 新闻提要上提供 200 亿次翻译，这得益于低资源机器翻译领域的发展以及评估翻译质量的最新进展。典型的 MT 系统需要为每种语言和每种任务构建单独的 AI 模型，但这种方法无法在 Facebook 上进行有效推广，因为人们在数十亿个帖子中发布超过 160

01

基于神经标签搜索，中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022

机器之心专栏机器之心编辑部这项研究旨在解决零样本下法语、德语、西班牙语、俄语和土耳其语等多语种的抽取式摘要任务，并在多语言摘要数据集 MLSUM 上大幅提升了基线模型的分数。抽取式文本摘要目前在英文上已经取得了很好的性能，这主要得益于大规模预训练语言模型和丰富的标注语料。但是对于其他小语种语言，目前很难得到大规模的标注数据。中国科学院信息工程研究所和微软亚洲研究院联合提出一种是基于 Zero-Shot 的多语言抽取式文本摘要模型。具体方法是使用在英文上预训练好的抽取式文本摘要模型来在其他低资源语言上

02

干货 | 揭开多语言词嵌入模型的神秘面纱

AI 科技评论按：如今 Facebook 有超过一半的用户使用英语以外的语言，使用了超过 100 种语言。这也给 Facebook 提出了一个巨大的挑战，针对 Facebook 这种服务规模下，使用机器学习和自然语言处理方法（NLP），为每个人提供紧密贴合他们常用语言的良好用户体验。为了更好地服务于 Facebook 社区，无论是通过提供多语言的类似 Recommendations 和 M Suggestion 这样的服务，还是训练系统来检测和删除违规内容的，都需要一种更好的方法来将自然语言处理方法（NLP）拓展到更多语言上去。

04

ElevenLabs：创新语音技术的个性化体验

ElevenLabs 是一个创新的在线平台，它将人工智能技术与个性化语音合成相结合，为用户提供了一个全新的语音克隆和语音生成体验。无论是创建有声读物、音频内容还是进行多语言配音，ElevenLabs 都能满足您的需求。

01

网站建设怎么设置多语言搭建时需要注意什么

现在很多企业为了能获取更多的用户资源，就会找互联网公司帮忙搭建企业网站，要求互联网公司根据企业的产品以及用户特征搭建符合企业形象的网站。有些企业是做外贸行业，所以网站就要多语言切换的按钮，那么网站建设怎么设置多语言？

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭