首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

LocWorld50大会前沿洞察:生成式AI助力本地化数据格式更新迭代

第50届全球本地化大会LocWorld50,今年于美国硅谷举行,引发了广泛关注。此次国际盛会汇聚了来自世界各地的本地化专家、跨文化传媒从业者以及语言技术领域的精英,他们共同探讨了本地化领域的最新趋势和前沿技术。

其中,技术分论坛(Technical Tracks)的主题备受瞩目,成为本次大会的一大亮点。这些专注于技术的分论坛,聚焦于本地化领域内最具挑战性的技术问题和解决方案,着重于尖端的国际化和本地化实践应用,通过引入创新的全球化工程技术、工具和服务,旨在改善全球用户体验。这是一场技术深度和精妙程度兼备的盛宴,为初涉全球化工程领域的工程师提供了极为宝贵的学习机会。

图源:LocWorld50 – Silicon Valley 2023 - LocWorld

https://locworld.com/events/locworld50-silicon-valley-2023/

本次会议中,来自Alpha CRC(英国剑桥阿尔法)公司的Paul Mangell为观众们带来了一场题为“Bye Bye XLIFF”的精彩演讲,该新颖的标题立即博得了人们的关注。多年来,XLIFF一直是本地化文件格式的业界标准,但现在,我们为何要告别XLIFF呢?

揭秘XLIFF——多语言翻译的标准格式

XLIFF,即XML Localization Interchange File Format,是一种用于存储和交换本地化和翻译相关数据的标准文件格式。它是一个基于 XML 的格式,通常用 .xlf 或者 .xliff 作为文件扩展名,旨在为不同翻译工具提供一种存储和交换可翻译数据的中间格式,从而简化多语言翻译项目的工作流程,在多语言项目中广泛使用,以便在不同工具和平台之间共享内容。XLIFF 文件包含源语言内容和与其关联的目标语言翻译,以及有关翻译的上下文信息、注释、标签等。这种格式的设计使得不同翻译工具和TMS系统能够共享和处理XLIFF文件,以便进行翻译、本地化和回译等操作。

提到XLIFF,就不得不提到与之关系密切的综合性工具——翻译管理系统(Translation Management System,TMS),二者通常联手用于协调和管理复杂的多语言翻译和本地化项目。在当今全球化市场中,跨越语言和文化障碍的成功传达至关重要,而XLIFF和TMS作为关键工具,为实现这一目标提供了坚实的技术基础。

TMS系统——XLIFF的“黄金搭档”

TMS 是用于管理翻译和本地化项目的软件系统。它提供了一个平台,用于组织、协调、分配任务、跟踪进度和质量,以及管理翻译资源(如翻译记忆库、术语库等)。TMS通常支持XLIFF文件的导入、导出和处理,帮助管理和协调多语言翻译和本地化项目,使翻译团队能够轻松地协作、翻译和本地化内容,同时还能确保翻译工作的一致性、质量和效率。通常,在翻译项目中,TMS与XLIFF通过以下步骤“完美结合”,提供强大的功能,以便顺畅、高效地管理复杂的多语言翻译和本地化项目。

1.导入XLIFF文件:TMS支持导入XLIFF,从中提取源语言内容和相关信息,以便将其分配给翻译者进行翻译。

2.分发任务:TMS将XLIFF文件中的内容分配给不同的翻译者或本地化团队,以便进行翻译和本地化工作。

3.翻译管理:TMS跟踪翻译任务的进度,管理翻译资源,记录翻译记忆和术语库,以提高翻译的效率和一致性。

4.导出XLIFF文件:完成翻译后,TMS可以导出XLIFF文件,其中包含目标语言翻译,以供进一步使用或交付给客户。

图:TMS系统导入XLIFF格式后处理数据的流程图

探寻现代化应对——Inox数据格式

尽管XLIFF多年来在多语言翻译和本地化项目中扮演了关键角色,但随着生成式AI技术迅速崭露头角,传统XLIFF在应对多元化需求方面显得力不从心。首先,XLIFF存在着格式上的限制,其采用XML格式,对于非技术从业者而言,操作相对不够直观。此外,尽管XLIFF在协助翻译团队协同工作方面功不可没,但它也容易受到不同工具之间兼容性问题的困扰,可能导致数据遗漏或错误。然而,最关键的挑战在于其无法满足现代全球化需求。随着全球化需求的持续扩大,当今项目需要更多灵活性和自动化,以适应不断多元化的语言和文化背景。

在LocWorld50大会上,Paul Mangell的演讲向我们呈现了新的解决方案。演讲中提到,专家们一直积极探讨现代翻译和本地化工作方式,尝试寻求替代方案,以满足不断增长的多语言项目需求。最终,Alpha CRC公司推出了一种新的数据格式——Inox数据格式。Inox格式作为一种在本地化过程中传递可本地化数据的方式,通过提供连接器、解析器、序列化器以及数据结构的语义单元,实现了数据的提取、加载和转换。这一创新为解决传统XLIFF所面临的挑战提供了一条有前途的道路,为多语言翻译和本地化项目的未来带来更高度的灵活性和效率。

图:Inox的运行图

在本地化项目中,Inox格式可以用于存储和管理需要翻译、本地化的内容和资源。它提供了一种更简单、灵活和可扩展的方式来处理本地化相关的数据,具体可分为以下四种功能:

1.文本翻译:Inox格式可以用于存储需要进行翻译的文本内容。本地化团队可以将需要翻译的文本存储为Inox格式,然后将其发送给翻译人员进行翻译工作。翻译人员可以轻松地查看和编辑Inox格式的文本,然后将翻译后的文本重新保存为Inox格式。

2.本地化资源管理:Inox格式可以用于存储和管理本地化资源,如字符串、标签、菜单项等。本地化团队可以将这些资源存储为Inox格式,然后使用相应的工具进行资源的提取、翻译和重新注入。Inox格式的灵活性和可扩展性使得本地化资源的管理更加方便和高效。

3.多语言版本控制:Inox格式可以用于存储多语言版本的内容。本地化团队可以使用Inox格式来维护不同语言版本的内容,包括文本、图像、音频等。通过使用Inox格式,可以轻松地管理和更新多语言版本的内容,以满足不同语言用户的需求。

4.本地化测试和验证:Inox格式可以用于本地化测试和验证过程中的数据存储。本地化团队可以将测试数据、验证结果等存储为Inox格式,以便于跟踪和管理。通过使用Inox格式,可以更好地组织和管理本地化测试和验证过程中的数据。

突破边界——Inox数据格式超越XLIFF

除此之外,Inox数据格式从多个方面都超越了XLIFF格式,可谓“势在必得”!

图:Inox处理数据的流程图,中文翻译仅供参考

Inox的优势可以从以下几个方面概括:

1.简单易用:Inox数据格式使用简单的文本格式,易于阅读和编辑。相比之下,XLIFF格式是一种XML格式,更加复杂和繁琐。

2.轻量高效:Inox数据格式文件通常比XLIFF文件更小,占用更少的存储空间和传输带宽。这使得Inox数据格式在处理大量数据时更加高效。

3.数据类型支持:Inox数据格式支持定义和指定每个字段的数据类型,例如整数、浮点数、字符串等。这使得数据的解析和处理更加准确和方便。

4.灵活可扩展:Inox数据格式支持多表关联、索引、约束等高级特性,可以更好地支持复杂的数据结构和数据操作。相比之下,XLIFF格式主要用于翻译和本地化领域,对于其他类型的结构化数据支持相对较弱。

5.兼容性:Inox数据格式可以与各种编程语言和工具进行集成和交互。开发人员可以使用自己熟悉的编程语言和工具来处理和操作Inox数据格式,而不需要额外学习和使用特定的XLIFF处理工具。

图:Inox的兼容性示意图,中文翻译仅供参考

“Bye Bye XLIFF”听起来充满激情,这也是在积极迎接人工智能给人类带来的挑战和机遇。我们正在向更智能、更高效的翻译和本地化方式迈进,以确保信息能够跨越文化和语言的边界,触及全球受众。这场本地化大会激发了人们的思考,引导本地化行业更好地适应不断发展的技术和工具,以实现多语言翻译和本地化的无缝、智能化。我们的共同目标是推动全球内容在GenAI时代更广泛传播,满足不断增长的多语言需求。希望我们共同努力,在这个新时代找到自己的立足之地,为全球化进程做出更大的贡献!

(以上内容根据网络公开信息和Loc50部分公开会议资料摘译整理,仅供行业信息分享使用,版权归原作者所有。)

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -

原创编辑:李婷婷

推文编辑:李丹

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OSu6CrZA42frx2q8nBX1RE7A0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券