脸书企图靠 AI 破局?还需先过语言关

脸书(Facebook)今年可谓麻烦缠身,假新闻、恐怖主义、泄露用户数据等等一系列丑闻全都找上门来,让脸书 CEO 扎克伯克疲于应对。为了解决数据安全问题,扎克伯格给的方案很明确,也很简单,利用人工智能(AI)来解决眼前的这些烦恼。针对数据泄露事件的两场听证会上,扎克伯格向在场记者和议员们解释未来将如何管制平台内容时,“AI”这个词在他的谈话中居然出现了30多次。

脸书 CTO 迈克·斯科洛普夫在一场记者发布会上也再次强调通过 AI 技术是保护社区安全的最好方法。这一切都表明脸书希望利用 AI 技术帮助自己出走眼下困境。

不过,有些人显然并不买账,在加利福尼亚的媒体和科技大会(Media and Tech Conference)上,一位观众提问迈克·斯科洛普夫聚焦在一个新闻:由于脸书上发布的假新闻引发了斯里兰卡国家的暴力事件,斯里兰卡政府已经屏蔽脸书。

脸书在国际上采取了什么行动,以防止类似的情况出现?

迈克·斯科洛普夫承认在面对这个国家文化和地区语言细微差别下,脸书的 AI 技术面临着挑战。

早在2017年,缅甸发生罗兴亚穆斯林种族清洗事件,联合国官员经调查后,认为脸书在散播仇恨罗兴亚人言论的活动中起到了推波助澜的作用。脸书方面对此回应称,承认擅长缅甸语的内容审查者数量不多并对此表示深深的歉意。

“我们构建的许多 AI 人工智能工具都需要大量的训练数据……而训练数据很容易在更大的语种中获得。”但在像缅甸语这样语料少的语言中,就没那么好了。” – CTO 迈克·斯科洛普夫

由此看见,脸书 AI 面临的不仅仅是技术层面的问题,还需克服多语的工作环境。

脸书的机器翻译技术在英语环境下效果最佳,因为大部分脸书的训练技术软件的文本资源都是从网上直接抓取的,而互联网的参与者大多数都说英语。然而统计显示,超过一半的脸书用户来自非英语国家,其他国家用于 AI 训练的语言资料不足,效果不好,这样形式就显得很严峻了。

由于最近发生的一系列事件,内容审查对于脸书的执行团队来说是一个非常高风险的挑战。脸书正在寻找各种途径,希望尽快解决多语工作环境的问题。

编后记

基于人工智能的 NMT 技术发展确实提高了机器翻译的速度,但依然无法完全保证翻译质量。与脸书遇到的挑战一样,NMT 技术同样面临缺少(多语)训练资料,地方俚语、文化背景的差异等导致翻译质量问题的挑战。这种情况下,企业可以选择像 EC Innovations 的 MTPE (机器翻译+人工校对)服务,在机器翻译后,由 EC Innovations 的专业母语译员对译文进行校对,保证译文的翻译质量,避免因机器错译对产品和品牌信誉产生负面影响。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180621A1F7B300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券