脸书(Facebook)今年可谓麻烦缠身,假新闻、恐怖主义、泄露用户数据等等一系列丑闻全都找上门来,让脸书 CEO 扎克伯克疲于应对。为了解决数据安全问题,扎克伯格给的方案很明确,也很简单,利用人工智能(AI)来解决眼前的这些烦恼。针对数据泄露事件的两场听证会上,扎克伯格向在场记者和议员们解释未来将如何管制平台内容时,“AI”这个词在他的谈话中居然出现了30多次。
脸书 CTO 迈克·斯科洛普夫在一场记者发布会上也再次强调通过 AI 技术是保护社区安全的最好方法。这一切都表明脸书希望利用 AI 技术帮助自己出走眼下困境。
不过,有些人显然并不买账,在加利福尼亚的媒体和科技大会(Media and Tech Conference)上,一位观众提问迈克·斯科洛普夫聚焦在一个新闻:由于脸书上发布的假新闻引发了斯里兰卡国家的暴力事件,斯里兰卡政府已经屏蔽脸书。
脸书在国际上采取了什么行动,以防止类似的情况出现?
迈克·斯科洛普夫承认在面对这个国家文化和地区语言细微差别下,脸书的 AI 技术面临着挑战。
早在2017年,缅甸发生罗兴亚穆斯林种族清洗事件,联合国官员经调查后,认为脸书在散播仇恨罗兴亚人言论的活动中起到了推波助澜的作用。脸书方面对此回应称,承认擅长缅甸语的内容审查者数量不多并对此表示深深的歉意。
“我们构建的许多 AI 人工智能工具都需要大量的训练数据……而训练数据很容易在更大的语种中获得。”但在像缅甸语这样语料少的语言中,就没那么好了。” – CTO 迈克·斯科洛普夫
由此看见,脸书 AI 面临的不仅仅是技术层面的问题,还需克服多语的工作环境。
脸书的机器翻译技术在英语环境下效果最佳,因为大部分脸书的训练技术软件的文本资源都是从网上直接抓取的,而互联网的参与者大多数都说英语。然而统计显示,超过一半的脸书用户来自非英语国家,其他国家用于 AI 训练的语言资料不足,效果不好,这样形式就显得很严峻了。
由于最近发生的一系列事件,内容审查对于脸书的执行团队来说是一个非常高风险的挑战。脸书正在寻找各种途径,希望尽快解决多语工作环境的问题。
编后记
基于人工智能的 NMT 技术发展确实提高了机器翻译的速度,但依然无法完全保证翻译质量。与脸书遇到的挑战一样,NMT 技术同样面临缺少(多语)训练资料,地方俚语、文化背景的差异等导致翻译质量问题的挑战。这种情况下,企业可以选择像 EC Innovations 的 MTPE (机器翻译+人工校对)服务,在机器翻译后,由 EC Innovations 的专业母语译员对译文进行校对,保证译文的翻译质量,避免因机器错译对产品和品牌信誉产生负面影响。
领取专属 10元无门槛券
私享最新 技术干货