我试图找出为一种尚未被现有机器翻译所支持的语言建立一个自然语言翻译模型的选择。该项目旨在建立一个系统,将一个非常有限的东非语言子集翻译成英语(只需要单向翻译)。
据我所知,这种语言还没有得到任何机器翻译系统的支持,但它与其他几种非洲大语言有关(将句子放入谷歌翻译,这种语言大多被自动检测为斯瓦希里语或肖纳语,英语翻译有时也是可用的)。
我知道为一种新语言建立一个翻译器绝非微不足道,但问题领域非常小,我认为它应该是可行的。支持此功能的大型云提供商、ML框架或将这些模型构建为服务的供应商有哪些特性?
如果这不是正确的堆栈交换这个问题,请指导我到一个更好的地方。
发布于 2019-04-12 10:23:49
我认为您的情况将受益于调谐,一种现有的语言到新的语言,但这只是一个好的方法,如果您计划使用它的商业。此外,谷歌接受帮助改进他们的翻译算法,你可以申请他们组成一个团队为此和捐赠数据。
谷歌使用神经网络,他们称之为谷歌的NMT (神经机器翻译)的翻译,它的工作,作为一个编码器-解码器对。您可以在他们的论文上阅读更多内容。
此外,谷歌的NMT也可以在tensorflow上使用,可以进行培训和改进。这是Apache 2.0下的许可,在他们的GitHub上有一个很好的教程和解释:
的检查
https://datascience.stackexchange.com/questions/49179
复制相似问题