我在哪里可以找到这样的语料库?我需要这个在令牌(单词)级别上在印地语和英语之间建立一个语言检测器。
例如,像罗马字母中的印地语维基百科就会非常有用。或者短篇小说,社交媒体帖子或推文,或者博客?有什么想法吗?
据我所知,现有的音译引擎并不是很好。如果有一个是好的,也会考虑使用它。
发布于 2020-04-15 19:59:52
谷歌翻译通过在https://translate.google.co.in/上选择“文本”选项,在搜索时提供音译结果。
但是,有一个问题。它的字符限制为5k。令人惊讶的是,谷歌在其他任何地方翻译时都不提供这一功能。(google docs、gmail等)请让我知道您是否能够找到一个更可行和更强大的解决方案来解决您的问题。
https://stackoverflow.com/questions/42103467
复制相似问题