首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >大量的罗马字母印地语文本语料库

大量的罗马字母印地语文本语料库
EN

Stack Overflow用户
提问于 2017-02-08 10:07:57
回答 1查看 1.2K关注 0票数 2

我在哪里可以找到这样的语料库?我需要这个在令牌(单词)级别上在印地语和英语之间建立一个语言检测器。

例如,像罗马字母中的印地语维基百科就会非常有用。或者短篇小说,社交媒体帖子或推文,或者博客?有什么想法吗?

据我所知,现有的音译引擎并不是很好。如果有一个是好的,也会考虑使用它。

EN

回答 1

Stack Overflow用户

发布于 2020-04-15 19:59:52

谷歌翻译通过在https://translate.google.co.in/上选择“文本”选项,在搜索时提供音译结果。

但是,有一个问题。它的字符限制为5k。令人惊讶的是,谷歌在其他任何地方翻译时都不提供这一功能。(google docs、gmail等)请让我知道您是否能够找到一个更可行和更强大的解决方案来解决您的问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42103467

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档