文字识别训练 - 腾讯云开发者社区

、

我想用印地语训练我的测试用法。我有许多‘印地语’书写的特定字体的文本图像，我想为这些图像训练tesseract ocr。有几次我尝试使用这个链接来训练tesseract。当我运行makebox命令时，它会提取box文件，但它可以识别像英文字符一样的文件。我不明白为什么会这样。请帮助我训练印地语的tesseract ocr。你可以在下面的链接上查看示例图像。

浏览 3提问于2014-12-20得票数 0

1回答

利用NLP和ML从图像中提取数据

、、、

📷有没有办法把ML和NLP结合起来解决这个问题？谢谢

浏览 0提问于2019-07-02得票数 2

11回答

如何通过表情包文字识别提取出文字，作为关键字搜索？

在我们的表情项目当中需要从形形色色的网络表情中找出对应的文字，作为关键字搜索。

浏览 2281提问于2018-08-24

1回答

如何训练语音识别的lstm

、、、、

我正在尝试训练用于语音识别的lstm模型，但不知道要使用什么训练数据和目标数据。我使用的是，它包含音频文件和它们的文字记录。在这一点上，我知道目标数据将被矢量化文本文本。至于训练数据，我在考虑使用每个音频文件(或MFCC特征)中的频率和时间。如果这是解决问题的正确方法，训练数据/音频将是多个数组，我如何将这些数组输入到我的lstm模型中？我需要对它们进行矢量化吗？

浏览 1提问于2016-11-26得票数 5

回答已采纳

1回答

从图像中检测手写对象

、

📷一旦我得到像素值，我想用白色像素替换它们，所以我从图像中完全删除了涂鸦。(PS:我没有太多的训练图像来训练CNN。所以，如果这个问题可以用经典的CV方法来解决的话，请在这里问一下。

浏览 0提问于2019-12-03得票数 0

1回答

同步文本和音频。有没有NLP/语音到文本库来做这件事？

、、

我想要同步语音录音与已知的文本。是否有一个语音到文本/自然语言处理库可以促进这一点？我想我会想要检测单词边界并从字典中计算候选匹配。我发现的大部分问题都与书面语言有关。我到目前为止发现的是：

浏览 1提问于2010-11-01得票数 14

回答已采纳

1回答

训练集的颜色特征在CNN的模式识别中起作用吗？

、、、、

我制作了一个模型来识别字符，其中训练集具有黑色背景的图像和白色的文字。然而，这种类型的模型无法识别白色背景上有黑底图案的图像(我尝试了自己的输入和上一组底片的底片)。是否可以使用相同的模型来识别两种类型的图像，或者我是否需要训练两个不同的模型？我不知道是否可以使用ImageDataGenerator类。

浏览 0提问于2019-04-14得票数 0

1回答

为什么伯特令牌器的功能不同？

、、、

在试验变压器的TFBertForSequenceClassification和BertTokenizer时，我注意到BertTokenizer：以这种方式标记文本与用于为BERT模型构造标记器的标记器不同：

浏览 0提问于2020-10-21得票数 1

1回答

如何帮助Tesseract识别这个简单图像中的字符？

、

这是我想要处理的原始图像的链接：但即使有了上面的图像，Tesseract也无法识别图像中的字符。另外，如果上面的技术不起作用，请建议一种替代方案，例如训练Tesseract或使用其他OCR或方法？

浏览 3提问于2016-06-26得票数 1

1回答

回答以下问题的图书馆：“某一文本中是否有提及的位置?如果有的话:提到了哪些位置？”

、

我需要回答这两个问题：如果有的话:提到了哪些地点？我听说过关于word2vec的一些好东西，但我不太确定它在这里是否合适。

浏览 0提问于2019-05-14得票数 1

回答已采纳

1回答

开发一款听觉训练软件，用什么工具好？

想开发一款听觉训练的软件。根据回答的情况来做数据收集和分析。得出分析报告。有些问题需要语音回答，需要识别语音来判断正误。

浏览 313提问于2018-09-10

2回答

未分类图像的Caffe图像分类器

、、

现在的问题是:如果我向分类器传递与训练数据集无关的图像(例如，房屋的图像)，我希望获得较低的分数作为输出，以帮助我识别分析的图像不是数据集类别之一。

浏览 14提问于2016-08-29得票数 1

1回答

如何将tesseract中的语言首选项从英语更改为其他语言？

、、、

现在它可以识别英文字符了。但是，如何才能将语言首选项从英语更改为其他语言呢？印度语系语言我已经下载了一种印度语言的训练数据，并用英语替换，并相应地修改了一些代码。但它并没有带来结果。

浏览 1提问于2012-12-29得票数 0

8回答

OCR文字识别技术有哪些应用？

OCR 是实时高效的定位与识别图片中的所有文字信息，返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别，以及中英文、字母、数字的识别。简单来说就是将图片上的文字内容，智能识别成为可编辑的文本，这么强大的功能在我们生活当中有哪些应用呢？

浏览 3646提问于2018-08-24

2回答

如何使用微软的Face来识别用户？

、

我正在做一个android应用程序，它捕获照片来验证用户。我正在尝试用很少的图片创建personGroup。但我犯了个错误。 public fun createPersonGroup(personGroupId: String, personGroupName: String) {} pub

浏览 2提问于2018-04-12得票数 1

回答已采纳

1回答

我有如下文字图像：假设这是一个256x64图像。我的目标是以73791096754314441539的形式从图像中提取文本，这基本上就是OCR所做的。我正在尝试建立一个能从图像中识别单词的模型。c2],[a3,b3,c3]] -> [[a1,a2,a3],[b1,b2,b3],[c1,c2,c3]] 然后通过一个RNN(LSTM或BiLSTM)，然后使用CTC (连接器时间损失)来查找丢失和训练网络

浏览 0提问于2017-07-11得票数 6

2回答

音频识别热词词库未生效？

上传了热词词库，但是识别结果热词感觉并未生效

浏览 248提问于2022-10-01

1回答

使用SAPI 5.3 Speech API进行声学训练

、、

在Vista上使用微软的SAPI5.3语音API，你如何通过编程对RecoProfile进行声学模型训练？更具体地说，如果您有一个文本文件和一个说出该文本的用户的音频文件，您会执行什么序列的SAPI调用来使用该文本和音频训练用户的配置文件？如果你使用音频文件而不是系统麦克风进行输入，这是否会使相对计时变得不那么宽松，因为识别器不会一直坐在那里听，直到扬声器听对了为止？

浏览 0提问于2008-11-18得票数 9

2回答