我正在尝试解码以盲文字体编写的PDF文件中的文本,并输出正常的文本。但是PDFTextExtractor (在iTextSharp中)不能处理这种字体。有没有可能用其他方式?我想知道如何从pdf文件中解码。我试着用,string text = PdfTextExtractor.GetTextFromPage(例如Arial)和
在当今时代,我们对每件事都有大量的信息。有时,信息是巨大的,而不是数字化的。从一些类似的手册中找出具体的信息,以便实时地给用户提供基本信息,您会开发什么样的逻辑格式?用户无需阅读所有文档。您是否首先将文档转换为类似的结构?有什么建议吗?我知道这是某种文本搜索问题。让我举一个例子,使这个问题变得有点集中:Table of content 1.) The operator must use synthetic gloves to handle chemicalsMANUAL2:(用于Minesotta)