我正在使用pdf.js。获取带有字体信息的块的文本
Object {
str: "blabla",
dir: "ltr",
width: 191.433141,
height: 12.546,
transform: Array[6],
fontName: "g_d0_f2"
}
是否有可能以某种方式获得更多关于g_d0_f2的信息。
发布于 2016-11-17 14:18:07
注意,PDF.js getTextContent与PDF中的象形文字不匹配,也不应该匹配。PDF32000规范有两种不同的文本显示和提取算法。即使您可以在page.commonObjs中查找字体数据,但由于象形文字编码不匹配,对提取的文本内容显示可能没有真正的帮助。
该页面的getTextContent正在进行文本提取和getOperatorList gets (字形)显示操作符。查看src/display/svg.js呈现器如何显示象形文字。
https://stackoverflow.com/questions/40656289
复制相似问题