首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >有没有办法在带标签的PDF(可访问的PDF)中导出阅读顺序?

有没有办法在带标签的PDF(可访问的PDF)中导出阅读顺序?
EN

Stack Overflow用户
提问于 2019-08-21 16:22:39
回答 1查看 139关注 0票数 0

我正在尝试使用iText7创建一个验证工具,以比较标记的PDF的阅读顺序和标记顺序。我是iText的新手。

我在c#中使用了下面的代码来提取标记结构并将其保存为xml。参考:(Get marked content using the MCID content)

代码语言:javascript
运行
复制
    FileStream outXml = new FileStream("pdf_content.xml",FileMode.CreateNew);
    TaggedPdfReaderTool tool = new TaggedPdfReaderTool(pdfoc);
    tool.SetRootTag("root");
    tool.ConvertToXml(outXml);
    outXml.Close();

我希望将读取顺序导出为Xml或其他格式。

EN

回答 1

Stack Overflow用户

发布于 2019-08-23 16:58:56

不是的。

阅读顺序是人类的概念,可能因人而异。

看一下下面的例子:

红色部分是与故事相关的片段,但它们打破了正常布局。

  • 你会先读吗?
  • 你会按照从上到下、从左到右的阅读顺序来读吗?
  • 你会最后读吗?

读取顺序(一般情况下)至少需要人工验证。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57587354

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档