我目前正在实现的功能是解析一组pdf以检索每个pdf meta data.And,然后通过在其中引用另一个pdf的地方向每个pdf添加超链接来互连这些pdf。我能够在这些pdf上传到服务器后创建绝对hyperlinks.But,然后它们可以从服务器下载到任何本地机器路径。我希望这些超链接在下载到不同的location.So后工作,如何创建与pdf组相关的超链接?
目前,我正在从django/python中的html模板生成pdf。
下面是我的视图中的相关片段
result = StringIO.StringIO()
html = render_to_string(template='some_ref/pdf.html', { dictionary passed to template},)
pdf = pisa.pisaDocument(StringIO.StringIO(html), dest=result)
return HttpResponse(result.getvalue(), content_type='appli
我有一个pdf文档,里面有几个超链接,我需要从PDF中提取所有文本。我使用了中的PDFMiner库和代码来提取文本。但是,它不提取超链接。
例如,我有一个文本,上面写着,并附加了一个链接。我能够提取单词Check this link out,但我真正需要的是超链接本身,而不是单词。
我该怎么做呢?理想情况下,我更喜欢用Python来做这件事,但我也愿意用任何其他语言来做。
我看过itextsharp,但还没有用过它。我在Ubuntu上运行,如果有任何帮助,我将非常感激。
我想前置“下载PDF的”到任何超链接,链接到PDF文件。目前,我可以预置确切的文本,但它会将其预置到超链接文本。我希望它驻留在超链接元素之外,如下所示:下载一个带文本的超链接PDF
这是我现在使用的代码:
jQuery('a[href$=.pdf]').prepend('Download a PDF of ');