腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(403)
视频
沙龙
1
回答
如
何在
python
3
中
从
pdf
中
读取
Telugu
表项
、
我正在使用下面的源代码
从
pdf
中
获取英文表格数据。但我无法获取其他语言。有人能帮助我如何传递语言参数和获取任何类型的语言吗 from tabula import read_
pdf
df = read_
pdf
(url, pages='all')
浏览 18
提问于2020-06-08
得票数 0
1
回答
我如何阅读
python
的
pdf
?
、
、
、
我如
何在
python
中
读取
pdf
?我知道一种将它转换为文本的方法,但是我想直接
从
pdf
中
读取
内容。 有人能解释一下
python
中
哪个模块最适合
pdf
提取吗?
浏览 2
提问于2017-08-21
得票数 45
1
回答
用PHP
从
PDF
中提取文本
、
我正在创建一个基于php的web应用程序,允许用户上传
PDF
文件。然后将
读取
该文件并检查某些数据(文本)。 问题是我甚至不知道如
何在
PHP
中
打开
PDF
文件。有一些
PDF
库主要用于创建
PDF
,但它们似乎不太擅长阅读它们。另一种解决方案是使用已有的
Python
或其他解决方案(
如
本站点上的其他线程所述),但我真的希望尽可能多地使用PHP,因为我打算稍后将数据导出到mysql等。任何关于如何阅读
PDF
并从中提取数据的建议都将
浏览 2
提问于2014-01-13
得票数 3
1
回答
在Windows上
从
Python
打开默认查看器
中
的文件
、
、
、
、
从
Python
脚本启动文件,在图形查看器
中
查看输出文件,让
python
脚本在不关闭查看器的情况下完成,这是一种常见的用法。在基于Linux的系统(
如
Ubuntu )上,您只需使用os.system(f'xdg-open "{file}"')。然而,在窗口上,这是行不通的。在Windows上,人们建议使用start命令,但这需要通过cmd.exe (
如
os.system(f'cmd /k start "{file}&qu
浏览 2
提问于2022-01-18
得票数 0
1
回答
如何
读取
亚洲语言(中文、日文、泰文等)的
PDF
文件并将字符串存储在
python
中
。
、
、
、
、
我使用PyPDF2
读取
python
中
的
PDF
文件。虽然它适用于英语和欧洲语言的语言(英文字母),但图书馆无法阅读亚洲语言,
如
日语和汉语。我尝试过其他库,
如
textract和PDFMiner,但都没有成功。 text = '
浏览 1
提问于2018-06-22
得票数 4
回答已采纳
3
回答
如
何在
python
中
从
文件夹
中
逐个
读取
pdf
文件
、
我正在阅读
pdf
文件,并试图通过NLP techniques.Right
从
它们提取关键字,现在程序一次只接受一个
pdf
。我在D盘上有一个文件夹,叫做'
pdf
_docs‘。该文件夹包含许多
pdf
文档。我的目标是
从
文件夹中一个接一个地
读取
每个
pdf
文件。我如
何在
python
中
做到这一点。到目前为止成功运行的代码如下所示。import PyPDF2 file = open('abc.
浏览 3
提问于2018-10-28
得票数 0
回答已采纳
3
回答
返回MVC FileContentResult以
从
、
、
目标:将UNC共享
中
的文件作为下载/打开选项返回给客户端。 信息:共享位于与承载网站的服务器不同的服务器上。当单击菜单上相应的文件夹名时,我能够成功地
从
共享(作为JSON结果返回文件)
中
读取
,然后在Jquery
中
为文件夹中找到的每个文件追加列
表项
,并使列
表项
ID成为文件名。这个很好用。当单击这些附加列
表项
时,我将它们的ID(即文件名,
如
"thefile.
pdf
")传递给返回FileCon
浏览 5
提问于2011-05-05
得票数 2
回答已采纳
1
回答
同时在多个文件上运行ipynb脚本/整个目录?
、
、
我会第一个告诉你,我的
Python
技能充其量是初学者,所以请原谅我在这里的无知。 作为背景,我在Anaconda木星笔记本
中
创建了一个
Python
脚本,它从文件夹C:\Users\...\PDFs
读取
单个
PDF
,提取上述
PDF
的文本,然后通过剪接将感兴趣的文本放入它创建的CSV文件
中
。问题是,我想在数百个
PDF
上执行这个脚本( ipynb脚本本身在单个
PDF
上执行时工作得很好,我只是不想继续手动更改Notebook/
浏览 5
提问于2021-01-25
得票数 1
回答已采纳
2
回答
如何
从
地理空间
PDF
中
获取坐标/范围?
、
、
、
、
我已经尝试在文本中转换
PDF
并
读取
它,我也尝试
从
PDF
文件中提取光栅来
读取
图像,但是没有一个替代方案有效。我在任何地方都没有找到
从
文件
中
获取这些信息的地方和方法。我尝试了什么: 和
PDF
:我尝试使用
读取
PDF
元数据。和图片:--我试着用在上找到的JS
中
的代码
从
PDF
中提取光栅,然后尝试用
读取
图像元数据,直到后来我才意识到这个代码在SVG中生成了一
浏览 9
提问于2022-05-17
得票数 4
1
回答
Python
:
PDF
:如何
从
表单元素(
如
复选框)
中
读取
、
、
我在
python
中用Reportlab创建了一个表单,例如,使用了一些复选框。magenta, pink, blue, green c = canvas.Canvas('simple_checkboxes2.
pdf
form.checkbox(name='cb3', tooltip='Field cb3', c.drawString(10, 500, '<
浏览 0
提问于2019-04-20
得票数 0
回答已采纳
1
回答
Python
代码将源自电子邮件的图像文件转换为
PDF
、
、
我需要能够直接通过电子邮件收到的发票到一个程序,只能
读取
PDF
格式的文件。这些发票通常是PNG或JPEG格式的图像。我想找出一个
Python
代码,允许我将这些非
PDF
表单,
如
PNG/JPEG,发送到一个特定的地址,无论是在线的还是本地的,它可以自动将这些文件转换为
PDF
,这样我就可以将它们发送到程序
中
。该程序只接受带有
PDF
附件的电子邮件上传。我有许多发票通过,所以我需要一些东西,可以处理多个文件被转换。 我不知道
从
哪里开始
浏览 1
提问于2020-12-03
得票数 0
1
回答
Python
库和ebook/
pdf
文件管理
、
、
我有数不清的数字格式的书籍,更多的是
pdf
格式的,但也有很多是电子酒吧格式的。它们太多,很难在文件夹中排序,可能是两个文件夹的一部分,因此它们被保存在一个文件夹
中
,而在其他文件夹
中
只有一个指向文件的链接。因此,我决定编写一个能够这样做的
Python
程序,然后打开文件的默认
读取
器。出于这些原因,我正在为任何能够
读取
pdf
文件的
Python
库提供服务,并为epub文件提供另一个库。我指的是两个库,它们能够
读取
文件
中
的标记
浏览 10
提问于2022-10-21
得票数 -1
回答已采纳
3
回答
用于
读取
PDF
文件的
Python
、
我发现很多帖子都提出了阅读
PDF
的解决方案。我想一个字一个字地阅读
PDF
文件,并对它做一些处理。人们推荐pdfMiner,它可以将整个
PDF
文件转换成文本文件。但我想要的是一个字一个字地读
PDF
。
浏览 2
提问于2011-05-10
得票数 11
回答已采纳
1
回答
用PyPDF2获取复选框和无线电字段
、
、
、
我的项目涉及
从
使用开源库的一堆
PDF
表单文件
中
读取
文本。在获取以下文本数据方面没有问题:cnt = len(reader.pages) print("reading
pdf
(%d pages我还尝试了reader.get_fields()和reader.get_form_text_fields()方法,
如
中所描述的,但是它们返回空值。我也试着读,但是没有在
浏览 6
提问于2022-08-23
得票数 0
4
回答
Linux -用于
PDF
文件的命令a2ps
、
是否可以使用a2ps命令打印
PDF
文件?如果有人能给我举个榜样呢?
浏览 9
提问于2014-10-06
得票数 1
回答已采纳
2
回答
错误:模块“熊猫”没有属性“read_
pdf
”
、
、
、
从
熊猫导入read_
pdf
方法时,使用
如
示例所示AttributeError: AttributeError:模块‘熊猫’没有属性'read_
pdf
‘
python
--version:
python
3.8.8Anaconda (version 1.7.2) I试图
从
已经存在的文件系统
中
<e
浏览 5
提问于2021-10-25
得票数 0
3
回答
macOS
中
的二进制(图像)数据剪贴板
、
当我将内容复制到剪贴板时,我可以使用以下命令将它们转储到我的控制台窗口或重定向到某个文件:但是,如果我右键单击图像并在浏览器
中
复制它,然后尝试: pbpaste >
浏览 2
提问于2010-06-30
得票数 10
回答已采纳
2
回答
动态文档的
Python
库
、
、
我想写一个脚本,为我的单位
中
的每个团队生成报告,其中每个报告使用相同的模板,但每个报告使用特定于每个团队的数字。报告应该是非程序员知道如何打开和阅读的格式,
如
.
pdf
。这在很多方面类似于R的rmarkdown,但我想生成的报告基于已经用
python
编写的代码
中
的数据。 我正在寻找的解决方案不需要直接导出到
pdf
。它可以导出到markdown,然后我知道如何转换。它不需要做markdown,但我知道如
何在
markdown
中
做其他所有事情,只要我能找到一种
浏览 22
提问于2019-11-21
得票数 4
回答已采纳
1
回答
解析XPS或
PDF
并将数据插入Word模板?
、
、
因此,我可以选择
从
数据库发送文档以
PDF
或XPS格式打印。我需要能够提取特定的数据,
如
姓名,日期等从这些格式之一,并将该数据插入到word模板。word模板不可编辑。您只能在字段中键入...每个字段前面都有一个标题,
如
姓名、道布等。我对C++、
Python
和Java已经很熟悉了。我有一点困难,找不出从这些文件类型
中
解析/提取数据的方法,以及哪种文件类型会更好。我完全不知
浏览 5
提问于2013-07-04
得票数 0
回答已采纳
2
回答
使用.NET将文档发送到网络打印机
、
、
我需要从数据库
中
读取
一堆
PDF
文件,将它们合并在一起,然后将其发送到其中一台打印机。如
何在
.NET (Visual Basic)
中
做到这一点?
浏览 2
提问于2009-08-03
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
用Python实现一款永久免费的PDF编辑工具
20行Python代码教你批量将PDF转为Word
Python基础教程21.1 问题描述
手把手教你如何用 Python从PDF 文件中导出数据
Django应用实战:编写你自己的PDF编辑器,实现PDF页面提取,页面合并与替换
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券