腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从docx表中
提取
URL
、
、
、
我用
python
3编写了一个解析器,使用
python
-docx库
提取
现有.docx中的所有表,并将其存储在
python
3中。 到目前一切尚好。它应该起作用的。未提供url或显示
文本
。我发现很多人对此也有类似的担忧,但大多数人似乎并没有“只是这样”的两难处境。
浏览 4
提问于2018-11-12
得票数 0
1
回答
利用深度学习从PDF中
提取
短语
、
我想教一个人工智能从PDF中
提取
特定的短语。例如,产品名称在文档中的某个位置,AI必须找到并
提取
它。我的问题是,是否最好将PDF作为图像或
提取
的字符串提供,因为文档是粗略构造的。
浏览 2
提问于2019-11-25
得票数 1
回答已采纳
2
回答
安装用于PDF
文本
提取
的弹出器
、
、
我试图跟随这个博客,尝试从发票pdf文件中
提取
文本
。我的
文本
提取
需要
提取
发票的特定字段。 我不确定如何使用这个.tar文件来解压包并在
Python
中使用它。 任何建议,我如何在我的mac上安装它,然后在
python
中以编程方式使用它来运行一堆
浏览 24
提问于2020-04-24
得票数 2
1
回答
使用
python
显示docx文件的内容
、
但是我下面的代码是
提取
文本
和打印it.Can,有人建议我怎么做呢?在这里,我的表中的
文本
正在显示,但没有显示表。这里能做些什么?
浏览 2
提问于2019-09-23
得票数 1
1
回答
将cp1251 pdf解析为
python
中的
文本
、
、
、
有什么方法可以用俄文(cp1251)从pdf文件中
提取
文本
吗? 对于解析pdf文件,我使用pdfminer包。
浏览 7
提问于2015-08-26
得票数 1
回答已采纳
1
回答
有没有办法在
python
中使用可读性(
文本
提取
算法)和自定义算法从
文本
中
提取
链接?
、
、
有没有办法在
python
中使用可读性(
文本
提取
算法)和自定义算法从
文本
中
提取
链接?1.)我在
python
中使用可读性。2.)我想以某种方式将
提取
的
文本
与原始的html
文本
进行比较,以便在文章的实际正文中
提取
链接。
浏览 0
提问于2011-01-04
得票数 0
回答已采纳
1
回答
Whoosh:索引MS文档,PDF
、
我想使用
python
进行文档搜索。Solr是行不通的,因为Java托管是一个限制。 因此,呼呼似乎是一个显而易见的选择。但它似乎不像Solr那样原生索引doc或pdf文件。
浏览 1
提问于2011-07-28
得票数 3
回答已采纳
1
回答
Azure机器学习无法将PDF作为web服务的输入
、
我在azure ML上部署了一个随机的森林实验,我试图根据文档包含的单词对文档进行评分。这些文档是PDF格式的。当我将这个实验部署为web服务时,它不允许我输入PDF。有没有一种方法可以将PDF输入到web服务?
浏览 0
提问于2017-02-06
得票数 1
4
回答
如何使用
python
从docx文件中
提取
超链接中的url
、
我一直试图找出如何使用
python
从docx文件中获取urls,但什么也找不到,我尝试过
python
-docx和
python
-docx2txt,但
python
-docx似乎只
提取
文本
,而
python
-docx2txt能够从超链接中
提取
文本
,而不是urls本身。
浏览 3
提问于2016-11-08
得票数 3
1
回答
Python
-
提取
文本
、
、
我有一个文件,其中包含一些
文本
,我需要从该文件中
提取
两个值并将其分配给变量。
浏览 8
提问于2021-09-26
得票数 0
回答已采纳
2
回答
Python
文本
提取
、
、
我正在用
python
做一个
文本
提取
。输出结果并不像我想要的那样好!我有一个
文本
文件,其中包含如下信息:VR 1.0
提取
不包括在换行符之后输入的数据,如果我运行此代码,输出将看起来像"AU Chen,G“,不包括其他名称,与标题等相同。Gully,SM,Whiteman,JA,Kilcullen,RN,2000
浏览 1
提问于2019-02-05
得票数 2
1
回答
将DOCX中的内容
提取
为
Python
代码
、
、
、
我一直在学习如何使用
Python
创建DOCX文件。但是,我有一个文档,我想使用
python
自动执行常规编辑。需要根据在excel电子表格中找到的术语进行编辑(删除或添加)。有没有办法将所有这些内容
提取
到
python
代码中,然后我可以根据excel电子表格添加关于在docx文件中打印或保留哪些内容的术语?主要关注的是DOCX内容-->
Python
代码 示例:如果我正在阅读的文档只包含一个段落“测试”,那么代码将生成一个单独的新代码,它将声明: document.add_paragraph('
浏览 21
提问于2019-07-10
得票数 0
3
回答
将PDF转换为.ipynb (从PDF中恢复木星笔记本)
、
、
我有一个PDF文件是从木星笔记本创建的,但是原始的.ipynb文件丢失了。有什么工具可以帮助将PDF转换成.ipynb吗?
浏览 2
提问于2020-06-24
得票数 0
1
回答
如何使用
Python
从PDF中的特定区域
提取
文本
?
、
、
、
我正在尝试使用
Python
从PDF中
提取
文本
,并且我已经成功地使用了PyPDF2,如下所示:pdfFileObj = open('path', 'rb')pageObj = pdfReader.getPage(0)这将从页面中
提取
所有
文本
,但我只想从页面左上角的3'x4‘矩形区域中
提取
浏览 13
提问于2017-08-21
得票数 9
1
回答
用深度学习或NLP对pdf文件中扫描文档的分类
、
、
、
、
我知道使用cnn分类图像,但我有一个问题,我有多种类型的扫描文件,在一个pdf文件在不同的页面。某些类型的扫描文档显示在pdf中的多个页面。输入将是pdf文件,其中包含扫描的目标文件。有人能指导我如何建立一个模型来解决这个问题吗? 谢谢你
浏览 0
提问于2021-08-27
得票数 1
1
回答
使用pyPdf在
Python
中裁剪页面
、
、
我正在编写一个脚本来从PDF中
提取
一些数据。PDF本身非常复杂,因为它有多个列。因此,我认为我应该裁剪每一列,并将这些列连接起来,以生成一个更适合使用pyPdf进行解析的新PDF。outputStream = file("out.pdf", "wb")outputStream.close() 然后,我将此PDF发送到PHP服务器,以解析它并获取
文本
浏览 7
提问于2015-01-31
得票数 2
回答已采纳
2
回答
如何在::前和::后之间
提取
文本
、
、
、
我想将
文本
提取
为::前面和::after之间的字符串。如何使用for循环
提取
selenium
Python
中的所有
文本
?
浏览 7
提问于2021-11-28
得票数 1
回答已采纳
2
回答
使用
Python
在运行
文本
中拆分单词?
、
、
我正在写一段代码,它将从运行的
文本
中
提取
单词。此
文本
可以包含分隔符,如\r、\n等,这些分隔符可能以
文本
形式存在。 我想去掉所有这些分隔符,只
提取
完整的单词。我如何使用
Python
做到这一点?有没有库可以用来处理
python
中的
文本
?
浏览 0
提问于2010-07-04
得票数 1
回答已采纳
1
回答
无法
提取
富
文本
--DOC,DOCX
、
、
、
问题:我需要的:有什么想法吗?
浏览 2
提问于2011-03-07
得票数 0
1
回答
如何在help()中填充各个方面
、
、
在查看几个不同模块上的help()时,它通常列出以下内容:MODULE DOCS课程: CLASSES
浏览 7
提问于2019-10-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python工具教你提取文本名词短语
如何用Python从PDF文件中提取文本词汇
文本提取函数
文本提取仨兄弟
Python提取Word文档中所有超链接地址和文本
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券