腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
URL
Python
中
提取
特定
文本
、
、
、
我正在尝试
从
返回的许多urls中
提取
特定
的
文本
。我正在使用
Python
2.7和requests和BeautifulSoup。一旦我在网址列表中找到了最高的数字,我就需要将这个"“加入到具有最高数字的网址
中
。最终的产品应该是这样的。 这是正确的方法吗?
浏览 2
提问于2017-08-14
得票数 2
回答已采纳
3
回答
在
Python
中使用
URL
从
txt中
提取
数据
、
我有一个包含txt 的
URL
,我想从这个
URL
中
提取
一段
特定
的数据:我已经添加了txt文件的截图。在截图中你可以看到“目录”。从这些目录
中
,我想要
提取
特定
项目编号的
文本
数据。例如,我想从第2部分项目5
中
提取
数据,这些项目的数据位于第12页。有人能帮助我使用
python
提取
此
特定
数据吗
浏览 2
提问于2020-10-31
得票数 0
2
回答
安装用于PDF
文本
提取
的弹出器
、
、
我试图跟随这个博客,尝试
从
发票pdf文件中
提取
文本
。我的
文本
提取
需要
提取
发票的
特定
字段。 我不确定如何使用这个.tar文件来解压包并在
Python
中使用它。 任何建议,我如何在我的mac上安装它,然后在
python<
浏览 24
提问于2020-04-24
得票数 2
1
回答
图像到
文本
转换
python
、
、
我正在尝试使用
python
中
的pytesseract模块
从
图像
中
仅
提取
突出显示的
文本
。 问题是我无法
提取
突出显示的部分,整个图像正在转换为
文本
,我不知道如何
提取
基于背景颜色的
特定
部分。
浏览 11
提问于2020-05-12
得票数 0
1
回答
用
python
从
pdf中
提取
特定
文本
是否可以使用
python
从
pdf中
提取
特定
的
文本
。 测试用例:我有一个超过10页的PDF文件,我需要
提取
特定
的
文本
和与它们相关联的值。示例:用户:value用户id:value。需要
提取
这些值。我能够阅读所有的页面,我现在想要具体的
文本
。
浏览 3
提问于2020-05-10
得票数 0
1
回答
PYTHON
+ SELENIUM (CHROME):如何
从
当前的
url
中
提取
特定
文本
,并使用
提取
的
文本
转到另一个
url
?
、
、
、
我使用iMacros已经有很长一段时间了,我有一段代码,我可以在其中
提取
文本
并使用它来创建我需要的
特定
url
。article[5]/h2/span/a" EXTRACT=TXT #With this, I'm able to use that extracted text to go to another
url
URL
GOTO=https://www.spiritfanfiction.com/perfil
浏览 12
提问于2019-04-27
得票数 1
回答已采纳
1
回答
使用
Python
仅从PDF中
提取
特定
文本
、
、
、
需要使用
python
从
具有不同PDF结构的发票PDF文件中
提取
特定
的
文本
,并将输出数据存储到
特定
的excel列
中
。所有PDF文件都有不同的结构,但内容值相同。试图解决这个问题,但不能只
提取
特定
的
文本
值。 需要
提取
发票ID,发行日期,主题,金额
从
整个PDF文件。
浏览 8
提问于2020-10-04
得票数 1
回答已采纳
1
回答
使用REGEX
从
URL
提取
特定
文本
、
、
我正在从事一个项目,其中我需要抓取一些
文本
,唯一可用的选择是通过正则表达式。如果这里的任何人可以帮助,那么请让我知道什么是正确的命令/语法来捕获文件编号从下面的
URL
。在本例
中
,我希望捕获的
文本
是"N14058677A“。 谢谢!TM
浏览 5
提问于2020-07-23
得票数 0
1
回答
从
文本
中
提取
特定
的
URL
、
我想从下面的
文本
中
提取
URL
:<a href="http://domaine.com/t/text/text"> <img src="http://domaine.com/i/text/></a> <br> <a href="http://[GoTo]"></a
浏览 8
提问于2017-06-27
得票数 0
回答已采纳
1
回答
从
docx文件中
提取
特定
字体的
文本
、
、
、
我使用
Python
3.4和
python
-docx库来处理.docx文件。我已经能够
从
文档中
提取
文本
。但我的目标是只
提取
那些具有
特定
字体的
文本
(并修改它们)。在过去的两天里,我一直在
中
搜索这个,但是没有结果。 这里有没有人对这个库有经验,如果有,他们能给我指出正确的方向吗?
浏览 1
提问于2014-09-01
得票数 4
1
回答
使用
python
从
PDF文件中
提取
相关
文本
、
、
、
使用
python
只
从
整个PDF文件中
提取
相关
文本
,并将输出数据存储到Excel的
特定
列
中
。我试图解决它,但不能
提取
特定
的
文本
值。下面是需要
提取
的示例输出的屏幕截图:我想
提取
excel.不同列
中
的发票号、订单号和总价值。
浏览 8
提问于2020-09-30
得票数 0
2
回答
从
SMS打开
URL
、
、
、
当我收到
特定
的消息时,我
提取
文本
并将其保存到一个文件
中
。该消息由
文本
和
URL
组成。如何
从
文本
文件
中
打开此
url
?
浏览 0
提问于2011-09-13
得票数 1
3
回答
如何
从
Python
的
url
中
提取
一些
文本
、
、
、
我试图让
python
从
URL
字符串中
提取
一些
文本
。SkuName总是在第5个"/“之后,然后在第6号"/”结束。我想
提取
“SkuName”names =names[index])) pri
浏览 1
提问于2019-03-28
得票数 0
回答已采纳
1
回答
谷歌什么时候索引了一个页面?
、
、
当Google索引一个
特定
的html页面时,我怎样才能找到(任何语言,但如果
Python
更好)? 理想情况下,我应该有一个
URL
列表来检查。此外,如果有人可以建议API
从
文本
中
提取
多种语言中的日期。
浏览 2
提问于2014-11-21
得票数 0
回答已采纳
2
回答
Python
BS4美汤HTML.Parser在网站上不起作用
、
我有
Python
3.7代码,尝试
从
以下网站()
提取
足球统计数据。看起来我在BS4美丽汤中使用的超
文本
标记语言解析器根本没有
提取
网站
中
的任何标签。我首先尝试
提取
特定
的标签,比如表示主队和客队的两个不同的div标签,以及包含球员姓名的标签。当这呈现了一个空的标签列表时,我只是简单地尝试
提取
该网站上的所有div标签,但我仍然得到了一个空列表。下面是我使用的代码:from bs4 impor
浏览 26
提问于2019-07-13
得票数 2
回答已采纳
1
回答
仅抓取来自多个不同网站的内容
、
、
、
因此,我已经建立了一个使用
Python
的网络爬虫,它让我的每一篇新文章都是html。现在重点是,我想分析纯内容(只分析文章,没有评论或推荐等),但我不能访问这些内容,除非定义一个正则表达式,以
从
我得到的html响应中
提取
内容。我曾尝试使用库html2text来
提取
内容,但该库仅将纯html转换为markdown,因此仍然存在评论或推荐等内容,我必须手动删除这些内容。 有什么想法,我该如何面对这个问题?
浏览 11
提问于2019-04-17
得票数 1
回答已采纳
2
回答
使用
python
提取
完整的XML块
、
、
、
是否可以使用
Python
从
XML文件中
提取
完整的XML
文本
块?我使用ElementTree和
Python
从
XML中
提取
标记和值,以便比较2个XML文件。但是可以
提取
XML块的整个
文本
吗?matches>36</matches> <WC>yes</WC> &l
浏览 0
提问于2018-11-28
得票数 3
回答已采纳
1
回答
使用
python
从
pdfs中
提取
特定
文本
、
、
我尝试过不同的
python
库来
从
pdfs中
提取
特定
的
文本
,我必须从这个pdf中
提取
标题下的
文本
,我必须将从例1开始的
文本
提取
为菱形粗体。 下一个pdf包含不同格式的的数据。在这个pdf
中
,我必须
从
历史
提取
数据到检查,然后
从
检查到调查与历史和调查作为一个excel文件
中
的列和相应的数据行。
python
regex不能满足这个条件,
浏览 20
提问于2022-06-30
得票数 0
3
回答
摘录PDF格式的
文本
(字体大小、类型等)
、
、
、
是否可以
从
PDF文件中
提取
有关
特定
字体/字体大小/字体颜色等的
文本
?我更喜欢Perl、
python
或*nix命令行实用程序。我的目标是
从
PDF文件中
提取
所有标题,这样我就有了一个包含在一个PDF文件
中
的文章索引。
浏览 8
提问于2013-10-15
得票数 4
回答已采纳
1
回答
如何
从
.docx文件
中
的表中
提取
文本
?
、
、
我希望使用
python
从
.docx文件
中
的表中
提取
文本
,以便进行进一步分析。row.cells: print(paragraph.text)我还试图像在表中一样遍历单元格,但我得到的错误
浏览 1
提问于2018-03-05
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券