腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有人能告诉我如何使用自然语言处理来
提取
诸如发票账单之类的
文本
信息吗?
nlp
假设我有
文本
文件,其中包含发票细节。我只想
提取
一些
基于
我的特定
条件
的信息,
如
Mobile-25000和quantity -1,我只想
提取
基于
移动和数量的信息,并将其存储在
文本
file.Can
中
,有人告诉我如何做到这一点。
浏览 0
提问于2020-04-01
得票数 0
3
回答
如
何在
python
中
基于
条件
提取
文本
python
、
pandas
、
beautifulsoup
title="Yet to Release"></a> Coming soon if a.text: titles.ap
浏览 25
提问于2020-07-24
得票数 0
回答已采纳
1
回答
根据同一级别的另一个子元素
文本
提取
子元素
中
的
文本
xml
、
python-3.x
、
elementtree
我是XML的新手,我已经考虑这个问题很长一段时间了……我想用
python
从xml文件中
提取
基于
另一个相同级别的元素
中
的另一个
文本
内容的
文本
内容: xml看起来是这样的: <element2> <source我想
提取
基于
文本
"content1“的
文本
"content2”。然而,如果我使用了iter()或child.tag,我就不能精确地定位我想要
提取
的
文本
浏览 15
提问于2019-09-11
得票数 0
回答已采纳
1
回答
Python
库或工具,可以在可搜索/可选择的PDF
中
获取包围框,而无需使用tesseract或任何其他与OCR相关的解决方案
python
、
pdf
、
computer-vision
、
ocr
、
bounding-box
我找不到一个
python
脚本或库,或者一个工具,可以在一个可搜索/可选择的PDF文件
中
给我在
文本
周围的包围框。我发现的所有工具首先将PDF转换成图像,或者使用GhostScript或其他工具,然后使用OCR解决方案(
如
Tesseract )
提取
包围框。但是,是否有任何
基于
python
的纯解决方案可以在可搜索/可选择的PDF中
提取
文本
周围的边框。 我试着寻找解决方案,并找到了一些,但他们使用的OCR服务,
如<
浏览 9
提问于2022-11-10
得票数 0
1
回答
用PHP从PDF中
提取
文本
php
、
pdf
我正在创建一个
基于
php的web应用程序,允许用户上传PDF文件。然后将读取该文件并检查某些数据(
文本
)。 问题是我甚至不知道如
何在
PHP
中
打开PDF文件。另一种解决方案是使用已有的
Python
或其他解决方案(
如
本站点上的其他线程所述),但我真的希望尽可能多地使用PHP,因为我打算稍后将数据导出到mysql等。任何关于如何阅读PDF并从中
提取
数据的建议都将不胜感激。
浏览 2
提问于2014-01-13
得票数 3
1
回答
如何提高Tesseract的效果
c++
、
image
、
opencv
、
image-processing
、
tesseract
我希望在使用OpenCV和tesseract时检测图像
中
的
文本
。我的步骤是: Green:通过OpenCV检测到
文本
(很好)。 黄色::<e
浏览 3
提问于2017-03-02
得票数 3
1
回答
在满足两个
条件
后从
文本
文件中
提取
数据
bash
、
scripting
、
grep
目前,我正在编写一个bash脚本,该脚本从一个名为carslist.txt的
文本
文件中
提取
数据,每辆车(及其相应的特性)都位于不同的行上。在
文本
文件满足单个
条件
(例如,下面的
条件
)之后,我能够从
文本
文件中
提取
和保存数据,但是我想不出如
何在
两个
条件
下这样做。:Corsa:1999:White:5Vauxhall:Nova:1994:Black:8 从上面的例子
中</
浏览 0
提问于2015-08-17
得票数 0
回答已采纳
1
回答
如何从数据库中
提取
学术论文的正文
sql
、
database
我想知道我是否可以做出一个从数据库中
提取
研究论文
文本
的算法,比如PubMed。 可能,查询语言也是相关的主题。首先,是否可以使用
Python
语言编写具有匹配
条件
的数据库搜索程序,
如
论文抄袭检查程序? 我认为论文抄袭检查程序给了我很多提示。 其次,这些程序如何搜索
文本
以检查与输入论文的相似性?我发现许多研究论文都不是免费的,它们的
文本
不允许直接搜索。
浏览 26
提问于2020-12-19
得票数 0
1
回答
如何使用Pyspark从mongodb
中
仅
提取
特定行?
apache-spark
、
pyspark
、
apache-spark-sql
、
spark-streaming
我正在从mongodb集合中
提取
数据,并使用Spark
python
代码将其写入bigquery表。option("createDisposition","CREATE_IF_NEEDED")\这将从mongodb集合中
提取
所有数据但我只想
提取
满足
条件
的文档(
如
sql查询
中
的where
条件
)。我发现的一种方
浏览 1
提问于2021-02-18
得票数 0
1
回答
解除用户上传的PDF的最佳方法
python
、
validation
、
pdf
我知道上传的PDF不应该/不需要包含任何可能被恶意使用的内容类型,
如
JS或AA。>我当前的用户输入验证是查看所有内容类型,如果"Encrypt“
中
的任何计数为有没有一种方法可以让我在内存
中
获取PDF,然后自动解除/解除它的武装,覆盖以前的文件?SuspectPDF = re
浏览 1
提问于2019-12-18
得票数 0
1
回答
图像到
文本
转换
python
python-3.x
、
ocr
、
python-tesseract
我正在尝试使用
python
中
的pytesseract模块从图像
中
仅
提取
突出显示的
文本
。 问题是我无法
提取
突出显示的部分,整个图像正在转换为
文本
,我不知道如何
提取
基于
背景颜色的特定部分。
浏览 11
提问于2020-05-12
得票数 0
2
回答
R
中
基于
条件
的
文本
提取
r
、
regex
、
text
、
data-manipulation
、
text-extraction
我有一个名为RN的字符变量,它的
文本
需要根据named_RN和general_RN的一些
条件
将其
提取
为2个变量。Amino Aminocap
如
您所见,我正在尝试
提取
括号内的信息。但是,如果RN有0代码,我想将它从0
中
提取
出来,如果它有非零代码,则
提取
到named_RN
浏览 2
提问于2017-06-19
得票数 0
回答已采纳
4
回答
在正则表达式中使用if子句
regex
、
vb.net
、
textmatching
我正在尝试将正则表达式传递给Regex.Match,以便从文章中
提取
特定
文本
。如
何在
正则表达式
中
编写if
条件
?我阅读了,根据它可以使用<?()>声明
条件
,但没有给出任何示例。例如,我有以下
文本
: "Mary have banana. Mary have apple. Mary have NO pear."但是,如果我只想
提取
mary拥有的结果,即(1) banana和(2) apple,我想我需要在(.+?\.)+?部分
浏览 4
提问于2011-04-13
得票数 0
回答已采纳
1
回答
如
何在
单个文档
中
查找单词相关性?
python
、
nltk
、
word
、
tf-idf
、
tfidfvectorizer
我想要在一个文档中找到一些词(
如
经济,技术)的相关性。 文档大约有30页,其想法是
提取
所有
文本
并确定与此文档的单词相关性。如果没有,我如
何在
Python
中
做到这一点?
浏览 1
提问于2019-04-01
得票数 0
2
回答
安装用于PDF
文本
提取
的弹出器
python
、
pdftotext
、
poppler
我试图跟随这个博客,尝试从发票pdf文件中
提取
文本
。我的
文本
提取
需要
提取
发票的特定字段。 我不确定如何使用这个.tar文件来解压包并在
Python
中使用它。 任何建议,我如
何在
我的mac上安装它,然后在
python
中
浏览 24
提问于2020-04-24
得票数 2
2
回答
python
从包含##开始
python
、
regex
我想用
python
regex在
文本
中找到包含此
条件
的所有字符串:
条件
是块##
中
的
文本
(某些
文本
) ##可以包含除##以外的任何字符。例如:要
提取
##db.tb.hh|db.dd.cc|(0)|##
浏览 3
提问于2017-05-01
得票数 0
回答已采纳
2
回答
使用
Python
在运行
文本
中
拆分单词?
python
、
parsing
、
text-processing
我正在写一段代码,它将从运行的
文本
中
提取
单词。此
文本
可以包含分隔符,
如
\r、\n等,这些分隔符可能以
文本
形式存在。 我想去掉所有这些分隔符,只
提取
完整的单词。我如何使用
Python
做到这一点?有没有库可以用来处理
python
中
的
文本
?
浏览 0
提问于2010-07-04
得票数 1
回答已采纳
1
回答
如
何在
python
中使用opencv对图像进行倾斜?
python
、
opencv
、
image-processing
假设Image包含一些其他信息,
如
文本
、圆形和矩形。现在,我想写一个脚本来拉直
基于
四个rectangle.my结果图像应该拉直的图像。因此,我可以在对其进行去偏斜后
提取
一些信息。我正在使用OpenCV
python
,请告诉我一种实现方法。请展示一些代码作为OpenCV
Python
.的示例,然后它必须类似于
浏览 0
提问于2016-12-27
得票数 2
回答已采纳
1
回答
使用Selenium (
Python
)从输出框
中
获取值
python
、
python-3.x
、
selenium
、
selenium-webdriver
、
selenium-chromedriver
我正在尝试
提取
基于
输入到另一个
文本
框的值在
文本
框中生成的
文本
。我查看了inspect元素,根本没有任何值的迹象,而且即使填充了这个框,“值”也没有。下面是页面()
中
的代码<td width="25%" class="form">Latitude:</td> <input type="text" name(&qu
浏览 2
提问于2020-01-22
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python在文本自动化处理中的应用
如何使用 Python 库来进行自然语言处理
NumPy能力大评估:这里有70道测试题
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券