腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
转换/编译
从
数据库中
提取
的多个.
pdf
文件
为一个.
pdf
/
文本
文件
/html的程序
language-agnostic
、
text
、
automation
在数据库
中
查询姓名。所讨论的数据库更像是ebscohost而不是mysql。2.从一系列.pdfs
中
单独移除
文本
。3.将这些结果粘贴/输出到单个
文件
中
。我有限的背景是php,javascript,html,等等,我只是不认为他们有能力读取这样的
文件
类型,如果我错了,请纠正我。所以我猜我只是在寻找1.一种语言/或方法,可能很适合我已经学到的东西。我将尝试
从
他那里获得一些更精确的信息,当我得到它时,我会补充这一点。而且我没有必要的代表。添加'.
浏览 0
提问于2011-11-29
得票数 0
回答已采纳
1
回答
如何:打开C#,突出显示搜索结果,并将突出显示保存回
PDF
c#
、
.net
、
asp.net
、
pdf
、
itextsharp
如何搜索和高亮显示
pdf
文件
中
的
文本
?有什么想法吗?
浏览 2
提问于2011-07-04
得票数 5
2
回答
将
pdf
文件
转换为excel表格
c#
、
asp.net
、
excel
、
pdf
我是.net的新手,我有一个包含三个表的
pdf
(与购买细节)我的任务是
提取
所有的3个表
从
pdf
和转换成一个excel表(三个excel表)使用c#代码。,我谷歌了3天,所有我能找到的是
从
pdf
中
提取
文本
的代码(但没有任何格式),我不能购买任何第三方工具,我需要一种方法,至少
提取
文本
在适当的表格格式,然后我会转换成excel使用互操作,或一个代码直接转换成
浏览 5
提问于2013-09-29
得票数 1
1
回答
Itextsharp
pdf
解析
itextsharp
、
itext
为什么需要字体FontName.afm
文件
来解析
PDF
文件
,而itextsharp可以解析所有的
PDF
文件
?即 例如,
PDF
文件
包含字体是新的
文本
,所以我的问题是,它可以
从
PDF
文件
中
解析该
文本
,而无需提供FontName.afm
文件
。
浏览 4
提问于2015-01-06
得票数 0
回答已采纳
1
回答
从
PDF
格式的嵌套表中
提取
数据
c#
、
pdf
、
ms-word
、
text-extraction
我有几个
pdf
文件
是
从
word或excel
文件
中
创建的。我需要获取表
中
的信息。文档
中
的
文本
不是图像,所以我能够使用pdfbox之类的工具
提取
文本
。当我有
文本
时,我无法知道它属于哪些单元格,因为我不知道表的边框在哪里。Iv‘e尝试了一些桌面工具,比如abby或solid
pdf
转换器,它们能够实现。要将这些
文件
转换成漂亮的word文档,但这不符合我的需要,因为我希望
浏览 3
提问于2010-08-20
得票数 3
1
回答
如何计算锁定
pdf
中
的特定字数
pdf
、
word-count
如何计算锁定的
pdf
文件
中
的特定字数?我用谷歌搜索了很久,还是没有找到解决方案。
浏览 0
提问于2013-03-24
得票数 1
1
回答
使用Python仅从
PDF
中
提取
特定
文本
python
、
dataframe
、
pdfminer
、
pypdf
需要使用python
从
具有不同
PDF
结构的发票
PDF
文件
中
提取
特定的
文本
,并将输出数据存储
到
特定的excel列
中
。所有
PDF
文件
都有不同的结构,但内容值相同。试图解决这个问题,但不能只
提取
特定的
文本
值。 需要
提取
发票ID,发行日期,主题,金额
从
整个
PDF
文件</em
浏览 8
提问于2020-10-04
得票数 1
回答已采纳
1
回答
从
UTF-8格式
pdf
文件
中
读取并以cp1252格式写入写入器。
java
、
pdf
、
utf-8
、
bytearrayoutputstream
、
cp1252
我正在尝试使用
文件
流从一个
pdf
文件
中
读取,我想用cp1252编码格式将它写给一个作者。out,"UTF-8");writer.write(ch);oos.close(); 但是输出是错误的,因为
文本
是不可读的
浏览 3
提问于2016-03-21
得票数 0
1
回答
如何使用iText 7
从
PDF
中
提取
图像
文本
c#
、
itext7
我创建了一个简单的方法,可以
从
PDF
文件
中
提取
文本
并将该
文本
插入
到
txt
文件
中
。问题是,它只
提取
PDF
的
文本
,而不是
从
插入
到
pdf
中
的图像中
提取
文本
。我尝试了这个,但不知道如何实现。如果您只对
文本
感兴趣,则此代码可以很好地工作。//usi
浏览 52
提问于2021-06-03
得票数 0
1
回答
如何从头开始制作python
中
的
pdf
解析器
python
、
pdf
我希望从零开始制作
PDF
解析器,使用Python (或)任何导致调整现有库/算法的方法。
浏览 1
提问于2016-06-12
得票数 0
1
回答
如何以编程方式使用AcroTextExtractor.exe?
adobe-reader
我正在尝试
从
PDF
文件
中进行批量
文本
提取
。我尝试过很多库,Adobe Reader对我来说似乎是最准确的
文本
提取
工具。我注意
到
在安装Adobe Reader的
文件
夹中有一个AcroTextExtractor.exe
文件
。它的名字似乎很有希望,谷歌他们显示这个
文件
是
PDF
到
文本
转换例程的一部分。如何从命令行调用此
文件
进行
文
浏览 0
提问于2015-04-09
得票数 7
2
回答
从
.
PDF
文件
中
提取
数据
c#
我需要从.
PDF
文件
中
提取
数据并将其加载到SQL2008
中
。谁能告诉我该怎么做??
浏览 5
提问于2011-02-07
得票数 3
1
回答
Azure机器学习无法将
PDF
作为web服务的输入
azure
、
azure-machine-learning-studio
这些文档是
PDF
格式的。当我将这个实验部署为web服务时,它不允许我输入
PDF
。有没有一种方法可以将
PDF
输入
到
web服务?
浏览 0
提问于2017-02-06
得票数 1
1
回答
使用bash读取
pdf
内容
bash
是否可以使用bash命令读取
pdf
的第一页(并执行一个琐碎的grep等)并相应地重命名
文件
?-a
浏览 2
提问于2014-07-08
得票数 1
回答已采纳
1
回答
将PDFpage下载为字符串
android
、
eclipse
、
string
、
pdf
、
download
在做了一些基本的教程之后,我开始在eclipse
中
制作我的第一个真正的android应用程序。我想让这个应用程序检查EditText
中
的
文本
是否与PDFpage上的
文本
匹配(这个: (它包含我学校的课程表更改))。我已经了解了如何让应用程序检查EditText
中
的
文本
是否与字符串匹配(使用方法PDFpage ()),所以现在我唯一需要做的就是将该字符串
中
的所有
文本
下载到一个字符串
中
。但我不知道该怎么做。
浏览 4
提问于2012-07-22
得票数 0
回答已采纳
1
回答
批量重命名
pdf
文件
,其名称来自linux
中
其内容的特定行。
linux
、
bash
、
pdf
、
rename
、
batch-rename
我有多个要重命名的
pdf
文件
。新的名称应该
从
pdf
的
文件
内容的特定(比如说第5行)
中
取下来。例如,如果
文件
的第5行有内容some string <--这个字符串应该是
文件
名。其他
文件
也是一样的。每个
文件
都应该用内容的第5行重命名。我在终端机上试过这个do filename=`basename -s .
pdf
&quo
浏览 2
提问于2017-10-13
得票数 4
回答已采纳
3
回答
在NSString
中
从
pdf
中
获取
文本
objective-c
、
ios
我试图使一个iOS应用程序,这将从
pdf
文件
中
提取
纯
文本
,并在UITextView
中
显示它。它根本不是一个
pdf
阅读器来查看
pdf
文件
,但我希望稍后对该
文本
执行某些操作。我已经尝试过使用,但
文件
使用的是ARMV6架构,这在Xcode4.5
中
似乎已过时 如果任何人能使用iOS的Quartz-2d框架提供一些准确和清晰的代码,那就太好了。
浏览 4
提问于2012-12-26
得票数 1
2
回答
perl
中
的
pdf
解析
perl
、
parsing
、
pdf
我试图
从
pdf
中
提取
一些信息。我正在尝试使用来自getpdftext.pl模块的CAM::
PDF
。当我只运行$~ getpdftext.pl sample.
pdf
时,它会生成一个
pdf
文本
到
stdout。 但我正在考虑将其写入
文本
文件
,并解析perl中所需的字段。有人能指点我怎么做吗?但是,当我试图在perl脚本
中
调用pdftotext.pl时,我会得到一个No such file错误。#程序<em
浏览 3
提问于2011-10-06
得票数 4
3
回答
将
PDF
转换为.ipynb (
从
PDF
中
恢复木星笔记本)
python
、
pdf
、
jupyter-notebook
我有一个
PDF
文件
是
从
木星笔记本创建的,但是原始的.ipynb
文件
丢失了。有什么工具可以帮助将
PDF
转换成.ipynb吗?
浏览 2
提问于2020-06-24
得票数 0
1
回答
如何读取一些
pdf
文件
中
除表格以外的所有内容?
python
、
pdf
我想使用python读取
pdf
文件
,但在阅读时,我不想将表格包含在
pdf
文件
中
。我只想要除了那些表格之外的所有其他内容。我尝试过像PyPDF2和Tabula这样的库,但我只是找到了
提取
表格或读取包括表格在内的内容的方法。 我也不想创建一个新
文件
并在其中添加页面。
浏览 26
提问于2019-09-02
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何用Python从PDF文件中提取文本词汇
pdf文件中的图片怎么提取?教你快速提取PDF中的图片
怎样从PDF文件中提取图片?简单实用的提取方法!
如何提取PDF文件中的图片内容?
怎么从pdf里提取图片?怎么用pdf转换器提取pdf中图片?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券