腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用Python
从
Latex导出
的
PDF
的
各个部分提取文本
、
、
、
我有科学
研究
论文
的
PDF
,这是用乳胶写
的
。每篇
研究
论文
都有“引言”、“相关工作”等部分,我想分别提取每个部分下
的
文本。这个
PDF
在第一页有“摘要”和“简介”两个部分。对于“引言”,我希望所有这些段落都在它
的
部分。如果我有Latex源文件,我可以做一些数据挖掘,并根据\section{}关键字提取文本 因此,我在Python3中尝试了一些方法,比如将
pdf
转换为latex ,但建议
浏览 4
提问于2017-09-28
得票数 0
1
回答
识别和提取
PDF
文档
的
特定部分
、
、
、
、
我有几个
PDF
格式
的
考试。我想通过编程将每个问题作为一个单独
的
图像/文档来提取。OCR并不理想,因为它没有很好地维护代码/方程格式。最终
的
目标是用每一张卡片制作闪存卡,每张卡片都包含一个完整问题
的
图像。问题可以在同一页上,也可以是多部分(例如1a、2f等)。 目前,我正在考虑使用OCR提取问题标签(例如1、2、3等)。然后在
pdf
中找到他们
的
位置,从一个问题
的
开始到下一个问题
的
开始,提取一个iamge。是否有任何框
浏览 8
提问于2017-11-07
得票数 4
回答已采纳
2
回答
Pdf
解析挑战
、
我有以下问题:我有很多
pdf
格式
的
论文
,我必须
从
每一篇
论文
的
第一页
中提
取
信息
,然后将其保存到数据库中。我该怎么做呢?有没有人已经这么做了?你向我推荐了哪些语言和工具?是否存在一个纸质存储库,已经完成了数据库馈送?考虑到
pdf
可能使用不同
的
编码,我也必须处理这个问题
浏览 0
提问于2011-05-18
得票数 1
回答已采纳
2
回答
wkwebview:查找web视图中加载
的
内容是否为
PDF
,并提供下载按钮。
、
、
、
、
我使用wkWebView来加载发表在IEEE、Science Direct等上
的
研究
论文
,所以当我点击
研究
论文
中
的
任何
PDF
时,
PDF
会被加载到webview中,那么是否有一种方法可以检测和启用wkWebView中
的
下载图标。尝试了解决方案:我尝试通过URLSession
从
URL获取
pdf
,这是为了像时代
的
95%一样,但有时我无法通过URLSession获得
PDF
浏览 1
提问于2020-02-13
得票数 3
2
回答
为什么字母“f”经常不能从
pdf
文件中
的
文本中复制?
、
、
我不确定这个问题是否符合这里
的
要求,但在我看来,字母'f‘在从
pdf
文本中复制时经常会被搞砸。 作为一名学生,我做
研究
,我读了很多
论文
。当我想复制文件
的
名称来重命名
pdf
文件时,这种情况经常发生。例如,我打开了链接
从
内置
pdf
显示插件Chrome在Macbook Pro与OSX10.9。试着复制
论文
的
标题并粘贴。“流体”中
的
“f”将消失。
浏览 2
提问于2013-12-12
得票数 10
回答已采纳
1
回答
如何
从
研究
论文
的
图像
中提
取(裁剪)图区域
、
、
、
、
我想从这张
研究
论文
的
图片
中提
取所有的数字/图表。我怎么能这么做?--我只想要数字部分--我有什么办法能把那部分剪出来吗?
浏览 6
提问于2019-12-12
得票数 2
回答已采纳
1
回答
如何
从
数据库
中提
取学术
论文
的
正文
、
我想知道我是否可以做出一个
从
数据库
中提
取
研究
论文
文本
的
算法,比如PubMed。 可能,查询语言也是相关
的
主题。首先,是否可以使用Python语言编写具有匹配条件
的
数据库搜索程序,如
论文
抄袭检查程序? 我认为
论文
抄袭检查程序给了我很多提示。 其次,这些程序如何搜索文本以检查与输入
论文
的
相似性?我发现许多
研究
论文
都不是免费
的
,它们
的
浏览 26
提问于2020-12-19
得票数 0
3
回答
Regex解析引文问题
、
、
我正在尝试
从
PDF
中提
取引用。我确认了我
的
regex在Rubular上工作,但是当我在一个真实
的
上测试我
的
代码时,它会显示出一些奇怪
的
间隔和错误
的
信息
。我如何修正这个regex,使它只提取APA
论文
引用(那些在参考部分,而不是在文本)。APA 可能是有用
的
。我正试图从一篇
研究
论文
中获得参考资料。如果您需要更多
的
细节,请告诉我。对于这个答案,多重正
浏览 3
提问于2015-09-25
得票数 5
回答已采纳
1
回答
从
科技
论文
中提
取特定
信息
、
、
我正在寻找我需要从科学
论文
中提
取
的
特定
信息
。这些
信息
主要存在于
论文
的
“评估”或“实施”部分。我需要提取内容中
的
任何函数名、参数、文件名、应用程序名、应用程序版本。是否有任何NLP技术/机器学习算法可以
从
科学
论文
中提
取这种类型
的
信息
?
浏览 6
提问于2018-10-24
得票数 1
1
回答
在R中对文章中
的
所有文本进行网络抓取
、
、
、
我正在创建一个网络摩天大楼,在那里我收集了一篇文章
的
全文。因此,现在我还不能获取文章全文所需
的
html。稍后应将文本输出到csv,其中所有文本都在一行中我
的
程序如下:library(RCurl)library(stringr)#for Fulltext to read
pdf
library(pdftools) fullText <-
浏览 1
提问于2021-03-31
得票数 1
1
回答
跨平台学术引文/稿件管理软件
、
、
我是一名学者,正在寻找一个软件来管理我
的
PDF
文件,具有以下功能:可用于引文管理 到目前为止,我看到了两个竞争者: Mendeley和Papers --然而Mendeley不允许(2)和(4),尽管文件做了所有的事情,但我必须为每一种设备购买不同
的
许可证
浏览 0
提问于2015-08-26
得票数 6
1
回答
从
PDF
中提
取页眉/页脚(以编程方式)
、
、
这可以
从
PDF
文档
中提
取页眉和/或页脚吗? 当我尝试了一些选项(包括PDFMiner,Ruby
PDF
-提取,
研究
PDF
格式规范),我开始怀疑页眉/页脚
信息
是不可用
的
。(如果可能的话,我想通过Python来实现这一点,但是任何其他
的
选择都是可行
的
。)
浏览 3
提问于2013-10-15
得票数 4
回答已采纳
1
回答
合并
PDF
并保留它们
的
索引(?)
、
、
我想合并两个
PDF
文件,保留两个文件
的
索引(xref-表)。.
中提
出
的
pdftk和工具 pdftk (pdftk)提供了一个"dump_data“命令,可以使用该命令提取元数据
信息
除了书签之外,使用"update_info“命令可以将这些数据放入
pdf</em
浏览 3
提问于2010-02-05
得票数 4
2
回答
使用wget
从
IEEExplore下载
论文
、
、
、
我现在离开了
研究
所,但需要从IEEExplore下载
论文
。http://ieeexplore.ieee.org/xpl/articleDetails.jsp?reload=true&arnumber=5738219&abstractAccess=no&userType= -O myp
浏览 1
提问于2014-04-02
得票数 11
3
回答
有没有办法
从
bash
中提
取
pdf
的
内容?
有没有办法
从
bash
中提
取
pdf
的
内容?(我有一个很大
的
学术
论文
文件夹,可悲
的
是,它们有"1010.3423.
pdf
“这样
的
标签。我想写一个bash脚本来更明智地命名它们,这涉及到谷歌搜索前几行。)
浏览 0
提问于2012-12-10
得票数 8
15
回答
如何
从
PDF
中提
取文本?
、
、
、
、
有人能推荐一个库/API来
从
PDF
中提
取文本和图像吗?我们需要能够获取文档中预先知道
的
区域中包含
的
文本,因此API需要为我们提供页面上每个元素
的
位置
信息
。有没有其他
的
方法(商业
的
或者免费
的
)来
从
pdf
<e
浏览 134
提问于2010-09-06
得票数 175
1
回答
从
PDF
中
的
文本中获取书目数据并导出到窗口表单
、
、
、
、
我使用iText5 for .NET
从
PDF
中提
取文本,使用下面的代码。Encoding.UTF8, Encoding.Default.GetBytes(s))); reader.Close();}%V 4%P 42-46%
浏览 4
提问于2011-12-06
得票数 0
1
回答
从
PDF
文档
中提
取特定片段
、
、
我有一些
pdf
格式
的
研究
论文
,我只想从
论文
中摘录导言/背景等。另外,我只能使用python。有人能帮帮忙吗?
浏览 18
提问于2018-08-12
得票数 0
回答已采纳
1
回答
过滤Rails数据库
我已经创建了一个
研究
人员
的
数据库,以及他们用Rails编写
的
论文
。我需要能够按作者对其进行过滤,以便将
信息
从
数据库
中提
取到人员姓名
的
页面上(例如,如果有一位名为Dr.A.
研究
员
的
研究
人员,我需要能够转到他
的
页面,该页面将填充他/她自动撰写
的
论文
)。我已经在这方面工作了一段时间了,并且已经绕了这么多次,我不太确定我在寻找什么(尽管我认为它
浏览 2
提问于2012-07-12
得票数 0
回答已采纳
1
回答
android应用程序中
的
权限模式
、
这是的
研究
论文
Android恶意软件检测与对比许可模式。 在一个android应用程序中可以有多个权限模式吗?如果是,怎么做?
浏览 2
提问于2015-10-31
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券