如何使用Python通过自动下载链接访问PDF文件？_如何通过Python使用World Bank API下载多个PDF文件_如何用Python自动找到下载按钮的链接并下载相应的文件？ - 腾讯云开发者社区

python、beautifulsoup、urllib3、urlopen

我正在尝试创建一个自动化的Python脚本，转到像this这样的网页，找到正文底部的链接(锚文本“此处”)，并下载后，点击上述下载链接加载的PDF。我能够从原始的超文本标记语言中检索并找到下载链接，但我不知道如何从那里获得link to the PDF。任何帮助都将不胜感激。links.append(link.get('href')) links2 = [x for x in

浏览 45提问于2021-04-21得票数 3

回答已采纳

1回答

从Google奖学金大量下载PDF

google-scholar、bulk-download

我想从谷歌学者那里下载100篇学术文章。我有机构访问权限，所以Google学者提供了可用的PDF文件。有没有一种自动下载PDF文件的方法？我意识到机构访问并没有给我大量下载的“许可”。然而，通过机构访问，我可以直接从谷歌奖学金页面上的链接访问PDF，而不是在付费墙后面。

浏览 0提问于2016-07-25得票数 0

1回答

检索动态生成并嵌入到HTML页面中的PDF文件

python-2.7、pdf、beautifulsoup

我正在尝试使用Python2.7检索嵌入在HTML页面中的PDF文件。我尝试过使用urllib和BeautifulSoup，但没有成功。我的问题是，当我显示页面的源代码时，我找不到任何PDF链接。以下是我正在尝试下载的PDF的一个示例：。编辑:我刚刚意识到PDF可能是动态生成的

浏览 0提问于2017-04-06得票数 1

3回答

如何使用Python下载pdf文件？

python、python-2.7、pdf、download、downloading-website-files

我正在寻找一种用python下载pdf文件的方法，我看到了推荐urllib模块的其他问题的答案。我试图用它下载一个pdf文件，但当我试图打开下载的文件时，会出现一条消息，指出该文件无法打开。urllib urllib.urlretrieve("http://papers.gceguide.com/A%20Levels/Mathematics%20(9709)/

浏览 8提问于2017-05-10得票数 7

1回答

使用Python在链接的href中执行JavaScript

javascript、python、mechanize、urllib、web-crawler

我正在尝试下载一些PDF的网站()自动使用Python.我尝试过使用urllib/urllib2/mechanize模块(我已经在其他站点上使用过了:这包括标准函数，如urlopen，urlretrieve等)，但在这里，链接的href属性中嵌入了JavaScript通过查看真实浏览器中的头文件(使用Firefox中的LiveHTTPHeaders扩展)，我知道会发出很多HTTP

浏览 5提问于2012-03-16得票数 6

回答已采纳

2回答

从http请求到txt的Pdf文件

python、shell、http、pdf、converter

我有一组指向pdf文件的链接：其中一些是受限的，这意味着我将无法访问pdf文件，而另一些将直接进入pdf文件本身，如上面的链接。我目前正在使用请求包(python)来

浏览 6提问于2014-10-09得票数 0

回答已采纳

2回答

从libsyn下载pdf和mp3

c#、webclient

的主要故事：我妹妹想从上学习韩语，她请求在这个网站上下载PDF和MP3文件，我以为这只是一个音频文件和pdf文件，所以我接受了她的请求，所以我访问了网站，然后我意识到她想要的是整个eBook和AudioBook，所以我决定不手动下载文件，而是制作一个自动下载程序。我的目标是从libsyn下载PDF或MP3文件，但问题是永久链接

浏览 0提问于2015-09-11得票数 1

回答已采纳

1回答

有没有办法让文件的URL在几秒钟后自动下载到Python的登录页面上？

python、html、pdf、redirect、web-scraping

在阅读了大量关于web抓取和如何使用Python进行URL重定向的帖子后，我终于不得不向您寻求帮助！我的目标是自动下载练习和他们的PDF格式的批改。我已成功保存练习，但在尝试下载更正PDF文件时遇到问题。例如，要访问更正文件，网站会提供此链接。当您单击它时，将打开一个页面，告诉您将访问更正。然后，几秒钟后，文件

浏览 0提问于2020-07-29得票数 1

2回答

使用ChromeDriver和Selenium禁用所有下载

selenium、selenium-chromedriver

当使用ChromeDriver通过Selenium访问一些静态文件时，比如hudoig.gov/sites/default/files/documents/2016-FW-1007.pdf (随机示例)，文件会自动下载到我的默认下载目录。有没有办法禁用此默认行为并防止保存文件？谢谢。注:我的问题类似于以下未回答的问题，但在我的情况下，我实际上想要禁用下载</e

浏览 67提问于2019-12-27得票数 0

回答已采纳

5回答

从网站下载所有.pdf文件的Python/Java脚本

java、python、html、download

我想知道是否可以编写一个脚本，以编程方式遍历网页并自动下载所有.pdf文件链接。在我开始尝试之前，我想知道这是否可能。问候

浏览 5提问于2014-02-15得票数 12

回答已采纳

1回答

使用wget从自重定向目录下载任意数量的文件

wget

我需要下载非常多的pdf文件(如果不是不可能，收集和整理所有链接)从我的大学网站使用wget，与以下链接：我使用以下命令： wget -mk --no-check-certificate --load-cookies cookies.txt http://examp

浏览 0提问于2015-11-05得票数 1

1回答

如何通过使用playwright导出blob文档来捕获下载事件

node.js、download、path、export、playwright

当我点击导出按钮时，页面将收集所有信息，然后自动生成一个pdf文件，并通过Chrome Viewver在新选项卡中打开。生成链接是: blob:https://somecode 我试图关闭Chrome Viewer并强制它下载pdf文件。但是，我无法捕获下载事件。请指导我如何使用Nodejs抓取Playwright的下载文件路径。谢谢。

浏览 63提问于2020-12-11得票数 1

2回答

如何获得上传到AWS桶的对象的下载链接？

python、amazon-web-services、amazon-s3、boto3

我使用AWS S3 boto3将文件上传到名为uploadtesting的AWS桶中。下面是一个实现示例：s3.meta.client.upload_file('files/report.pdf', 'uploadtesting', 'report.pdf') 从AWS S3控制台访问对象允许您查看对象URL，但是它不是一个可<e

浏览 4提问于2021-07-10得票数 1

回答已采纳

1回答

AWS Web服务器--一些PDF文件不显示在网页上，而是自动下载

amazon-web-services

日安，我目前正试图在iFrame中显示PDF文件，但出于某种原因，每当我访问这些链接时，它们就会自动下载。这是一个自动下载的文件:这是一个正常显示的文件：

浏览 5提问于2022-01-28得票数 -1

1回答

ANDROID - button重定向到浏览器并下载php生成的pdf

php、android、pdf、fpdf、android-download-manager

使用fpdf，我可以通过转到php文件和URL变量并通过$_GET[''];获取这些变量来生成类记录的pdf。int ID = 120120; String URL = "http://www.domain.xyz/printrecords.php?classid="+I

浏览 0提问于2018-03-13得票数 0

1回答

使用Scrapy下载PDF文件

python、session、cookies、scrapy

我正在使用一个Python web抓取框架Scrapy从一个网站抓取pdf文件。为什么会这样&你知道如何克服这个问题吗？

浏览 1提问于2011-11-13得票数 0

1回答

从网站源代码中的超链接中提取URL

python、html、parsing

我正在尝试使用BeautifulSoup解析来自的PDF文件。但是，锚标记中的href属性包含到该特定PDF的下载页面的某种HyperLink，而不是直接下载链接。在解压缩下载链接并通过Python脚本将其保存到硬盘驱动器时，我需要帮助。

浏览 1提问于2020-06-16得票数 0

回答已采纳

1回答

在无rails的capybara下载文件

javascript、ruby、selenium、capybara

场景:尝试通过capybara访问外部url来下载文件。Selenium或webkit必须用作驱动程序。机架测试不能使用，因为它不允许访问外部urls。 <a href="javascript:OpenFile('****.pdf', 2)">some_text_h

浏览 0提问于2016-04-26得票数 0

2回答

wkhtmltopdf:下载PDF到用户的HD

php、wkhtmltopdf

如何自动下载使用或生成的pdf文件(到用户的HD中)？你知道..。用户点击链接("Download this page as PDF")并将pdf下载到他/她的HD。哈维

浏览 1提问于2011-02-18得票数 0

回答已采纳

3回答

当网站用户通过php下载文件时，如何创建数据库日志？

php、mysql

我需要创建一个小网站，人们通过一个html登录/密码的形式访问一个会话开始。我已经完成了这一点，但我需要记录时，用户点击一个链接并下载一个文件。链接文件 header('

浏览 3提问于2011-03-04得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云