我是一名重症监护病房的护士,对电脑有点舒服。
我要修一门创伤课,需要读一本书。他们给了我一个eBook阅读,但它只能通过一个可怕的网站访问。
我试图抓取这个文件,这样我就可以把它放到我的eReader上了。我用谷歌铬做了检查,发现它从这里抓取了文件。我如何能够下载这(作为一个) pdf?
“src="https://openpage-ebooks.jblearning.com/op2_content/extracted_books/9781284184853-8.1.1/EPUB/xhtml/9781284180718_Title.xhtml”class=“内容-沙箱”style=“高度:455;”>
发布于 2022-01-12 11:17:52
src属性提供电子书的url (或者可能是嵌入式查看器?)在xhtml中,所以它不是pdf或epub下载链接。我猜你的读书机上没有网架吧?如果不这样做,您就无法保证您可以以与您的读取器兼容的格式获得它。您可能必须转到“网络”选项卡并查看发出的请求。可能需要使用auth令牌进行身份验证,因为当我尝试访问url时,它会给我一个403的禁止。
更新:从iframe标记的src属性中的附加信息和url结构来看,他们的服务器可能有电子书的每一页,从epub格式提取为xhtml,并且每次更改页面时都提供给网页。所以没有办法直接从这个页面下载pdf。从我们拥有的信息中,为了获得一个pdf,您必须将每个xhtml页面加载到iframe中(检查网络选项卡以找到页面的请求),并将其转换为您的读取器所需的格式。从xhtml转换为pdf是可能的,但我认为这将是繁琐的和/或需要脚本来查找、下载和转换每个页面(特别是因为您事先并不知道每个页面的url )。很抱歉让你失望了。
https://stackoverflow.com/questions/70680515
复制相似问题