腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
bs4
无法
正确
打开
本地
存储
的
html
页面
、
当我试图解析
本地
存储
的
网页副本时,漂亮
的
汤返回给我胡言乱语。我不明白为什么,因为当我将requests和
bs4
模块一起用于抓取任务时,我从未遇到过这个问题。这是我
的
代码from
bs4
import BeautifulSoup as BS url_2 = r'/Users/davidferreira/Documents/coding_2/ak_screen
浏览 18
提问于2017-03-14
得票数 0
回答已采纳
1
回答
BeautifulSoup (
bs4
),
html
5lib,HTMLParseError:格式错误
的
开始标记,位于第1行,第11列
、
、
我需要将源代码从网站复制到
本地
存储
的
html
文件中,因为直接从url解析并不能捕获所有
页面
元素。我希望在源代码中提取一个表中
的
位置元素,用于地理编码。我
的
程序遍历几个
页面
的搜索结果,将每个
页面
的源代码写入
本地
存储
的
一个
html
文件。address元素大约只占每页材料
的
三分之一,所以去掉额外
的
元素以减小文件大小会很好。为此,我希望
浏览 15
提问于2017-07-01
得票数 0
回答已采纳
2
回答
在
本地
内容上使用漂亮
的
汤
、
、
我开始了一个研究项目,使用带有
本地
链接和镜像选项
的
wget抓取
页面
。我当时这样做是为了获得数据,因为我不知道这些网站会活跃多久。所以我有60-70个网站完全镜像
的
本地
化链接坐在一个目录。我现在需要从他们那里得到我能做
的
。 有没有一个很好
的
例子来解析这些
页面
呢?我意识到漂亮汤
的
设计是为了获取http请求并从那里解析。老实说,我对美汤还不是很了解,我
的
编程技能也不是很棒。现在我有一些时间投入其中,我想用简单
的</
浏览 5
提问于2017-01-10
得票数 1
1
回答
将BeatifulSoup输出保存到mongo并再次加载它
、
、
我有一个爬虫,为我
的
应用程序获得某些网页。我想将关注点分开,爬虫应该是‘哑’
的
,只需获取
页面
,接受BeautifulSoup JSON,并将其保存到MongoDB中。编辑:插图 import json req = urllib2.Request('http://www.google.comres.read()) soup_js
浏览 3
提问于2014-03-22
得票数 0
回答已采纳
2
回答
在Swift中从
本地
文件编辑和加载
HTML
、
、
、
、
我在我
的
项目包中
存储
了一个.
html
文件。当我在WebView.(UIWebview/WKWebview)中加载它时,会加载数据,但其中
的
表结构是不可见
的
。表
的
边框、列、行。这些值只是浮动
的
。在Chrome浏览器中,它
正确
地
打开
。webView.loadRequest(myURLRequest)iOS App UIWebView :
Html
页面
能够
浏览 2
提问于2018-07-19
得票数 2
回答已采纳
3
回答
我可以同时使用BeautifulSoup和Selenium吗?
、
、
我正在刮一个有关产品
的
信息
的
网站。我需要登录才能访问我可以访问
的
产品。成功登录并导航到“产品详细信息”
页面
后,Selenium将一无所获。在过去
的
一周里,我一直在努力,但什么也没有成功。所以,我想知道我是否可以尝试BeautifulSoup来获得我想要
的
文本,在达到这个点之后? 是可行
的
吗?请复述任何资料或阅读资料。
浏览 11
提问于2021-06-21
得票数 0
1
回答
漂亮汤4代码针对不同
的
情况返回不同
的
答案
、
、
我正在尝试使用以下
BS4
代码抓取网页:#url2 = "file:///C:/Users/abc.
html
"
html
= response.read()myuls = soup.findAll(&
浏览 1
提问于2014-07-16
得票数 0
1
回答
使用下载PDF文件
、
、
、
、
这里是我
的
代码:import requestsfrom
bs4
import BeautifulSoup soup= BeautifulSoup(response.text, "
html
.parserfilename, 'wb') as f: f.writ
浏览 4
提问于2020-07-21
得票数 2
1
回答
如何使用python获取动态web内容?
我想获取网页
的
动态内容。我在python中尝试过许多模块,比如机械化、urllib、
BS4
,并且在PHP中也使用了simple_
html
_dom模块,但是它们都没有帮助我
正确
地获取动态
页面
的内容。我试过这样
的
代码:url = '<url>'f = urllib2.urlopen(req) a = open("E://<url>.
浏览 3
提问于2015-05-20
得票数 0
回答已采纳
1
回答
如何在Android文件管理器中直接
打开
html
页面
时
正确
设置背景图片
的
绝对路径
、
、
、
、
我正在使用Android中
的
droidEdit创建一个简单
的
html
页面
,就是这么简单。在这个
页面
中有一个带有背景
的
div。这个背景是一个
本地
存储
的
图像,但是url必须(由于多种原因)是一个绝对路径,而不是一个相对路径,特别是像这样
的
路径: file:///sdcard/assets/images/test.gif 现在,如果我
打开
我<em
浏览 48
提问于2019-09-01
得票数 0
回答已采纳
3
回答
如何保存
本地
存储
中
的
状态?
、
、
、
active'); }; item.addEventListener('click',activeLink));我试了几种方法,却找不到办法
浏览 8
提问于2022-07-21
得票数 1
2
回答
使用python 3.5从静态
HTML
文件中提取数据
、
、
、
、
我在
本地
机器上保存了静态
HTML
页面
。我尝试使用简单
的
文件
打开
和BeautifulSoup。
打开
文件时,由于unicode错误和BeautifulSoup,它不会读取整个
html
文件,它适用于实时网站。#with beautifulSoupimport urllib.requestpage:
浏览 3
提问于2017-01-03
得票数 0
回答已采纳
2
回答
IE9不支持localStorage?
、
、
、
为所有浏览器
存储
本地
数据
的
最佳方式是什么?
浏览 0
提问于2012-11-09
得票数 5
回答已采纳
1
回答
使用Selenium在一个烧瓶应用程序中进行网络抓取?
、
、
、
、
我希望创建一个使用Selenium和
BS4
来抓取网站
的
烧杯后端。API将使用可以为<link>提供输入
的
任意前端进行调用。= driver.page_source但是,对于我想要抓取
的
页面
,内容会迅速添加,但是如果您在新浏览器中
打开
页面
因此,
页面
必须被
打开
,等待必须发生,然
浏览 5
提问于2022-01-04
得票数 0
1
回答
bs4
是否检索整个网页,即使需要物理滚动才能获得所有元素?
、
我对编码很陌生,我正在用Python学习,如果我违反了这篇文章
的
任何规则,我也很抱歉。我已经在这里上传了一个
html
代码示例,在这里您可以看到所讨论
的
元素: 我不是在这里要求一个特定
的
解决方案,只是一些指针,我应该使用
bs4
中
的
哪些功能来完成这个任务,或者,如果我需要通过另一个外接程序来完成它呢
浏览 0
提问于2018-09-14
得票数 1
回答已采纳
1
回答
升级后: rCharts在rmarkdown中不起作用
、
在我升级到rCharts版本0.4.5之后,我在我
的
rmarkdown文件中看不到绘图了。我已经生成了一个最小
的
rmd示例,其中我再也看不到绘图(如果我在浏览器中
打开
输出)。我完全不知道这是哪个包造成
的
。请注意,如果我使用$save模式,并且只导入创建
的
html
文件,如示例2所示,则可以很好地工作。我从highcharts演示中创建了一个最小示例。也帮了我
的
忙。设置打印
浏览 0
提问于2015-05-12
得票数 1
1
回答
引导3.1.1不工作于
Html
5shiv
的
IE8库
、
、
、
我在我
的
网页中使用了引导3.1.1,并添加了
html
5shiv库和响应库来修复这个问题,但是它没有在internet 8上运行。<
html
lang="en"> <meta http-equiv="X-UA-Compatible" content--[if IE]> <script src=&quo
浏览 4
提问于2014-08-08
得票数 0
1
回答
Python cgi脚本
无法
打开
本地
目录中
的
html
文件
、
、
、
param1=Something
的
href )时,它会启动一个cgi脚本,这个脚本用传递
的
值执行一些操作,最后生成一个新
的
网页,
存储
在我
的
机器
本地
(例如,在类似/home/user/web/out/
的
路径中好吧,我已经尝试在浏览器中自动
打开
这个新
页面
两天了,尝试了所有我在文档和论坛中搜索到
的
解决方案。我再次尝试使用webbrowser.open(),但后来我意识到我不
浏览 1
提问于2013-10-09
得票数 2
1
回答
角度登录
页面
、
、
我想知道人们会如何使用Angular应用程序
的
登录
页面
,该应用程序完全独立于应用程序,一旦通过身份验证,将被传递到主要
的
angular应用程序中。因此,类似于一旦通过身份验证就会传递到index.
html
的
Signin.
html
页面
。我想不通
的
是,将鼠标加载到signin.
html
的
主应用程序中,然后如何处理迁移到有自己模块
的
index.
html
,以及是否可以在登录-> in
浏览 1
提问于2015-05-01
得票数 0
1
回答
如何
正确
处理android网页包装应用程序
的
网页视图中
的
注销?
、
、
为了控制登录过程以获得自动登录,我在
本地
创建了一个登录
页面
,并且登录过程工作正常。登录
页面
将在
本地
存储
用户登录信息,以便下次用户
打开
应用程序时,将跳过登录页并显示登录网页。 然而,我遇到了登出
的
问题。用户如何返回
本地
登录页?我想
的
是在网页上创建一个注销栏,有一个登录按钮there.Are有更好
的
方法吗?更糟糕
的
是,网页上还有一个注销按钮,该按钮将引导用户进入在线登录
页面
,该
浏览 5
提问于2014-08-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
3.0版本-教你打开环保创业币的注册页面和正确注册及实名认证
论清远年轻人手机里app的正确打开方式,真实到无法反驳!
一直说爬虫,你可知道爬虫的机制内容的嘛?
selenium+python自动化88-用例不通过的时候发送邮件
用python爬取一整站的小图
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券