腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
BeautifulSoup
进行
网页
抓取
时
出现
429
错误
、
、
、
首先,我不得不说,我对
使用
Python
进行
Web
抓取
非常陌生。我正在尝试
使用
这些代码行来收集数据from bs4 import
BeautifulSoup
html_page = requests.get(baseurl).text soup =
BeautifulSoup
(html_page, 'html.parser
浏览 3
提问于2018-08-02
得票数 1
回答已采纳
2
回答
使用
BeautifulSoup
进行
网页
抓取
时
出现
“浏览器不受支持”
错误
、
、
我正在尝试网络
抓取
一个网站,但我一直得到这个“浏览器不支持”的
错误
。有人知道怎么解决这个问题吗?谢谢。537.36'} page = bs4.
BeautifulSoup
浏览 4
提问于2018-08-31
得票数 1
2
回答
使用
BeautifulSoup
进行
网页
抓取
、
、
、
我想从这个链接中删除国家名称和国家首都:from bs4 import
BeautifulSoup
soup =
BeautifulSoup
我觉得这很简单,但我并不能真正理解所有的教程,因为它们
使用<
浏览 1
提问于2015-11-20
得票数 0
1
回答
Python:当
使用
请求包在HTTPS页面上执行get请求
时
,如何确保凭据中的标志被封装
、
、
、
、
所以我
使用
BeautifulSoup
和请求从https网站获取数据类似于:中的解决方案 如何确保登录和密码受到保护,而不是以纯文本的形式发送
浏览 0
提问于2018-07-10
得票数 0
回答已采纳
1
回答
使用
Python、
BeautifulSoup
进行
网页
抓取
、
、
、
、
我在
使用
Python解析链接
时
遇到了问题。下面是我的代码: def get_content(html): items = soup.find_all('divlink = item.find('a', class_='gl-product-card__details-link') print(link.get('href')) 我得到了这个
错误
浏览 7
提问于2020-06-15
得票数 1
回答已采纳
1
回答
BS4返回到Cloudflare网站,而不是实际的网站
、
、
、
这是有效的,但当代码打印
时
,它会打印DDOS攻击网站,而不是加载之后的网站。我甚至尝试做一个time.sleep(5)来帮助计时。 我怎么才能克服这一点。import requestsimport time url = 'https://www.psacard.com/cert/49628062User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:80.0
浏览 26
提问于2021-01-15
得票数 0
2
回答
无法从Quora
网页
中
抓取
许多问题
、
、
我正在学习
BeautifulSoup
,并试图
抓取
this Quora页面上存在的不同问题的链接。 当我向下滚动网站
时
,
网页
中
出现
的问题不断
出现
并显示。当我尝试
使用
下面的代码
抓取
这些问题的链接
时
,在我的例子中,我只能得到5个链接。ie -我只得到5个问题的链接,即使在网站上有很多问题。 有没有什么解决办法可以让
网页
上
出现
这么多问题的链接?from bs4 import
BeautifulSou
浏览 39
提问于2018-12-22
得票数 1
1
回答
BeautifulSoup
4返回
错误
的超文本标记语言?
、
、
我正在尝试
使用
Beautifulsoup
在Indeed.com上通过网络
抓取
招聘信息。但是,当我
抓取
URL
时
,返回的HTML与我在Google Chrome中手动转到URL,然后查看HTML
时
看到的HTML不同。 'Doberman', 'Google',
浏览 0
提问于2019-07-10
得票数 2
1
回答
抓取
aspx页面的Python代码是什么?
、
、
、
、
我的要求是将mcode传递给下面的web aspx查询,然后将结果
网页
打印到pdf。 https://wwww.abcd.com/xyz/subject.aspx?
浏览 2
提问于2020-03-18
得票数 0
3
回答
如何解决以下代码中的NoneType Web
抓取
属性
错误
?
、
在对
网页
进行
web
抓取
时
,
出现
了
错误
(AttributeError:'NoneType‘对象没有属性'text')。如何消除此
错误
?我的代码是: pag
浏览 11
提问于2022-05-31
得票数 0
1
回答
如何配置Scrapy以
使用
BeautifulSoup
解析器
、
、
、
我
使用
BeautifulSoup
的默认html.parser从任何
网页
中提取数据,没有什么原因让我觉得它比
使用
XPATH/CSS选择器更灵活、更强大。在
抓取
之前,我学习了
使用
BeautifulSoup
进行
网络
抓取
。我想不出一种让Scrapy
使用
bs4作为解析器的方法。有可能吗?
浏览 2
提问于2019-08-18
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
进行
网页
抓取
:读取表
、
当我点击第二个页面
时
,url没有改变。import pandas as pdfrom bs4 import
BeautifulSoup
source =
浏览 0
提问于2019-09-27
得票数 1
2
回答
使用
beautifulSoup
和urllib
进行
网页
抓取
、
、
我
使用
的是python 3.6,我可以
使用
BeautifulSou.来
抓取
文本。我正在用沃尔玛网站练习。我试图从沃尔玛
抓取
文本。这是我的代码。from bs4 import
BeautifulSoup
main_page=urlopen('http://www.walmart.com/ip/Sceptre-32-Class-HD-720P-LED-TV-X322BV-SR/55
浏览 0
提问于2017-08-30
得票数 0
1
回答
使用
BeautifulSoup
对LinkedIn
进行
网络
抓取
时
出现
401
错误
、
、
、
我正在尝试
使用
Python库从我的LinkedIn "Recently Added Connections"页面中提取
BeautifulSoup
。具体地说,我想要最近连接的名称-它显示在页面顶部。当我检查这个特定部分的HTML
时
,我看到的包装内容是: <span class="mn-connection-card__name t-16 t-black t-bold"> Bob McBobface</span> 然而,我用
BeautifulSoup<
浏览 11
提问于2019-08-23
得票数 1
2
回答
使用
GoDaddy管理的Wordpress托管和Cloudflare的Google工具中的许多"
429
“爬行
错误
、
、
、
以下设置:Cloudflare作为CDN在我添加Cloudflare和SSL之前,它可以正常工作,没有任何缺陷。造成这一问题的更可能的原因是什么?如何
进行
最佳调试?
浏览 0
提问于2014-11-25
得票数 5
回答已采纳
1
回答
注释在
网页
上可见,但
BeautifulSoup
返回的html对象不包含注释部分
、
、
、
我尝试
使用
网址链接从
网页
中提取评论的文本内容,并
使用
BeautifulSoup
进行
抓取
。当我单击URL链接
时
,在页面上可以看到注释的内容,但是
BeautifulSoup
返回的HTML对象不包含这些标记和文本。 我
使用
带有'html.parser‘的
BeautifulSoup
来做
网页
抓取
。我成功地提取了给定
网页
中视频的点赞/浏览量/评论
浏览 19
提问于2019-03-25
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
进行
网页
抓取
时
,无法捕获html元素
、
、
、
使用
BeautifulSoup
进行
网页
抓取
时
,无法捕获html元素 我在pycharm中运行以下代码 from bs4 import
BeautifulSoup
pri
浏览 36
提问于2021-01-23
得票数 0
1
回答
范围循环在not擦除中不起作用
、
我已经用BS4写了一个小的
网页
抓取
器,用这个代码我可以一次刮掉一个页面,下面是相关代码。import csvimport requestssoup =
BeautifulSoup
(html,'lxml') 这段代码
抓取
一个页面,但是我想一次
抓取<
浏览 1
提问于2016-04-02
得票数 0
1
回答
如何刮出403
错误
的网站?
、
、
、
我试图刮下面的
网页
,但得到一个
错误
。/jamanetwork.com/journals/jamaneurology/article-abstract/2696970'soup =
BeautifulSoup
您可以在没有凭据的情况下访问
网页
,所以不知道为什么我在
抓取
时会
出现
“请求被禁止”的
错误
。
浏览 2
提问于2022-01-02
得票数 -2
1
回答
当有onclick事件按钮
时
,
抓取
数据
、
、
、
、
我正在尝试从"“中
抓取
数据(对不起,该网站没有英文) 当我不喜欢橙色的squre按钮
时
,这个站点没有"detailTable“ 单击该按钮
时
,会
出现
"detailTable“,我实际上想刮一下它用这个虚拟的
网页
由于它是虚拟
网页
,请求URL (POST)没有任何规则。 在这种情况下,单击onclick按钮("detailTable")
时
出现
的情况是Selenium,这是唯一的方法吗
浏览 6
提问于2022-06-07
得票数 2
回答已采纳
点击加载更多
相关
资讯
使用Python进行网页抓取的介绍
如何有效地使用网页操作器进行数据抓取?
使用多个Python库开发网页爬虫(一)
Python爬虫入门,快速抓取大规模数据
python爬虫-解析网页的几种方法之BeautifulSoup
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券