腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
BeautifulSoup
抓取
多个
URL
、
、
我正在尝试
抓取
一个网站,然而,我无法完成代码,以便我可以插入几个网址一次。目前,代码可以一次
使用
一个
URL
, 当前代码为: import requestsimport lxmlfrom urllib.error import HTTPErrorfrom bs4 import
BeautifulSoup
goo
浏览 28
提问于2020-09-18
得票数 0
3
回答
Web
抓取
:用Python
抓取
多个
Web
、
、
from bs4 import
BeautifulSoup
forpg in range(1, 10): soup =
BeautifulSoup
(page.content, 'lxml') for paragraph
浏览 1
提问于2019-01-13
得票数 3
回答已采纳
1
回答
使用
BeautifulSoup
抓取
URL
、
、
我必须在
URL
中放置一个变量吗?我需要通过一个列表形成一个循环或循环吗?from bs4 import
BeautifulSoup
soup =
BeautifulSoup
(html,'lxml')
浏览 2
提问于2016-04-01
得票数 0
回答已采纳
3
回答
如何从
多个
urls中刮取数据并将这些数据保存在同一个csv文件中?
、
、
、
、
我正在
使用
beautifulsoup
来
抓取
数据。有
多个
urls,我必须将我从这些urls中
抓取
的数据保存在同一个CSV文件中。当我试图从不同的文件中
抓取
并保存到相同的CSV文件时,我在CSV文件中刮到的最后一个
url
中的数据就在那里了。下面是我从其中
抓取
数据的代码。images = []for page in pages:
url
= "https:/
浏览 17
提问于2022-09-05
得票数 0
回答已采纳
1
回答
在Chrome中
使用
Headless模式效率较低?
、
、
、
、
我
使用
selenium +美汤(
使用
selenium打开包含大量javascript的页面,并
使用
javascript命令将其转换为
BeautifulSoup
对象)来从体育网站上
抓取
数据,但由于某些原因,我不能
使用
无头浏览器。当我
使用
chromedriver实现无头浏览器时,我几乎不会像让chromedriver打开并运行时那样
抓取
大量数据。有没有人有类似的问题,或者有什么建议?') 我的项目非常长,由
多个
文件组成。但是,上
浏览 2
提问于2020-05-09
得票数 0
1
回答
使用
Python和
BeautifulSoup
抓取
多个
页面-网站
url
不起作用
、
、
、
我的python代码成功地从https://www.groupeactual.eu/offre-emploi中
抓取
文本并将其保存到csv文件中。然而,在上面的网站上有
多个
页面可用,我希望能够在其中刮。例如,
使用
上面的
url
,当我单击指向"page 2“的链接时,整个
url
会发生变化,但当我在代码中
使用
该
url
时,我会得到来自page 1的结果。 如何更改我的代码以从所有列出的可用页面中
抓取
数据?我的代码: fro
浏览 16
提问于2020-07-17
得票数 1
2
回答
美丽的汤用Python 3
抓取
多个
URL
、
、
、
、
下面的代码运行良好,但我需要
抓取
多个
网址,我不知道如何真正…基本上,我试图从一个搜索链接获得一个重定向链接 # Getting the webpage, creating a R
浏览 0
提问于2018-05-09
得票数 2
3
回答
是否可以从一个.txt中打开
多个
URL
并同时
抓取
所有网页?
、
、
我无法理解如何处理
多个
URL
。这就是我到目前为止尝试过的方法,但它只是从列表中
抓取
了最后一个
URL
:from bs4 import
BeautifulSoup
urls = (line.strip() for line in inf)
浏览 1
提问于2012-11-08
得票数 0
回答已采纳
1
回答
如何在不模拟点击的情况下
抓取
内容
、
有没有什么方法可以让我在不
使用
python selenium模拟点击的情况下获取描述?
浏览 16
提问于2020-07-20
得票数 0
1
回答
BeautifulSoup
抓取
多个
链接
、
、
我想
使用
BeautifulSoup
抓取
这个website,首先提取每个链接,然后一个接一个地打开它们。一旦他们被打开,我想刮公司的名称,它的股票代码,股票交易和提取
多个
PDF链接时,他们是可用的。data.append(str(link.get('href'))) try:
url
= base + link req = requests.get(
浏览 18
提问于2021-04-11
得票数 0
回答已采纳
3
回答
Python web
抓取
用户列表
、
我试图从一个网站上
抓取
用户列表,但它有
多个
页面,我可以
抓取
第一个页面,但当我
抓取
每个页面时就卡住了。代码-import requests for profile in soup.se
浏览 5
提问于2018-01-09
得票数 1
回答已采纳
2
回答
BeautifulSoup
体育刮板返回空列表
、
、
我正在尝试
使用
Python的
BeautifulSoup
从this网站上
抓取
网球比赛的结果。我尝试了很多东西,但我总是得到一个空的列表。我是不是犯了什么明显的错误?当我检查这个类时,它在网站上有
多个
实例,但它似乎没有找到它。import requests
url
= 'https://www.flashscore.com/tennis/atp-singles/frenc
浏览 34
提问于2020-09-17
得票数 1
3
回答
如何在python中并行
抓取
多个
html页面?
、
、
、
、
我正在用Django web框架用Python制作一个网络
抓取
应用程序。我需要用漂亮的汤库
抓取
多个
查询。下面是我写的代码的快照: r = requests.get(
url
) links= soup.find_all("a", {"class":"dev-link"}) 实际上,网页的
抓取</e
浏览 0
提问于2017-05-29
得票数 2
1
回答
BeautifulSoup
web
抓取
多个
页面
URL
不变
、
、
、
、
当
使用
漂亮的汤来进行网络刮擦评论时,当涉及到“所有观众”的评论时,我有一个问题。更改审阅列表页时,
URL
不会更新。type=user 单击下一步时,不会更改
URL
。Network Method Post 当我查看GET操作的头部时,我看到了一个请求
URL
,当我尝试它包含我需要的所有信息时,问题是我不知道他们进入下一个页面的命名约定。Request
URL
page 1->2 Request
URL
page 2->3 我怎样才能让漂亮的汤遍历这些呢? 谢谢! 下面应该有足够的
浏览 21
提问于2019-09-20
得票数 1
回答已采纳
1
回答
如何
使用
python
抓取
javascript表
、
、
、
我正在试着从这个页面
抓取
表格:有18个单独的页面,
url
不会为每个页面改变。任何建议都将不胜感激。
浏览 2
提问于2015-07-08
得票数 0
2
回答
当类名出现在
多个
位置时,在漂亮的汤中搜索项
、
、
、
我的问题是
BeautifulSoup
和Python。我试图
抓取
一个网站,但问题是div和类名在整个html中出现在
多个
位置,所以当我
抓取
它时,只显示每个类的第一个匹配项。下面是一个例子import csv
url
= 'http://www.thinkgeek.com/interestsicpg=HP_BrandLogos_Top_Color_Marvel&
浏览 0
提问于2015-01-31
得票数 1
1
回答
Web
抓取
:阅读所有的href
、
、
我用python编写了一个小脚本来读取网页中的所有href。但它有个问题。例如,它不读href="pages.php?ef=fa&page=n_fullstory.php&NewsIDn=1648"。import urllibpattern = re.compile(regex) htmltext =
浏览 2
提问于2017-05-11
得票数 1
回答已采纳
1
回答
如何
抓取
没有不同类的表数据?
、
、
我正在尝试写一些代码,将
抓取
不同的数据从一个股票筛选器网站上的表,并保存在excel中的数据。我遇到的问题是,对于我想要从表中提取的一些值,没有一个明确的类代码。from bs4 import
BeautifulSoup
import pandas as pd headers = {'User-Agent': 'Mozilla/df_headers = ['Ticker' , 'Owner' , 'Relationshiop'
浏览 12
提问于2021-11-07
得票数 0
回答已采纳
1
回答
如何从python
抓取
的
URL
列表中
抓取
数据?
、
、
、
我正在尝试
使用
Orange中的
BeautifulSoup
4从同一网站
抓取
的
URL
列表中
抓取
数据。 当我手动设置
URL
时,我已经成功地从单个页面中
抓取
了数据。year=2021&zone=1§ion=1901"soup =
BeautifulSoup
(req.text, "html.parser")) 并且我已经能够
抓取</e
浏览 21
提问于2021-07-23
得票数 1
回答已采纳
3
回答
Python
BeautifulSoup
剪贴表
、
、
、
、
我正在尝试用
BeautifulSoup
创建一个表格
抓取
。我写了这段Python代码:from bs4 import
BeautifulSoup
soup =
Beau
浏览 0
提问于2013-09-24
得票数 27
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python BeautifulSoup库自动抓取生成新文章
Python网络爬虫抓取网页的含义和URL基本构成
Python爬虫库-BeautifulSoup的使用
Python网络爬虫:抓取网页的含义和URL基本构成
如何使用Python和BeautifulSoup爬取网站
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券