腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
从一
个
类
中
提取
多个
元素
beautifulsoup
我一直在尝试从网站上抓取图片的链接,但我只设法获得了第一
个
链接。代码: from bs4 import
BeautifulSoup
source = requests.get(link).text imglist = soup.find_all('div', class_='container-chapter-reader
浏览 34
提问于2021-05-03
得票数 2
回答已采纳
1
回答
如何使用
BeautifulSoup
抓取Instagram
python
、
web-scraping
、
beautifulsoup
、
instagram
、
python-requests
我想
从一
个
公开的Instagram账户上抓取照片。我对bs4非常熟悉,所以我就从这个开始。使用Chrome上的
元素
检查器,我注意到图片在无序列表
中
,李有
类
“照片”,所以我想,到底什么--不可能很难与findAll擦肩而过,对吧?错误:它不返回任何东西(下面的代码),我很快就注意到,,
元素
检查器
中
显示的代码和我从请求中
提取
的代码,与我从请求中
提取
的代码
中
的 AKA无序列表不同。 知道怎样才能得到
元素
检
浏览 3
提问于2013-08-08
得票数 12
回答已采纳
2
回答
如何将两
个
不同的
元素
追加到列表
中
python
、
list
、
beautifulsoup
我使用
beautifulsoup
从url页面
提取
href链接,然后将url名称和
提取
的链接附加到列表
中
以创建列表。例如,对于每个url,我希望访问页面并
提取
链接
中
的url,然后将其附加到列表
中
的列表以创建: [['www.example.com', 'www.example.com/extractedlink1',我遇到问题的部分是在列表
中
追加列表
中
的两
个
元素
浏览 6
提问于2017-02-06
得票数 0
回答已采纳
2
回答
试图查找没有*特定*
类
的所有<a>
元素
python
、
web-scraping
、
beautifulsoup
我第一次尝试网络抓取,我正在使用
BeautifulSoup
从一
个
网站收集一些信息。我试图得到所有的
元素
,这些
元素
有一
个
类
,而不是另一
个
类
。例如:<a class="something">Information I want</a> <a cla
浏览 0
提问于2021-04-04
得票数 0
回答已采纳
1
回答
巨蟒和美丽的汤,捡起所有的
元素
python
、
elements
在python和BeatifulSoup的帮助下,我
从一
个
网站得到了一篇文字文章。现在我有
个
奇怪的问题..。我只是在
多个
p标记
中
打印出文本,这些标记位于带有
类
dr_article的div
中
。= tag.find_all("p").text但是,当我在[0]之前选择.text的第一
个
<e
浏览 5
提问于2013-08-01
得票数 5
回答已采纳
2
回答
BeautifulSoup
不会从网页中
提取
所有表单
python
、
html
、
forms
、
web-scraping
、
beautifulsoup
我希望
从一
个
给定的网站使用Python3和
BeautifulSoup
提取
所有表单。下面是一
个
执行此操作的示例,但无法
提取
所有表单:from bs4 import
BeautifulSoup
data = urlopen(url) parser =
浏览 0
提问于2017-03-27
得票数 2
3
回答
在python中使用re.sub()替换html代码
python
、
regex
、
str-replace
例如:在这种情况下,我试图在我的表
中
添加边框。
浏览 5
提问于2014-12-22
得票数 0
回答已采纳
1
回答
当
元素
存在于浏览器
中
时,漂亮的soup返回none
python
、
web-scraping
、
beautifulsoup
我已经看过之前的答案,但似乎没有一
个
是适用的。我正在构建一
个
开源的quizlet抓取器,用于
从一
个
类
(例如)中
提取
所有链接。在本例
中
,标签是a,
类
是"UILink“。但是当我使用下面的代码时,返回的列表并不包含我要查找的
元素
。是因为描述的JavaScript问题吗如何抓取这些urls?import requests from bs4 import
B
浏览 0
提问于2020-10-18
得票数 0
2
回答
使用Python从HTML中
提取
带有父标记类型的文本
python
、
html-parsing
我希望
从一
些HTML中
提取
文本和
元素
类型。some text'}, {'tag':'h1', 'text':'some header'}, {'tag':'div', 'text':'some more text'}] 我如何通过HTML解析来
提取
这些信息我尝试过使用
BeautifulSoup
并能够
提取
HTML
中
浏览 1
提问于2022-04-20
得票数 -1
回答已采纳
1
回答
使用
beautifulSoup
在没有
类
的情况下从标记
中
抓取
python
、
web-scraping
、
beautifulsoup
如果我想从锚标签
中
的href属性和字符串“水平零黎明”
中
抓取链接。我能用
beautifulSoup
做些什么来刮掉我需要的数据?
浏览 1
提问于2017-05-26
得票数 1
回答已采纳
2
回答
BeautifulSoup
- lxml和html5lib解析器之间的差异
python
、
web-scraping
、
beautifulsoup
、
lxml
、
html5lib
我使用的是
BeautifulSoup
4和Python2.7。我想
从一
个
网站中
提取
某些
元素
(数量,见下面的例子)。由于某些原因,lxml解析器不允许我从页面中
提取
所有想要的
元素
。它只打印前三
个
元素
。我正在尝试使用html5lib解析器来查看是否可以
提取
所有这些解析器。from bs4 impor
浏览 1
提问于2014-03-27
得票数 7
2
回答
如何
提取
嵌套在
多个
划分
元素
中
的锚
元素
python
、
html
、
web-scraping
、
beautifulsoup
、
css-selectors
我试图用一
个
公共的
类
attr从我漂亮的soup对象中
提取
锚
元素
,每个
类
都嵌套在
多个
分区
中
。这些划分是重复的,并用一些脚本分隔 我尝试利用锚
元素
中
的公共类属性来
提取
它们。import requests, bs4, webbrowser webpage.raise_for_status() soup=bs4.
Beautiful
浏览 22
提问于2019-05-27
得票数 2
回答已采纳
1
回答
难刮web表-
多个
嵌套
类
python-3.x
、
web-scraping
、
beautifulsoup
、
html-table
我试图
从一
个
网站刮表,但不确定是否能够正确地引用适当的
类
。我附上截图和从
BeautifulSoup
提取
的身体。我是不是看错了,请原谅,我对网络刮擦很陌生。我需要
提取
圆圈高亮部分
中
存在的表格,但是不确定如何在那里遍历。
浏览 6
提问于2022-08-23
得票数 0
回答已采纳
0
回答
选择带有
多个
css的html标签
beautifulsoup
我使用
BeautifulSoup
从html中
提取
标签。有一些具有
多个
css
类
的html标签示例: <a class ='a-link-normal s-access-detail-page s-color-twister-title-link='s-access-detail-page s-color-twister-title-link a-text-normal'>Div text</div&
浏览 9
提问于2018-07-18
得票数 0
3
回答
BeautifulSoup
-没有
类
的刮表
python
、
python-3.x
、
web-scraping
、
beautifulsoup
我被困在一
个
项目,需要我刮一
个
桌子
从一
个
网站。我遇到的问题是网页上有
多个
表,当我检查
元素
时,它们似乎都没有
类
。然而,表行和列确实有分配给它们的
类
。from bs4 import
BeautifulSoup
income_url = "http://zipatlas.com/us/pa/philadelphia/zip-code-co
浏览 11
提问于2020-04-13
得票数 1
回答已采纳
1
回答
beautifulsoup
4从具有特定属性值的锚点
元素
获取href
python
、
parsing
、
beautifulsoup
我正在尝试解析来自页面上
多个
锚点
元素
的href值,这些锚点
元素
的属性为itemprop,值为url,使用
BeautifulSoup
4 例如,从<a itemprop="url" href="/pages/page"></a>中
提取
/pages/page,但是在一
个
页面中有
多个
这样的项目,所以我希望将它们放在一
个
数组
中
。
浏览 2
提问于2016-10-28
得票数 1
1
回答
BeautifulSoup
-
多个
表
beautifulsoup
我怀疑如何
从一
个
html页面中
提取
多个
表。我们有两种类型的表,我只想将具有相同样式的表(包含很多列的表)导入到dataframe
中
。from bs4 import
BeautifulSoup
html = respons
浏览 4
提问于2021-12-11
得票数 -2
1
回答
如何
提取
特定
元素
后面的所有
类
"a“?
python-3.x
、
beautifulsoup
我正在尝试
提取
一
个
类
中
的所有
元素
a,这个
类
的文本是Full browser with import requestssoup =
BeautifulSoup
(requests.get(url).content, '
浏览 15
提问于2020-08-25
得票数 0
回答已采纳
3
回答
所有html
中
没有被请求和
BeautifulSoup
提取
的
元素
python
、
web-scraping
、
beautifulsoup
、
html-parsing
我正试图
从一
个
显示来自不同代理机构的当前赔率的网站上获取关于市场竞争影响的分配赔率。我正在使用请求和
BeautifulSoup
提取
相关数据。然而,在使用之后:from bs4 import
BeautifulSoup
url = "https://www.bestodds.com.au/odds/cricketICC-World-Twenty20/Sri-Lanka-v-Afghanistan_71992
浏览 3
提问于2016-03-17
得票数 0
回答已采纳
3
回答
使用Python Selenium性能进行Web抓取
python
、
performance
、
selenium
、
web-scraping
、
beautifulsoup
我认为不同之处在于浏览器加载
元素
所需的时间,但它肯定不止如此。一旦浏览器加载页面(5秒),我所要做的就是
从一
个
表中
提取
一些<tr>标记。大约花了3-4分钟才
提取
出1016条记录,在我看来这是非常缓慢的。我得出的结论是,用于查找
元素
(如find_elements_by_name )的webdriver很慢。要比find方法在
BeautifulSoup
中
慢得多?如果我从webdriver获得整个html,然后用lxml解析它并使用
Bea
浏览 0
提问于2019-09-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用多个Python库开发网页爬虫(一)
——BeautifulSoup
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
网页解析之Beautiful Soup库运用
Python爬虫入门,快速抓取大规模数据2
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券