腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
抓取
标签
属性
BeautifulSoup
、
、
、
我将从该页面中
抓取
所有data-oid标记,但在输出中不返回任何内容 代码 url = 'https://www.betexplorer.com/soccer/south-korea/k-league-2/bucheon-fc-1995-jeonnam/EDwej14E/' soup =
BeautifulSoup
(response.text
浏览 6
提问于2021-07-25
得票数 1
回答已采纳
2
回答
如何用
BeautifulSoup
访问
标签
的
属性
值
、
、
我正在使用
BeautifulSoup
和请求进行网络
抓取
。我知道如何在标记之间提取
属性
,但是如果我想要的是
标签
下面的数字'4.31',知道如何获得它吗?</svg>我试过:soup.find('title') 所以数字基本上就是
标签
..。
浏览 5
提问于2019-12-28
得票数 1
回答已采纳
1
回答
instagram帖子和评论的css选择器不起作用
、
在我下面的示例代码中,我导航到了奥巴马的第一个Instagram帖子。我试着指向他的帖子和旁边的评论。 driver.get("https://www.instagram.com/p/B-Sj7CggmHt/") element = driver.find_element_by_css_selector("div._97aPb") 我希望这适用于任何帖子和任何Instagram用户的页面,但似乎帖子和评论的xpath发生了变化。不管是哪篇文章,我怎么才能找到图片+评论的组合块呢?会很感谢你的帮助的谢谢。 我也希望能够单独指向图像和单独指向评论。我已经浏览了多个
浏览 10
提问于2020-03-31
得票数 1
1
回答
如何在没有标记对象的情况下使用Beautiful soup
抓取
值
、
、
、
我试图从图片中
抓取
一些数据,基本上是黑值(241,86,89...)featured_challenges = soup.find_all('a')作为一个新手,我不知道如何找到黑值,因为它们似乎不属于任何
标签
或
属性
……有人能帮忙吗?
浏览 9
提问于2020-08-01
得票数 0
回答已采纳
1
回答
通过任务进行练习,以连接到页面并从中获取信息
、
、
我现在正在做这个任务:“使用
BeautifulSoup
并请求Python包打印出纽约时报主页上所有文章标题的列表。”目前,我只能连接到该页面:from bs4 import
BeautifulSoup
else: print("Page not found!")
浏览 0
提问于2020-08-08
得票数 0
1
回答
使用
beautifulSoup
在没有类的情况下从标记中
抓取
、
、
如果我想从锚
标签
中的href
属性
和字符串“水平零黎明”中
抓取
链接。我能用
beautifulSoup
做些什么来刮掉我需要的数据?
浏览 1
提问于2017-05-26
得票数 1
回答已采纳
3
回答
抓取
具有多个
属性
的
标签
、
、
我正在尝试
抓取
一个有3个
属性
的
标签
。我已经使用了这段代码,但是我没有得到任何结果。我知道这个
标签
存在于html源代码中。'https://www.immobiliare.it/69866648-Vendita-Quadrilocale-via-Mario-Ridolfi-32-Roma.html') soup =
BeautifulSoup
浏览 1
提问于2018-11-28
得票数 1
2
回答
我不理解此AttributeError的原因:'NoneType‘对象没有'find_all’
属性
、
、
import requestsurl="https://ratings.fide.com/top_lists.phtml"soup =
BeautifulSoup
(html,"html.parser") list = soup.find("tbody").find_all("tr",limit=
浏览 0
提问于2021-01-05
得票数 0
1
回答
Web
抓取
:阅读所有的href
、
、
我用python编写了一个小脚本来读取网页中的所有href。但它有个问题。例如,它不读href="pages.php?ef=fa&page=n_fullstory.php&NewsIDn=1648"。import urllibpattern = re.compile(regex) htmltext =
浏览 2
提问于2017-05-11
得票数 1
回答已采纳
1
回答
如何限制
BeautifulSoup
发现的元素的数量?
、
当使用
BeautifulSoup
抓取
网页时,是否有一种方法可以限制find方法家族找到的元素数量。 例如,如果我只想要前5个
标签
,我可以使用
BeautifulSoup
做这个吗?
浏览 1
提问于2020-06-09
得票数 2
回答已采纳
1
回答
在Morningstar上无法使用Beautiful Soup找到桌子
、
、
我正试着用
BeautifulSoup
来
抓取
晨星财经。由于某些原因,我甚至找不到包含财务数据的表。 我尝试过使用div
标签
和table
标签
。两个都不走运。from urllib.request import urlopen as uReq'http://financials.morningstar.com我要
抓取
的数据表应该在"financials“div
浏览 11
提问于2019-06-21
得票数 1
1
回答
迭代URL以保存未知数量的图片
、
、
我试图从同行评议网站上
抓取
多张图片,以进行一些基于图像的分析,但我在试图弄清楚是否可以更改URL以从一篇特定的论文中
抓取
每一张图片时遇到了麻烦。全文在这里: 我正在使用的图像的URL是:。
浏览 0
提问于2020-12-01
得票数 0
10
回答
使用Python进行Web
抓取
、
、
、
我目前正在尝试
抓取
一个HTML格式相当差的网站(通常缺少结束标记,没有使用类或it,因此很难直接转到您想要的元素,等等)。到目前为止,我使用
BeautifulSoup
已经取得了一些成功,但偶尔(尽管很少),我会遇到一个页面,在这个页面上,
BeautifulSoup
创建的HTML树与(例如) Firefox或Webkit略有不同问题通常是这样的:网站打开一个<b>
标签
两次,当
BeautifulSoup
看到第二个<b>
标签
时,它会立即关闭第一个
标签
,
浏览 3
提问于2010-03-08
得票数 9
回答已采纳
1
回答
Python Web Scraper尝试让程序
抓取
某个特定位置的数据,而不是整个页面
、
、
当前的程序正在
抓取
它看到的所有用
标签
“文章”和
属性
/类“故事”表示的标题,因此不仅从合并和收购栏目中
抓取
标题,而且还从市场新闻栏目中
抓取
标题。一旦机器人开始从市场新闻栏目中
抓取
标题,我就一直收到
属性
错误,因为市场新闻栏目没有任何摘要,因此没有文本可拉,导致我的代码终止。我试着写了一行新的代码,告诉程序不要寻找所有的
标签
和文章,而是寻找所有的
标签
,如果我给机器人一条更直接的路径,它将从自上而下的方法中
抓取
文章
浏览 11
提问于2020-03-17
得票数 1
回答已采纳
1
回答
用
BeautifulSoup
抓取
<span>
标签
、
、
我正在尝试用
BeautifulSoup
抓取
页面,<span>标记中有<script>标记,如下所示 <span data-link="{include tmpl='productCardOrderCount
浏览 12
提问于2021-03-08
得票数 0
2
回答
使用Beautiful Soup在Web上浏览链接
、
、
我正在尝试
抓取
一个博客"“,并
抓取
其中的所有链接,以在每个
抓取
的链接中查找与人工智能相关的信息。标记和
标签
中有。imp
浏览 21
提问于2019-08-11
得票数 1
回答已采纳
2
回答
Python -从图像(alt标记)中刮取文本
、
我一直在使用
BeautifulSoup
成功地从网站上
抓取
一些信息,但是我在从图片/链接中
抓取
"alt“
标签
时遇到了问题。下面是我迄今为止使用的代码:from bs4 import
BeautifulSoup
tree = requests.get(page) soup = <em
浏览 1
提问于2020-04-24
得票数 2
回答已采纳
2
回答
不能从网站上刮掉一些"div“
标签
、
、
我正在尝试从这个页面中
抓取
职位:。可能是个新手的问题,但事实证明,我可以得到某些
标签
,而其他
标签
似乎是无法触及的,例如:from bs4 import
BeautifulSoup
html = urlopen("https://www.fl.ru/projects/") textTag
浏览 0
提问于2018-06-29
得票数 1
回答已采纳
1
回答
为什么对象没有'tbody‘
属性
?
、
、
、
我只是一个python初学者,主要是因为我的工作而
抓取
数据,我想知道为什么没有‘tbody’
属性
的原因。在HTML的tbody
标签
中很明显,它找不到。这只是一个简单的维基百科数据
抓取
脚本,这里是代码,有人能帮我吗?import requestsimport pandas as pd URL='https://en.wikipedia.org/wiki/List_of_countries_by_
浏览 32
提问于2019-11-23
得票数 0
1
回答
如何在多个页面上
抓取
链接标题并通过指定的
标签
、
我很难弄清楚如何使用
BeautifulSoup
来
抓取
页面上所有的100个链接标题,因为它是在"a href =.“下。我已经尝试了下面的代码,但它返回一个空白。from bs4 import
BeautifulSoup
import bs4 page = urlopen(url) soup = bs4.
Beautiful
浏览 17
提问于2020-06-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python BeautifulSoup库自动抓取生成新文章
使用多个Python库开发网页爬虫(一)
a标签中的title属性分享之水资源
php学习之ht.ml的标签属性1
Python爬虫之BeautifulSoup详解
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券