使用Python抓取以使用BeautifulSoup收集有关属性的信息_使用Python的BeautifulSoup上的属性错误(web抓取)_使用Beautifulsoup时的Python抓取问题 - 腾讯云开发者社区

、、、、

这是我第一次做网络抓取。我想要做的是获得有关属性的所有可能的信息(位置，价格等)。所以现在，我通过谷歌搜索收集到的信息是这样的： import requestsfrom pprint import pprint as pprequests.get(rootURL)

浏览 0提问于2019-03-18得票数 0

回答已采纳

1回答

网页扫描:更新股票价格的通知

、、、

问题我是一个全新的Python程序员(我对python有一个非常基本的

浏览 4提问于2016-11-07得票数 0

4回答

JavaScript和HTML的抓取

、、、、

我正在做一个项目，其中我需要抓取几个网站，并从他们收集不同种类的信息。信息，如文字，链接，图像等。有什么办法吗？

浏览 8提问于2014-03-31得票数 5

回答已采纳

1回答

是否有可能从Last.FM应用程序接口中获取scrobble和监听器？

、、、

我正在使用Python来收集艺术家的信息。我已经在使用Python的pylast模块，但不知道它是如何工作的。

浏览 2提问于2013-05-29得票数 3

1回答

网络抓取或数据采集软件

、、

嗨，是我的问题吗？亲切问候Uzair

浏览 6提问于2022-07-22得票数 -1

3回答

从Zillow抓取数据的最佳方法是什么？

、、、

我试图从齐洛收集数据，但没有成功。url = https://www.zillow.com/homes/for_sale/Los-Angeles-CA_rb/?，位置等信息。我已经尝试过使用像BeautifulSoup这样的包进行HTML抓取。我也试过用json。我几乎肯定Zillow的API不会有帮助。我的理解是，API最适合收集特定属性

浏览 8提问于2017-10-07得票数 0

回答已采纳

3回答

如何使用CSS选择器使用BeautifulSoup检索位于某个类中的特定链接？

、、、、

我是Python的新手，我正在学习它用于抓取目的，我正在使用BeautifulSoup来收集链接(即'a‘标签的href )。我正在尝试收集网站的“即将到来的事件”标签下的链接。我使用Firebug检查元素并获取CSS路径，但此代码不返回任何内容。我正在寻找修复，也有一些建议，我可以选择适当的CSS选择器，以检索任何网站所需的<

浏览 0提问于2014-07-17得票数 39

回答已采纳

1回答

如何在Python中爬行，而网站屏蔽的内容不被抓取？

、、、

我是Python的初学者，尝试使用BeautifulSoup爬行。并试图抓取一个收集产品信息的网站。pr_url = soup.findAll("li", {"class", "_3FUicfNemK"})使用BeautifulSoup进行爬行的其他代码都是一样的。但问题是，即使我写下了正确的</e

浏览 0提问于2020-03-05得票数 1

回答已采纳

2回答

Ruby中可用的网页抓取gem/工具

、、、

我正在尝试在我正在处理的Ruby脚本中抓取网页。该项目的目的是展示哪些ETF和股票共同基金最符合价值投资理念。我想要抓取的一些页面示例如下：http://finance.yahoo.com/q/hl?s=SPY+Holdings http://www.marketwatch.com/tools/mutual-fund

浏览 0提问于2013-02-23得票数 10

回答已采纳

1回答

使用python实现Web数据的抓取

、、

我刚刚开始学习使用Python进行网络抓取。我的目标是从网站上为Bajaj汽车有限公司收集实时新闻。from bs4 import BeautifulSoup data = urlo

浏览 0提问于2015-11-04得票数 0

回答已采纳

5回答

如何从其他网站获取数据？

、、、

我想创建一个网站，从其他网站提取信息，并将它们打印到我的网站上，我正在进行研究，所以我想听取一些意见，这个项目的最佳解决方案是什么？我听说Python使用解析器可以做到这一点，我只是想知道我应该走哪条路，应该使用哪种语言？

浏览 1提问于2013-06-14得票数 4

1回答

我正在收集COVID疫苗接种数据，并尝试使用Python从这个站点(第一个站点--“接受1剂疫苗的人”)中获取疫苗编号。我尝试使用BeautifulSoup来提取超文本标记语言，然后按XPath或属性进行搜索。当然，首先，我使用BeautifulSoup解析页面： rhode_island = BeautifulSoup(requests.get('https://ri-department-of-hea

浏览 12提问于2020-12-19得票数 1

回答已采纳

1回答

如何在一个页面加载完所有搜索结果后使用python* urlopen抓取？*

、、、

我正在尝试抓取机票信息(包括机票信息和价格信息等)从使用python3和BeautifulSoup。下面是我使用的python代码。在这段代码中，我试图抓取2012-07-25从北京(北京)到丽江(丽江)的航班信息。import urllib.parsefrom bs4 import BeautifulSoup

浏览 2提问于2012-07-25得票数 5

回答已采纳

2回答

如何抓取没有页数的url

、、

我正在抓取一个网页，其中有一个没有页面，我如何才能抓取这些页面，以获得我想要的信息。假设我正在抓取一个URL ，这个页面有两个页面，我如何抓取这些总页面并得到总的产品列表。到目前为止我所做的是:我从他们那里抓取一个url，我通过正则表达式抓取一个特定的url，并试图从那个url中找到他们的链接，其他页面中没有包含链接产品名称的信息</em

浏览 1提问于2016-02-28得票数 0

3回答

通过bs4打印刮过的网页时出错

、、、、

代码：import urllibsoup = BeautifulSoup(page1) print(soup.get_text())\sony\Desktop\Trash\Crawler Try\try2.py", lin

浏览 3提问于2015-01-07得票数 1

回答已采纳

0回答

使用BeautifulSoup从链接获取元数据

、、、、

我正在尝试抓取链接，以获得标题，描述和图像，以给出文章或网页的一个小概述。目前，我通过BeautifulSoup获取元属性来实现og:title。这对新闻文章很有效。我如何使用BeautifulSoup和Python从任何网站--可能不仅仅是opengraph支持的网站--提取找到的第一张图片和标题？

浏览 10提问于2017-01-01得票数 0

3回答

Python漂亮的汤，在网站上刮桌子

、

我最近开始对通过python库beautifulsoup4进行网络抓取感兴趣，我的目标是获取有关新冠肺炎案例的数据(在摩洛哥是一个良好的开端)；我的信息所在的网站是："“有一个包含所有信息的大表，我尝试这样做：re

浏览 0提问于2020-10-16得票数 0

回答已采纳

1回答

Python web抓取: google搜索结果中的网站

、、、、

Python的新手。我想从一个谷歌搜索页面从多个网站(例如100+)提取信息。我只想提取关键信息，例如那些带有<h1>、<h2>或<b>或<li> HTML标签的信息等，但我不想提取整个段落的<p>。我知道如何从google搜索中收集网站URL列表；我还知道如何在查看页面的HTML后对单个网站进行网络抓取。我使用Request和BeautifulSo

浏览 18提问于2021-03-31得票数 1

3回答

检索超过7天的特定用户的推文

、、

我正在尝试获取任何用户的推文...但它只返回过去7天的推文...我想找回比那更早的推文...怎么做..。但它只给我在过去7天内的推文。

浏览 1提问于2010-08-10得票数 2

回答已采纳

1回答

如何在不模拟点击的情况下抓取内容

、

我正在尝试获取这个page上的课程描述。单击按钮后会显示描述，但我发现它们已经写在html中了。有没有什么方法可以让我在不使用python selenium模拟点击的情况下获取描述？

浏览 16提问于2020-07-20得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云