如何使用BS4中find all方法抓取某些字符串

、、、、

sp=0‘，它出现在整个页面中。我不确定如何使用soup.find_all方法来完成此操作。我需要的字符串总是出现在‘’旁边这就是我所想的(如下所示)，但显然我的参数是错误的。如何格式化find_all方法以在整个页面中返回‘/r/8291696a3726?sp=0’字符串？for divsec in soup.find_<

浏览 11提问于2016-08-02得票数 3

回答已采纳

1回答

findall中的findall对字符串无效

、

我试图在我抓取的HTML页面中搜索特定的字符串。我在bs4中使用了find_all()方法并提供了字符串参数，但它不起作用。hl=en-IN&gl=IN&ceid=IN%3Aen from bs4 import BeautifulSoup def search(soup):results = soup.find_all</e

浏览 34提问于2020-03-22得票数 0

回答已采纳

1回答

Python语言中BS4* find_all()语句中的过滤函数问题*

、、、、

我正在抓取一个HTML网页。我在Mac机上使用Python库(4.6.0)和BeautifulSoup (3.7)。在其他东西中，我看到了一堆'div‘标签，它们有class属性。为了获得这些标记，我尝试使用BS4文档()中提到的过滤函数。我的印象是，find_all()将bs4标记元素传递给函数，在该函数中，您可以对BS4标记元素执行任何操作。这似乎不是真的。我得到一个字符串，显然我所

浏览 103提问于2018-07-09得票数 -1

4回答

如何在BS4中有效抓取多个URL

、、、

我正在尝试找到一种在BS4中抓取多个页面的有效方法。我能够轻松地抓取第一页，并获得我需要的所有数据，但不幸的是，并不是所有的数据都在上面。还有另外两个页面需要抓取，而不是硬编码并更改第二个和第三个页面的URL，我想知道是否有更好的方法使用BS4在Python中实现这一点。唯一需要更改的部分是page=1到相应的页码(1、2、3)。import csv from bs4</em

浏览 0提问于2018-04-04得票数 0

1回答

用python抓取表

、、、

试图从开放访问的学术文章中抓取表格，出于某些原因，我无法从本文中抓取这些表，这就是我所做的，但由此产生的ResultSet“表”是一个空列表。谢谢你的帮助。from bs4 import BeautifulSoup content = requests.get(u

浏览 4提问于2017-08-26得票数 0

2回答

为什么beautifulsoup4的find_all()函数不能获取所有的<h3>标记

、、

import requestsfrom bs4 import BeautifulSoup as soup 'User-Agentheaders = headers) print(page.status_code)

浏览 0提问于2020-06-15得票数 1

1回答

美丽的汤刮

、、、

我的python代码是用漂亮的汤抓取一个网站，并提取事件数据(日期、事件、链接)。我的代码是拉取位于tbody中的所有事件。每个事件都存储在一个<tr class="Box">中。"Box">中拉取事件数据。有没有一种方法可以跳过这种tr风格/忽略未来的案例？ ? ('tbody') table_rows = table.find_all('tr'

浏览 12提问于2020-09-30得票数 2

回答已采纳

2回答

如何使用漂亮汤检查字符串是否存在

、、

嗨，我正在尝试编写一个程序来抓取一个URL，如果刮取的数据包含一个特定的字符串，那么如何使用漂亮的汤来实现这个目标呢？import requestsdata = requests.get('https://www.google.com',verify=False)for inp in sou

浏览 0提问于2018-11-03得票数 2

回答已采纳

1回答

用漂亮汤抓取网页数据

、、、

我尝试过抓取商店位置的文本详细信息，并使用BeautifulSoup将它们写入csv。在佐治亚州，第一家商店机场在名为location的单一类中，在LocationSecContent类中，其余4家在LocationSecContent中的另一个类位置中。我想要抓取文本详细信息，并将商店详细信息，如名称、位置、街道、电话、传真、小时内容和所有详细信息写入csv文件。我在firefox中使用firebug。以下是我尝试过的方法： fro

浏览 0提问于2017-05-16得票数 0

2回答

如何用空类值从div中刮取文本

、、、

嗨，如何在不上课的情况下从div中抓取文本？首先，我尝试使用类“作业”页从div中抓取所有数据，然后没有类值，但它不起作用。import requests try: page_content = BeautifulSoup(

浏览 1提问于2018-04-28得票数 0

回答已采纳

2回答

如何在csv中写入抓取的数据？

、、

大家好，我是python的新手，我不知道如何将抓取的数据转换成csv格式。这是我的程序import urllib.request import pandas response = requests.get(url) soup = BeautifulSoup(response.text, "html.parser&q

浏览 1提问于2019-09-25得票数 1

1回答

使用python在相邻字符之间创建空格

我有一个网页抓取器，它可以抓取页面内容并写入csv文件。company-govcloud-ab-mc-nonprod(MC Non Prod)在我的代码中，我尝试使用替换来插入空格，但它不起作用：fr

浏览 15提问于2019-08-12得票数 0

回答已采纳

1回答

Python数据抓取:使用href和prettify系列来抓取标题不起作用

、

').text filename = tvhead.tr.find_all('td',class_='coll-1 name')现在，我想要抓取该集的标题和文件大小，然后在该页面中对所有这些内容进行循环。但在此之前，我只能使用以下代码

浏览 5提问于2018-09-12得票数 1

3回答

是否可以从一个.txt中打开多个URL并同时抓取所有网页？

、、

我无法理解如何处理多个URL。这就是我到目前为止尝试过的方法，但它只是从列表中抓取了最后一个URL：from bs4 import BeautifulSoup line = url for td in soup.find_all('

浏览 1提问于2012-11-08得票数 0

回答已采纳

1回答

尝试使用美汤从html表中抓取特定数据。

、

我试着从下面的html表格中抓取时间。color="#000000" size="2">10:00 </font><input name="new" type="text" class="myinput"/></tr> 我想不出如何解析时间号import bs4 as bs sourc

浏览 14提问于2019-06-24得票数 0

3回答

Web抓取:用Python抓取多个Web

、、

from bs4 import BeautifulSoupforpage=' + str(pg) for paragraph in soup.find_all('p'):print(paragraph.

浏览 1提问于2019-01-13得票数 3

回答已采纳

1回答

如何使用美丽的汤和熊猫从这个网站上捕获结构化格式的表格？

、、、、

我想从这个网站上抓取表格，因为它每小时都在更新，所以我也想跟踪变化。我尝试过使用selenium抓取数据，但它们都在一个列中，没有任何表。如何使用pandas和Beautiful Soup以结构化的格式抓取表格并跟踪更改。这就是我想弄明白的代码。import pandas as pdsoup = BeautifulSoup(html, "html.parser") tab

浏览 7提问于2020-09-23得票数 0

回答已采纳

1回答

如何使用Python和BeautifulSoup或Pandas从Finviz.com中抓取最大赢家和最大输家的表行？

、、、

如何使用Python和BeautifulSoup或Pandas从Finviz.com中抓取最大赢家和最大输家的表行？import requests c=r.content table =soup.find("

浏览 15提问于2020-04-09得票数 1

1回答

将漂亮汤刮擦表转换为列表

、、

用Beautifulsoup从Wikipedia中抓取一列将返回最后一行，而我希望它们都在列表中：from bs4 importwiki/Agriculture_in_India"soup = BeautifulSoup(html, "html.parser") table = soup.find("table", {'c

浏览 3提问于2017-05-11得票数 1

回答已采纳

1回答

无法从网页检索链接

、

我正在使用bs4运行在一堆网站和抓取一个特定的链接从每个网页，但我有一个问题，抓取该链接。 print(soup.find_all('a')) 在“县联系人”下，这些页面中大多数都有一个链

浏览 3提问于2022-07-06得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

findall中的findall对字符串无效

Python语言中BS4* find_all()语句中的过滤函数问题*

如何在BS4中有效抓取多个URL

用python抓取表

为什么beautifulsoup4的find_all()函数不能获取所有的<h3>标记

美丽的汤刮

如何使用漂亮汤检查字符串是否存在

用漂亮汤抓取网页数据

如何用空类值从div中刮取文本

如何在csv中写入抓取的数据？

使用python在相邻字符之间创建空格

Python数据抓取:使用href和prettify系列来抓取标题不起作用

是否可以从一个.txt中打开多个URL并同时抓取所有网页？

尝试使用美汤从html表中抓取特定数据。

Web抓取:用Python抓取多个Web

如何使用美丽的汤和熊猫从这个网站上捕获结构化格式的表格？

如何使用Python和BeautifulSoup或Pandas从Finviz.com中抓取最大赢家和最大输家的表行？

将漂亮汤刮擦表转换为列表

无法从网页检索链接

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐