从soup文件中抓取相关信息_Web抓取soup文件中的相关信息_Python/Beautiful Soup:根据用户输入从网站抓取特定信息 - 腾讯云开发者社区

、

我正在尝试抓取url以获得所有分支的地址和branch_name。URL="https://www.uob.co.id/personal/branch-and-atm-locator.page“ 在网络选项中，我发现请求的url路径是: URL="https://www.uob.co.idimport requestsr = requests.get(URL) soup = BeautifulSoup

浏览 22提问于2020-11-10得票数 0

回答已采纳

1回答

Web抓取soup文件中的相关信息

、

我正在尝试抓取这个特定的url，以获取有关分行/自动柜员机名称和位置地址的信息。url="https://www.bankmayapada.com/en/contactus/location-information" 然而，我得到的soup文件非常混乱，我不知道如何提取所需的信息。我需要的信息是分行/自动柜员机名称及其对应的地址。现在，我正在弄清楚soup文件的结

浏览 18提问于2020-11-09得票数 1

回答已采纳

2回答

从美丽的汤中抓取信息并将其放入文本文件？

、、

我已经开始学习如何使用urllib和漂亮汤从网站上抓取信息。我想从这个页面获取所有文本(在代码中)，并将其放入一个文本文件中。import urllibbase_url = "http://www.galactanet.com/oneoff/theegg_mod.html" soup</

浏览 0提问于2012-10-18得票数 1

回答已采纳

2回答

在网页中加载更多内容，并发出写入文件的问题

、、、、

我正在进行一个网络抓取项目，它涉及到从一个基于搜索词的网站中抓取URL，将它们存储在一个CSV文件中(在一个列下)，最后从这些链接中抓取信息并将它们存储在一个文本文件中。代码的后半部分只读取最后一个链接(存储在csv文件中)，抓取

浏览 8提问于2017-07-19得票数 0

回答已采纳

1回答

如何使用python抓取多页网站并将数据导出到.csv文件中？

、、

我想使用python抓取以下网站，并需要将已抓取的数据导出到CSV文件中：如何在运行脚本后从所有页面抓取全部数据，以及如何将数据导出为CSV文件？？search=&&&page=" + str(i)) i

浏览 2提问于2016-07-24得票数 0

2回答

蟒蛇，美汤，WebScraping，熊猫，数据帧

、、、

我逐渐熟悉了Beautiful Soup和Pandas的Dataframe，但我似乎无法将两者结合起来。man=557')for

浏览 0提问于2015-09-02得票数 2

1回答

Python，Selenium "::after“抓取时的问题

、、、、

我正在尝试从一个动态的中抓取汽车信息。但是，在运行Selenium chrome浏览器后，检查元素不会像原始源页面中那样显示。在html源代码中出现“::after”元素，而不是汽车细节的html代码(产品图像附近的信息区域)。= BeautifulSoup(driver.page_source, 'html.parser')print(t

浏览 1提问于2020-03-18得票数 1

1回答

Python -从网站抓取电子邮件的美丽汤

、、

我们发现一个问题是，在原始列表中，URL是http，但随后它们会重定向到https。我不确定这是否会导致在尝试从页面中提取信息时出现问题。当我在Chrome中使用Inspector时，我可以看到页面的结构，但当我试图设置代码来抓取相关链接时，我会出现空的(字面上的)。我使用的最通用的代码是： soup = BeautifulSoup(urllib2.urlopen('https://ngcproject.org/program/algir

浏览 1提问于2017-03-29得票数 0

0回答

(简写)- POST数据应该是字节或字节的可迭代。它不能是字符串类型

、、

只是尝试从.csv文件中输入链接，然后从每个链接中抓取信息，然后将其写入.csv中的其他列。我已经挠头好几天了。其他人能看到这里出了什么问题吗？错误发生在soupwriter = csv.writer(csv_file) if row: # THE ER

浏览 0提问于2017-11-30得票数 0

回答已采纳

2回答

Python -从图像(alt标记)中刮取文本

、

我一直在使用BeautifulSoup成功地从网站上抓取一些信息，但是我在从图片/链接中抓取"alt“标签时遇到了问题。saison_id=2017"soup = BeautifulSoup(page.content, 'html.parser') Players= soup.find_all("a", {"class": &

浏览 1提问于2020-04-24得票数 2

回答已采纳

1回答

为什么通过漂亮汤导入的html与实际的html不同？

、

嗨，我正在制作一个程序，它在堆栈溢出中为搜索词抓取结果。我需要知道抓取的最大页面，但是通过开发工具查看的html结构和通过漂亮汤获得的html信息是不同的。网址：result = requests.get(url)prin

浏览 1提问于2020-08-30得票数 1

2回答

从多个页面中抓取天气数据

、、、

我是python的新手Expected column names (order dose not matter): ['Average temperature (°F)', 'Average，我需要将数据帧保存为pickle文件</em

浏览 9提问于2019-11-27得票数 0

1回答

如何在不知道标签/类的情况下使用搜索词来抓取网页？

、、、、

注意:我搜索了一个解决我的问题的方法，但是我找不到任何解决方案，因为它不同于我们通常需要的抓取方法。所以，这就是为什么，不要标记为重复，请！该项目分为两部分：我们已经抓取了谷歌搜索结果URL(例如，前5)的基础上的搜索词。然后，我们必须从这些页面中抓取搜索结果的URL，以获取搜索词的相关信息，因此我们不知道这些结果页面的实际类/标记。那么，我们如何在不知道实际标签/类的情况下，从网页中获取搜索词的相关

浏览 0提问于2019-06-13得票数 3

1回答

如何通过许多站点在BeautifulSoup调用中存储html元素的变体？

、

, 'html.parser') item_soup = soup.find_all(classspan, the "true" name is stored as text这两个片段是相同的，除了不只是复制/粘贴每个站点的

浏览 3提问于2020-06-02得票数 0

0回答

Web抓取表格元素

、、、

我目前正在尝试从espn网站上抓取2018年梦幻足球运动员排名，并将这些信息导入csv文件中。目前，我的程序能够成功地抓取，但它只获取我搜索到的每个class标签的第一个元素。我使用了soup.find_all('')方法，但似乎仍然没有得到整个表。这是我的代码。2018-fantasy-football-ppr-rankings-top-300' # cr

浏览 3提问于2018-07-20得票数 0

回答已采纳

1回答

用python抓取出现在单击中的表

、、、、

我想从这个中抓取信息。我对网络抓取很陌生，并且尝试过使用BeautifulSoup来做这件事。换句话说:我直接从页面中抓取的HTML代码不包括我想要获得的表。谢谢。我现在的代码是：import requests

浏览 1提问于2017-09-10得票数 1

回答已采纳

1回答

Python，从URL中获取特定的链接，循环通过URL从这些页面获取数据

、、

到目前为止，我得到的链接从基本网址，但我没有循环它们，因为我没有正确的url列表。一旦我只能得到与方框分数相关的信息(我不知道该如何做)，我如何从各个页面中获取信息，以及如何格式化这些信息，以便将其写入csv。www.basketball-reference.com' data = requests.get("http://www.basketball-reference.com/leagues/NBA_20

浏览 3提问于2015-01-06得票数 0

回答已采纳

2回答

如何确保BeautifulSoup不将逗号视为制表符

、、、、

我创建了一个抓取代码，以便从当地的报纸站点获取信息。目前的代码存在两个问题。以下代码；from urllib.request import urlopen as uReq page_urlhttps://newer

浏览 3提问于2020-06-30得票数 0

2回答

使用Beautiful Soup在Web上浏览链接

、、

我正在尝试抓取一个博客"“，并抓取其中的所有链接，以在每个抓取的链接中查找与人工智能相关的信息。我已经尝试了以下代码的各种变体，但似乎都没有多大

浏览 21提问于2019-08-11得票数 1

回答已采纳

2回答

用“div‘s”刮桌子

、、、

当试图抓取网页时，此表没有<tr>标记，并且都是<div>标记。我希望能够从table-row类中获取信息，但刮伤永远不会返回任何信息。使用下面的代码，当我刮掉.table-header，或者仅仅是.practiceDataTable时，我就可以从它获得数据了。www.nascar.com/results/race_center/2018/monster-energy-n

浏览 0提问于2018-03-21得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云