如何使用漂亮的汤从li标签中抓取日期？_用漂亮的汤从div标签中抓取href_如何使用漂亮汤从多个页面中抓取数据 - 腾讯云开发者社区

、、、

我抓取了特定类的所有li标记，并得到了输出： <li>Aug 14-18, <a href="https://ai4good.org/fragile-earth-2021/">Fragile Earth</li> <li>Aug 19-26, <a href="https://ijcai-21.org/">I

浏览 28提问于2021-08-16得票数 0

1回答

美丽的汤刮不出所有的东西

、

我正在尝试从第一个图像中获取img标记，这样我就可以获取图像链接。当我用漂亮的汤抓取站点时，没有img标签(如图2所示)。我不明白为什么每个网站都有一个img标签，但美丽的汤却没有。

浏览 1提问于2020-03-02得票数 1

2回答

使用漂亮汤从脚本标记中抓取数据

、

我是一个python美容汤库的新手，我正在尝试从一个网站的highcharts中抓取数据。我发现我需要的所有数据都位于一个脚本标签中，但是我不知道如何抓取它们(请参见附件)有没有办法使用python漂亮的script从这个脚本标签中获取数据？

浏览 32提问于2020-07-07得票数 1

回答已采纳

1回答

如何在python中将网页表格数据转换为json对象或dict

、、、、

我正在尝试从包含表的网页中获取数据，然后将表中的值与其他表值进行比较。我可以在python中将网页转换为json数据或字典吗？例如，我有url www.yahoo.com，如何将html数据转换为json？如果我尝试json.loads(data)，我得到错误raise ValueError("No JSON object could be decoded")是否有办法从网页上显示的表格中拉出数据

浏览 1提问于2016-01-22得票数 1

1回答

如何使用Beautiful soup从没有类名或id的嵌套<li>访问<i>标记

、

我正在尝试抓取这个webpage1。我想使用漂亮的汤从链接访问‘R’列我的代码： rupees= job.ul.find('li').find('i',class_='material-icons rupee') 结果:无预期:卢比1.10

浏览 20提问于2021-07-13得票数 0

回答已采纳

2回答

使用漂亮的汤从标签中抓取文本

、、

我学习了一些Python和如何使用BeautifulSoup库，并尝试了下面的方法。paris.quel-institut-beaute.com/').read() print (soup) 当我尝试使用属性只获取文本时，它告诉我这是不可能的。

浏览 0提问于2017-10-03得票数 0

1回答

BeautifulSoup:仅从特定类获取泛型标记

、、

当我使用像这样的漂亮汤时，我会从HTML文件中得到我想要的所有文本：catname = BeautifulSoup，我是如何得到一个漂亮的汤，以得到一个非常具体的标签，在我已选定的</e

浏览 1提问于2015-04-27得票数 0

回答已采纳

3回答

美丽的汤使用正则表达式来查找标签？

、、

我真的希望能够让Beautiful Soup匹配任何标签列表，就像这样。我知道attr接受正则表达式，但是在漂亮的汤中有什么东西允许你这样做吗？soup.findAll("(a|div)")<a> ASDFS<a> asdfsdf 我的目标是创建一个可以从网站抓取表格的抓取器。有时标签的命名不一致，我希

浏览 0提问于2014-07-15得票数 27

回答已采纳

1回答

如何从这个html中提取链接

、、

我是HTML的新手，我正在尝试用漂亮的汤抓取一些web数据。我能得到这样的标题value.find('div&

浏览 1提问于2020-08-13得票数 0

1回答

使用BeautifulSoup抓取的数据与源代码不匹配

、、、

我是网络抓取的新手。我已经看过一些关于如何使用漂亮的汤来抓取网站的教程。作为练习，我想从一个房地产网站上提取数据。我想要抓取的特定页面是这个：我遇到的第一个问题是，使用经

浏览 4提问于2021-05-02得票数 1

1回答

有没有可能用漂亮的汤刮出一个“动态网页”？

、、、

我现在开始用漂亮的汤来抓取网站，我想我已经掌握了基本的知识，虽然我缺乏网页的理论知识，但我会尽我最大的努力来表达我的问题。我所说的动态网页是这样的:一个网站，它的HTML会根据用户的动作而改变，在我的例子中，它是可折叠的表格。我想获得一些"div“标签中的数据，但是

浏览 1提问于2016-11-22得票数 4

0回答

无法使用python漂亮的汤获取项目

、

我正在努力学习如何用漂亮的汤+蟒蛇进行网络抓取，我想从上抓取摄影师的名字，但我想不出如何分离文本。我想要的html如下所示，我想输出的是"Steven Poster"：<div class="text-sluglist">&

浏览 2提问于2017-12-06得票数 0

回答已采纳

1回答

使用漂亮汤查找h4标签

、、

我对网络抓取非常陌生，也看到了一些类似于我的问题，但这些解决方案对我来说并不管用。因此，我试图刮这个网站：的h4标签，其中包含即将到来的篮球比赛的日期和时间。我试着用漂亮的汤抓住标签，但它总是返回和空列表。下面是我现在使用的代码：doc = BeautifulSoup(result.text, "h

浏览 5提问于2022-05-02得票数 1

回答已采纳

1回答

从抓取的网页中提取价值

、、

第一次尝试使用python，在谷歌搜索了一天之后，我原来的大脑更加困惑了。如何从prettify输出中提取Value1、Value2和Value3并将它们存储为变量。<font color

浏览 1提问于2012-01-19得票数 0

2回答

我很难使用Beautiful Soup从NCBI网站上抓取数据

、、、

我无论如何也想不出如何使用漂亮的汤从网页中抓取孤立的源信息，比如：我一直在尝试检查这个标记是否存在，当我知道它确实存在时，它总是返回不存在的结果。如果我甚至不能验证它的存在，我就不知道如何抓取它。

浏览 4提问于2021-04-24得票数 1

1回答

用精美的汤从HTML中抓取表格

、、、

我正在尝试用python3从中抓取数据。该网站包含了基于冠军的FPS多人游戏“圣骑士”的玩家数据。我想要得到一个基于冠军的球员的统计数据，如网站所示。我面临的问题是，当我用Chrome检查页面源代码时，我得到了包含"table“标签的代码，它是干净的，我可以很容易地抓取它：但是当我创建soup对象时，我得到了一个不同的代码。当我转到页面源码时，它和<

浏览 2提问于2018-06-26得票数 0

2回答

如何在scrapy中提取javascript值

、

我用抓取来抓取youtube视频，我需要video.When的标题/描述语言，我在上使用浏览器查看源代码，我可以在脚本标签内有一个变量'METADATA_LANGUAGE': 'no'。或者我应该下载并解析html，并使用漂亮汤/html解析器之类的库。

浏览 4提问于2016-04-22得票数 1

回答已采纳

3回答

无法从网站获取数据，因为URL在获取数据时不会更改，因此数据表为空

、、、

我刚刚开始使用python进行网络抓取。我使用了两个库来抓取:请求和漂亮的汤。我打开给定的URL，并在该页面上传递所需数据的日期间隔。当我按submit时，URL不会改变，但是数据在页面上。")all = soup.find_all("table", {"clas

浏览 3提问于2017-02-20得票数 1

回答已采纳

3回答

如何使用漂亮的汤获取儿童标签描述的文本

、、

我正在用漂亮的汤从中抓取一些数据ingredients = soup.find('div', {"class": "ings"}).findChildren('p') 它为我提供了成分列表，但带有p标签。

浏览 2提问于2016-08-30得票数 1

1回答

用python无源抓取iframes

、、、、

我正在尝试从以下html文件中抓取iFrame (id=“id=”)的内容：我试着使用selenium和漂亮的汤，但是代码仍然看不到iFrame中的元素。有没有一种有效的方法从这个html文件中抓取上述iFrame的内容(最好不使用selenium)？

浏览 3提问于2020-05-27得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云