使用bs4 python查找带有某些子标签的标签

文章/答案/技术大牛

发布

2回答

、、

我有一个以下格式的html。h2><div class="Consider"> <p>Text2</div> 我只想在标记div的子标记(Div)具有"row“类的情况下获取该标记

浏览 10提问于2018-07-25得票数 0

1回答

Redis根据设置值查找关键字

我正在使用redis来存储某些实体的标签。value || book:1:tags | [python| book:3:tags | [fiction, adventure] |如何查找所有带有特定标签

浏览 0提问于2012-07-21得票数 3

回答已采纳

1回答

web抓取:如何从多个表体中抓取一个特定的表体？

、

我正在尝试抓取站点中的一个特定表- 我尝试过使用find_all()函数。但这只列出了所有的<tbody>标记。我只想刮掉突出显示的表体。

浏览 1提问于2019-05-31得票数 0

1回答

提取Youtube搜索结果的问题

、、

我是Python新手，学习了使用bs4进行Web抓取的基础。在这里，我试图提取Youtube搜索结果的所有链接，但它不像其他网站那样工作。我分析了搜索结果html数据，搜索结果的链接在带有id“视频标题”的锚标签中，但是标签没有出现在我的bs4解析的html文档中。from bs4 import BeautifulSoup as bs impor

浏览 0提问于2019-05-09得票数 3

回答已采纳

1回答

Python语言中BS4 find_all()语句中的过滤函数问题

、、、、

我在Mac机上使用Python库(4.6.0)和BeautifulSoup (3.7)。在其他东西中，我看到了一堆'div‘标签，它们有class属性。一些'div‘标签带有多个class属性值。现在我想根据标记名和class属性值进行过滤，例如，我想找到class='a‘但没有class='b’的' div‘标记(是的，有些div标记带有class='a b')。为了获得这些标记，我尝试使

浏览 103提问于2018-07-09得票数 -1

0回答

如何查找带有某些子属性的标签？-- BeautifulSoup 4

、

我是Python和BeautifulSoup的新手，如何搜索其子标签具有特定属性的特定标签？

浏览 5提问于2016-07-01得票数 0

1回答

如何使用Python查找包含特定文本的特定html行

、、、

我正在通过HTML查找存储在一行中的名称值对。我不知道如何在漂亮的soup find命令中指定要搜索的文本。from bs4 import BeautifulSoup <tr> <td> <span>112120我意识到我可以返回所有"td“元素并在每个元素中搜索"Project ID:”

浏览 111提问于2018-08-02得票数 0

回答已采纳

2回答

如何使用bs4在python中使用连字符获得标记的值？

、、、

我在学校的项目中使用了一个带有模块bs4的python，我在其中一个部分遇到了问题。我想从标签中得到一个值，但是这个标签包含了破折号(-)。我搞不懂。

浏览 3提问于2020-05-23得票数 0

回答已采纳

1回答

合并两个json url时遇到问题

、、

当我尝试运行pip3 install --upgrade json来解决这个错误时，python无法找到该模块。我正在使用的代码段可以在错误下面找到，但对于代码本身的一些进一步的方向将不胜感激。> File "/usr/lib/python3.8/u

浏览 16提问于2021-01-03得票数 0

回答已采纳

1回答

如何使用美汤在标签之外查找和更改文本？

、、

我有一个这样的文件：我想要在tag1之外提取字符串，并用漂亮的汤将其更改为如下所示：如何用beautifulSoup替换标签外的单词？

浏览 2提问于2017-08-18得票数 1

1回答

如何在数据目录中进行通配符搜索(Google平台)

、、、、

跨列名和标记属性(以及值)搜索元数据是有意义的。当前的只列出非常严格的搜索行为，例如tag:data_gov_template.hasPII(=true) (元数据/属性和值不能直接搜索？)

浏览 4提问于2020-11-10得票数 1

1回答

抓取问题：“检查元素”与“查看页面源”不同

、、、、

我试图做一个网页刮一个网页，其中包括多个标签本身。当我单击所需的选项卡，在显示其内容后，首先会出现两个问题。1-网页地址不改变，对所有标签都是相同的。2-当我看到带有浏览器(firefox和chrome)的“查看页面源”的页面源时，所有选项卡的页面源看起来也是相同的，而当我对其中一个选项卡使用“检查Elemnt”时，我看到我的目标内容以html形式显示的代码问题是，我无法通过<em

浏览 2提问于2020-02-06得票数 4

回答已采纳

2回答

标记名中带有"-“的标记的BeaufifulSoup、lxml导航？

、、、

Python BeautifulSoup和lxml解析上面的xml文件。通常我使用'.‘导航到元素。例如： from bs4 import BeautifulSoup soup = BeautifulSoup(lxml')

浏览 9提问于2020-06-18得票数 0

3回答

如何操作解析树？

、、、、

我一直在使用斯坦福的Tregex和T工工具，但是代码很混乱，不适合我的主要是Python环境(这些工具是Java的，不太适合调整)。我想要一个工具集，当我需要更多的功能时，可以方便地进行黑客攻击。)：查找带有标签NP的任何节点，该节点具有带有标签NP的第一个子节点和一些名为"Bank“的后代，以及带有</

浏览 4提问于2010-09-12得票数 15

回答已采纳

1回答

从html中抓取一对标记。

、、、、

我使用python3.6和Pycharm 2016.2作为编辑器。下面是我的代码：import urllib.request from urllib.parse import urlp

浏览 2提问于2017-01-02得票数 0

回答已采纳

1回答

如何使用Python和Beautiful-soup从Instagram中抓取标签

、、、

我试着在instagram上寻找热门标签的相关标签，但在使用BeautifulSoup时没有得到任何回报import html5libfrombs4 import BeautifulSoup related_tags = [] #for el in tagsreq.content, 'html5lib')

浏览 13提问于2020-05-25得票数 0

回答已采纳

1回答

使用Python更改XML标记名

、、

对XML和Python非常陌生。我想更改XML文档中某些元素的标记名。</SSN> <Dependent>该文档包括数百家公司和数千名员工，他们都有几十到数百个子元素，所以我认为我需

浏览 0提问于2019-02-20得票数 5

回答已采纳

2回答

我需要使用漂亮汤python从类标记中检索数据，而内部标记中没有数据。

、、

我需要使用ikman.lk漂亮汤 python库从“”检索数据。</span> 我只需要得到“显示131个广告中的1-25”部分使用美丽汤库。

浏览 0提问于2019-02-12得票数 0

2回答

XML:删除节点的子节点

我想要查找xml文件中具有特定标记名的所有节点，假设为"foo“。如果这些foo-tag包含带有node-name "bar“的子节点，那么我想删除这些节点。结果应该写入到文件中。<foo> <bar/> // don't remove this one </foo> </m

浏览 0提问于2010-04-19得票数 6

回答已采纳

1回答

如何记住“反应钩子”中最后使用过的页/表？

、

我正在制作一个反应应用程序与2个菜单项主页和查找(两个不同的网址)。Home由子选项卡a、b、c和Find组成，包括d、e、f。我正在处理来自Home的标签'b‘，并导航到查找页面以查找某些内容，现在当我单击顶部的“主页”菜单时，我不再在标签'b’中了。我如何记得以前的路径，在反应钩子，任何帮助或线索？

浏览 11提问于2022-01-17得票数 1

回答已采纳

点击加载更多