如何使用BeautifulSoup替换`td```标签中的`img```标签？

文章/答案/技术大牛

发布

1回答

、、、

我正在尝试使用python3.8.7和BeautifulSoup4.9.3解析一个充满表格的网页，这样我就可以在电报频道上显示它。我可以从网页获得所有必要的表格，但在这些表格的深层有td标签，其中包含带有明星src的img标签，需要用p标签替换。= pickle.load(v_file) v_soup = bs.BeautifulSoup(v_pickled.c

浏览 54提问于2021-05-11得票数 1

回答已采纳

2回答

美丽的汤-如何修复损坏的标签

、、

在用Beautiful Soup解析之前，我想知道如何修复损坏的html标签。我怎么做替换才能让美汤看到呢？from BeautifulSoup import BeautifulSoup <tr> td>LABEL1</td><<em

浏览 0提问于2011-09-22得票数 2

回答已采纳

4回答

是否使用BeautifulSoup提取特定的TD表元素文本？

、、

我试图使用BeautifulSoup库从自动生成的HTML表中提取IP地址，但我遇到了一些问题。href="hello.html">127.0.0.1<a></td> <td><img src="uk.gif" /><a href="uk.com">uk</a></td</e

浏览 0提问于2014-03-30得票数 6

2回答

用python中的Beautiful解析html

、、

></tr></table></tr>

浏览 0提问于2013-10-19得票数 1

回答已采纳

6回答

Python Beautifulsoup* img标签解析*

、、

我正在使用漂亮的汤来解析'www.youtube.com‘中的所有img标签。代码是from BeautifulSoup import BeautifulSoupsoup = BeautifulSoup(page) tags=soup.find

浏览 2提问于2012-05-15得票数 5

2回答

如何使用美汤删除其他html标记之间的标记

、、

在本文的基础上构建：'<td><script class="blah">a</script>baba<script id="blahhhh">b</script></td>''<td>ababab</

浏览 1提问于2015-04-30得票数 1

1回答

如何告诉BeautifulSoup忽略jsp代码？

、、

我正在使用BeautifulSoup修改大量的html和jsp文件。这些是包含在主模板中的内容文件。一切正常，除了当我打印结果时，BeautifulSoup删除了jsp文件中的jsp代码。有什么方法可以让BeautifulSoup忽略<%和%>和标签之间的代码吗？下面是显示BeautifulSoup当前行为的代码：<tr> &

浏览 0提问于2014-02-13得票数 1

4回答

排除带有漂亮汤的标签

、

我正在尝试获取一个包含漂亮汤的html表格中的内容。当我到达单元格的级别时，我只需要获取不在strike参数之间的值<strike>$0.45</strike><br/>因此，在上面的情况下，我只想返回0.41美元。我正在使用data.get_text()，但我不知道如何</

浏览 0提问于2018-02-20得票数 0

2回答

使用BeautifulSoup获取html中的链接

、、

我有一段代码： <a title="Blabla" href="http://www.blabla.com/.html">Blabla</a>我只需要检索链接，我尝试了很多方法，比如：for link in soup.find_all("<em

浏览 1提问于2014-11-17得票数 2

回答已采纳

1回答

用BeautifulSoup替换python中的文本

、

我正在尝试用beautifulSoup解析表，并用- so代替-so来删除某些行中的空格<td><small>15</small></td></tr><tr> <td</e

浏览 0提问于2014-01-24得票数 2

回答已采纳

1回答

用美汤提取表中的所有链接

、、、

<td style="text-align: center;"><a title="Some title" href="https://www.blabla.com">Testing</a></td> 我正在尝试使用BeautifulSoup来获取a标记的所有href，这些标记是td标记的子级。我能跑 urls =

浏览 18提问于2020-12-17得票数 0

回答已采纳

1回答

如何使用Python查找包含特定文本的特定html行

、、、

我正在通过HTML查找存储在一行中的名称值对。我不知道如何在漂亮的soup find命令中指定要搜索的文本。from bs4 import BeautifulSoup <tr> <td> <span>112120</spa

浏览 111提问于2018-08-02得票数 0

回答已采纳

2回答

jQuery .replaceWith()方法无效

、、

我在使用.replaceWith()时遇到了问题，它适用于第一个模糊，但对第二个不起作用，下面是我的代码： $("#wilayaRow== "Selectionnez une wilaya...") { $("#wilayaRow .tdrequired label").replaceWith("<img src='../..label").repla

浏览 3提问于2015-12-19得票数 0

回答已采纳

2回答

使用RegEx在Notepad++中从HTML标记中获取图像文件名

、、

我有大量的HTML代码。<td></

浏览 8提问于2014-10-10得票数 0

回答已采纳

1回答

防止某些HTML标记使用Python呈现

、、、、

说我有一根绳子：我有一个函数，它将字符串转换为HTML，并删除除<img>标记以外的所有标记，如下所示： for tag in soup.fi

浏览 4提问于2015-08-21得票数 2

回答已采纳

1回答

如何用美汤获取超大内容网站的大量href链接

、、

我正在分析一个有1000多个href链接的大型html网站。我正在使用Beautifulsoup来获取所有的链接，但当我再次运行程序时，beautifulsoup无法处理它。(查找特定的所有'td‘标签。我将如何克服这个问题？虽然我可以用urllib加载html页面，但是不能打印所有的链接。当我将它与find one 'td‘标签一起使用时，它被传递了。__Page.find(&

浏览 3提问于2013-02-28得票数 0

1回答

BeautifulSoup --防止标记自动关闭

、

BeautifulSoup在解析以下代码时卡住了：>>> soup.prettify() '<img src="#" alt="Click Here >"

浏览 3提问于2011-06-16得票数 2

2回答

如何使用循环替换python中的字符？

、、、、

在那之后，当循环找到“模块”时我必须停止-->这部分是工作的。我的代码出了什么问题，我该如何修复它以更改这些字符？csvimport sysimport timeimport pandas as pd f = open('0910000511.txt&

浏览 0提问于2017-07-11得票数 0

2回答

如何“清除”CSS假表行？

、

因此，我必须在每6张图片前“清除”(我知道这不是正确的词)才能开始新的一行。这是画廊：<div class="tr"> <img src="img/logo-1.jpg" alt=""> <di

浏览 3提问于2015-03-10得票数 0

回答已采纳

7回答

将</br>转换为结束行

我正在尝试使用BeautifulSoup提取一些文本。为此，我使用了get_text()函数。我的问题是，文本包含</br>标记，我需要将它们转换为结束行。我该怎么做呢？

浏览 0提问于2012-09-23得票数 41

回答已采纳

点击加载更多