删除HTML标记python

文章/答案/技术大牛

发布

2回答

、、

从本质上讲，我想知道从字符串中删除HTML标记的最简单方法。这将返回非常期望的[<span class="text-robux-lg wait-for-i18n-format-render">1,250</span>]，但我不知道如何获取'PriceTag‘并删除标记

浏览 15提问于2021-04-15得票数 0

回答已采纳

1回答

使用python删除html标记？

我知道这方面可能有很多问题，但我想知道如何删除这些标记，而不必导入或使用HTMLParser或regex。我尝试了一堆不同的替换语句，试图删除<>s中包含的字符串的部分，但没有效果。基本上我的工作是：html = response.read()从这里开始，我只是试图操纵字符串变量html来完成上面的操作我还试着做一个for循环，遍历每个字符来检查它是否是封闭的，但出

浏览 3提问于2014-02-26得票数 2

回答已采纳

2回答

Python:删除HTML标记& HTML标记之间的文本

、、

我试图删除HTML标记(Python 3)，但也试图删除它们之间的文本。下面的代码片段似乎并没有给出我正在寻找的结果，也没有给出我所发现的所有其他问题，所以我似乎只考虑删除HTML标记，但是保留HTML标记中的文本，这不是我想要做的。

浏览 1提问于2017-05-02得票数 4

回答已采纳

2回答

使用regex和python替换HTML标记

、、、

我有一个Python脚本，它将查看具有以下格式的HTML文件：<HTML></HTML><DOC>...</HTML>如何使用Python中的regex删除除开始和结束DOC标记之外的所有HTML标记</

浏览 0提问于2009-09-27得票数 1

回答已采纳

1回答

Python -删除多余的html标记

、

</i><i>This article is written <a href="http

浏览 1提问于2015-06-25得票数 0

1回答

python追加()并删除html标记

、、

还有带有dept值的html标记。我怎么才能去掉那些标签。requests.get("http://hortonworks.com/careers/open-positions/") soup = BeautifulSoup(response.text, "html.parser

浏览 2提问于2016-10-13得票数 0

回答已采纳

1回答

Python -删除标记标记并从文件中读取html？

、、、、

我有一个名为BBC_news_home.html的文件，我需要删除所有标记标记，所以我只剩下一些文本。到目前为止我得到了： cleaned = '' f = codecs.open(&

浏览 2提问于2017-10-10得票数 0

回答已采纳

2回答

如何使用Python从html字符串中删除(而不是删除)指定的标记？

、

使用Python从HTML字符串中删除(而不是删除)指定标记的正确方法。 ....pass #return the html string by stripping the tags from the list 这些问题解释了一切。我将编写一个python函数，该函数以HTML作为输入，以及要删除的标记列表(模仿Django模板的

浏览 7提问于2017-08-28得票数 1

1回答

如何在html中将多个导出的数据帧合并为一个数据帧

、、、、

现在，我已经将76个dataframes导出为HTML文件。import glob names = [i.split(".")[0] for i in df] html = "</head> <body> <p>Data as of 5/11&#x

浏览 0提问于2020-05-11得票数 1

1回答

Python -使用regex删除HTML-标记

、

这通常不是一项艰巨的任务，但今天我似乎无法删除一个简单的javascript标记。

浏览 4提问于2017-02-13得票数 0

回答已采纳

2回答

用python删除特定的html标记

、

我在HTML单元格中有一些HTML表，如下所示： <tr><td><font color="%s"><b>%s</b></td></tr> </table>' % ( bgcol

浏览 3提问于2012-07-13得票数 1

回答已采纳

1回答

替换或删除HTML标记&内容Python

、、

我想删除一个HTML打开和关闭和内容之间的两个标签与正则表达式。如何删除以下字符串中的<head>标记。my_string = ''' <head> this is a paragraph tag </head> <p>

浏览 0提问于2019-04-12得票数 0

回答已采纳

3回答

删除Python中的unicode HTML标记

、、、

我有一个字符串，我想从其中删除HTML标记。 “概述”：“\u003cp style=\”边距:0 0px；填充:0 0px；行高:20 0px；轮廓:无！我尝试过使用BeautifulSoap和Python，但是它只识别标记是以'<‘和'>’格式编写的。是否有一个库或任何函数可以帮我移除这个？或者我应该转换unicode字符并手动完成它？

浏览 14提问于2022-10-29得票数 0

2回答

删除html标记中的数据- Python

、、

我正在尝试删除Html标记之间的一些数据，例如，<html> </html> 我想去掉所有的导航以得到类似<html> </html>的东西。我尝试过使用BeautifulSoup和regex，但是如果我想删除所有导航器，不管它们的参数是什么，并

浏览 1提问于2015-06-16得票数 0

回答已采纳

2回答

在Python3中操作HTML

、、、、

我试图使用Python3操作HTML并删除带有特定id标记的div。是否有比使用for-Loops和regex混合操作或移除该容器更优雅的方法？我知道，有HTMLParser模块，但我不确定这是否对我有帮助(它找到了相应的标记，但是如何删除这些标记和内容？)

浏览 2提问于2015-12-14得票数 2

回答已采纳

3回答

如何使用regex删除某些HTML标记中的字符串，字符串必须包含空空间

、

我尝试用python中的正则表达式清理一些HTML数据。给定带有HTML标记的输入字符串，如果内容包含空格，我希望删除标记及其内容。</code>", " ", inputString)只能删除所有标记，如何改进它，或者还有其他方法？提前谢谢。

浏览 5提问于2017-01-03得票数 1

回答已采纳

2回答

HTML Regex帮助

、、

我必须在wp_posts.sql上做一个大的替换，并且我想删除所有的<a href>和</a>标签。我试着用VIM来做这件事，但是我想不出它的正则表达式。

浏览 0提问于2011-06-14得票数 1

回答已采纳

2回答

如何使用Python从HTML、Urls中删除

、、、、

问题是文本，里面有很多html标记和urls，我需要纯文本。我希望在循环中删除该元素，然后将已清除的文本附加到我的新列表中。这就是我到目前为止所拥有的。pattern.search(conv.text): data.append(conv.text) 我找不到正确的正则表达式来删除像这个

浏览 3提问于2017-04-12得票数 0

回答已采纳

2回答

在输入字符串中只保留一组html标记的Python代码

、

我有这样的文本： <script></script> <p> Description </p></div> 我想删除除h标签和p标签之外的所有html标签。html标记，但它不允许保留一个标记列表，同时删除其他标记

浏览 1提问于2018-10-16得票数 1

1回答

从python列表项中创建有序列表

、、

有一个名为whatever的列表，我想在Jinja中逐项列出：{% for item in whatever %} <td> </td>{% endfor %}但是，当我以这种方式实现时，我会得到无序的列表输出，而不是顺序编号，即

浏览 3提问于2013-04-12得票数 3

回答已采纳

点击加载更多