使用BeautifulSoup从<pre>元素获取文本

、、、

我一直在尝试从this site中提取DNA序列，但我似乎无法访问这些数据。我的代码如下所示。from urllib.request import urlopen as uReqpage_soup = bslol(uClient.read(), "html.parser") uClient.close() 为了获得文本，我首先尝试使

浏览 11提问于2020-08-10得票数 1

回答已采纳

1回答

Python请求Select()方法-选择'pre‘元素

、、

使用Requests和BeautifulSoup抓取网页。似乎无法使用select()方法来获取下面HTML中显示的文本。<head><style type="text/css"></style></head> <pre style="word-wrap: break-word; white-space: pre-wra

浏览 1提问于2015-08-01得票数 1

2回答

如何将抓取的多行内容转换为列表？

、、、

/usr/bin/python from BeautifulSoup import BeautifulSoupimport.read() preBegin = webpage.find('<pre>') # Locate the pre provided

浏览 2提问于2013-01-20得票数 1

2回答

如何在lxml iterwalk循环中用文本替换HTML标记

、、、、

我正在用lxml iterwalk遍历一个HTML树，我想用换行符替换<pre></pre>中的所有<br>标记。这就是我到目前为止所知道的： root = lxml.html.fromstring(text) if el.tag == 'pre

浏览 0提问于2014-06-09得票数 2

1回答

检索动态网页内容PyQt5

、

这个代码块可以正确地处理身份验证，但是如果我尝试访问类名为lang-py的前标记元素，我会得到None作为输出返回给我。comment113272437_64055601" print(r.html) main() 如何在<pre

浏览 18提问于2020-09-25得票数 0

回答已采纳

2回答

如何防止BeautifulSoup转换实体？

、、

我有一个名为BeautifulSoup的关键字标记，当我使用keyword.decode(formatter=None)获取html文本时，我得到了以下内容 <pre><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type"&g

浏览 0提问于2013-11-16得票数 5

2回答

使用BeautifulSoup处理前标记中的尖括号

、、、

我有一个这样的字符串 html = "<pre>City_<cityname>_001</pre>" 在尝试使用BeautifulSoup 4解析它时，使用以下代码， >>> from bs4 importBeautifulSoup >>> html = "<pre>City_<cityname>_001</pr

浏览 33提问于2019-01-22得票数 0

1回答

用漂亮的汤在特定的文本上缩小一点。

、

我想从这里得到河的水位，import requests g_data = soup.find_all

浏览 3提问于2020-10-08得票数 2

回答已采纳

2回答

从锚标记的内联子节点中提取文本

、

optparse.html"> <span class="pre</span> — Parser for command line options我正在使用以下脚本： from

浏览 4提问于2021-07-20得票数 1

回答已采纳

1回答

如何将txt文件拆分为不包含特定内容行的多个文件

、、、、

但是，我想要做的是将源文件的某些部分从编写到较小的文件中排除。(如果行没有以<p>开头，那么就不要写到文件中)。out_file:if out_file:我想要做的是想出一种方法--运行代码，但是如果一行没有从<

浏览 3提问于2016-01-22得票数 1

回答已采纳

1回答

漂亮的汤提取没有标签的文本

、、

我有HTML解析文本如下，并试图以相同的顺序提取文本。<b> Data Data Summary<br/><br/><pre>Data paragraph whichcontains huge string<br/></pre> <br&#x

浏览 2提问于2018-06-11得票数 1

1回答

如何使用编码JSoup文档文本

我有一个这样的节点我需要像这样获取div元素的文本我从.text()方法得到的输出是在BeautifulSoup中，它将返回> something < not encoded输出。如何从JSoup获取未转换的文本？

浏览 0提问于2013-07-03得票数 0

3回答

无法获取开始标记和结束标记之间的文本

、

soup = BeautifulSoup("<p>'hello'<a>'my link'</a></p>", 'html.parser')None 输出是否正常

浏览 2提问于2017-04-05得票数 0

2回答

如何使用beautifulsoup4在python中获取pre标记中的文本？

、、

这个站点有一个pre标签，里面有文本，但当我尝试获取pre标签内的文本时，它只返回[] 代码： requester = {'User-Agent': 'Mozilla/5.0'}u =urlopen(req) soup = BeautifulSoup

浏览 66提问于2020-09-17得票数 0

回答已采纳

3回答

无法在BeautifulSoup中美化抓取的html

、、、

我有一个小脚本，它使用urllib2来获取站点的内容，找到所有的链接标记，在顶部和底部附加一小段超文本标记语言，然后我尝试美化它。import urllib2import re pre>Page title</title></head>' p

浏览 0提问于2010-01-08得票数 2

回答已采纳

1回答

巨蟒和美丽的汤，捡起所有的元素

、

下面的with代码如下所示：soup = BeautifulSoup(webtext它获得第一个元素文本。准确地说，我修改了我的代码，如下所示：soup = BeautifulSoup(class":"dr_article&qu

浏览 5提问于2013-08-01得票数 5

回答已采纳

2回答

如何用beautifulsoup4提取html？

、

我的代码：html = """<td class='Thistd'><a><img /></a>Here is some text.</td>""" tds = soup.findAll('td', {'class': 'Th

浏览 1提问于2015-10-14得票数 1

回答已采纳

4回答

如何使用Python从网页的检查元素中获取数据

、、

我想使用Python从I元素中获取数据。我可以使用BeautifulSoup下载源代码，但现在我需要网页的检查元素中的文本。如果你能建议我怎么做，我会非常感激的。编辑:我的意思是，在google中，右键单击就会给出一个名为in元素的选项，它的代码与特定页面中的每个元素相关。我想提取这段代码/只是它的文本字符串。

浏览 12提问于2014-07-30得票数 6

回答已采纳

1回答

如何解析标签外的文本

、、、、

我正在解析一个文本，每个单词都被做成一个链接。问题是标点符号不是标签<a>的内容，它们只是位于标签之外，所以我也不知道如何获得标点符号。</td> </tbody>这是解析器from selenium import webdriverdriver = webdriver.Chrome(executable_path="...") dri

浏览 3提问于2022-11-06得票数 1

回答已采纳

2回答

我正在使用Python3.7和BeautifulSoup(4)进行一个项目，在这个项目中，我需要刮掉一些数据，而不知道的确切结构，而是假设用户的相关信息将在headings, paragraph, pre对于这些标记，在find_all之后，我希望将headings and paragraph标记与code and pre标记与ResultSet对象分开。以下是我尝试过的： required_tags = ["h1", "h2", "h3", "h4&q

浏览 0提问于2019-06-18得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python请求Select()方法-选择'pre‘元素

如何将抓取的多行内容转换为列表？

如何在lxml iterwalk循环中用文本替换HTML标记

检索动态网页内容PyQt5

如何防止BeautifulSoup转换实体？

使用BeautifulSoup处理前标记中的尖括号

用漂亮的汤在特定的文本上缩小一点。

从锚标记的内联子节点中提取文本

如何将txt文件拆分为不包含特定内容行的多个文件

漂亮的汤提取没有标签的文本

如何使用编码JSoup文档文本

无法获取开始标记和结束标记之间的文本

如何使用beautifulsoup4在python中获取pre标记中的文本？

无法在BeautifulSoup中美化抓取的html

巨蟒和美丽的汤，捡起所有的元素

如何用beautifulsoup4提取html？

如何使用Python从网页的检查元素中获取数据

如何解析标签外的文本

将元素与BeautifulSoup结果集分离

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐