腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
BeautifulSoup
从
<
pre
>
元素
获取
文本
、
、
、
我一直在尝试
从
this site中提取DNA序列,但我似乎无法访问这些数据。我的代码如下所示。from urllib.request import urlopen as uReqpage_soup = bslol(uClient.read(), "html.parser") uClient.close() 为了获得
文本
,我首先尝试
使
浏览 11
提问于2020-08-10
得票数 1
回答已采纳
1
回答
Python请求Select()方法-选择'
pre
‘
元素
、
、
使用
Requests和
BeautifulSoup
抓取网页。似乎无法
使用
select()方法来
获取
下面HTML中显示的
文本
。<head><style type="text/css"></style></head> <
pre
style="word-wrap: break-word; white-space:
pre
-wra
浏览 1
提问于2015-08-01
得票数 1
2
回答
如何将抓取的多行内容转换为列表?
、
、
、
/usr/bin/python from
BeautifulSoup
import
BeautifulSoup
import.read() preBegin = webpage.find('<
pre
>') # Locate the
pre
provided
浏览 2
提问于2013-01-20
得票数 1
2
回答
如何在lxml iterwalk循环中用
文本
替换HTML标记
、
、
、
、
我正在用lxml iterwalk遍历一个HTML树,我想用换行符替换<
pre
></
pre
>中的所有<br>标记。这就是我到目前为止所知道的: root = lxml.html.fromstring(text) if el.tag == '
pre
浏览 0
提问于2014-06-09
得票数 2
1
回答
检索动态网页内容PyQt5
、
这个代码块可以正确地处理身份验证,但是如果我尝试访问类名为lang-py的前标记
元素
,我会得到None作为输出返回给我。comment113272437_64055601" print(r.html) main() 如何在<
pre
浏览 18
提问于2020-09-25
得票数 0
回答已采纳
2
回答
如何防止
BeautifulSoup
转换实体?
、
、
我有一个名为
BeautifulSoup
的关键字标记,当我
使用
keyword.decode(formatter=None)
获取
html
文本
时,我得到了以下内容 <
pre
><span id="VAL(<>)"><span class="keyword">val</span> (<>)</span> : <code class="type"&g
浏览 0
提问于2013-11-16
得票数 5
2
回答
使用
BeautifulSoup
处理前标记中的尖括号
、
、
、
我有一个这样的字符串 html = "<
pre
>City_<cityname>_001</
pre
>" 在尝试
使用
BeautifulSoup
4解析它时,
使用
以下代码, >>> from bs4 import
BeautifulSoup
>>> html = "<
pre
>City_<cityname>_001</
pr
浏览 33
提问于2019-01-22
得票数 0
1
回答
用漂亮的汤在特定的
文本
上缩小一点。
、
我想从这里得到河的水位,import requests g_data = soup.find_all
浏览 3
提问于2020-10-08
得票数 2
回答已采纳
2
回答
从
锚标记的内联子节点中提取
文本
、
optparse.html"> <span class="
pre
</span> — Parser for command line options我正在
使用
以下脚本: from
浏览 4
提问于2021-07-20
得票数 1
回答已采纳
1
回答
如何将txt文件拆分为不包含特定内容行的多个文件
、
、
、
、
但是,我想要做的是将源文件的某些部分
从
编写到较小的文件中排除。(如果行没有以<p>开头,那么就不要写到文件中)。out_file:if out_file:我想要做的是想出一种方法--运行代码,但是如果一行没有
从
<
浏览 3
提问于2016-01-22
得票数 1
回答已采纳
1
回答
漂亮的汤提取没有标签的
文本
、
、
我有HTML解析
文本
如下,并试图以相同的顺序提取
文本
。<b> Data Data Summary<br/><br/><
pre
>Data paragraph whichcontains huge string<br/></
pre
> <br
浏览 2
提问于2018-06-11
得票数 1
1
回答
如何
使用
编码JSoup文档
文本
我有一个这样的节点我需要像这样
获取
div
元素
的
文本
我
从
.text()方法得到的输出是在
BeautifulSoup
中,它将返回> something < not encoded输出。如何
从
JSoup
获取
未转换的
文本
?
浏览 0
提问于2013-07-03
得票数 0
3
回答
无法
获取
开始标记和结束标记之间的
文本
、
soup =
BeautifulSoup
("<p>'hello'<a>'my link'</a></p>", 'html.parser')None 输出是否正常
浏览 2
提问于2017-04-05
得票数 0
2
回答
如何
使用
beautifulsoup
4在python中
获取
pre
标记中的
文本
?
、
、
这个站点有一个
pre
标签,里面有
文本
,但当我尝试
获取
pre
标签内的
文本
时,它只返回[] 代码: requester = {'User-Agent': 'Mozilla/5.0'}u =urlopen(req) soup =
BeautifulSoup
浏览 66
提问于2020-09-17
得票数 0
回答已采纳
3
回答
无法在
BeautifulSoup
中美化抓取的html
、
、
、
我有一个小脚本,它
使用
urllib2来
获取
站点的内容,找到所有的链接标记,在顶部和底部附加一小段超
文本
标记语言,然后我尝试美化它。import urllib2import re
pre
>Page title</title></head>' p
浏览 0
提问于2010-01-08
得票数 2
回答已采纳
1
回答
巨蟒和美丽的汤,捡起所有的
元素
、
下面的with代码如下所示:soup =
BeautifulSoup
(webtext它获得第一个
元素
文本
。准确地说,我修改了我的代码,如下所示:soup =
BeautifulSoup
(class":"dr_article&qu
浏览 5
提问于2013-08-01
得票数 5
回答已采纳
2
回答
如何用
beautifulsoup
4提取html?
、
我的代码:html = """<td class='Thistd'><a><img /></a>Here is some text.</td>""" tds = soup.findAll('td', {'class': 'Th
浏览 1
提问于2015-10-14
得票数 1
回答已采纳
4
回答
如何
使用
Python
从
网页的检查
元素
中
获取
数据
、
、
我想
使用
Python
从
I
元素
中
获取
数据。我可以
使用
BeautifulSoup
下载源代码,但现在我需要网页的检查
元素
中的
文本
。如果你能建议我怎么做,我会非常感激的。编辑:我的意思是,在google中,右键单击就会给出一个名为in
元素
的选项,它的代码与特定页面中的每个
元素
相关。我想提取这段代码/只是它的
文本
字符串。
浏览 12
提问于2014-07-30
得票数 6
回答已采纳
1
回答
如何解析标签外的
文本
、
、
、
、
我正在解析一个
文本
,每个单词都被做成一个链接。问题是标点符号不是标签<a>的内容,它们只是位于标签之外,所以我也不知道如何获得标点符号。</td> </tbody>这是解析器from selenium import webdriverdriver = webdriver.Chrome(executable_path="...") dri
浏览 3
提问于2022-11-06
得票数 1
回答已采纳
2
回答
将
元素
与
BeautifulSoup
结果集分离
、
、
、
我正在
使用
Python3.7和
BeautifulSoup
(4)进行一个项目,在这个项目中,我需要刮掉一些数据,而不知道的确切结构,而是假设用户的相关信息将在headings, paragraph,
pre
对于这些标记,在find_all之后,我希望将headings and paragraph标记与code and
pre
标记与ResultSet对象分开。以下是我尝试过的: required_tags = ["h1", "h2", "h3", "h4&q
浏览 0
提问于2019-06-18
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用lxml模块 获取标签内所有文本
如何使用Python从列表中删除指定的元素
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
python教程|如何批量从大量异构网站网页中获取其主要文本?
享学课堂浅谈Python3中BeautifulSoup的使用方法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券