腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
:
如何
从
<
div
>
获取
不同
的
项
、
我一直在和
BeautifulSoup
打交道,想搞一个网站。结构是这样
的
: <
div
class="content"> <a class="post-title" href我已经创建了三个空数组,分别名为"time“、"post-title”和"url“,我想将它们追
浏览 15
提问于2020-06-13
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
从
HTML中
获取
文本
、
、
、
我试着用Python2.7和
BeautifulSoup
4
从
我
的
电力供应商
的
BeautifulSoup
4中获得当前
的
"5分钟趋势价格“。xpath是:xpath = "//html/body/
div
[2]/
div
/
div
/
div
[3]/p[1]"<
div
class="i
浏览 3
提问于2013-09-10
得票数 2
回答已采纳
2
回答
在
BeautifulSoup
中查找具有特定id
的
div
的
数量?
、
我正在尝试找到一种方法来计算id为"blue“
的
div
的
数量。这在
BeautifulSoup
中是可能
的
吗?下面是我
的
代码: soup =
BeautifulSoup
.
BeautifulSoup
("<html><body><
div
id='blue'></
浏览 0
提问于2016-04-16
得票数 1
2
回答
BeautifulSoup
Python
获取
语法
、
我试图
从
维基百科页面收集一些数据,但我似乎无法缩小对
div
中
的
ui和li
项
的
获取
范围。到目前为止,我
的
情况如下:我正在阅读文档,我似乎找不到在哪里或
如何
深入到ul或
div
class = mw-parser-output中
的
li
浏览 0
提问于2018-02-06
得票数 1
回答已采纳
2
回答
python中
的
html数据抓取
、
我正在
获取
html格式
的
数据。
如何
从
该格式中
获取
特定数据。完整
的
html将在django
的
post请求中出现。现在,我必须在html中
的
tables标记之间
获取
数据。已尝试
beautifulSoup
,但正在从urls
获取
数据。在python中
获取
标签之间数据
的
任何可能
的
方法。 python版本:2.7
浏览 4
提问于2015-08-21
得票数 2
1
回答
如何
从
网页中抓取href (以前做过,但对一个网站不起作用?)
、
、
我试图
从
以下网站
的
某些
div
类(class="card-img-block")中
获取
链接:import requestshtml = 'https://milled.com/OneKingsLane' req = session.g
浏览 1
提问于2019-12-12
得票数 0
回答已采纳
1
回答
获取
共享特定xpath
的
所有
项
的
lxml
、
、
、
我试图从一个网站上
获取
所有的价格,使用xpath。所有的价格都有相同
的
xpath,或者我假设第一
项
有效.让我告诉你: soup =
BeautifulSoup
(5]/
div
/
div
/
div
/
div
[1]/ul/li[1]/article/
div
[1]/<e
浏览 4
提问于2022-06-03
得票数 -1
2
回答
使用python语言将html转换为文本
我想用Python
从
HTML文件中提取文本。我想要
的
输出基本上与
从
浏览器复制文本并将其粘贴到记事本中得到
的
输出相同。我想要一些比使用正则表达式更健壮
的
东西,因为正则表达式在格式不佳
的
HTML上可能会失败。我看到很多人推荐Beautiful Soup,但我在使用它时遇到了一些问题。首先,它会拾取不需要
的
文本,比如JavaScript源。而且,它不能解释HTML实体。例如,我希望将HTML源中
的
'转换为文本中
的
撇号,就像我
浏览 0
提问于2010-08-19
得票数 2
回答已采纳
2
回答
检查
div
类是否存在返回错误
、
、
当我用漂亮
的
汤登录一些产品后,我试着
从
网页上刮起东西来。有一种情况是,产品不再可用。该网页只有在没有产品
的
页面上才有一个
div
类,如下所示 <p>There is an error</p>if soup.find_all('
div
', {'class': 'alert'}):
浏览 1
提问于2019-03-24
得票数 0
2
回答
使用Python和
BeautifulSoup
从
页面中
获取
表信息
、
、
我试图
从
获取
信息
的
页面。 我试图
从
“名册”表中
获取
所有的信息,但由于某种原因,我无法通过“美丽
的
灵魂”(
BeautifulSoup
.I)获得它。我尝试过soup.find("
div
", {'id': '
div
_games_played_team'}),但它不起作用。当我查看页面的HTML时,我可以在一个非常大
的
注释和一个常规
的
div
浏览 3
提问于2020-04-13
得票数 0
回答已采纳
1
回答
如何
从
网站上抓取所有价格
、
、
、
所以这就是我所拥有的,尽管这看起来很有趣.将印刷前10
的
价格只
从
齐洛。你怎么写这个来抓取页面上
的
所有项目?(奖金,如果你漂亮,也请告诉我
如何
保存所有的价格作为一个列表
的
变量<3)from bs4 import
BeautifulSoup
HEADERS = {'User-Agent':'Mozilla
浏览 2
提问于2022-06-05
得票数 -1
2
回答
使用<td>提取BS4元素
、
、
、
当我使用
BeautifulSoup
时,我遇到
的
问题是找不到一种在class中提取表
的
方法。我试图提取信息
的
方式如下所示:谢谢你提前给我答案!
浏览 1
提问于2021-04-30
得票数 1
回答已采纳
2
回答
无法找到匹配以下内容
的
适当正则表达式:
、
我试图
获取
响应文本
的
内容,即日期。但是,如果它不是日期,它就不应该
获取
内容。有人能帮帮我吗..。我目前
的
判断是:“更新/终止日期:^\d(\d/)” <
div
class="responseText"> 01/01/2
浏览 2
提问于2019-11-04
得票数 0
回答已采纳
2
回答
在
BeautifulSoup
中使用过滤器时
获取
内部标记文本
我有:<
div
id="price">$199.00</
div
>我怎么才能得到$199.00
的
文本。使用不起作用,因为我
从
整个文档中获得了所有的innet文本。
浏览 1
提问于2013-11-27
得票数 0
1
回答
基于节点实例
的
提取
、
相关
的
部分看起来是这样
的
。 ...顾名思义,RecurringText在所有文件中都是一致
的
。但是,VariableText会发生变化。它唯一
的
共同点是它是下一个编码部分。我想要Text1,Text2和Text3提取液。(直到和包含RecurringText)之前和之后(包括和之后)
的
内容(包括和VariableText之后)都可以被抛在后面。我在其他地方发现
的
从
RecurringText提取
的
部分,但我不知道
如何
删除下一个项目,如果
浏览 3
提问于2016-05-23
得票数 0
回答已采纳
1
回答
如何
使用编码JSoup文档文本
我有一个这样
的
节点我需要像这样
获取
div
元素
的
文本我
从
.text()方法得到
的
输出是在
BeautifulSoup
中,它将返回> something < not encoded输出。
如何</e
浏览 0
提问于2013-07-03
得票数 0
2
回答
为什么美丽汤只给我网站
的
第一个入口?
、
、
我正在尝试
从
以下网站上列出
的
文章中
获取
标题、日期和作者:https://coreyms.com/ 这是我运行
的
代码 from bs4 import
BeautifulSoup
import csvsoup=
BeautifulSoup
(source,'lxml
浏览 21
提问于2019-09-21
得票数 1
回答已采纳
2
回答
使用
BeautifulSoup
提取外部
div
、
如果HTML代码如下所示:<p>hello</p> <
div
class="nesteddiv"> <p>two</p> </
浏览 0
提问于2011-06-11
得票数 3
回答已采纳
2
回答
如何
使用
BeautifulSoup
从
div
标签中提取文本
、
、
我试图从下面的html内容<
div
class="nowPrice"><
div
class="showPrice" style="color: rgb(14, 203, 129);">47,864.58</
div
><
div
class="subPrice">$47,864.58</
div
></
div
>中<em
浏览 2
提问于2021-09-17
得票数 0
回答已采纳
1
回答
如何
从
csv文件中特定列
的
所有行中解析HTML编码
的
文本?
、
下面是“content”列中数据外观
的
图像: 我在pandas中加载了一个csv文件。在列'Content‘中,每一行都包含
不同
长度
的
html编码文本。有些就像500+
的
单词。我
的
目标是去掉“content”列
的
所有行中
的
所有html编码。到目前为止我只有这个。dataset = pd.read_csv('NuggetData.csv') “‘Content”是表中
的
浏览 44
提问于2019-04-24
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券