首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BeautifulSoup,提取HTML信息中的字符串,ResultSet对象

BeautifulSoup,提取HTML信息中的字符串,ResultSet对象
EN

Stack Overflow用户
提问于 2021-04-13 14:58:09
回答 1查看 24关注 0票数 0

以下是我从代码中得到的结果

输入:contents = bs.find_all('div', {'class':'result_list'})

输出:

代码语言:javascript
运行
复制
<div class="result_list" id="search-list"><div class="sight_item" data-address="广州市番禺区大石镇105国道大石段593号" 
data-children-count="17" data-districts="广东·广州·广州长隆旅游度假区" data-foreign="false" data-id="4281924223"
data-point="113.321711,23.007944" 

所以我想提取ResultSet中的信息。

例如,

我想要获取“data-address”和“data-point”。

那么我该怎么做呢?

EN

回答 1

Stack Overflow用户

发布于 2021-04-13 15:05:46

首先,html代码应该有一个结束的div标记。因此,让我们将内容的输出设置为

代码语言:javascript
运行
复制
<div class="result_list" id="search-list">
  <div class="sight_item" data-address="广州市番禺区大石镇105国道大石段593号" 
    data-children-count="17" data-districts="广东·广州·广州长隆旅游度假区" 
    data-foreign="false" data-id="4281924223"
    data-point="113.321711,23.007944">

      DIV CONTENT GOES HERE!

  </div>
</div>

另外,contents应该是一个div标记列表,所以让我们用[0]访问该列表的第一个元素

所以试试这个吧。

代码语言:javascript
运行
复制
contents = bs.find_all('div', {'class':'result_list'})
# contents is now a list of divs
sight_item = contents[0].div.div
data_address = sight_item['data-address']
print(data_address)


# output
# 广州市番禺区大石镇105国道大石段593号

data_point = sight_item['data-point']
print(data_point)

#output
# 113.321711,23.007944
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67070086

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档