以下是我从代码中得到的结果
输入:contents = bs.find_all('div', {'class':'result_list'})
输出:
<div class="result_list" id="search-list"><div class="sight_item" data-address="广州市番禺区大石镇105国道大石段593号"
data-children-count="17" data-districts="广东·广州·广州长隆旅游度假区" data-foreign="false" data-id="4281924223"
data-point="113.321711,23.007944" 所以我想提取ResultSet中的信息。
例如,
我想要获取“data-address”和“data-point”。
那么我该怎么做呢?
发布于 2021-04-13 15:05:46
首先,html代码应该有一个结束的div标记。因此,让我们将内容的输出设置为
<div class="result_list" id="search-list">
<div class="sight_item" data-address="广州市番禺区大石镇105国道大石段593号"
data-children-count="17" data-districts="广东·广州·广州长隆旅游度假区"
data-foreign="false" data-id="4281924223"
data-point="113.321711,23.007944">
DIV CONTENT GOES HERE!
</div>
</div>另外,contents应该是一个div标记列表,所以让我们用[0]访问该列表的第一个元素
所以试试这个吧。
contents = bs.find_all('div', {'class':'result_list'})
# contents is now a list of divs
sight_item = contents[0].div.div
data_address = sight_item['data-address']
print(data_address)
# output
# 广州市番禺区大石镇105国道大石段593号
data_point = sight_item['data-point']
print(data_point)
#output
# 113.321711,23.007944https://stackoverflow.com/questions/67070086
复制相似问题