我想从一个网站解析大的HTML文本。所以我已经解析了Div,现在我想要标签中的内容,例如:
<div id="lala"><p>I WANT</p> <ul><li>THIS</li></ul>. <p>All of them</p></div>
这是我的以下代码:
patchpage = requests.get(href)
tree = html.fromstring(patchpage.content)
patch_message = tree.xpath('//div[@class="messageText"]')
for item in patch_message:
await client.say(item.text.strip()) # This is bugging and give me error
return await client.say(patch_message)
目前,patch_message为我提供了:
[<Element div at 0x29c4be2fa98>]
除了:/谁能告诉我如何将div内容解析成python吗?
发布于 2017-11-07 23:25:46
假设您得到的错误是AttributeError: 'NoneType' object has no attribute 'strip'
您只需要排除None对象,使其不被剥离。
for item in patch_message:
if item.text:
print item.text.strip()
https://stackoverflow.com/questions/47159610
复制相似问题