这是一个如此基本的问题,以至于我实际上在文档中找不到它:-/
在以下内容中:
img = house_tree.xpath('//img[@id="mainphoto"]')[0]
如何获取<img/>
标签的超文本标记语言?
我尝试过添加html_content()
,但得到了AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'
。
另外,它是一个标签,里面有一些内容(例如<p>text</p>
),我如何获取内容(例如text
)?
非常感谢!
发布于 2011-03-23 02:50:57
我想这将会很简单:
from lxml.etree import tostring
inner_html = tostring(img)
至于从<p>
内部获取内容,比如一些选定的元素el
content = el.text_content()
https://stackoverflow.com/questions/5395948
复制相似问题