当我使用Nokogiri执行以下操作时:
some_html = '<img src="bleh.jpg"/>test<br/>'
f = Nokogiri::HTML(some_html)
#do some processing
puts f
它将打印整个XHTML文档结构,其中包含上面的代码。
如何打印/返回/获取some_html
变量中的html部分?
不是的。
f
将返回:
"<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www
.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n<img src=\"bleh.jpg\">test<br>\n
</body></html>\n"
我只想要内部/片段部分:
<img src=\"bleh.jpg\">test<br>
发布于 2009-11-27 13:59:09
使用Nokogiri::HTML::fragment(...)
而不是使用Nokogiri::HTML(...)
进行解析
asdf = Nokogiri::HTML::fragment('<img src="bleh.jpg">test<br>')
print asdf.to_html
# >> <img src="bleh.jpg">test<br>
发布于 2009-11-04 22:48:46
你说的“html”部分是什么意思?
只需执行f.text()
即可获取内部文本。
https://stackoverflow.com/questions/1674171
复制相似问题