文章/答案/技术大牛

发布

社区首页 >问答首页 >使用Nokogiri解析blogspot XML文件

问使用Nokogiri解析blogspot XML文件
EN

Stack Overflow用户

提问于 2010-07-20 11:37:21

回答 3查看 814关注 0票数 1

我有一个博客导出的xml文件，它看起来像这样：

<feed>
<entry>
<title> title </title>
<content type="html"> Content </content>
</entry>
<entry>
<title> title </title>
<content type="html"> Content </content>
</entry>
</feed>

如何使用Nokogiri和Xpath解析？

这就是我所拥有的：

#!/usr/bin/env ruby

require 'rubygems'
require 'nokogiri'


 doc = Nokogiri::XML(File.open("blogspot.xml"))

 doc.xpath('//content[@type="html"]').each do |node|
  puts node.text
 end

但是它没有给我任何东西:/

有什么建议吗？:/

xml

xpath

nokogiri

blogspot

回答 3

Stack Overflow用户

发布于 2010-07-20 11:43:00

你的代码很适合我。某些版本的Nokigiri存在一些问题。

我得到了：

 Content
 Content

我使用nokogiri (1.4.1x86-mswin32)

票数 0

Stack Overflow用户

发布于 2010-07-20 12:01:51

结果，我不得不删除提要的属性

<feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:georss='http://www.georss.org/georss' xmlns:gd='http://schemas.google.com/g/2005' xmlns:thr='http://purl.org/syndication/thread/1.0'>

票数 0

Stack Overflow用户

发布于 2010-10-31 04:47:42

我只是偶然发现了这个问题。问题似乎出在XML名称空间上：

“原来我不得不删除提要的属性”

<feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:georss='http://www.georss.org/georss' xmlns:gd='http://schemas.google.com/g/2005' xmlns:thr='http://purl.org/syndication/thread/1.0'>

XML名称空间使访问节点变得复杂，因为它们提供了一种分隔相似标记的方法。请阅读Searching an HTML / XML Document的“名称空间”部分。

Nokogiri也有remove_namespaces!方法，这是一种有时很有用的处理问题的方法，但也有一些缺点。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/3286831

复制

相似问题

问使用Nokogiri解析blogspot XML文件
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Nokogiri解析blogspot XML文件EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Nokogiri解析blogspot XML文件
EN