首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Nokogiri查询JavaScript中包含的HTML注释?

Nokogiri查询JavaScript中包含的HTML注释?
EN

Stack Overflow用户
提问于 2013-03-12 08:50:20
回答 1查看 1.6K关注 0票数 0

我有以下HTML,正在尝试获取脚本节点中的注释:

代码语言:javascript
运行
复制
<html>
    <head>
        <script language="JavaScript" type="text/javascript">
            <!--
            url = 'http://someurl.com';
            -->
        </script>
    </head>
</html>

使用它,我得到了脚本节点:

代码语言:javascript
运行
复制
javascript_code = doc.xpath("/html/head/script")

但是,在将comments()添加到xpath时,它不返回任何内容:

代码语言:javascript
运行
复制
javascript_code = doc.xpath("/html/head/script/comment()")

我不知道为什么这不起作用,看起来应该很简单。有可能得到评论吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-03-13 13:23:21

如果您将文档解析为XML,它将找到注释。但是,如果您将其解析为HTML,Nokogiri会将脚本标记的全部内容放入cdata部分。然后你可以把它解析出来。

代码语言:javascript
运行
复制
require 'rubygems'
require 'nokogiri'

body = DATA.read

doc = Nokogiri::XML(body)
puts doc.search('/html/head/script/comment()').text.strip 
# puts "url = 'http://someurl.com';"

doc = Nokogiri::HTML(body)
puts doc.search('/html/head/script').text.strip 
# puts "<!--\n            url = 'http://someurl.com';\n            -->"


__END__
<html>
    <head>
        <script language="JavaScript" type="text/javascript">
            <!--
            url = 'http://someurl.com';
            -->
        </script>
    </head>
</html>
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15351391

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档