首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Scala和HTML解析

Scala和HTML解析
EN

Stack Overflow用户
提问于 2009-11-08 17:50:31
回答 5查看 24.1K关注 0票数 20

如何将HTML DOM文档加载到Scala中?XML singleton在尝试加载xmlns标记时出错。

代码语言:javascript
复制
import java.net._
import java.io._
import scala.xml._

object NetParse {

   import java.net.{URLConnection, URL}
   import scala.xml._

   def netParse(sUrl: String): Elem = {
       var url = new URL(sUrl)
       var connect = url.openConnection

       XML.load(connect.getInputStream)
   }
}

最后我找到了一个解决方案!-需要scala 2.7.7或更高版本才能工作(2.7.0有一个致命的bug):How-to-use-TagSoup-with-Scala-XML

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2009-11-08 18:01:24

票数 16
EN

Stack Overflow用户

发布于 2009-11-09 07:17:23

请尝试使用scala.xml.parsing.XhtmlParser

票数 5
EN

Stack Overflow用户

发布于 2011-01-04 21:00:57

我刚刚尝试在scala 2.8.1中使用这个答案,并最终使用了下面的工作:

http://www.hars.de/2009/01/html-as-xml-in-scala.html

我需要的有趣之处是:

代码语言:javascript
复制
val parserFactory = new org.ccil.cowan.tagsoup.jaxp.SAXFactoryImpl
val parser = parserFactory.newSAXParser()
val source = new org.xml.sax.InputSource("http://www.scala-lang.org")
val adapter = new scala.xml.parsing.NoBindingFactoryAdapter
adapter.loadXML(source, parser)
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1695902

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档