如何将HTML DOM文档加载到Scala中?XML singleton在尝试加载xmlns标记时出错。
import java.net._
import java.io._
import scala.xml._
object NetParse {
import java.net.{URLConnection, URL}
import scala.xml._
def netParse(sUrl: String): Elem = {
var url = new URL(sUrl)
var connect = url.openConnection
XML.load(connect.getInputStream)
}
}
最后我找到了一个解决方案!-需要scala 2.7.7或更高版本才能工作(2.7.0有一个致命的bug):How-to-use-TagSoup-with-Scala-XML
发布于 2009-11-08 18:01:24
发布于 2009-11-09 07:17:23
请尝试使用scala.xml.parsing.XhtmlParser
。
发布于 2011-01-04 21:00:57
我刚刚尝试在scala 2.8.1中使用这个答案,并最终使用了下面的工作:
http://www.hars.de/2009/01/html-as-xml-in-scala.html
我需要的有趣之处是:
val parserFactory = new org.ccil.cowan.tagsoup.jaxp.SAXFactoryImpl
val parser = parserFactory.newSAXParser()
val source = new org.xml.sax.InputSource("http://www.scala-lang.org")
val adapter = new scala.xml.parsing.NoBindingFactoryAdapter
adapter.loadXML(source, parser)
https://stackoverflow.com/questions/1695902
复制相似问题