我在使用jsoup时遇到了问题,我想要获得一行数据,稍后我将把该行插入到另一个html文档中。但是当我检查时间时,发现没有and标签。我怎么才能解决它呢?content-wrapper\"><p><strong><span class=\"CLASS 1 CLASS 2 CLASS 3\">123</span></strong><br /><strong>DATA1</strong><
在大多数情况下,使用jsoup解析XML都没有问题。但是,如果XML文档中有<link>标记,jsoup会将<link>some text here</link>更改为<link />some text here。这使得无法使用CSS选择器提取<link>标记内的文本。
那么如何防止jsoup“清理”<link>标签呢?
我尝试了我自己的一个已经从维基主页抓取html,就像在JSoup.org上建议的示例,但当我试图使用简单的for循环打印它时,我得到了一个类似的错误/它说你不能在元素上use.size。for(int d=1; d<= newsHeadlines.size(); d++) Exception in thread "main" java.lang.Errorarray or an instance
我正在尝试解析以下URL的html:
获取包含讲师姓名的"< p >“标记的文本。所需信息位于"< p >“标记内,但我无法使用JSoup检索标记。这不就是Jsoup的getAllElements()方法要做的吗?"http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-ther