腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
JSoup
-
基于
文本
的
获取
标签
java
、
jsoup
假设我在一个页面上有3个
文本
框,定义如下。input id="input" type="close" autocomplete="off" role="combobox" placeholder="Close"> 我会将'Open‘值作为参数传递给
JSoup
,
JSoup
应该会像下面这样返回数据(这是中间
文本
框
的
详细信息)。<input id="input" type
浏览 35
提问于2021-10-14
得票数 0
1
回答
在Scala中将html转换为xhtml (有效
的
xml)
xml
、
scala
我正在尝试加载有效
的
html以便在Scala中处理。转换成xml似乎是一个很好
的
起点。在有些有争议
的
上,这看起来是非常好
的
代码。基本上,它应该需要“修复”在html中有效但在有效xml中无效
的
标签
,从而阻止文档成为有效
的
xhtml,甚至更多。scala.io.Source(fromFile)
获取
的
现有html文档。在代码库中,Node类型
的
含义似乎有点,或者我不确定如何从从scala.io.Source
的</
浏览 2
提问于2013-11-23
得票数 0
3
回答
如何从网页中提取所有
文本
?
java
、
html
、
dom
、
web
、
jsoup
我正在使用
JSoup
库来提取网页中
的
文本
。以下是我
的
代码 URL url = new URL(text); textField.append("\n");} { 在这里,我只能从"p“
标签
获取</
浏览 9
提问于2013-10-09
得票数 1
1
回答
使用
JSOUP
的
HTML标注
javascript
、
html
、
css
、
annotations
、
jsoup
我需要根据网页
的
文本
内容自动注释网页。例如,我想在有城市
的
地方注释html内容,并添加一个跨度,如下所示:问题是,我知道城市
的
位置是
基于
文本
内容以前我使用过
JSoup
,但我找不到如何根据
文本
位置找到插入
标签
的
位置。
浏览 0
提问于2015-12-06
得票数 1
1
回答
计算html dom节点(在使用javascript rangy库
的
文档节点)中
的
字符数
的
最佳方法是什么?
javascript
、
android
、
html
、
webview
、
rangy
计算html dom节点(在使用javascript rangy库
的
文档节点)中
的
字符数
的
最佳方法是什么?
浏览 1
提问于2015-09-06
得票数 0
1
回答
JSoup
核心网页
文本
提取
java
、
jsoup
我是
JSoup
的
新手,如果我
的
问题太琐碎了,很抱歉。我试图从中提取文章
文本
,但在打印解析文档时,在解析输出中看不到任何文章{ Document document; document =
Jsou
浏览 0
提问于2013-06-19
得票数 1
回答已采纳
2
回答
如何拦截来自iFrame
的
图片(img
标签
)?
java
、
iframe
、
tags
、
image
我正在寻找解决以下问题
的
想法:我想要做
的
是:
获取
URL,然后使用Java库操作
获取
的
内容(有什么建议吗?)。然后将修改后
的
内容发送给que客户端。 这是解决这个问题
的
最好方法吗?建议wellcome :)
浏览 0
提问于2010-03-16
得票数 1
回答已采纳
1
回答
当
标签
存在于网页中时,
Jsoup
选择方法返回null
java
、
html
、
jsoup
Jsoup
可以在标记中
获取
文本
。但是,当我想从<div class=kcm-read-text>
标签
中
获取
文本
时,它返回null。我也不知道原因。我正在想办法,但还是不知道原因。这是我
的
密码Element isiBerita = dok.select("div.kcm-read-text").first(); 我也尝
浏览 0
提问于2016-02-13
得票数 2
回答已采纳
2
回答
JSoup
的
替代方案或如何清理空白
java
、
html
、
jsoup
有人知道
JSoup
的
替代品吗? jQuery
的
html清洁插件对我来说很好,但我感兴趣
的
是在服务器端,而不是在客户端中进行html代码清理。String cleanS = dirtyS.replaceAll("<p> </p>", ""); //This doesnt work 我发现脏html包含了
浏览 4
提问于2012-10-25
得票数 4
回答已采纳
2
回答
无法从网站抓取图像url
php
、
android
、
html
、
parsing
我在试着 刮擦 图像url来自 欧足联网站 使用
Jsoup
,但我遇到了一个错误。这是我用来检索图像url
的
代码。Document doc =
Jsoup
.connect(Utility.url).get(); Elements img = doc.select("img"); 我使用断点来查看哪一行不起作用,我发现doc变量工作正常,所有页面都被刮掉了,但是当我调试下一行时,我得到了null和一个包含0个对象
的
数组。我已经在stackoverflow上看过了,但是我找不到解决我
的
问题<
浏览 49
提问于2014-01-02
得票数 0
回答已采纳
1
回答
获取
JSoup
的
一部分
java
、
html
、
parsing
、
jsoup
我对汽车广告
的
抓取网站有问题。我想知道广告商
的
名字。主要
的
问题是,有时这个名字以不同
的
方式显示出来。解决方案很容易,因为我将这样做: Elements ownerElement =
Jsoup
.parseStringUtils.substringBetween(String.valueOf(ownerElement), "\">", "<
浏览 1
提问于2019-03-06
得票数 0
回答已采纳
1
回答
Jsoup
用不带递归
的
分隔符替换
标签
java
、
jsoup
我有一个HTML文件,我想从其中
获取
文本
。我决定使用
Jsoup
,但我有一个问题。我想一个接一个地迭代
标签
的
文本
。 这里有一个类似的问题:带有“递归”答案
的
。我不想因为内存问题而实现递归解决方案。我
的
问题是,
Jsoup
有没有一个内置
的
函数,可以给我提供带有预定义分隔符而不是标记
的
干净
文本
,或者有没有什么方法可以让我在没有递归解决方案
的
情况下逐个元素迭代(一个元素没有
浏览 2
提问于2014-10-08
得票数 0
1
回答
如何在android webview中拆分网页?
javascript
、
android
、
webview
我必须以编程
的
方式拆分内容页面。这样我不仅可以选择打印页面,它还可以用于缩略图或任何其他选项。在这篇文章中,我使用java script接口在android webview中显示网页。因此,请帮助任何建议或参考关于此拆分概念,以实现在android webview中
的
网页拆分。
浏览 4
提问于2015-01-06
得票数 3
1
回答
为什么tagName“链接”不能解析
java
、
jsoup
我在我
的
Jsoup
项目中有一个有线传感器<html>..</html>System.out.println(document.select("link").text()) ;//nothing gets printed./html>System.out.pri
浏览 3
提问于2016-04-20
得票数 1
1
回答
使用
JSoup
返回来自特定div
的
链接中
的
所有
文本
java
、
html
、
css
、
jsoup
我使用
JSoup
解析特定div中
的
链接列表。使用#div>a cssQuery语法,我可以很好地获得链接。但我无法从内部
获取
文本
: /* Download HTML pageLong.MAX_VALUE); File input = new File(HTML_DOC); Documen
浏览 3
提问于2017-05-11
得票数 0
3
回答
如何提取<p>标记之间
的
文本
java
、
html
、
parsing
、
jsoup
我想从放置在p和li
标签
中
的
超
文本
标记语言页面中提取
文本
,这样我就可以开始对页面进行标记化,为每个页面构建倒排索引,以便回答搜索查询。如何使用
jsoup
获取
p标记要在该参数中写入
的
字符串可能是什么?
浏览 2
提问于2013-05-23
得票数 10
回答已采纳
3
回答
如何在android中解析HTML?
android
、
html
、
xml
、
parsing
我正在为android开发一个应用程序,该应用程序
的
一个功能元素是从图书馆目录
的
在线搜索中返回结果。应用程序需要以与应用程序其余部分一致
的
方式显示搜索结果,搜索是通过自定义HTML表单执行
的
。也就是说,需要对搜索结果进行解析,并显示有用
的
元素。我想知道是否/如何在android中实现这一点?
浏览 0
提问于2011-08-19
得票数 5
回答已采纳
1
回答
使用XHTML文档中
的
grails中
的
JSOUP
在两个不同
的
标记之间
获取
文本
html
、
grails
、
tags
、
xhtml
、
jsoup
我试图在我
的
xhtml文档中
获取
标记ae_definedtermtitlebegin
的
所有
文本
。此标记在整个文档中发生1000次。我正在尝试创建一个与此标记相关联
的
文本
列表。我正在使用
JSOUP
和grails。到目前为止,代码已经写好了。Document doc =
Jsoup
.parse(file,"UTF-8") Elements pres = doc.getElementsByTag("ae_definedTermT
浏览 0
提问于2014-11-25
得票数 1
5
回答
如何从
文本
中移除只有html标记?
java
、
html
、
out-of-memory
、
jsoup
、
strip
我只想从带有
JSOUP
的
文本
中删除html标记。我使用了这里
的
解决方案(),但是经过一些检查后,我发现
JSOUP
获得了Java堆异常: OutOfMemoryError用于大型htmls,但不是所有的。代码在最后一行(而不是在
Jsoup
.parse上)抛出一个异常: html = html.replace("<","<").replace("
浏览 12
提问于2016-01-02
得票数 4
回答已采纳
4
回答
Java : HTML解析
java
、
html-parsing
我有如下给出
的
HTML内容。我在这里寻找
的
标记是"img src"和"!important"。Java提供HTML解析技术了吗?
浏览 2
提问于2011-01-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用lxml模块 获取标签内所有文本
基于keras的文本分类实践基于keras的文本分类实践
爬虫之Jsoup
基于Python的文本情感分类
基于文本特征的价格模型
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券