如何在jsoup中找到带有pseudoElement ::before的HTML标记

、、、

我将阅读来自一个网站的jsoup的img链接。当我搜索HTML代码时，我在一个::before (https://developer.mozilla.org/en-US/docs/Web/CSS/::before)元素中找到了这样的链接 ::before <img src="https://link.png

浏览 27提问于2020-03-21得票数 0

回答已采纳

1回答

java中的Jsoup.parse()和Jsoup.ParseBodyFragment()有什么区别？

、

import org.jsoup.Jsoup;import org.jsoup.nodes.Element; import org.jsoup.select.Elements"<html><head><title>Sample Title</title></head><body>Sample Conte

浏览 1提问于2020-06-08得票数 1

1回答

使用丢失和损坏的标记清除HTML

、、

我正在寻找一种方法，以清洁HTML文本，可能会有一些丢失或损坏的标签在他们。这些程序通常是由非程序员编写的，HTML可能会出现一些问题。("JSOUP: "+ Jsoup.clean(test, StringUtils.EMPTY, Whitelist.relaxed()));BEFORE: Here is a fake - Publisher</i

浏览 0提问于2016-03-29得票数 0

回答已采纳

3回答

我是否得到包含html代码内容中一个单词的标签和类名？

、、

给定的我的方法是：该网站的HTML代码有

浏览 5提问于2014-06-17得票数 1

回答已采纳

2回答

如何使用Jsoup获得特定的行

这是我试着用Jsoup刮的源代码。我有兴趣从以下各方面取得资料：“编号”、“日期”、“类型”、“品种”、“性别”、“年龄”、“体重”和“领养费”。也就是说，我正在寻找我的输出：日期: 11/20/2018品种:德国牧羊犬年龄:2岁，0个月领养费:250美元 Document dogs = Jsoup.connect("https:/&#

浏览 0提问于2018-11-20得票数 2

1回答

对文档中的某些区域有选择地禁用j五十四中的漂亮打印。

、、

当使用jsoup清洗文档时，我喜欢它自动应用漂亮打印的事实。我知道我可以在每个文档的基础上停用它，但是我喜欢将它应用到大多数文档中，除了某些有问题的区域之外，在这些区域，jsoup做得并不好。一个例子是带有DIV的标记，即在语义上它们的行为类似于PRE标记，这意味着浏览器对行提要和其他空白(缩进)非常敏感。如果在这些区域中有更多的标记，如BR、SPAN等，情况会变

浏览 5提问于2019-12-17得票数 1

回答已采纳

4回答

如何在android中移除类似 的html标签？

、、

我在我的android应用程序中使用json，实际上是在列表视图中，它在我的文本中也显示了html标签，我如何才能只显示避开html标签的文本呢？= null ) } }在我的列表视图中，它是这样显示的frnds' ‘ gudmrng'

浏览 0提问于2013-05-24得票数 1

1回答

用golang解析破损的HTML

、、

我需要在HTML字符串中找到元素。不幸的是，HTML几乎被破坏了(例如，没有开头对的结束标记)。我尝试在launchpad.net/xmlpath中使用XPath，但是它不能解析一个该死的错误文件。如何在带有golang的破HTML中找到元素？我更喜欢使用XPath，但是如果我可以使用它查找带有特定id或类的标记，那

浏览 1提问于2014-06-07得票数 9

3回答

Java查找未关闭的HTML标记

、、

如何在HTML字符串中找到没有结束标记的标记并关闭它？带有没有关闭标记的标记的HTML字符串： <head> </head> dasa </p

浏览 3提问于2014-04-24得票数 1

回答已采纳

1回答

从html <body>元素中抓取数据

、、、

我正在使用JSoup，这是一个纯Java的超文本标记语言解析器库，用来从互联网上拉取和解析纯超文本标记语言页面(好吧，使用非常少的JS)。到目前为止，如果我想要抓取的数据被附加到一个非常冗长的HTML元素(如<a href="...."我可以很容易地在JSoup中获得<body>标记，但是这个标记中的文本通常是乱七八糟

浏览 0提问于2015-05-06得票数 1

1回答

替换HTML文件中的特定字符串

、、

我需要翻译一些HTML页面内容。我有很多HTML文档作为文件列表，还有一个具有如下翻译的地图：Map<String, String> translations 替换-因为我不想在注释或javascript中翻译字符串，另一个问题是一个带有原始文本的字符串可以是另一个带有<

浏览 1提问于2013-12-09得票数 0

回答已采纳

2回答

使用无头浏览器查找嵌套在带有selenium的HTML* <div>标记中的样式*

、、、、

使用带有无头浏览器HtmlUnitDriver的selenium，我正在尝试在嵌套在内部的webelement上执行一个findElementBy。当我从网页中直接查看HTML时，正文看起来如下所示。当我使用Google打开开发工具时，我可以看到文本框(webelement)的html代码(它看起来类似)是嵌套在标记中的。有没有办法找到嵌套在div标记中的textbox webelement，以便我可以使用selen

浏览 0提问于2015-02-10得票数 0

2回答

如何在特定字符串中查找字符串并插入

、、、、

我有一个获取XML字符串的方法，理论上应该在每个特定的标记之前插入一个注释。return sb.toString(); addCommentXML("somereallylongxml", "second", "it’s a comment")的输出应该是

浏览 2提问于2017-06-18得票数 0

回答已采纳

1回答

如何在Jsoup中关闭关闭标记</tagName>的自动生成？

、、

我试图解析HTML文档，在这里我遇到了以下场景。我已经将内容以字符串的形式放在下面的代码中。在此中，锚标记中有一个P标记。如果使用Jsoup解析，则在近#item1 1之间添加一个额外的< /a>标记和< a>标记，从而更改html结构。("UNPARSED = \n"+html); System.out.println("<em

浏览 2提问于2014-11-20得票数 0

回答已采纳

3回答

jQuery提取双引号中的文本

、

我有大型的HTML文件，有传统的双引号，如“，关闭为”，如何在双引号中提取纯文本？“And, as best friends, you would have shopped lots of times before, wouldn’t you?<&

浏览 3提问于2015-03-05得票数 0

回答已采纳

2回答

内部标记避免，Android webservices

、

所以当我在浏览器中viewsource的时候.有一些span标记，显示数据是很困难的，所以我如何避免这种情况呢？

浏览 0提问于2011-12-27得票数 0

回答已采纳

15回答

如何在使用jsoup将html转换为纯文本时保留换行符？

、

我有以下代码： public String noTags(String str){ "<HTML> <HEAD> <T

浏览 4提问于2011-04-13得票数 112

1回答

已启用使用带有主题的重氮将类添加到body标记

、、

那么，如何在body标记中动态添加一个简单的附加css类呢？编辑:这适用于带有主题和Plone的纯重氮(plone.app.theming)： <before theme-children="/html/body"><xsl:attribute name="class"><xsl:value-of select="/html/body

浏览 0提问于2012-11-17得票数 7

回答已采纳

2回答

我如何获得特定的标签与j友爱android

、、、

这里是我HTML的一些部分<img class=\"aligncenter size-full wp-image-3197\" src=\"data:image-300x169.jpg 300w\" sizes=\"(max-width: 800px) 100vw, 800px\" /></noscript>goodbye

浏览 3提问于2017-01-02得票数 1

回答已采纳

1回答

在文档子字符串周围绘制一个框

、、、、

在每个文件夹中，有一个超文本标记语言文件和一个.txt文件，其中包含超文本标记语言文件中的文本，去掉所有超文本标记语言标记。从这两个文件中，我想创建一个新文件，它是一个HTML文件，在"This is some text“周围画了一个方框，如下所示：这里最明显的问题是，打印精美的文本文件不包含任何标记，因此很难在HTML文档中找到它。-Grab HTML内容，去掉所有的

浏览 0提问于2016-07-13得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

java中的Jsoup.parse()和Jsoup.ParseBodyFragment()有什么区别？

使用丢失和损坏的标记清除HTML

我是否得到包含html代码内容中一个单词的标签和类名？

如何使用Jsoup获得特定的行

对文档中的某些区域有选择地禁用j五十四中的漂亮打印。

如何在android中移除类似<br>的html标签？

用golang解析破损的HTML

Java查找未关闭的HTML标记

从html <body>元素中抓取数据

替换HTML文件中的特定字符串

使用无头浏览器查找嵌套在带有selenium的HTML* <div>标记中的样式*

如何在特定字符串中查找字符串并插入

如何在Jsoup中关闭关闭标记</tagName>的自动生成？

jQuery提取双引号中的文本

内部标记避免，Android webservices

如何在使用jsoup将html转换为纯文本时保留换行符？

已启用使用带有主题的重氮将类添加到body标记

我如何获得特定的标签与j友爱android

在文档子字符串周围绘制一个框

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐