我使用Html.fromHtml( string ).toString()将可能包含或不包含html和/或html实体的字符串转换为纯文本字符串。
这是相当慢的,我想我最后的计算是在avg上花了大约22ms。对于一大批这样的东西,它可以在一分钟内添加。因此,我正在寻找一个更快的,性能构建的选项。
有没有什么方法可以加速这个过程,或者有其他可用的解码选项?
编辑:由于似乎没有更快的内置方法或专门针对性能而构建的方法,因此我将奖励任何可以将我引向以下库的人:
Html.fromHtml(String).toString();
更快的
需要注意的是,我已经用这个方法尝试过Jsoup:Jsoup.parse(String).text()
,它的速度更慢。
发布于 2011-02-03 11:34:12
的unescapeHtml()呢?该库可在Apache网站上找到。
(编辑:2019年6月-有关库的更新,请参阅下面的评论)
发布于 2011-01-20 00:55:51
fromHtml()
没有高性能的超文本标记语言解析器,我不知道SpannedString
上的toString()
实现有多快。我怀疑它们都不是为你的场景而设计的。
理想情况下,字符串在到达低功耗手机之前是干净的。或者在构建过程中清理它们(对于资源/资产),或者在服务器上清理它们(在下载它们之前)。
无论出于何种原因,如果您确实需要在设备上清理它们,您也许可以使用NDK来创建一个C/C++库,以便更快地为您执行清理。
发布于 2014-10-16 04:36:10
这是一个令人难以置信的快速而简单的选项:Unbescape
它极大地提高了我们的解析性能,这需要每个字符串都通过解码器运行。
https://stackoverflow.com/questions/4321896
复制相似问题