首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >HtmlUnit正在抛出内存,并且可能会泄漏内存

HtmlUnit正在抛出内存,并且可能会泄漏内存
EN

Stack Overflow用户
提问于 2011-09-24 05:53:11
回答 3查看 3.5K关注 0票数 2

我将Selenium与启用了javascript的HtmlUnitDriver一起使用时,出现了内存不足错误(我使用Java)。我只是浏览同一页。我只使用了一个GET命令。克服这种情况的解决方案是什么?

EN

回答 3

Stack Overflow用户

发布于 2011-09-28 06:53:55

我也遇到过类似的问题。这最终成为了帧自动加载的问题……一个无法禁用的功能。

看看这个:Extremely simple code not working in HtmlUnit

这可能会有帮助。

更新

HtmlUnit的当前版本是2.10。我从2.8版本开始使用HtmlUnit,每个新版本都会消耗更多的内存。我发现在启用javascript的情况下获取5个页面会导致2 2GB的进程。

从javascript的角度来看,有许多方法可以改善这种情况。然而,当你不能修改javascript时(例如:如果你正在抓取一个网站),你就束手无策了。当然,禁用javascript是最好的方法。但是,这可能会导致获取的页面与预期的页面不同。

不过,我确实设法克服了这种情况。经过多次测试后,我注意到这可能不是HtmlUnit的问题(我从一开始就认为它是有罪的)。它看起来像是JVM。将Sun改为OpenJDK成功了,现在这个过程只需要200MB,而不是消耗2 2GB的内存。我正在添加版本信息。

Sun (Oracle) 32位JVM:

代码语言:javascript
运行
复制
$java -version
java version "1.6.0.26"
Java(TM) SE Runtime Environment (build 1.6.0_26-b03)
Java HotSpot(TM) Server VM (build 20.1-b02, mixed mode)

OpenJDK 32位JVM:

代码语言:javascript
运行
复制
$java -version
java version "1.6.0_18"
OpenJDK Runtime Environment (IcedTea6 1.8.13) (6b18-1.8.13-0+squeeze2)
OpenJDK Server VM (build 14.0-b16, mixed mode)

操作系统:

代码语言:javascript
运行
复制
$ uname -a
Linux vostro1015 2.6.32-5-686-bigmem #1 SMP Sun May 6 04:39:05 UTC 2012 i686 GNU/Linux

请与我分享你的经验。

票数 2
EN

Stack Overflow用户

发布于 2011-09-24 05:57:24

通过将以下内容添加到启动运行Selenium的JVM的java命令行,为JVM提供更多内存:

代码语言:javascript
运行
复制
-Xmx512m

此示例为JVM提供了最大512 Mb。

这取决于您从何处运行Selenium。如果是maven,则可以将其添加到MAVEN_OPTS环境变量中;如果是Eclipse,则需要编辑测试类的运行配置,等等。

票数 1
EN

Stack Overflow用户

发布于 2013-01-08 16:42:38

与HtmlUnit相关:

别忘了给webClient.closeAllWindows();打电话。我总是把它放在我使用webclient的区域周围的finally-block中。这样就可以确保停止所有的javascript并释放所有的资源。

webClient的设置也很有用

代码语言:javascript
运行
复制
    webClient.setJavaScriptTimeout(JAVASCRIPT_TIMOUT);
    webClient.setTimeout(WEB_TIMEOUT);
    webClient.setCssEnabled(false);  // for most pages you do not need css to be enabled
    webClient.setThrowExceptionOnScriptError(false); // I never want Exceptions because of javascript

JAVASCRIPT_TIMOUT不应该太高,长时间运行javascript可能是内存问题的一个原因。WEB_TIMEOUT想一想你想要等待多长时间。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7535243

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档