首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何从WebView获取网页内容?

如何从WebView获取网页内容?
EN

Stack Overflow用户
提问于 2010-03-04 10:15:45
回答 7查看 115.2K关注 0票数 87

在Android上,我有一个显示页面的WebView

如何在不再次请求页面的情况下获取页面源代码?

看起来WebView应该有某种返回字符串的getPageSource()方法,可惜它没有。

如果我启用了JavaScript,那么在这个调用中放入什么适当的JavaScript来获取内容?

代码语言:javascript
复制
webview.loadUrl("javascript:(function() { " +  
    "document.getElementsByTagName('body')[0].style.color = 'red'; " +  
    "})()");  
EN

回答 7

Stack Overflow用户

回答已采纳

发布于 2011-02-04 05:36:17

我知道这是一个迟来的答案,但我找到了这个问题,因为我也有同样的问题。我想我在lexandera.com上的this post中找到了答案。下面的代码基本上是从网站上剪切并粘贴的。它似乎起到了作用。

代码语言:javascript
复制
final Context myApp = this;

/* An instance of this class will be registered as a JavaScript interface */
class MyJavaScriptInterface
{
    @JavascriptInterface
    @SuppressWarnings("unused")
    public void processHTML(String html)
    {
        // process the html as needed by the app
    }
}

final WebView browser = (WebView)findViewById(R.id.browser);
/* JavaScript must be enabled if you want it to work, obviously */
browser.getSettings().setJavaScriptEnabled(true);

/* Register a new JavaScript interface called HTMLOUT */
browser.addJavascriptInterface(new MyJavaScriptInterface(), "HTMLOUT");

/* WebViewClient must be set BEFORE calling loadUrl! */
browser.setWebViewClient(new WebViewClient() {
    @Override
    public void onPageFinished(WebView view, String url)
    {
        /* This call inject JavaScript into the page which just finished loading. */
        browser.loadUrl("javascript:window.HTMLOUT.processHTML('<head>'+document.getElementsByTagName('html')[0].innerHTML+'</head>');");
    }
});

/* load a web page */
browser.loadUrl("http://lexandera.com/files/jsexamples/gethtml.html");
票数 165
EN

Stack Overflow用户

发布于 2011-12-24 14:33:54

根据issue 12987,Blundell的答案会崩溃(至少在我的2.3VM上)。相反,我截取了一个带有特殊前缀的对console.log的调用:

代码语言:javascript
复制
// intercept calls to console.log
web.setWebChromeClient(new WebChromeClient() {
    public boolean onConsoleMessage(ConsoleMessage cmsg)
    {
        // check secret prefix
        if (cmsg.message().startsWith("MAGIC"))
        {
            String msg = cmsg.message().substring(5); // strip off prefix

            /* process HTML */

            return true;
        }

        return false;
    }
});

// inject the JavaScript on page load
web.setWebViewClient(new WebViewClient() {
    public void onPageFinished(WebView view, String address)
    {
        // have the page spill its guts, with a secret prefix
        view.loadUrl("javascript:console.log('MAGIC'+document.getElementsByTagName('html')[0].innerHTML);");
    }
});

web.loadUrl("http://www.google.com");
票数 34
EN

Stack Overflow用户

发布于 2012-04-17 10:26:46

这是一个基于jluckyiv's的答案,但我认为更改Javascript会更好、更简单,如下所示。

代码语言:javascript
复制
browser.loadUrl("javascript:HTMLOUT.processHTML(document.documentElement.outerHTML);");
票数 17
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2376471

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档