在使用ui4j重定向页面后,可以通过以下步骤从页面中提取URL:
下面是一个示例代码,演示如何使用ui4j和Jsoup从页面中提取URL:
import com.ui4j.api.browser.BrowserEngine;
import com.ui4j.api.browser.BrowserFactory;
import com.ui4j.api.browser.Page;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class URLExtractor {
public static void main(String[] args) {
// 创建浏览器引擎
BrowserEngine browser = BrowserFactory.getWebKit();
// 加载页面并进行重定向
Page page = browser.navigate("https://example.com");
// 获取页面的HTML内容
String html = page.getDocument().getBody().getInnerHTML();
// 使用Jsoup解析HTML内容
Document doc = Jsoup.parse(html);
// 提取页面中的所有链接
Elements links = doc.select("a[href]");
// 遍历链接并打印URL
for (Element link : links) {
String url = link.attr("href");
System.out.println(url);
}
// 关闭页面和浏览器引擎
page.close();
browser.shutdown();
}
}
这段代码使用ui4j加载页面并获取HTML内容,然后使用Jsoup解析HTML并提取页面中的所有链接。你可以根据需要进一步处理提取到的URL。
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云