首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一个简单的java提取页面源码的示例

一个简单的java提取页面源码的示例

作者头像
Pulsar-V
发布2018-04-18 16:59:41
5860
发布2018-04-18 16:59:41
举报
文章被收录于专栏:Pulsar-VPulsar-V
package Main;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URLConnection;
import java.net.URL;
public class Test {
	public static void main (String[] args) {
		getHtml("http://www.XXXX.com/");
	}
	public static void save(String name,String Lname,String data) throws IOException {
		File html=new File("./"+name+"."+Lname);
		if (!html.exists()) {
			html.createNewFile();
		}
		FileWriter fw=new FileWriter(html.getAbsoluteFile());
		BufferedWriter bw=new BufferedWriter(fw);
		bw.write(data);
		bw.close();
	}
	public static String getHtml(String target) {
		String result="";
		BufferedReader in=null;
		try{
			URL url_address=new URL(target);
			URLConnection get_url=url_address.openConnection();
                        //构造请求头
			get_url.setRequestProperty("accept", "*/*");
			get_url.setRequestProperty("connection", "Keep-Alive");
			get_url.setRequestProperty("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;SV1)");
                        //打开请求
			get_url.connect();
			in =new BufferedReader(new InputStreamReader(get_url.getInputStream()));
			String out;
			while ((out = in.readLine()) != null) {
				result += "\n"+line;
			}
			System.out.println(result);
		}catch (Exception e) {
			e.printStackTrace();
		}finally {
			if(in!=null){
				try{
					in.close();
				}catch(Exception e2){
					e2.printStackTrace();
				}
			}
		}
		return result;
	}
}
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档