一个简单的java提取页面源码的示例

package Main;

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URLConnection;
import java.net.URL;
public class Test {
	public static void main (String[] args) {
		getHtml("http://www.XXXX.com/");
	}
	public static void save(String name,String Lname,String data) throws IOException {
		File html=new File("./"+name+"."+Lname);
		if (!html.exists()) {
			html.createNewFile();
		}
		FileWriter fw=new FileWriter(html.getAbsoluteFile());
		BufferedWriter bw=new BufferedWriter(fw);
		bw.write(data);
		bw.close();
	}
	public static String getHtml(String target) {
		String result="";
		BufferedReader in=null;
		try{
			URL url_address=new URL(target);
			URLConnection get_url=url_address.openConnection();
                        //构造请求头
			get_url.setRequestProperty("accept", "*/*");
			get_url.setRequestProperty("connection", "Keep-Alive");
			get_url.setRequestProperty("user-agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;SV1)");
                        //打开请求
			get_url.connect();
			in =new BufferedReader(new InputStreamReader(get_url.getInputStream()));
			String out;
			while ((out = in.readLine()) != null) {
				result += "\n"+line;
			}
			System.out.println(result);
		}catch (Exception e) {
			e.printStackTrace();
		}finally {
			if(in!=null){
				try{
					in.close();
				}catch(Exception e2){
					e2.printStackTrace();
				}
			}
		}
		return result;
	}
}

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Android知识点总结

Java总结IO篇之字节流与字符流转化

25720
来自专栏深度学习与计算机视觉

OpenCV 利用getTickCount()与getTickFrequency()计算执行时间

其实这是个很简单的应用,贴出来是因为我经常能用到这两个函数,顺便写一下吧。 double t1 = (double)getTickCount(); . . . ...

46170
来自专栏JAVA技术站

JAVA IO流之BufferedInputStream,BufferedOutputStream

BufferedInputStream的数据成员buf是一个位数组,默认为2048字节。当读取数据来源时,例如文件,BufferedInputStream会尽量...

10420
来自专栏landv

社会单位消防安全户籍化管理系统——半自动提交V1.0版本

17120
来自专栏钟绍威的专栏

初识字节流+实现缓冲字节流OutputStream的主要方法构造方法读关流实现BufferedInputStream实现BufferedOutputStream为什么read()返回的是Int型而不是

java中的IO流可以分为两种:字符流和字节流 字符流,顾名思义,就是对字符进行操作,只能操作文本文件 字节流,就是对字节进行操作,然而所有文件都是由字...

20280
来自专栏Hongten

J2SE IO编程

CopyFile.java    hongten.java   hello.java

8610
来自专栏Java帮帮-微信公众号-技术文章全总结

Java基础-21(02)总结字符流,IO流编码问题,实用案例必做一遍

C:把集合中的数据存储到文本文件 package cn.itcast_02; import java.io.BufferedWriter; import jav...

38740
来自专栏Java后端生活

JavaWeb(十二)EL表达式

pageScope、requestScope、sessionScope、applicationScope

10920
来自专栏landv

社会单位消防安全户籍化管理系统——半自动提交V1.0版本

1.3K30
来自专栏码云1024

字符流之FileReader&FileWriter

28850

扫码关注云+社区

领取腾讯云代金券