前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法

作者头像
小蓝枣
发布2021-12-01 13:53:49
2.3K0
发布2021-12-01 13:53:49
举报
文章被收录于专栏:CSDN博客专家-小蓝枣的博客

实例为从我文章中读取标题。

在这里插入图片描述
在这里插入图片描述

通过 class 属性锁定标题元素,把匹配的内容打印出来。

在这里插入图片描述
在这里插入图片描述

下面是源码:

代码语言:javascript
复制
package com.test.test;

import java.io.*;
import java.net.URL;
import java.net.URLConnection;

public class WebHtmlTest {
    public static void main(String[] args) throws IOException {
        /*
         作用:从url中读取web页面的内容
        */

        String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";

        // 连接的超时时间
        System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
        // 读取数据的超时时间
        System.setProperty("sun.net.client.defaultReadTimeout", "20000");

        try {
            URL url = new URL(html_url);
            URLConnection url_connection = url.openConnection();
            InputStream input_stream = url_connection.getInputStream();
            InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
            BufferedReader html_reader = new BufferedReader(input_stream_reader);
            String html_reader_line = null;

            // 读取html内容
            while ((html_reader_line = html_reader.readLine()) != null) {
                if(html_reader_line.contains("class=\"title-article\"")) {
                    System.out.println(html_reader_line);
                }
            }

            // 关闭创建的对象
            html_reader.close();
            input_stream_reader.close();
            input_stream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }

    }
}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/08/03 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档