首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Jsoup(一)Jsoup详解(官方)

一、Jsoup概述 1.1、简介     jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。...1.2、Jsoup的主要功能     1)从一个URL,文件或字符串中解析HTML     2)使用DOM或CSS选择器来查找、取出数据     3)可操作HTML元素、属性、文本     注意:jsoup...假如你使用正常的 Jsoup.parse(String html) 方法,    通常你也可以得到相同的结果,但是明确将用户输入作为 body片段处理,以确保用户所提供的任何糟糕的HTML都将被解析成body...a元素   3)说明     jsoup elements对象支持类似于CSS (或jquery)的选择器语法,来实现非常强大和灵活的查找功能。.     ...: 查找包含给定文本的元素,搜索不区分大不写,比如: p:contains(jsoup)       :containsOwn(text): 查找直接包含给定文本的元素       :matches(regex

8.4K50
您找到你想要的搜索结果了吗?
是的
没有找到

Jsoup入门学习一

2、Jsoup 的主要功能,如下所示:   1)、从一个URL,文件或字符串中解析HTML;   2)、使用DOM或CSS选择器来查找、取出数据;   3)、可操作HTML元素、属性、文本;   4)、...parsing-a-document 5、Jsoup查找DOM元素的主要方法,如下所示: 1)、getElementById(String id) 根据 id 来查询 DOM。   ...如果满足不了自己的需求,可以使用Jsoup 的选择器语法查找 DOM 元素,如下所示: 1 package com.bie.jsoup; 2 3 import java.io.IOException...// ns|tag: 通过标签在命名空间查找元素,比如:可以用 fb|name 语法来查找 元素 15 str = doc.select("jsoup|li").first().text...36 6)、parent > child: 查找某个父元素下的直接子元素,比如:div.content > p 查找 p。 37 7)、parent > * 查找某个父元素下所有直接子元素

2.4K10

Jsoup选择器语法

站在巨人的肩膀上才能看的更远 jsoup 是一款基于Java 的HTML解析器,可直接解析某个URL地址或HTML文本内容。...jsoup的强大在于它对文档元素的检索,Select方法将返回一个Elements集合,并提供一组方法来抽取和处理结果,要掌握Jsoup首先要熟悉它的选择器语法。...通过ID查找元素,比如:#logo .class: 通过class名称查找元素,比如:.masthead [attribute]: 利用属性查找元素,比如:[href] [^attr]: 利用属性名前缀来查找元素...”body”元素下的所有 p元素 parent > child: 查找某个父元素下的直接子元素,比如:可以用div.content > p 查找 p 元素,也可以用body > * 查找body标签下所有直接子元素...(text): 查找包含给定文本的元素,搜索不区分大不写,比如: p:contains(jsoup) :containsOwn(text): 查找直接包含给定文本的元素 :matches(regex):

1.5K30

JAVA网络爬虫之Jsoup解析

所以这里我准备使用jsoup来爬取, jsoup是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。...可操作HTML元素、属性、文本;虽然使用Jsoup可以替代HttpClient直接发起请求解析数据,但是往往不会这样用,因为实际的开发过程中,需要使用到多线程,连接池,代理等等方式,而jsoup对这些的支持并不是很好...,所以我们一般把jsoup仅仅作为Html解析工具使用。...代理在Jsoup真中共的使用过程如下所示,在使用过程中要注意JSoup默认会关闭连接 访问HTTP网站请通过设置相同Proxy-Tunnel来保持相同的外网IP....java.net.InetSocketAddress;import java.net.PasswordAuthentication;import java.net.Proxy;import org.jsoup.Jsoup

60450
领券