WebSocket,是基于TCP的支持全双工通信的应用层协议
WebSocket 使用
WebSocket - 建立连接
SOAP (Simple Object Access Protocol),译为:简单对象访问协议
WSDL (Web Services Description Language),译为:Web服务描述语言
RESTful 的实践建议
IPv6 - 地址格式
IPv6 - 首部格式
IPv6 - 拓展头部
网络爬虫的简易实例
import org.apache.commons.io.FileUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.File;
import java.net.URL;
public class Main {
public static void main(String[] args) throws Exception {
// 请求网站:https://ext.se.360.cn/webstore/category
// Jsoup使用CSS选择器来查找元素
String dir = "C:/Users/yusael/Desktop/imgs/"; // 爬取后的存放路径
String url = "https://ext.se.360.cn/webstore/category";
Document doc = Jsoup.connect(url).get();
Elements eles = doc.select(".applist .appwrap");
for (Element ele : eles) {
String img = ele.selectFirst("img").attr("src");
String title = ele.selectFirst("h3").text();
String intro = ele.selectFirst(".intro").text();
// 下载图片
String filepath = dir + (title + ".png");
FileUtils.copyURLToFile(new URL(img), new File(filepath));
}
}
}
robots.txt
缓存 - 响应头
优先级:Pragma > Cache-Control > Expires
优先级:ETag > Last-Modifie
缓存 - 请求头
缓存的使用流程