首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Java数据采集--2.使用Jsoup抓取开源中国

本节使用Jsoup获取网页源码,并且解析数据。 使用JSoup 解析网页,语法使用 JS,css,Jquery 选择器语法,方便易懂 抓取网站:http://www.oschina.net/news/list 开源中国-新闻资讯模块 基本工作: 1.创建好Java工程,包等基本工作。 2.导入Jsoup所依赖的jar包。官网下载地址如下: http://jsoup.org/packages/jsoup-1.8.1.jar 3.创建JsoupDemo类。(类名自己随意,java基础,没必要多说吧) 核心内容 1.在main函数中使用Jsoup获取网页源码 String url = "http://www.oschina.net/news/list"; Document document = Jsoup.connect(url) .userAgent("Mozilla/5.0 (Windows NT 6.1; rv:30.0) Gecko/20100101 Firefox/30.0") .get(); 此段代码意思为使用Jsoup链接url地址,并且返回封装该网页的html源码的Document树,userAgent为模拟浏览器头,get为使用get方式提交,关于connect的参数还有很多,请自行查看API学习。 2.分析网页源码 在目标网页上点击右键,火狐有使用FireBug查看元素,谷歌有审查元素,然后可以看到相应的源码和网页的对应情况。如下图(以后都以谷歌浏览器为例):

01

四种方式解决页面国际化问题——步骤详解

最近在做公司的网站,但是有一个是比较麻烦的事情就是需要做的一个国际化,我们都知道后端其实做国际化的话是直接可以配置的,相对来说是比较简单的,但是前端做国际化的话是很麻烦的一件事情,但是不是说不可以做,我之前呢是准备直接做两套网站,这样一样可以实现国际化的效果,其实这也是过去网站国际化的一个做法,包括现在也有人这样做,这个办法我们就不具体的写了,因为很简单,直接一模一样的写两份,一份是中文的一份是英文的就行了!其实我没写之前看了很多的资料,关于国际化的,很多的大神提供了很多的办法,但是都不是很详细,写的很模糊,所以我查看很多资料以后决定写这篇博客,总结一下自己的想法,同时希望可以帮助很多的人解决这个问题!

05
领券