首页
学习
活动
专区
工具
TVP
发布

网络

万维网上有很多好玩的资讯~
专栏作者
95
文章
172327
阅读量
52
订阅数
如何用 Python 爬取网页制作电子书
关键时刻,第一时间送达! 作者简介:孙亖,软件工程师,长期从事企业信息化系统的研发工作,主要擅长后台业务功能的设计开发。 本文来自作者在 GitChat 上分享「如何用 Python 爬取网页制作电子书」主题内容。 📷 有人爬取数据分析黄金周旅游景点,有人爬取数据分析相亲,有人大数据分析双十一,连小学生写论文都用上了大数据。 我们每个人每天都在往网上通过微信、微博、淘宝等上传我们的个人信息,现在就连我们的钱都是放在网上,以后到强人工智能,我们连决策都要依靠网络。网上的数据就是资源和宝藏,我们需要一把铲子来挖
企鹅号小编
2018-02-02
2.3K0
HTML 正文内容提取库 Boilerpipe
Boilerpipe 是一个能从 HTML 中剔除广告和其他附加信息,提取出目标信息(如正文内容、发布时间)的 Java 库。 授权协议:Apache 开发语言:Java 操作系统:跨平台 Boilerpipe 是一个能从 HTML 中剔除广告和其他附加信息,提取出目标信息(如正文内容、发布时间)的 Java 库。其算法的基本思想是通过训练获得一个分类器来提取出我们需要的信息。 Boilerpipe 的包结构: 📷 boilerpipe,根目录 document,文档包,定义了 boilerpipe 所处理
企鹅号小编
2018-02-02
2.6K0
Bootstrap HTML编码规范
语法 用两个空格来代替制表符(tab) -- 这是唯一能保证在所有环境下获得一致展现的方法。 嵌套元素应当缩进一次(即两个空格)。 对于属性的定义,确保全部使用双引号,绝不要使用单引号。 不要在自闭合(self-closing)元素的尾部添加斜线 -- HTML5 规范中明确说明这是可选的。 不要省略可选的结束标签(closing tag)(例如, 或 )。 实例: Page title            Hello, world! 📷 HTML5 doctype 为每个 HTML 页面的第一行添加标准
企鹅号小编
2018-01-25
1.5K0
SEO之404页面应该怎么做?
404页面是什么? 404是网页反馈的状态码之一,4开头的状态码是指用户错误,5开头的是服务器错误。而404页面就是当用户提交信息后服务器无法回应或者反馈信息就会出现404页面。主要原因就是用户提交了错误信息,或者原内容没移动或者删除导致。 📷 404页面的主要作用: 404主要是反馈给用户所请求的也面错误或者不存在的同时不是让用户离开而是继续浏览其他页面。目前很多的空间后台都是可以设置404页面,如果设置不了网上的方法还是非常的多的。这里简单说一个方法(Apache服务器404页面建立方法):很简单就是在
企鹅号小编
2018-01-25
1K0
怎么理解前端路由?当然是自己实现一个啦!
spa流行的今天不少同学会把前端路由跟后端路由弄混, 莫名其妙的怎么页面404啦之类'奇怪'的问题, 其实这就是没弄清楚前端路由和后端路由的原因(当然你用hash当我没说). 本文所有前端路由都是spa的情况下, 不存在后端渲染好变量的情况 原理 首先我们看看前后端路由在浏览器中是怎么工作的, 上图: 后端控制的路由: 我们可以知道后端其实返回的是html字符串, 也就是dom节点不出意外的话是确认的. 不管你请求多少次, 结果都是确定的(get 幂等). 所以也就不存在404的情况 前端控制的路由: 📷
企鹅号小编
2018-01-15
5810
关注专栏作者,随时接收最新技术干货
Techeek
腾讯产品运营
花落花飞去
腾讯社区运营
一分钟了解互联网动静分离架构
企鹅号小编
2018-01-04
8440
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档