腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
网络
万维网上有很多好玩的资讯~
专栏作者
举报
95
文章
172327
阅读量
52
订阅数
订阅专栏
申请加入专栏
全部文章
其他
https
数据库
http
网络安全
安全
html
java
python
javascript
apache
分布式
区块链
sql
linux
nginx
编程算法
node.js
云数据库 SQL Server
tomcat
网站
存储
运维
html5
大数据
安全漏洞
php
servlet
xml
css
ajax
云数据库 Redis
打包
mongodb
人工智能
企业
shell
dns
ftp
seo
cdn
tcp/ip
系统架构
虚拟化
比特币
数字货币
机器学习
ios
jsp
angularjs
react
jquery
json
android
api
maven
搜索引擎
容器镜像服务
神经网络
腾讯云测试服务
图像处理
电商
渲染
移动开发
云+未来
容器
devops
游戏
开源
黑客
爬虫
ssh
unity
rpc
udp
socket编程
数据处理
windows
物联网
数据结构
nat
性能测试
搜索文章
搜索
搜索
关闭
如何用 Python 爬取网页制作电子书
python
爬虫
html
关键时刻,第一时间送达! 作者简介:孙亖,软件工程师,长期从事企业信息化系统的研发工作,主要擅长后台业务功能的设计开发。 本文来自作者在 GitChat 上分享「如何用 Python 爬取网页制作电子书」主题内容。 📷 有人爬取数据分析黄金周旅游景点,有人爬取数据分析相亲,有人大数据分析双十一,连小学生写论文都用上了大数据。 我们每个人每天都在往网上通过微信、微博、淘宝等上传我们的个人信息,现在就连我们的钱都是放在网上,以后到强人工智能,我们连决策都要依靠网络。网上的数据就是资源和宝藏,我们需要一把铲子来挖
企鹅号小编
2018-02-02
2.3K
0
HTML 正文内容提取库 Boilerpipe
java
apache
html
Boilerpipe 是一个能从 HTML 中剔除广告和其他附加信息,提取出目标信息(如正文内容、发布时间)的 Java 库。 授权协议:Apache 开发语言:Java 操作系统:跨平台 Boilerpipe 是一个能从 HTML 中剔除广告和其他附加信息,提取出目标信息(如正文内容、发布时间)的 Java 库。其算法的基本思想是通过训练获得一个分类器来提取出我们需要的信息。 Boilerpipe 的包结构: 📷 boilerpipe,根目录 document,文档包,定义了 boilerpipe 所处理
企鹅号小编
2018-02-02
2.6K
0
Bootstrap HTML编码规范
html5
html
javascript
css
语法 用两个空格来代替制表符(tab) -- 这是唯一能保证在所有环境下获得一致展现的方法。 嵌套元素应当缩进一次(即两个空格)。 对于属性的定义,确保全部使用双引号,绝不要使用单引号。 不要在自闭合(self-closing)元素的尾部添加斜线 -- HTML5 规范中明确说明这是可选的。 不要省略可选的结束标签(closing tag)(例如, 或 )。 实例: Page title Hello, world! 📷 HTML5 doctype 为每个 HTML 页面的第一行添加标准
企鹅号小编
2018-01-25
1.5K
0
SEO之404页面应该怎么做?
搜索引擎
网站
seo
apache
html
404页面是什么? 404是网页反馈的状态码之一,4开头的状态码是指用户错误,5开头的是服务器错误。而404页面就是当用户提交信息后服务器无法回应或者反馈信息就会出现404页面。主要原因就是用户提交了错误信息,或者原内容没移动或者删除导致。 📷 404页面的主要作用: 404主要是反馈给用户所请求的也面错误或者不存在的同时不是让用户离开而是继续浏览其他页面。目前很多的空间后台都是可以设置404页面,如果设置不了网上的方法还是非常的多的。这里简单说一个方法(Apache服务器404页面建立方法):很简单就是在
企鹅号小编
2018-01-25
1K
0
怎么理解前端路由?当然是自己实现一个啦!
html
javascript
spa流行的今天不少同学会把前端路由跟后端路由弄混, 莫名其妙的怎么页面404啦之类'奇怪'的问题, 其实这就是没弄清楚前端路由和后端路由的原因(当然你用hash当我没说). 本文所有前端路由都是spa的情况下, 不存在后端渲染好变量的情况 原理 首先我们看看前后端路由在浏览器中是怎么工作的, 上图: 后端控制的路由: 我们可以知道后端其实返回的是html字符串, 也就是dom节点不出意外的话是确认的. 不管你请求多少次, 结果都是确定的(get 幂等). 所以也就不存在404的情况 前端控制的路由: 📷
企鹅号小编
2018-01-15
581
0
关注专栏作者,随时接收最新技术干货
英特奈特
关注
Techeek
腾讯产品运营
关注
花落花飞去
腾讯社区运营
关注
企鹅号小编
腾讯
关注
一分钟了解互联网动静分离架构
html
cdn
nginx
企鹅号小编
2018-01-04
844
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档