腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
沈唁志
沈唁志博客是关注PHP开发等技术的个人博客,同时也是个人程序人生的点滴记录和时光储备。
专栏作者
举报
369
文章
1302240
阅读量
72
订阅数
订阅专栏
申请加入专栏
全部文章(369)
php(150)
其他(46)
wordpress(41)
https(30)
git(25)
数据库(21)
编程算法(19)
python(18)
github(18)
api(18)
thinkphp(18)
微信(17)
开源(16)
网络安全(16)
网站建设(16)
swoole(16)
html(15)
linux(15)
网站(14)
sql(13)
http(13)
对象存储(12)
mqtt(12)
存储(11)
javascript(9)
爬虫(9)
windows(9)
json(8)
搜索引擎(8)
nginx(8)
seo(8)
安全(8)
java(7)
小程序(7)
xml(6)
jquery(6)
打包(6)
apache(6)
命令行工具(6)
腾讯云测试服务(6)
人工智能(6)
bash(5)
composer(5)
云数据库 SQL Server(5)
ios(4)
go(4)
access(4)
svn(4)
ssh(4)
cdn(4)
socket编程(4)
mac os(3)
css(3)
ide(3)
ubuntu(3)
centos(3)
容器镜像服务(3)
laravel(3)
SSL 证书(3)
容器(3)
分布式(3)
缓存(3)
数据迁移(3)
shell(3)
html5(3)
ftp(3)
tcp/ip(3)
jenkins(3)
配置(3)
官方文档(2)
ajax(2)
云数据库 Redis(2)
postgresql(2)
unix(2)
windows server(2)
运维(2)
dns(2)
lnmp(2)
大数据(2)
数据结构(2)
nat(2)
腾讯云开发者社区(2)
迁移(2)
函数(2)
开发(2)
ICP备案(1)
云服务器(1)
云点播(1)
数据万象(1)
渠道代理(1)
c 语言(1)
c++(1)
ruby(1)
android(1)
ruby on rails(1)
maven(1)
负载均衡缓存(1)
bash 指令(1)
云直播(1)
腾讯云可观测平台(1)
NAT 网关(1)
域名注册(1)
企业邮箱(1)
物联网通信(1)
微信云支付(1)
微信小程序音视频(1)
phpunit(1)
sass(1)
游戏(1)
自动化(1)
正则表达式(1)
erp(1)
yum(1)
面向对象编程(1)
markdown(1)
udp(1)
rabbitmq(1)
lamp(1)
数据分析(1)
物联网(1)
云数据库 postgresql(1)
云上实践(1)
unicode(1)
sdk(1)
ipv6(1)
图片处理(1)
即时通信 IM(1)
腾讯云(1)
app(1)
bug(1)
button(1)
command(1)
console(1)
datetime(1)
default(1)
desktop(1)
edit(1)
invoke(1)
iterm2(1)
local(1)
mac(1)
macbook(1)
member(1)
meta(1)
model(1)
mpdf(1)
pdf(1)
scp(1)
script(1)
shift(1)
title(1)
tostring(1)
triggers(1)
trim(1)
typecho(1)
版本管理(1)
编码(1)
博客(1)
部署(1)
插件(1)
产品(1)
创业(1)
对象(1)
反向代理(1)
服务器(1)
公众号(1)
接口(1)
连接(1)
浏览器(1)
漏洞(1)
乱码(1)
软件开发(1)
数据(1)
索引(1)
特效(1)
微信开放平台(1)
系统(1)
效率(1)
研发(1)
域名(1)
字符串(1)
搜索文章
搜索
搜索
关闭
网站怎么快速开通站点LOGO展示权限
搜索引擎
网站
爬虫
网站能够在搜索引擎展示LOGO标志,是很多站长所梦寐以求的,网站开通站点LOGO后,可以在搜索结果页中显示相关图片
沈唁
2019-05-22
2.2K
0
怎么使用 Git 和 Github 向开源项目提交 Pull Request
git
开源
python
爬虫
ssh
渣渣橘又跟我提了一下毒鸡汤,看了一下之前学的 python 脚本还能用,然后在 Github 上看到了一个爬虫集合的项目,收集各种爬虫
沈唁
2018-12-06
1.2K
0
Python爬虫Chrome网页解析工具-XPath Helper
python
爬虫
html
github
之前就说过Python爬虫中Xpath的用法,相信每一个写爬虫、或者是做网页分析的人,都会因为在定位、获取XPath路径上花费大量的时间,在没有这些辅助工具的日子里,我们只能通过搜索HTML源代码,定位一些id,class属性去找到对应的位置,非常的麻烦,今天推荐一款插件Chrome中的一种爬虫网页解析工具:XPath Helper,使用了一下感觉很方便,所以希望能够帮助更多的Python爬虫爱好者和开发者
沈唁
2018-07-25
3.3K
0
USpider~一只超级污的司机蜘蛛
php
爬虫
python
api
之前就看到了狂放小朋友的PHP版本的污言爬虫,然后我就征求了一下小朋友的意见,就改成了Python版本的爬虫,也算是当做练手了
沈唁
2018-07-25
673
0
Python爬虫常用的小技巧-伪造随机的User-Agent
python
爬虫
不管是做开发还是做过网站的朋友们,应该对于User Agent一点都不陌生,User Agent 中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等 通过UA来判断不同的设备或者浏览器是开发者最常用的方式方法,这个也是对于Python反爬的一种策略,但是有盾就有矛啊 写好爬虫的原则只有一条: 就是让你的抓取行为和用户访问网站的真实行为尽量一致 1、伪造UA字符串,每次请求都使用随机生成的UA
沈唁
2018-07-04
1.3K
0
Python爬虫常用的小技巧-设置代理IP
python
爬虫
xml
在学习Python爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术导致爬取失败。高强度、高效率地爬取网页信息常常会给网站服务器带来巨大压力,所以同一个IP反复爬取同一个网页,就很可能被封,这里讲述一个爬虫技巧,设置代理IP 这里介绍一下免费获取代理IP的方法,这个方法的优点就是免费,但是缺点就是爬取后存在很多不能用的 IP地址取自国内髙匿代理IP网站,西刺代理,我们爬取首页IP地址就足够一般使用,或者你也可以爬取第一页,第二页…的 配置环境 安装requests库 安装bs4库 安装lxml库 具体代码
沈唁
2018-06-20
700
0
Python爬虫之XPath语法和lxml库的用法
python
爬虫
xml
html
本来打算写的标题是 XPath 语法,但是想了一下 Python 中的解析库 lxml,使用的是 Xpath 语法,同样也是效率比较高的解析方法,所以就写成了 XPath 语法和 lxml 库的用法 安装 为什么要用这个库呢,因为要写爬虫啊,利用 lxml 库来解析 HTML 代码,同时 lxml 也继承了 libxml2 的特性自动修正 HTML 代码,利用pip安装即可 pip install lxml XPath 语法 XPath 是一门在 XML 文档中查找信息的语言,可以用于在 XML 文档中通过
沈唁
2018-05-24
1.1K
0
【收藏】Python 爬虫的工具列表大全
python
爬虫
这个列表包含与网页抓取和数据处理的 Python 库。 网络 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于 pycurl)。 pycurl – 网络库(绑定 libcurl)。 urllib3 – Python HTTP 库,安全连接池、支持文件 post、可用性高。 httplib2 – 网络库。 RoboBrowser – 一个简单的、极具 Python 风格的 Python 库,无需独立的浏览器即可浏览网页。 MechanicalSoup
沈唁
2018-05-24
1.8K
0
什么是Robots协议,标准写法是什么
搜索引擎
爬虫
seo
网站
html
什么是 Robots 协议 Robots 是网站和搜引擎之间的一个协议。用来防止搜索引擎抓取那些我们不想被索引到的页面或内容。早期是为了防止搜索引擎抓取网站的一些隐私页面,不想公开展示的页面,Robots 的作用已经不在局限于网页的隐私了,如今已经是作为学习 SEO 的一个最基础的范畴,能够有效提高网站的健康度、纯净度,降低网站垃圾内容收录 User-agent:是定义搜索引擎的,指定搜索引擎的爬取程序,如果想定义所有搜索引擎请用 * , 记住他不能单独使用,他要配合前面两个语法使用(随便一个就行了) D
沈唁
2018-05-24
1.4K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档