腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
未闻Code
专栏成员
举报
586
文章
1129727
阅读量
93
订阅数
订阅专栏
申请加入专栏
全部文章(586)
python(255)
编程算法(143)
爬虫(65)
https(40)
http(37)
网络安全(35)
javascript(33)
云数据库 Redis(32)
html(31)
sql(31)
网站(31)
数据库(30)
mongodb(30)
scrapy(27)
官方文档(23)
php(22)
selenium(22)
json(20)
正则表达式(18)
tcp/ip(18)
ide(17)
git(17)
云数据库 MongoDB(16)
其他(15)
github(15)
linux(14)
开源(14)
node.js(12)
java(11)
api(11)
文件存储(11)
go(10)
容器镜像服务(10)
xslt & xpath(10)
windows(9)
产品经理(8)
腾讯云测试服务(7)
游戏(7)
分布式(7)
腾讯云开发者社区(7)
云数据库 SQL Server(6)
ubuntu(6)
ssh(6)
kafka(6)
测试(6)
函数(6)
数据(6)
字符串(6)
mac os(5)
xml(5)
css(5)
android(5)
flask(5)
打包(5)
nginx(5)
命令行工具(5)
缓存(5)
markdown(5)
微信(5)
安全(5)
数据分析(5)
es(5)
模型(5)
c++(4)
django(4)
数据加密服务(4)
容器(4)
shell(4)
面向对象编程(4)
unicode(4)
excel(4)
pandas(4)
代理(4)
工作(4)
开发(4)
ios(3)
访问管理(3)
电商(3)
numpy(3)
etcd(3)
dataframe(3)
datetime(3)
key(3)
redis(3)
requests(3)
set(3)
time(3)
表格(3)
程序(3)
服务器(3)
接口(3)
开发者(3)
手机(3)
NLP 服务(2)
iphone(2)
c 语言(2)
jquery(2)
arm(2)
web.py(2)
搜索引擎(2)
svg(2)
存储(2)
自动化(2)
grep(2)
二叉树(2)
单元测试(2)
数据结构(2)
ascii(2)
验证码(2)
Elasticsearch Service(2)
bug(2)
curl(2)
data(2)
device(2)
func(2)
gpt(2)
patch(2)
prompt(2)
遍历(2)
程序员(2)
队列(2)
对象(2)
二进制(2)
工具(2)
后端(2)
技巧(2)
配置(2)
搜索(2)
装饰器(2)
云服务器(1)
机器学习(1)
lua(1)
bash(1)
actionscript(1)
vue.js(1)
ecmascript(1)
makefile(1)
sqlite(1)
matlab(1)
unix(1)
apache(1)
bash 指令(1)
apt-get(1)
mapreduce(1)
专用宿主机(1)
日志服务(1)
SSL 证书(1)
图像处理(1)
渲染(1)
webpack(1)
运维(1)
图像识别(1)
监督学习(1)
npm(1)
自动化测试(1)
rpc(1)
jenkins(1)
kernel(1)
hexo(1)
anaconda(1)
机器人(1)
企业组织(1)
图片处理(1)
add(1)
app(1)
async(1)
bit(1)
channel(1)
chat(1)
collections(1)
commit(1)
connect(1)
date(1)
display(1)
dsl(1)
element(1)
emoji(1)
error(1)
eval(1)
exception(1)
exec(1)
format(1)
free(1)
init(1)
int(1)
io(1)
ip(1)
list(1)
memory(1)
mock(1)
mysql(1)
na(1)
object(1)
ode(1)
office(1)
pdf(1)
photoshop(1)
pip(1)
plugin(1)
plugins(1)
poco(1)
powerpoint(1)
pymongo(1)
queue(1)
record(1)
reduce(1)
rename(1)
response(1)
search(1)
self(1)
sensors(1)
size(1)
sleep(1)
string(1)
tmux(1)
url(1)
warnings(1)
xor(1)
zip(1)
编程(1)
编程语言(1)
编辑器(1)
变量(1)
登录(1)
递归(1)
翻译(1)
分布式系统(1)
公众号(1)
管理(1)
架构(1)
脚本(1)
进程(1)
镜像(1)
跨域(1)
框架(1)
连接(1)
流量(1)
内存泄漏(1)
逆向工程(1)
前端(1)
权限(1)
日志(1)
软件(1)
事务(1)
同步(1)
统计(1)
图表(1)
网络(1)
系统(1)
协程(1)
序列化(1)
压缩(1)
异步(1)
异常(1)
隐私(1)
优化(1)
域名(1)
LLM(1)
搜索文章
搜索
搜索
关闭
一日一技:亲眼所见,也非真实,如何明目张胆架设后门程序
http
node.js
shell
javascript
php
这样的言论显然非常天真,一来,并不会有很多人真的去看源代码;二来,有一些缺陷隐藏得很深,光看源代码看不出来,例如 log4j2;第三,有办法把后门藏在一段非常安全的代码里面,你即使看源代码也看不出哪里有问题。
青南
2021-12-27
611
0
一日一技:Puppeteer 不重启如何更换代理 IP
tcp/ip
爬虫
http
php
javascript
我们知道,在写爬虫的过程中,如果总是使用同一个 IP,很容易就会被网站识别并封禁,所以需要使用代理 IP 并经常更换。
青南
2021-12-21
3.4K
0
一日一技:HTTPS 证书和中间人攻击的原理
https
网络安全
http
有同学在知识星球和公众号粉丝群里面提到,希望我讲一讲 HTTPS 证书、为什么使用 Charles、Fiddler、MitmProxy 抓 HTTPS 的请求要安装证书、 requests 发送请求的时候,verify 参数除了 False/True 还能填写什么参数。今天我们就这几个问题来做一个简单的介绍。
青南
2021-11-12
4.5K
0
一日一技:谁说 Scrapy 不能爬 HTTP/2?
scrapy
http
爬虫
https
go
之前有一位爬虫大佬写了一篇文章,说 HTTP/2协议天然就能防大部分的爬虫。Python 无论是 requests 还是 Scrapy 都不支持 HTTP/2协议。
青南
2021-10-19
1.2K
0
未闻Code·知识星球周报总结(七)
php
爬虫
http
scrapy
云数据库 Redis
1. 看数据量。数据量小,数据放在内存里面;数据量中等,数据放在基于内存的数据库里面;数据量特别大,数据放在硬盘里面。
青南
2021-10-19
824
0
未闻Code·知识星球周报总结(六)
php
scrapy
http
python
云数据库 Redis
之前在知识星球上有人问如下找出连续子序列的最大和,这样算是不是很慢?哪里可以优化呢?
青南
2021-10-19
544
0
再见 HTTP 1.1,怎样把网站升级成 HTTP 2?
http
https
网络安全
nginx
网站
由于网站并行加载的资源比较多,HTTP 2 相比 HTTP 1.1 来说,所有的连接共享一个 TCP 连接,同时一个域名下还没有最多同时连接数的限制,加载速度会比 1.1 好一些。
青南
2021-06-23
2.9K
0
简单方便的 JavaScript 逆向辅助模拟方法
javascript
编程算法
node.js
http
在 JavaScript 逆向过程中,我们可能找到了一些入口,但是深入追踪下去,就发现这个过程过于复杂,调用层级越来越深,最终很难完全把整个过程完整还原出来,不得不放弃。
青南
2021-06-23
2.5K
1
一日一技:Scrapy 如何正确 Post 发送 JSON 数据
json
官方文档
scrapy
http
php
我们知道,HTTP请求的 POST 方式,提交上去的数据有很多种格式。例如JSON/form-data/x-www-form-urlencoded等等。我们在 Postman 的 POST 请求里面,可以看到这些数据格式,如下图所示:
青南
2021-06-23
3K
0
超强反爬虫方案!Requests 什么的通通爬不了(文末抽奖)
scrapy
爬虫
http
https
nginx
上一篇文章再见 HTTP 1.1,怎样把网站升级成 HTTP 2?介绍了如何升级网站到 HTTP/2.0,但是实际上并没有显式地声明禁用 HTTP 1.x 的请求。
青南
2021-06-23
1.6K
0
一日一技:如何捅穿Cloud Flare的5秒盾
http
爬虫
tcp/ip
https
网络安全
经常写爬虫的同学,肯定知道 Cloud Flare 的五秒盾。当你没有使用正常的浏览器访问网站的时候,它会返回如下这段文字:
青南
2021-05-14
5.6K
0
一日一技:如何正确使用 Scrapy 自带的 FilesPipeline?
scrapy
python
tcp/ip
http
爬虫
Scrapy自带的 FilesPipeline和ImagesPipeline用来下载图片和文件非常方便,根据它的官方文档[1]说明,我们可以很容易地开启这两个 Pipeline。
青南
2021-01-05
2.6K
0
在Scrapy中如何使用aiohttp?
scrapy
爬虫
tcp/ip
http
当我们从一些代理IP供应商购买代理IP时,他们可能是提供一个网址供我们查询当前可用的代理IP。我们周期性访问这个网址,拿到最新的IP,再分给爬虫使用。
青南
2020-07-16
6.4K
0
为什么你会被限制登录网页版微信?
微信
html
爬虫
http
tcp/ip
有一个词叫做“三月爬虫”,指的是有些学生临到毕业了,需要收集数据写毕业论文,于是在网上随便找了几篇教程,学了点requests甚至是urllib和正则表达式的皮毛,就开始写爬虫疯狂从网上爬数据。这些爬虫几乎没有做任何隐藏自己的举动,不换IP,不设置headers,不限制速度,极易被有反爬的网站封锁,极易给没反爬的小网站造成流量压力。
青南
2020-05-14
6.3K
2
从零开发一个爬虫框架——Tinepeas
scrapy
爬虫
编程算法
http
api
Scrapy 是一个非常优秀的爬虫框架,为了向 Scrapy 致敬,也为了让大家更好地理解 Scrapy 的工作原理,我们自己模仿 Scrapy 的数据流,写一个爬虫框架。
青南
2020-05-14
828
0
Callback ——从同步思维切换到异步思维
php
http
html
这是一种非常常见的直线性思维,我先请求网站拿到 html,然后我再把 html 传给负责处理的函数。在整个过程中,“我“担任着调度的角色。
青南
2020-04-26
597
0
Bug or Feature?藏在 requests_html 中的陷阱
xslt & xpath
xml
http
html
在写爬虫的过程中,我们经常使用 XPath 来从 HTML 中提取数据。例如给出下面这个 HTML:
青南
2020-03-04
641
0
一日一技:超级简单搭建更加稳定安全的文件分享服务器
http
tcp/ip
php
数据库
sql
在公众号以前的文章里面,我们提到,如果想简单的分享一下文件,我们可以使用一行 Python 命令:
青南
2020-02-26
1.3K
0
一篇文章理解Python异步编程的基本原理
编程算法
python
scrapy
http
未闻 Code 已经发布过很多篇关于异步爬虫与异步编程的文章,最近有读者希望我能深入介绍一下 asyncio 是如何通过单线程单进程实现并发效果的。以及异步代码是不是能在所有方面都代替同步代码。
青南
2020-02-19
1.1K
1
浅度测评:requests、aiohttp、httpx 我应该用哪一个?
http
在 Python 众多的 HTTP 客户端中,最有名的莫过于requests、aiohttp和httpx。在不借助其他第三方库的情况下,requests只能发送同步请求;aiohttp只能发送异步请求;httpx既能发送同步请求,又能发送异步请求。
青南
2020-02-19
1.7K
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档