首页
学习
活动
专区
工具
TVP
发布

Python爬虫与算法进阶

专栏作者
132
文章
246463
阅读量
85
订阅数
分布式全站爬虫——以"搜狗电视剧"为例
打开一个具体的影视:http://kan.sogou.com/player/181171191/,网址中有具体数字ID,我们假设数字ID就是递增的,即从1开始,那么我们可以拼接url:
小歪
2020-04-27
5890
Redis SCAN的使用
有时候需要从 Redis 实例成千上万的 key 中找出特定前缀的 key 列表来手动处理数据,可能是修改它的值,也可能是删除 key。这里就有一个问题,如何从海量的 key 中找出满足特定前缀的 key 列表来?
小歪
2019-09-26
2.9K0
谈一谈es的优势和限制
企业内部使用的elasticsearch是提供垂直搜索的一种方案,什么是垂直搜索呢。
小歪
2019-08-15
1.9K0
JS逆向常见混淆总结
一直想写一篇关于混淆的总结,篇幅比较短但都是在摸索过程中的总结,先占坑,有新的内容会再补充。 eval加密 把一段字符串当做js代码去执行 1eval(function(){alert(100);return 200})() 例子: 漫画柜,空中网 之后会单独写一篇漫画柜的解密。 变量名混淆 把变量名、函数名、参数名等,替换成没有语义,看着又很像的名字。 1_0x21dd83、_0x21dd84、_0x21dd85 用十六进制文本去表示一个字符串 1\x56\x49\x12\x23 利用JS能识别的编码来做
小歪
2019-06-24
2.3K0
【面试高频问题】线程、进程、协程
需要先对 IO 的概念有一定的认识: IO在计算机中指Input/Output,也就是输入和输出。
小歪
2019-06-17
1.3K0
拜托,面试官别问我「布隆」了
一个网站有 100 亿 url 存在一个黑名单中,每条 url 平均 64 字节。这个黑名单要怎么存?若此时随便输入一个 url,你如何快速判断该 url 是否在这个黑名单中?
小歪
2019-05-15
6040
刷题之合并K个排序链表
从21. 合并两个有序链表的基础上,我们已经能够解决两个有序链表的问题,现在是k个有序链表,我们可以将第一二个有序链表进行合并,然后将新的有序链表再继续跟第三个有序链表合并,直到将所有的有序链表合并完成。 这样做思路上是可行的,但是算法的时间复杂度将会很大,具体就不计算了。有兴趣的自己计算下。
小歪
2019-05-06
6090
萌新刷题之跳跃游戏
每次选择最远能达到的地方,假设从某一点最远可以到达A点,那么A点之前的所有点都是可以到达的。所以我们只要不断的更新最远可达到的点,然后看是否最远的点超过了终点即可。
小歪
2018-12-24
3580
说一道排序题
关于Python的sorted排序算法,这篇文章讲的比较详细:python sort函数内部实现原理,说到Python使用的是著名的Timesort算法。
小歪
2018-12-19
4380
初步尝试 sklearn
Scikit-learn是一个用于Python编程语言的免费软件机器学习库。 它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k均值和DBSCAN,旨在与Python数值和科学库NumPy和SciPy互操作。
小歪
2018-11-30
5430
淘宝sign加密算法
淘宝对于h5的访问采用了和客户端不同的方式,由于在h5的js代码中保存appsercret具有较高的风险,mtop采用了随机分配令牌的方式,为每个访问端分配一个token,保存在用户的cookie中,通过cookie带回服务端分配的token, 客户端利用分配的token对请求的URL参数生成摘要值sign,
小歪
2018-08-31
12.7K1
Leetcode-Solutions 1.two-sum (Python&Golang)
恩,最后找队友一起刷题。喜欢可以联系我 ,来公众号“Python爬虫与算法进阶”找我哦
小歪
2018-05-16
7453
来codewars与我一起玩耍吧
先看一道题目 如何使用代码表示“石头、剪刀、布”之间的关系。 即:石头 > 剪刀,剪刀 > 布, 剪刀 > 布 当时我想了很多,构造一个字典,和数字对应,但是应该如何表示“大小”关系呢?想破脑袋都想不出来,最后看了答案,形如 dict = {'a': 'b', 'b': 'c', 'c': 'a'} 简直是妙啊!!! 原题在这里,Rock Paper Scissors!,可以自己试试看。 我觉得很妙的解法 CodeWars 这是CodeWars上的一题,我觉得挺有意思的。CodeWars其实和leetco
小歪
2018-04-17
8850
学点算法之队列的学习及应用
约瑟夫问题 约瑟夫问题 有 n 个囚犯站成一个圆圈,准备处决。首先从一个人开始,越过k-2个人(因为第一个人已经被越过),并杀掉第k个人。接着,再越过 k-1个人,并杀掉第k个人。这个过程沿着圆圈一直进行,直到最终只剩下一个人留下,这个人就可以继续活着。 问题是,给定了n和k,一开始要站在什么地方才能避免被处决? 这个问题是以弗拉维奥·约瑟夫命名的,它是1世纪的一名犹太历史学家。他在自己的日记中写道,他和他的40个战友被罗马军队包围在洞中。他们讨论是自杀还是被俘,最终决定自杀,并以抽签的方式决定谁杀掉谁。约
小歪
2018-04-04
7830
学点算法之字符串的乱序检查
问题 字符串的乱序检查。 一个字符串是另一个字符串的乱序。如果第二个字符串只是第一个的重新排列,例如,’heart’ 和 ‘earth’ 就是乱序字符串。’python’ 和 ‘typhon’ 也是。为了简单起见,我们假设所讨论的两个字符串具有相等的长度,并且他们由 26 个小写字母集合组成。我们的目标是写一个布尔函数,它将两个字符串做参数并返回它们是不是回文。 解法1:检查 我们对乱序问题的第一个解法是检查第一个字符串是不是出现在第二个字符串中。如果可以检验到每一个字符,那两个字符串一定是回文。可以通过用
小歪
2018-04-04
1.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档