青南

LV1
举报
发表了文章

爬虫出海Step by Step(一)

上周的文章《一日一知:国内爬虫开发人员的未来》发布以后,很多同学私信我表示对爬虫出海很有兴趣,希望我能详细介绍一下。因此,我准备用几篇文章来介绍爬虫出海的具体做...

青南
爬虫API网站数据分析https
发表了文章

一日一技:用Python做游戏有多简单

我520的公众号图片发了以后,有很多同学问我这个游戏是怎么做的,难不难。我就用两篇文章来介绍一下,如果使用Python做游戏。

青南
Python游戏
发表了文章

一日一技:如何从大量商品数据里面找到降价商品?

相信很多做爬虫的同学都会爬电商网站,每天爬一次,然后监控商品是否降价。如果你只监控一个商品,那么是否降价这非常容易判断,但如果你要找到这个网站里面所有降价的商品...

青南
电商
发表了文章

一日一技:数据可视化常见图表怎么做

数据可视化是指用图形或表格的方式来呈现数据。图表能够清楚地呈现数据性质, 以及数据间或属性间的关系,可以轻易地让人看图释义。用户通过探索图(Expl...

青南
编程算法PythonMATLABNumpy
发表了文章

一日一知:你样样都比竞品好,怎么大家都喜欢竞品?

假设你开发了一个游戏X,在上市之前找来1000名玩家试玩体验。这些玩家都玩过市面上的著名游戏Y。为了简单起见,我们假设游戏只有两个评价指标,画面和玩法。你发现你...

青南
游戏
发表了文章

一日一技:如何批量给PDF添加水印?

我们有时候需要把一些机密文件发给多个客户,为了避免客户泄露文件,会在机密文件中添加水印。每个客户收到的文件内容相同,但是水印都不相同。这样一来,如果资料泄露了,...

青南
Python
发表了文章

一日一技:抛掉JavaScript,用HTML和Python做网站

有时候,我们的电脑上没有安装Python,但你需要验证一段Python代码的运行效果。

青南
HTMLPythonJavaScriptNumpyGit
发表了文章

一日一技:优雅地加载Yaml配置文件

我在多篇文章里面都说过,我非常喜欢使用Yaml格式来写配置文件。Yaml是一个对人非常友好的配置格式。

青南
官方文档腾讯云测试服务
发表了文章

一日一技:协程与多进程的完美结合

我们知道,协程本质上是单线程单进程,通过充分利用IO等待时间来实现高并发。在IO等待时间之外的代码,还是串行运行的。因此,如果协程非常多,多少每个协程内部的串行...

青南
爬虫官方文档
发表了文章

一日一技:多个Python项目怎么调用我自己的工具函数?

在多年写代码的过程中,我总结了不少常用的工具函数。这些工具函数有的能够实现快速重试网络请求,有的可以把任意格式的时间转成标准格式,还有的可以自动生成正则表达式。

青南
PythonHTML
发表了文章

一日一知:架构到底是什么?

有同学问:总会听到身边的大佬们谈到架构,感觉很高级,架构到底是一个什么样的东西呢?

青南
爬虫网站编程算法数据库SQL
发表了文章

一日一知:国内爬虫开发人员的未来

最近两年,我已经没有做过国内任何网站的爬虫了,根据这两年爬海外网站的一些经验,谈谈我的发现和想法。

青南
网站游戏自然语言处理电商爬虫
发表了文章

一日一知:自学爬虫的求职建议

前几天有一位知识星球中的同学讲了他目前的状况,希望咨询一些未来发展的问题,感觉应该和许多想要去好一点大公司的求职者有一些共性建议:这位同学目前是专升本,专科大三...

青南
PHP网络安全二叉树Python
发表了文章

极其简单,加速Github Release 下载

有一些开源软件,它的新版本是通过Github Release来发布的。你在它的官网点击下载以后,实际上是从一个Github的地址下载文件。

青南
GitGitHubhttps网络安全开源
发表了文章

如何提问:为什么X-Y问题会浪费大家的时间?

这个同学写的爬虫代码运行一段时间以后,内存会急剧上升,因此它觉得上Requests 有内存泄漏的问题。于是大家都在回答怎么检测哪一行代码导致了内存泄漏,以及出现...

青南
发表了文章

GneList 来了!抓取列表页-极-其-简-单!

GneList是一个浏览器插件,专门用来生成列表页的 XPath。使用这个 XPath,你可以快速获取到列表页中的每一个条目。

青南
XSLT & XPathGitHubGit开源MongoDB
发表了文章

我做了一个App,如何让别人限时使用?

假设有这样一个场景,你接了一个私活,帮别人做一个软件,软件没有联网功能。东西做好以后,客户还没有给钱,说要先试用一下。你选择了相信客户,把软件发送给了他。然后他...

青南
编程算法
发表了文章

一日一技:为什么网站知道我的爬虫使用了代理?

实际上,网站要识别你是否使用了代理,并不一定非要什么高深的反爬虫机制,也不需要使用AI识别用户行为。下面这几种情况,要识别代理简直是易如反掌。

青南
TCP/IP爬虫网站云服务器
发表了文章

一日一技:使用装饰器简化大量if判断(二)

于是,今天我们就来看看大于小于应该怎么来判断。为了实现我们今天的目标,有两个前置知识需要掌握,一个是Python自带的operator模块,另一个是偏函数。

青南
Python
发表了文章

一日一技:如何提取网页中的日期?

最近我发现Python的一个第三方库,叫做htmldate,经过测试,它提取新闻的发布时间比较准确。我们来看看这个库怎么使用。首先使用pip安装:

青南
https网络安全

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券