崔庆才的专栏

304 篇文章
147 人订阅

全部文章

崔庆才

爬虫非专业八级模拟考试

最大的爬虫就是搜索引擎。Google作为世界上最大的搜索引擎,其爬虫流量也遥遥领先于其他各类搜索引擎爬虫,占所有爬虫流量的3.87%

15140
崔庆才

正式开始工作了,分享一点想法

正式入职微软,提交了第一个 PR 之后,我坐在椅子上思考人生。终于我也变成了一名正式的企业员工,变成了一名正式的踏入社会的职业人士,从此我的学生生涯也算是画上了...

12030
崔庆才

字体侵权怕不怕,免费商用来一波~

很多小伙伴把字库的字体商用也是常有的,可能是没有版权意识,也可能是抱有侥幸心理,如果造成巨大经济损失,往往得不偿失。

23150
崔庆才

高质量又免费的图标资源都在这

在我们去开发一款 App 的时候,图标一定用得到,去上哪儿找高质量又免费的图标资源呢?说真的接下来推荐的这几个网站上的图标质量非常高,你可以找到很多灵感与启发,...

15420
崔庆才

八个最致命的 Linux 命令!

rm -rf 命令是删除文件夹及其内容的最快方法之一。但是一点点错字或失误可能会导致不可恢复的系统损坏。与 rm 命令一起使用的一些选项是:

11950
崔庆才

如何使用 SSH 远程控制一台 Windows 服务器

入职微软之后,这边大多数是使用 Windows 进行开发的,比如我的台式机是 Windows 的,还有一部分服务器是 Windows 的,当然 Linux 是也...

24020
崔庆才

90% 的人说 Python 程序慢,5 大神招让你的代码像赛车一样跑起来

很多人抱怨说自己写的 Python 代码跑的慢,尤其是当处理的数据集比较大的时候,其实稍微改动几行代码就可以让你的代码性能提高好几倍,不信一起来看下面这个 5 ...

10250
崔庆才

高效开发!借助 Mac + Windows 实现八屏办公!

下面是我的 Mac 同时驱动三块显示器的样子,加上 Mac 自己的屏幕一共是四块屏幕,照片如下:

17330
崔庆才

异步爬虫写起来太麻烦?来试试 Trio 吧!

“Async” 是“asynchronous”的简写,为了区别于异步函数,我们称标准函数为同步函数,从用户角度异步函数和同步函数有以下区别:

12030
崔庆才

项目里文件名永远不要用中文!永远不要!

最近碰到了一个问题,项目中很多文件都是接手过来的中文命名的一些素材,结果在部署的时候文件名全都乱码了,导致项目无法正常运行。

18640
崔庆才

这才是你寻寻觅觅想要的 Python 可视化神器!

Plotly Express 是一个新的高级 Python 可视化库:它是 Plotly.py 的高级封装,它为复杂的图表提供了一个简单的语法。

13620
崔庆才

干货推荐:看过介绍 Python 迭代器和生成器最易懂、最全面的文章

迭代器:是访问数据集合内元素的一种方式,一般用来遍历数据,但是他不能像列表一样使用下标来获取数据,也就是说迭代器是不能返回的。

11240
崔庆才

爬过这些网站才算会爬虫

网络上有形形色色的网站,不同类型的网站爬虫策略不同,难易程度也不一样。从是否需要登陆这方面来说,一些简单网站不需要登陆就可以爬,比如之前爬过的猫眼电影、东方财富...

16230
崔庆才

JavaScript 又出新特性了?来看看这篇就明白了

https://juejin.im/post/5ca2e1935188254416288eb2

11020
崔庆才

别只用 Selenium,新神器 Pyppeteer 绕过淘宝更简单!

如果大家对 Python 爬虫有所了解的话,想必你应该听说过 Selenium 这个库,这实际上是一个自动化测试工具,现在已经被广泛用于网络爬虫中来应对 Jav...

64120
崔庆才

如何用 Python 和 BERT 做中文文本二元分类?

因为我当时正在用 fast.ai 的 ULMfit 做自然语言分类任务(还专门写了《如何用 Python 和深度迁移学习做文本分类?》一文分享给你)。ULMfi...

12020
崔庆才

Python 封王,Java 和 C宣布永久退出竞争舞台,你怎么看?

关于 Python,编程圈里从不缺少金句:「人生苦短,我学 Python!」「学完 Python,便可上天!」,而最近这些话从调侃正在变为事实!

14130
崔庆才

time date datetme timestamp 傻傻分不清楚

时间格式对于任何一个工程师来说都是绕不开的知识,爬虫工程师同样如此。爬虫工程师要将不同网站的相同类型内容存放在同一个数据表当中,常见的有:

32160
崔庆才

一文看尽深度学习这半年

为了解决这个问题,年初我和 Robert Stojnic 搞了 Papers With Code,这个网站把深度学习的研究论文和代码结合在一起。

28490
崔庆才

让我大吃一堑的前后分离 web 站模拟登录

scrapy 模拟登录相信大家都会,而且非常的熟练。但是技术一直在进步(尤其是前端领域),近几年前后端分离的趋势越来越明显,很多 web 站都采用前后端分离的技...

31720

扫码关注云+社区

领取腾讯云代金券