崔庆才的专栏

139 篇文章
85 人订阅

全部文章

崔庆才

只会爬虫不会反爬虫?动图详解利用 User-Agent 进行反爬虫的原理和绕过方法!

随着 Python 和大数据的火热,大量的工程师蜂拥而上,爬虫技术由于易学、效果显著首当其冲的成为了大家追捧的对象,爬虫的发展进入了高峰期,因此给服务器带来的压...

721
崔庆才

爬虫又报错了?用 Scrapy 来一发邮件不就好了!

有时候我们写了很多爬虫在运行,但是我们可能不会一直有时间来监控它的变化,比如报错了,或者爬完了,如果我们能有个通知来通知我们,那该是多好啊!比如发个邮件,发个短...

674
崔庆才

从小白到大神,你可能需要这么做!

七八年前,我绝对是不会相信能够成为现在的自己,之前的我可以说是对计算机都一无所知的小白,而现在我已经就职于顶级互联网公司,并且已经获得数了十个数据挖掘比赛冠军,...

1035
崔庆才

对你没有看错!不到 10 行代码完成抖音热门视频的爬取!

最近研究了一下抖音的爬虫,目前实现了热门话题和热门音乐下面所有相关视频的爬取,并且我已经将该爬虫打包成了一个 Python 库并发布,名称就叫做 douyin,...

893
崔庆才

这可能是你见过的最全的网络爬虫干货总结!

昨天的时候我参加了掘金组织的一场 Python 网络爬虫主题的分享活动,主要以直播的形式分享了我从事网络爬虫相关研究以来的一些经验总结,整个直播从昨天下午 1 ...

1253
崔庆才

一文详细揭秘 Redis 持久化,了解一下?

Redis 是一个开源( BSD 许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持的数据类型很丰富,如字符串、链表、集 合、以及散...

572
崔庆才

重磅福利!腾讯 AI Lab 开源大规模高质量中文词向量数据,800 万中文词随你用!

今日,腾讯 AI Lab 宣布开源大规模、高质量的中文词向量数据。该数据包含 800 多万中文词汇,相比现有的公开数据,在覆盖率、新鲜度及准确性上大幅提高,为对...

1333
崔庆才

GitHub 最大更新:直接运行代码;人工智能凉了?年度报告揭示真相

很简单,以后你不光能在 GitHub 上存储和搜索代码,而且还能直接运行部分代码。这个期待已久的更新获得一致好评。详情如何,下面我们会仔细说。

671
崔庆才

最强 NLP 预训练模型!谷歌 BERT 横扫 11 项 NLP 任务记录!

作者:Jacob Devlin、Ming-Wei Chang、Kenton Lee、Kristina Toutanova

832
崔庆才

机器学习训练营第二期开始报名了!

差不多在一个月前,我分享了自己对爬虫和 AI 行业的一些看法,文章原文是:分享我对爬虫和 AI 行业的一点看法,顺便打个广告,强烈建议大家在阅读本篇文章之前先看...

1782
崔庆才

跟繁琐的模型说拜拜!深度学习脚手架 ModelZoo 来袭!

好多天没有更新原创文章了,国庆前的一段时间确实比较忙,整个九月在参加各种面试,另外还有公司的项目,还有自己的毕设,另外还需要准备参加一些活动和讲座,时间排的很紧...

622
崔庆才

来一家咖啡店的所见所想

咖啡店叫唐恩都乐,可能大家不是特别熟悉,这家咖啡店是美国的,2008 年进入了中国大陆,但是在国内的总店似乎还不到 100 家,而星巴克 1999 年进入中国大...

702
崔庆才

大数据时代的争议:Spark 能替代 Hive 吗?

学习 Spark 的面试者普遍认为 Spark 必然会替代 Hive 成为新的一代大数据仓库标准。

1302
崔庆才

深度学习效果不好?试试 Batch Normalization 吧!

Batch Normalization(简称BN)自从提出之后,因为效果特别好,很快被作为深度学习的标准工具应用在了各种场合。BN大法虽然好,但是也存在一些局...

3843
崔庆才

一言不合就改成 777 权限?会出人命的!

最近和几个朋友开发项目,期间使用了一台服务器跑模型,这台服务器是多人公用的,很多人都在上面有自己的账号,互不干涉内政,一切看起来十分井然有序。

1163
崔庆才

如何在手机或 iPad 上写 Python 代码?

或者用 iPad 外接一个键盘,侯爵老师一度迷恋这种工作方式,据说可以拥有更加专注的沉浸式编程体验。

3553
崔庆才

让面试官颤抖的 HTTP 2.0 协议面试题

Http协议,对于拥有丰富开发经验的程序员来说简直是信手拈来,家常便饭。虽然天天见,但是对于http协议的问题,可能很多人在没有积极准备的情况下,不一定能很好的...

1243
崔庆才

MIT正式发布编程语言Julia 1.0:Python、R、C++三合一

在过去一年中,研究者利用 Julia 在一台超级计算机上分析天文图像,速度提升了 1000 倍,在 15 分钟内将接近 2 亿个天体进行分类。从技术上来看,...

984
崔庆才

NLP通用模型诞生?一个模型搞定十大自然语言常见任务

翻译:于之涵 编辑:Leo 出品:AI科技大本营 (公众号ID:rgznai100)

1245
崔庆才

五道口的“信服”你是一家黑店吗?

开篇点题:不要去北京五道口的“信服”维修任何设备!不要去北京五道口的“信服”维修任何设备!不要去北京五道口的“信服”维修任何设备!

1463

扫码关注云+社区