爬了知乎200万数据,图说程序员都去哪里工作?

我们行业的人都喜欢哪,哪里每年带走一堆人?

然后花半小时写了个多线程爬虫,爬下来几百万数据(其中每个学校的大圆圈占比代表该校学生在调研总数中的占比)

这次抓取的数据量有将近200万,跑了一个下午,然后我把没有公司或者教育学校的筛掉,就还剩25万了~

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏极乐技术社区

微信小程序开发心得第一章:心法修炼

或许有人会问为毛第一章就来个这么高级吓人的标题,没错,就是为了吸引你阅读,哈哈。根据我的工作经验和多年做生意的经历告诉我,在进入任何一个领域的时候,首先要进行心...

2258
来自专栏何俊林

为什么有的大公司代码也很烂?

最近一个朋友进入梦寐以求的大公司,和我抱怨了下,他们大公司代码写的也不怎么好,连他一个菜鸡都能看出逻辑漏洞,都没人改。让他有点怀疑人生了。那么为什么有的大公司代...

2403
来自专栏BestSDK

APICloud:接入云端API,无需代码一样开发APP

APICloud是中国领先的“云端一体”的移动应用云服务提供商。APICloud为开发者从“云”和“端”两个方向提供API,简化移动应用开发技术,让移动应用的开...

5696
来自专栏北京马哥教育

运维新手们,别再问需不需要学PYTHON了!

在你还没学好走路的时候,不要老想着,将来我当上老板了,我是开宝马呢?还是开奔驰呢?要先学会骑自行车。。。 经常有人在群里问,运维人员需不需要学开发?需不需要学P...

40414
来自专栏haifeiWu与他朋友们的专栏

2016学习总结

2016,一年过去了。在这一年里做了很多事情,也收获颇多。参加软件设计大赛、去南京总决赛(当然还有玩儿)、学习研究敲代码、复习基础准备面试、写简历、找工作、工作...

1302
来自专栏SDNLAB

从ETSI NFV第二次互操作测试看NFV业务落地还有多远

2396
来自专栏腾讯大讲堂的专栏

在瞬息万变的活动支撑工作中,如果以不变应万变

在线是业务的关键指标之一,每个业务一般一年会进行至少1次的冲在线活动。在活动支撑工作中将涉及服务器压力、外部攻击、带宽、活跃玩家以及活动规模等不断上升和变化,如...

1896
来自专栏知晓程序

如何一步步成为吃货?这款小程序,记录你的「美食足迹」

比方说,每次吃饭前,先掏出手机拍几张照片,分享到网上。如果你也是这样一个吃货,那么,就一定不要错过「美食足迹 go 」。

812
来自专栏IT大咖说

构建 WebRTC 应用时,应当注意什么?

内容来源:2018 年 1 月 13 日,声网Agora.io音乐工匠高泽华在“架构师修炼之道——极光开发者沙龙JIGUANG MEETUP”中,进行的《Web...

1694
来自专栏CSDN技术头条

银联基于OpenStack的金融私有云建设实践

【编者按】已经5岁的OpenStack已经成为极富生命力的框架。其简化云部署、构建应用和服务、可扩展性、可管理性等方面都有不俗表现。CSDN于4月举办的OCC(...

33410

扫码关注云+社区

领取腾讯云代金券