首页
学习
活动
专区
工具
TVP
发布

Data Analysis & Viz

专栏作者
71
文章
66988
阅读量
18
订阅数
收益3583万?我是如何快速统计「李子柒」YouTube频道视频累计播放量并计算收益的
上一篇文章「年更博主冒个泡,或将开启可视化之旅」发布后,看到有人评论“催更催更,等下一篇”、“失踪人口回归”,还是挺开心的,没想看居然还有人看,不由感慨「终于等到我,还好你们没放弃」,doge。
古柳_DesertsX
2020-09-01
1.8K0
一文教你用 Neo4j 快速构建明星关系图谱
本文将带你用 neo4j 快速实现一个明星关系图谱,因为拖延的缘故,正好赶上又一年的4月1日,于是将文中的几个例子顺势改成了“哥哥”张国荣。正所谓“巧妇难为无米之炊”,本次爬取娱乐圈_专业的娱乐综合门户网站下属“明星”页的“更多明星”里所有9141条数据。
古柳_DesertsX
2019-04-09
1K0
手把手教你完成一个数据科学小项目(3):数据异常与清洗
本系列将全面涉及本项目从爬虫、数据提取与准备、数据异常发现与清洗、分析与可视化等细节,并将代码统一开源在GitHub:DesertsX/gulius-projects ,感兴趣的朋友可以先行 star 哈。
古柳_DesertsX
2018-08-21
8050
手把手教你完成一个数据科学小项目(2):数据提取、IP查询
本系列将全面涉及本项目从爬虫、数据提取与准备、数据异常发现与清洗、分析与可视化等细节,并将代码统一开源在GitHub:DesertsX/gulius-projects ,感兴趣的朋友可以先行 star 哈。
古柳_DesertsX
2018-08-21
4720
手把手教你完成一个数据科学小项目(1):数据爬取
请先阅读“中国年轻人正带领国家走向危机”,这锅背是不背? 一文,以对“手把手教你完成一个数据科学小项目”系列有个全局性的了解。
古柳_DesertsX
2018-08-21
6120
当你点开这首《八月》的歌:9400余条评论的分析与挖掘
八月伊始的当口,念想着:新的一个月了,是否有关于八月的歌呢,闲时也蛮想找来听下的。说来也怪,哪个月都不曾有过此念头,这回却“突发奇想”且又念念不忘,于是打开网易云音乐,傻瓜般地搜索“八月”,倒也真有不少同名歌曲,其中第一首就是八尾旅人的日文歌曲《八月》,点开听了下,还无暇看歌词描写的是什么,就看到了评论数高达9千余条,而且有8月1号当天许多“同道中人”的留言,看来在这新的一个月的当日,有此心路历程和“行迹”的人,却也不在少数哈。
古柳_DesertsX
2018-08-21
4730
乱炖数据之2700余篇“简书交友”专题文章数据的花式玩法
简书上有个“简书交友”专题,经常会有人写些自己的情况、贴贴自己的照片然后投稿到这一专题,有介绍的比较详细的比如下图所示(侵删),较为规整和全面;
古柳_DesertsX
2018-08-21
6730
乱炖“简书交友”数据之代码
上一篇文章乱炖数据之2700余篇“简书交友”专题文章数据的花式玩法发布后,不少人想学习下代码,由于此前不曾在GitHub上开源过,流程还不熟悉,再者本项目中很多尝试性的代码,异常杂乱,因而没有立马公开。在经过删减和整理后,将继续更新出来。
古柳_DesertsX
2018-08-21
5680
用Zhihu-OAuth库轻松爬取知乎各类数据
去年(手动滑稽)某日想爬取知乎特定话题下的全部回答数据,于是翻出以前写的知乎话题爬虫跑运行了下,没想到遇到一个一直没能解决的bug,貌似是抓包到的API返回的JSON数据格式有问题,于是遭遇爬知乎的滑铁卢。幸而想起有个叫“Zhihu-OAuth”的库,于是了解了下并上手一用,还蛮方便的,于是介绍给想爬取知乎数据的小伙伴们。
古柳_DesertsX
2018-08-21
4350
Python网页爬虫&文本处理&科学计算&机器学习&数据挖掘兵器谱
周末时看到这篇不错的文章,其中介绍了诸多python第三方库和工具,与大家分享下,也算是门可罗雀的本号第一次转载文章。后续看到精彩的文章也会继续分享。
古柳_DesertsX
2018-08-21
7450
用python的PIL库轻松拼接一百张照片
和大家分享下之前用python的第三方库PIL库进行多图拼接制作的一些漂亮的照片墙成果图。
古柳_DesertsX
2018-08-21
1.6K0
两个超详细的python爬虫技能树(思维导图)
在python微信群里说过会分享看过的两个python爬虫技能树(思维导图),这回算是填个坑。
古柳_DesertsX
2018-08-21
1.5K0
最全知乎专栏合集:编程、python、爬虫、数据分析、挖掘、ML、NLP、DL...
上一篇文章《爬取11088个知乎专栏,打破发现壁垒》 里提到,知乎官方没有搜素专栏的功能,于是我通过爬取几十万用户个人主页所专注的专栏从而获取到11088个知乎专栏。
古柳_DesertsX
2018-08-21
2.5K0
爬取11088个知乎专栏,打破发现壁垒
上回我用Gephi绘制了知乎374名10万+关注的大V间相互关注情况,因为涉及25090条关注数据,最后成果图不算理想,但也能简单窥见大V生态圈的面貌,详情见于:《374名10万+知乎大V(一):相互关注情况》。
古柳_DesertsX
2018-08-21
6100
374名10万+知乎大V(一):相互关注情况
两个月前,今日头条签约了300多名知乎大V,随后引发广大关注和讨论,具体可见:如何看待今日头条一口气签了 300 多个知乎大 V 的传闻?
古柳_DesertsX
2018-08-21
5370
开心二则:公众号开通原创与可视化神器RAW
今天有几件开心的小事,故简单地和大家分享下。第一则算是个小广告,就不投稿了,估计也没人会看到,应该没什么坏影响吧。
古柳_DesertsX
2018-08-21
3740
百年百图の中国(1900-1999):另类python爬虫和PIL拼图
标题有点长,也有点怪。前半部分文艺向,后半部分python技术向。目的就是用PIL库得到100张图的拼图(成果图见文末)。
古柳_DesertsX
2018-08-21
3780
爬取简书26万+用户信息:数据可视化
简书上有哪些优质用户?有多少大V粉丝数上万,获赞数上万?小透明的自己能排到多少位?大V之间相互关注情况如何?签约作者有多少人......
古柳_DesertsX
2018-08-21
6920
我的简书一月记:数据可视化
截止前天,来简书正好一个月。20170730 注册了账号,当晚发布处女作《爬取张佳玮138w+知乎关注者:数据可视化》,从而开启了《python爬虫和数据可视化》系列的写作。
古柳_DesertsX
2018-08-21
4170
(送福利)BDP绘制微博转发动态热力图
先把效果图放上来,酷炫压场。看完本文,你就能轻松实现这个动态效果,全程只需几分钟!
古柳_DesertsX
2018-08-21
1.3K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档