首页
学习
活动
专区
工具
TVP
发布

有趣的Python和你

专栏作者
208
文章
179864
阅读量
55
订阅数
Python数据分析师养成记
从这周开始,罗罗攀开始更新新系列《Python数据分析师养成记》。该系列将以小白的视角出发,一步步的进阶Python数据分析。
罗罗攀
2019-04-18
4700
Anaconda安装和使用
俗话说的好,“工欲善其事,必先利其器”。我们要运行Python代码,就需要Python的环境。本文就将详细讲解anaconda的安装和使用。
罗罗攀
2019-04-17
1.3K0
Python有趣|数据分析三板斧
天下武功中,哪个是最简单,最实用的了?那当然是程咬金的三板斧。传说中,程咬金晚上睡觉,梦见一老神仙,教了他三十六式板斧,这套功夫威力极大,而且招式简单,十分适合程咬金,但是程咬金醒来之后就只记住了三招,便有了这三板斧。就是这简单的三板斧,帮助李世民建立大唐江山。
罗罗攀
2019-03-19
9590
深度学习|中文文本的分类(建模篇)
前言 上回我们处理好了中文文本,具体的步骤如下: 数据情况 中文文本分词 建立token token转换为列表 统一长度 那这篇文章我们就使用MLP和LSTM模型来训练我们的数据。 MLP建模 模型结构 嵌入层:用于转换为向量列表(NLP知识点) 平坦层 隐藏层 输出层 建立模型 from keras.models import Sequential from keras.layers import Dense,Dropout,Embedding,Flatten model = Sequential()
罗罗攀
2019-02-26
5600
简书非官方大数据(一)
昨天安稳的开始了Python数据分析的学习,向右奔跑前辈问我有没有兴趣搞下简书用户的爬取和数据分析,像我这种爱好学习(不行,让我吐一下),当然是答应了。说实话,这个实战对我来说,难度很大:
罗罗攀
2019-02-22
3850
Python数据分析之糗事百科第二弹
data1为段子信息,data2为用户信息,二个表都有用户url,我们可以将其merge。
罗罗攀
2019-02-22
3850
Python数据分析之糗事百科
最近一直忙着写材料,没给大家写作业的案例,第二期同学很厉害,都是抢着要作业做,哈哈,今天我就给大家写点爬虫的扩展和数据分析,让厉害的同学学起来。
罗罗攀
2019-02-22
3510
用Python看我的2018
2018余额已不到两天,2018初的flag完成了几个?今天我利用Python爬虫和数据分析技术,分析我的2018年文章分享情况。
罗罗攀
2019-01-03
3710
Python数据分析之猫眼电影TOP100
如果大家经常阅读Python爬虫相关的公众号,都会是以爬虫+数据分析的形式展现的,这样很有趣,图表也很不错,今天了,我就来分享上一次在培训中的一个作品:猫眼电影爬虫及分析。 通过猫眼电影TOP100榜的爬虫,然后进行可视化,让学员体会到,小数据爬虫也能玩出这样的花样来。
罗罗攀
2018-12-26
1.1K0
python数据分析之基情的择天记
names用于存入小说人物和出场次数;relationships保存人物关系的有向边,该字典的键为有向边的起点,值为一个字典edge,edge的键是有向边的终点,值是有向边的权值,代表两个人物之间联系的紧密程度;linenames存入每行小说出现的人物;all_names是小说所有人物。
罗罗攀
2018-08-28
3990
京东文胸爬虫及数据分析爬虫代码数据分析
许久不来写文章了,最近夏令营搞的确实没时间。这次把上次直播讲的东西写成文字,带大家开波车。
罗罗攀
2018-08-28
8340
超级课程表APP爬虫,大学生都这么玩
记得读大学时,看课程信息,查分数,看美女(嘘)都会使用超级课程表APP,当时这款APP非常火爆,今天,就带领大家回到大学,看看大学生都在干嘛? 该文涉及内容:
罗罗攀
2018-08-10
6620
sklearn调包侠之PCA降维
PCA(主成分分析),它是一种维度约减算法,即把高维度数据在损失最小的情况下转换为低纬度数据的算法。
罗罗攀
2018-08-02
6500
Python数据分析之定制化网易云音乐歌单数据情况数据分析
最近朋友圈刷疯了的几件事: 圣诞节骗我艾特微信官方戴红帽 老的跟树皮似的骗我晒18岁皂片 明明开挂却骗我自己玩的跳一跳 网易云听歌报告告诉我最爱tfboy 支付宝关键词鄙视我太穷丢它脸
罗罗攀
2018-07-03
2K3
Python数据分析之简书粉丝敌我差距爬虫分析及代码敌我差距
最近粉丝涨的飞快,已突破3500大关,虽然比起大咖来说,是微乎其微,但看过我简书风云榜的都知道,3500粉丝也能排上前200名(虽然只爬取了20多万的数据)。 但随着粉丝的增长,也担心粉丝的质量问题,我发现许多粉丝都是没有发表任何文字的,我把这些用户定义为非活跃用户(这样太过偏激),今天就已作者本人的粉丝和向右奔跑前辈的粉丝做比较,看下敌我差距~ 爬虫分析及代码 简书的原因,这里只能爬取粉丝的前100页,一页就是9个粉丝,总共只能爬取900个粉丝,爬取的字段也是很简单: 粉丝id 关注量 粉丝量 文章数(
罗罗攀
2018-07-03
4980
Python爬虫小分队第四期招募帖外因内因
产品运营的时代到了 刚开始老大准备开线上培训的时候,就说过,希望把这个培训当做一个产品好好运营,而这个事情终于在第四期开始拉开帷幕。 现在有了专业的推广运营的人,有了自己的logo,当然也有我们
罗罗攀
2018-07-03
2800
Python数据分析之merge使用
在现实生活中,都会存在不同的表,但表之间有相互关系,我们需要进行整理,进行连接,这种过程类似于数据库的连接。 我们先构造用户和订单的dataframe: import pandas as pd import numpy as np import datetime customers = { 'CustomerID':[10,11], 'Name':['xiaomin','zhansan'], 'Address':['csuft','changsha'] } customers =
罗罗攀
2018-07-03
3300
Python数据分析之读取文件读取CSV读取Excel读取MySQL读取MongoDB
Python的数据分析,大部分的教程都是想讲numpy,再讲Dataframe,再讲读取文件。但我看书的时候,前面二章看的实在头晕,所以,我们还是通过读取文件来开始我们的Python数据分析吧。 读取
罗罗攀
2018-07-03
5.8K0
Python数据分析之dataframe的groupbygroupby函数highcharts绘图
大家都知道数据库有groupby函数,今天给大家讲讲dataframe的groupby函数。 groupby函数 还是以上文的数据为例子,进行讲解,首先读入数据,通过groupby聚合数据。(该数据为简书it互联网一段时间的文章收录信息) import pandas as pd import pymysql conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset=
罗罗攀
2018-07-03
6720
Python数据分析之groupby语法糖对分组进行迭代语法糖一:选取一个或多个列
对于dataframe的groupby聚合函数来说,我们适当了解下语法糖,会对数据分析起到事半功倍的效果。 对分组进行迭代 首先看下各字段的类型 import numpy as np import pandas as pd import pymysql conn = pymysql.connect(host='localhost', user='root', passwd='123456', db='test', port=3306, charset='utf8') jianshu = pd.read_sq
罗罗攀
2018-07-03
6660
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档