该博客由一群数据科学家所运营,专注于讲解在各种领域如何使用大数据技术(从机器学习和人工智能到业务领域)。
1 引言
前面已经介绍了一些数据分析的技巧,主要是用Python和R实现。...2 R
2.1 判断两个数据框之间的相关性
两个数据框,如下:
df1 = data.frame(x11 = c(10,20,30,40,50,55,60),
x12...,对每一列设置相应的条件进行选择,例如id[gender=="m"]就是在id列中找出male的数据并形成一个子集:
> df%>%summarise(male_cnt=length(id[gender...3.2 利用applymap改变多个列的值
通过一个示例演示如何使用applymap()函数更改pandas数据框中的多个列值。...3.4 判断两个数据框之间的相关性
和前面R中的做法类似,python中利用的是corr()函数:
df1 = pd.DataFrame({'x11' : [10,20,30,40,50,55,60],