前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas按照指定的列排序、paste命令指定分隔符、ggplot2添加拟合曲线

pandas按照指定的列排序、paste命令指定分隔符、ggplot2添加拟合曲线

作者头像
用户7010445
发布2020-07-23 19:32:02
1.2K0
发布2020-07-23 19:32:02
举报
  • pandas 按照指定的列排序
代码语言:javascript
复制
aa = {'AA':[1,2,3],"BB":[4,5,6],"CC":['A_3','A_1',"A_2"]}
df = pd.DataFrame(aa)
df.sort_values("CC")

这样df本身不变

代码语言:javascript
复制
df.sort_values("CC",inplace=True)

这样df自己就变了

  • linux paste命令可以通过 -d参数指定分隔符,默认好像是空格还是tab paste是用来合并列的
代码语言:javascript
复制
paste -d , L01.csv L02.csv > col_merged.csv
  • R语言数据框统计每行或者每列中特定元素的个数 比如每行中的元素等于0的有多少个 用到的是apply()函数 参考 https://stackoverflow.com/questions/11797216/count-number-of-zeros-per-row-and-remove-rows-with-more-than-n-zeros
代码语言:javascript
复制
> df<-data.frame(A=sample(0:5,10,replace=T),B=sample(0:5,10,replace=T))
> df
   A B
1  2 5
2  0 1
3  0 3
4  5 3
5  2 1
6  3 5
7  1 1
8  0 0
9  5 4
10 5 4
> apply(df == 0,1,sum)
 [1] 0 1 1 0 0 0 0 2 0 0
> apply(df == 0,2,sum)
A B 
3 1 

第二个位置的参数如果是1就按每行算,如果是二就用每列算

  • ggplot2添加拟合曲线 使用geom_smooth()函数 添加二次方程的拟合曲线
代码语言:javascript
复制
library(ggplot2)
x<-seq(-2,2,by=0.05)
y<-x^2
df<-data.frame(a=x,b=y)
help(package="ggplot2")
ggplot(df,aes(x=a,y=b))+
  geom_point()+
  geom_smooth()

image.png

geom_smooth()函数不需要指定任何参数,自己直接就添加的是二次方程的拟合曲线,当然以上结果是因为自己的数据非常标准,是直接用二次方程来生成的

如果数据不是很标准的效果

代码语言:javascript
复制
x<-seq(-2,2,by=0.05)
y<-x^2+rnorm(length(x),sd=2)
df<-data.frame(a=x,b=y)
ggplot(df,aes(x=a,y=b))+
  geom_point()+
  geom_smooth()

image.png

就变成了这个样子

这时候如果想添加比较标准的二次曲线的话,用geom_smooth()函数我暂时还不知道如何实现,想到的一个办法是在方程已知的情况下,直接用方程构造数据,然后用geom_line()函数直接添加线段

代码语言:javascript
复制
x<-seq(-2,2,by=0.05)
y<-x^2+rnorm(length(x),sd=2)
df<-data.frame(a=x,b=y)
x1<-seq(-2,2,by=0.05)
y1<-x1^2
df1<-data.frame(a=x1,b=y1)
ggplot(df,aes(x=a,y=b))+
  geom_point()+
  geom_line(data=df1,size=2,color="blue")

image.png

有读者在我的公众号留言问

添加 y=a×exp(b×X)这样的拟合曲线,因为已经知道了拟合方程,所以按照上面的思路构造数据,然后用geom_line()函数添加线段

比如自己的数据

代码语言:javascript
复制
x<-seq(-5,25,by=0.5)
y<- 0.2*exp(0.079*x) + rnorm(length(x),mean = 0.05,sd=0.02)
df<-data.frame(x=x,y=y)
ggplot(df,aes(x=x,y=y))+
  geom_point()

image.png

然后添加拟合曲线

代码语言:javascript
复制
x<-seq(-5,25,by=0.5)
y<- 0.2*exp(0.079*x) + rnorm(length(x),mean = 0.05,sd=0.02)
df<-data.frame(x=x,y=y)

x1<-seq(-5,25,by=0.5)
y1<- 0.2*exp(0.079*x1)+0.05
df1<-data.frame(x=x1,y=y1)
ggplot(df,aes(x=x,y=y))+
  geom_point()+
  geom_line(data=df1,size=1,color="red")

image.png

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-07-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 有读者在我的公众号留言问
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档