下面我们将通过Python中的pandas包完成常见的数据分析任务:
相关系数和协方差
import pandas.io.data as web
from pandas import DataFrame...as pd
from pandas import DataFrame,Series
读取文件
#读取文本格式的数据
pd.read_csv('',nrows=1)
#读取带分隔符的数据,如txt等...('',header=None)
#自定义列名
pd.read_csv('',names=['a','b','c'])
#指定某一列为索引
pd.read_csv('',names=names,index_col...df1上,如果没有则删掉
pd.merge(df1,df2,on='key')
#如果键不同,则分别进行指定
pd.merge(df1,df2,left_on='key1',right_on='key2...(left,right,on=['key1','key2'],how='outer')
#注意,在进行一列连接时,DataFrame对象中的索引会被丢弃掉
pd.merge(left,right,on=