, columns (1)} skipna : 布尔值,默认为True.表示跳过NaN值.如果整行/列都是NaN,那么结果也就是NaN level : int or level name, default...(df.sum()) #当轴为1.就会按行求和 print("df.sum(axis=1)") print(df.sum(axis=1)) #选择skipna=False可以禁用跳过Nan值 print...columns (1)} skipna :布尔值,默认为True.表示跳过NaN值.如果整行/列都是NaN,那么结果也就是NaN level : int or level name, default...Series,自动跳过NaN值 print("df.mean()") print(df.mean()) #当轴为1.就会按行求平均数 print("df.mean(axis=1)") print(df.mean...(axis=1)) #选择skipna=False可以禁用跳过Nan值 print("df.mean(axis=1,skipna=False):") print(df.mean(axis=1,skipna
{sum,std,…},但这里的 axis 可以用名称或整数指定: Series:无需 axis 参数 DataFrame: "index",即 axis=0,默认值 "columns", 即 axis...: float64 In [84]: xs_stand = df.sub(df.mean(1), axis=0).div(df.std(1), axis=0) In [85]: xs_stand.std...Series.nunique() 返回 Series 里所有非空值的唯一值。...对于非数值型 Series 对象, describe() 返回值的总数、唯一值数量、出现次数最多的值及出现的次数。...C 1 A 2 C 3 A 4 C dtype: object 多行或多列中存在多个最大值或最小值时,idxmax() 与 idxmin() 只返回匹配到的第一个值的 Index
p+1指向aa数组序号为1的行(学生序号从0开始) pt是指向float型数据的指针变量,*(pt+i)表示该学生的第i门课程的成绩**/
> a 0 1.0 1 2.0 2 NaN 3 3.0 dtype: float64 # is.na 方法,如果为NaN, 返回True, 否则返回False >>> a.isna...() 0 False 1 False 2 True 3 False dtype: bool # notnat方法,如果为NaN, 返回False, 否则返回True >>>...3]}) >>> df A B 0 1.0 1.0 1 2.0 NaN 2 NaN 3.0 # 对每一列的NaN值,依次用对应的均值来填充 >>> df.fillna(df.mean())...缺失值的删除 通过dropna方法来快速删除NaN值,用法如下 >>> a.dropna() 0 1.0 1 2.0 dtype: float64 # dropna操作数据框时,可以设置axis参数的值...# 默认为0,表示去除包含 了NaN的行 # axis=1,表示去除包含了NaN的列 >>> df = pd.DataFrame({'A':[1, 2, None], 'B':[1, np.nan,
,1,np.nan,2,3,5,np.nan]), "B":np.array([np.nan,4,np.nan,5,9,np.nan,np.nan]), "C":np.array([np.nan,4,np.nan...,5,9,np.nan,np.nan]) }) df.columns = ["a","b",'c'] print(df) print(pd.isnull(df)) # 检查数据中非空值出现的情况,...并返回一个布尔值组成的列 print(df.dropna()) # 移除出现空值的行 print(df.dropna(axis=1)) # 移除包含空值的列 print(df.dropna...(axis=1,thresh=4)) #移除空值个数为4的行 print(df.fillna(1)) # 空值部分用1替换 # print(df.fillna(df.mean())) # 空值部分用平均数替换...append(df2)) # 将数据框1和数据框2结合起来 print(pd.concat([df1,df2],axis = 1)) # 在数据框1的列最后添加DF2 df1 = pd.DataFrame
0 4 0 3 2 1 1 7 1 rank 排名从1开始 返回的是平均排名,打破平级关系,method参数 average:默认平均值 min:使用分组中的最小值 max:使用最大值 first...汇总和统计 sum():返回含有列的和的S型数据 传⼊axis='columns’或axis=1将会按⾏进⾏求和 axis=0:表示行;axis=1:表示列 skipna:排除缺失值,默认值是True...idxmax()/idxmin():返回最大值或者最小值的索引 describe:返回多个统计值 df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],...1.40 b 2.60 c 0.00 d -0.55 dtype: float64 # 含有一个NA值自动排除 df.mean(axis='columns', skipna=False)...a NaN b 1.300 c NaN d -0.275 dtype: float64 df.mean(axis='columns') a 1.400 b 1.300
当参数的值为 index 或 0 时,表示按列进行计算;当参数的值为 columns 或 1 时,表示按行进行计算。...=0))print(df.sum(axis='index'))print(df.mean(axis=0))print(df.mean(axis='index'))print(df.cumsum(axis...np.NaNprint(df.sum(axis=1))print(df.sum(axis='columns'))print(df.mean(axis=1))print(df.mean(axis='columns...'))print(df.cumsum(axis=1))print(df.cumsum(axis='columns'))print(df.cumprod(axis=1))print(df.cumprod(...(df.mean(axis=1, skipna=False))print(df.mean(axis='columns', skipna=False))print(df.cumsum(axis=1, skipna
apply 方法,他会在指定列的每个值上执行。...详见代码: image.png 均值和标准差 我们通过 describe 方法查看的统计信息中均值和方差都是按照列统计呢,这里要说的,既可以按照列,还可以按照行 均值,行 df.mean(axis=0)...,列df.mean(axis=1) 方差,行 df.std(axis=0),列df.std(axis=1) DataFrame 转换为 Numpy image.png DataFrame 合并 连接合并...在两个 df 的结果一致的情况下,我们可以简单两个 df 拼接起来 垂直(行)拼接,pd.concat([df1,df2],axis=0),水平(列)拼接,pd.concat([df1,df2],axis...(df_2, how='left', on='datetime') 在 DataFrame 中查找 NaN 每行有多少 NaN,df.isnull().sum() Dataframe 中 NaN 的总数
= 0,how='any') 返回给定轴缺失的标签对象,并在那里删除所有缺失数据(’any’:如果存在任何NA值,则删除该行或列。)。...(10)检查缺失值 pd.isnull(object) 检测缺失值(数值数组中的NaN,对象数组中的None/ NaN) (11)删除特征 df.drop('feature_variable_name...', axis=1) axis中0对应行,1对应列。...Statistical summary of the data frame, with quartiles, median, etc. df.describe() # Average values df.mean...this# df["size"].median() (21)对数据进行排序 df.sort_values(ascending= False) (22)布尔索引 在这里,我们将过滤名为“size”的数据列,仅显示值等于
(7)列出所有列的名字 df.columns 基本数据处理 (8)删除缺失数据 df.dropna(axis=0, how='any') 返回一个 DataFrame,其中删除了包含任何 NaN 值的给定轴...(10)检查空值 NaN pd.isnull(object) 检查缺失值,即数值数组中的 NaN 和目标数组中的 None/NaN。...(11)删除特征 df.drop('feature_variable_name', axis=1) axis 选择 0 表示行,选择表示列。...Statistical summary of the data frame, with quartiles, median, etc. df.describe() # Average values df.mean...this# df["size"].median() (21)给数据排序 df.sort_values(ascending = False) (22)布尔型索引 以下代码将过滤名为「size」的行,并仅显示值等于
ascending 默认值是 True 列中的每行上的 apply 函数 在前一篇的增加列的部分,根据风速计算人体感觉是否舒适,为了功能的演示,在这里使用 DataFrame 的 apply 方法,他会在指定列的每个值上执行...详见代码: 均值和标准差 我们通过 describe 方法查看的统计信息中均值和方差都是按照列统计呢,这里要说的,既可以按照列,还可以按照行 均值,行 df.mean(axis=0),列df.mean(...axis=1) 方差,行 df.std(axis=0),列df.std(axis=1) DataFrame 转换为 Numpy DataFrame 合并 连接合并 在两个 df 的结果一致的情况下,我们可以简单两个...df 拼接起来 垂直(行)拼接,pd.concat([df1,df2],axis=0),水平(列)拼接,pd.concat([df1,df2],axis=1) 基于索引关键字合并 Pandas 还提供了像...datetime') 在 DataFrame 中查找 NaN 每行有多少 NaN,df.isnull().sum() Dataframe 中 NaN 的总数,上面统计出来的数量求和,df.isnull(
今天群里边有人问到 Math.max() 方法返回 NaN 的问题,我简单举个例子,看下图: 看上去没什么问题,但为什么返回 NaN 呢?...我们先简单看一下 Math.max() 方法: Math.max() Math.max() 函数返回一组数中的最大值。...参数:一组数值 value1, value2, ... 返回值: 返回给定的一组数字中的最大值。 注意:如果给定的参数中至少有一个参数无法被转换成数字,则会返回 NaN。...解构,这没问题,ES6 语法是支持这样了,会把数组解构成一组值。 但这里的问题是 array 是一个二维数组,解构完还是一个数组,而非数字,所以返回 NaN 了。...未经允许不得转载:w3h5 » Math.max()方法获取数组中的最大值返回NaN问题分析
System.out.println(3*0.1); System.out.println(4*0.1); System.out.println(4*0.1==0.4); System.out.println(1*...0.3); System.out.println(1*0.3 == 0.3); 结果: false false 0.30000000000000004 0.4 true 0.3 true 0.1
axis属性值 这里的dropna只填写了【axis】一个参数,其中0的值代表行,1的值代表列。...") # 删除所有有空的行 df = df.dropna(axis=0) print(df) axis=0效果测试: axis=1效果测试: 很明显我们能看的出来,只要是axis=0有空的行就删除了...,axis=1有空的列就删除了。...axis:轴。0或'index',表示按行删除;1或'columns',表示按列删除。 inplace:是否原地替换。布尔值,默认为False。...如果为True,则在原DataFrame上进行操 作,返回值为None。 limit:int,default None。
会直接改变原Dataframe; df['col1']=[1,2,3,4,5]del df['col1'] 方法3:pop方法直接在原来的DataFrame上操作,且返回被删除的列,与python中的pop...))) 方法3:df.assign 效果其实是左连接,之所以会出现NaN的情况,是因为C和df的索引不一致导致。...info() 函数返回有哪些列、有多少非缺失值、每列的类型;describe() 默认统计数值型数据的各个统计量,可以自行选择分位数位置。...5. df.mean(axis=1)是什么意思?它与df.mean()的结果一样吗?第一问提到的函数也有axis参数吗?怎么使用?...答:df.mean(axis=1)意思是对df按列求均值;axis = 0表示保持列标签不变,对行进行操作;axis = 1表示保持行标签不变,对列进行操作。
领取专属 10元无门槛券
手把手带您无忧上云