首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python常用小技巧总结

others Python合并多个EXCEL工作表 pandas中Series和Dataframe数据类型互转 相同字段合并 Python小技巧 简单的表达式 列表推导式 交换变量 检查对象使用内存情况...(dropna=False) # 查看Series对象的唯⼀值和计数 df.apply(pd.Series.value_counts) # 查看DataFrame对象中每⼀列的唯⼀值和计数 df.isnull...map(function, iterable, …) function – 函数 iterable – 一个或多个序列 d = {"male": 1, "female": 0} df["gender"]...sys.getsizeof() range()函数返回的是一个类,在使用内存方面,range远比实际的数字列表更加高效 import sys mylist = range(1,10000) print...reduce(function, iterable[, initializer]) function – 函数,有两个参数 iterable – 可迭代对象 initializer – 可选,初始参数

9.4K20

Pandas之实用手册

用read_csv加载这个包含来自音乐流服务的数据的基本 CSV 文件:df = pandas.read_csv('music.csv')现在变量df是 pandas DataFrame:1.2 选择我们可以使用其标签选择任何列...:使用数字选择一行或多行:也可以使用列标签和行号来选择表的任何区域loc:1.3 过滤使用特定值轻松过滤行。...假设数据框有一个缺失值:Pandas 提供了多种方法来处理这个问题。最简单的方法是删除缺少值的行:fillna()另一种方法是使用(例如,使用 0)填充缺失值。...this function as follows:"""df.apply(subtract_and_divide, args=(5,), divide=3)按照group的size排序"""sort...(frame)df = pd.concat(frame_list)"""misc: set display width, col_width etc for interactive pandas session

15810
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas速查卡-Python数据科学

    它不仅提供了很多方法和函数,使得处理数据更容易;而且它已经优化了运行速度,与使用Python的内置函数进行数值数据处理相比,这是一个显著的优势。...刚开始学习pandas时要记住所有常用的函数和方法显然是有困难的,所以在Dataquest(https://www.dataquest.io/)我们主张查找pandas参考资料(http://pandas.pydata.org...(dropna=False) 查看唯一值和计数 df.apply(pd.Series.value_counts) 所有列的唯一值和计数 选择 df[col] 返回一维数组col的列 df[[col1,...col1组的所有列的平均值 data.apply(np.mean) 在每个列上应用函数 data.apply(np.max,axis=1) 在每行上应用一个函数 加入/合并 df1.append(df2...() 查找每个列中的最大值 df.min() 查找每列中的最小值 df.median() 查找每列的中值 df.std() 查找每个列的标准差 点击“阅读原文”下载此速查卡的打印版本 END.

    9.2K80

    12种用于Python数据分析的Pandas技巧

    Apply Function Apply函数是使用数据和创建新变量的常用函数之一。在对DataFrame的特定行/列应用一些函数后,它会返回相应的值。这些函数既可以是默认的,也可以是用户自定义的。...如这里我们就定义了一个查找每行/列中缺失值的函数: #Create a new function: def num_missing(x): return sum(x.isnull()) #Applying...注:Pandas的sort函数已经不能用了,现在排序要调用sort_value。 9....(n-1) if not labels: labels = range(len(cut_points)+1) #Binning using cut function of pandas colBin...为了解决这个问题,这里我们定义了一个简单的函数,它把输入作为“字典”,然后调用Pandas的replace函数重新编码: #Define a generic function using Pandas

    88520

    Pandas中实现聚合统计,有几种方法?

    对于上述仅有一种聚合函数的例子,在pandas中更倾向于使用groupby直接+聚合函数,例如上述的分组计数需求,其实就是groupby+count实现。...agg内接收聚合函数字典,其中key为列名,value为聚合函数或函数列表,可实现同时对多个不同列实现不同聚合统计。...这里字典的key是要聚合的name字段,字典的value即为要用的聚合函数count,当然也可以是包含count的列表的形式。...而后,groupby后面接的apply函数,实质上即为对每个分组下的子dataframe进行聚合,具体使用何种聚合方式则就看apply中传入何种参数了!...05 总结 本文针对一个最为基础的聚合统计场景,介绍pandas中4类不同的实现方案,其中第一种value_counts不具有一般性,仅对分组计数需求适用;第二种groupby+聚合函数,是最为简单和基础的聚合统计

    3.1K60

    数据科学家私藏pandas高阶用法大全 ⛵

    的一列的计数统计,可以使用groupby和count组合,如果要获取2列或更多列组成的分组的计数,可以使用groupby和size组合。...大家都知道,我们可以使用value_counts获取列里的取值计数,但是,如果要获取列中某个值的百分比,我们可以添加normalize=True至value_counts参数设置来完成: import...) 我们知道可以通过value_counts很方便进行字段取值计数,但是pandas.value_counts()自动忽略缺失值,如果要对缺失值进行计数,要设置参数dropna=False。...如果您想将分组后的数据字段整合成列表,可以使用lambda x:list(x),如下示例: import pandas as pd df = pd.DataFrame( { "...(x) # get list } ) 图片 8:DataFrame.explode() 类似于上例,如果你想把一个DataFrame中某个字符串字段(列)展开为一个列表,然后将列表中的元素拆分成多行

    6.1K30

    快速介绍Python数据分析库pandas的基础知识和代码示例

    “软件工程师阅读教科书作为参考时不会记住所有的东西,但是要知道如何快速查找重·要的知识点。” ? 为了能够快速查找使用功能,使我们在进行机器学习模型时能够达到一定流程化。...我创建了这个pandas函数的备忘单。这不是一个全面的列表,但包含了我在构建机器学习模型中最常用的函数。让我们开始吧!...本附注的结构: 导入数据 导出数据 创建测试对象 查看/检查数据 选择查询 数据清理 筛选、排序和分组 统计数据 首先,我们需要导入pandas开始: import pandas as pd 导入数据...或者从列表中创建一个series # Create a series from an iterable my_list my_list = [['Bob',78], ['Sally...使用max()查找每一行和每列的最大值 # Get a series containing maximum value of each row max_row = df.max(axis=1) ?

    8.1K20

    灰太狼的数据世界(三)

    我们把每一列数据都取出来,做成一个list(其实就是我们上期说的Series)。 如果我们想为这些数据添修改索引列(就是数据中的0,1,2),可以使用index参数指定索引。...所以如果构造一个DataFrame,那就需要想好有哪几个列,把列对应的数据做成一个列表放进去。就可以了。...(dropna=False):查看Series对象的唯一值和计数 df.apply(pd.Series.value_counts):查看DataFrame对象中每一列的唯一值和计数 print(df.head...使用duplicated方法可以查找出是否有重复的行,使用drop_duplicated方法就可以直接将重复的行删除了。...import pandas as pd import numpy as np s = pd.Series(np.arange(2, 6)) print(s) print(s.apply(lambda x

    2.8K30
    领券