首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python-科学计算-pandas-12-df单列计算

    Python科学计算及可视化 今天讲讲pandas模块 计算Dataframe某一列和、均值、最大值、最小值、样本标准方差 Part 1:背景 ?...已知一个Df,如下图 包括3列["time", "pos", "value1", "value2"] 包括8行[0,1,2,3,4,5,6,7] 2.目标:求value1该列和、均值、最大值、最小值、..._1 = pd.DataFrame(dict_1, columns=["time", "pos", "value1", "value2"]) print(df_1, "\n") # 单列计算 # 求和...求单列df_1["value1"].sum(),基本格式df[列名].计算函数() 和:sum 均值:mean 最大值:max 最小值:min 样本标准方差:std,注意是样本标准方差,对应(n-1...),不是总体标准方差 Ps:根据pos列可以将value1进行分组,那么对应每一组计算值又如何实现?

    86820

    Python-科学计算-pandas-24-创建空DF

    系统:Windows 10 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 pandas:1.1.5 这个系列讲讲Python科学计算及可视化...今天讲讲pandas模块 生成一个空df Part 1:场景描述 一些情况下需要对df进行操作,若这个df是中间计算出来,有可能是空字符串,这样后续很多运算就会报错 其中一个方法就是给其赋值一个空...df Part 2:代码1 import pandas as pd df = pd.DataFrame(columns=['A', 'B', 'C', 'D']) print(df) if df.empty...: print("为空df") print(type(df)) 代码截图 执行结果 Part 3:代码2 import pandas as pd df = pd.DataFrame...df来说,其实可以不需要列名 代码2中无列名,生成df更纯粹一点 注意两者类型都是pandas.core.frame.DataFrame ---- 本文为原创作品,欢迎分享朋友圈

    74610

    Python-科学计算-pandas-25-列表转df

    系统:Windows 11 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 这个系列讲讲Python科学计算及可视化 pandas模块 今天讲讲如何讲一个列表转换为...df Part 1:场景说明 我们在工作中可能需要对一些列表或者字典数据进行运算 当然我们可以通过循环判断一波处理得到想要结果,但着实复杂低效 遇到这种计算问题,自然想到pandas这个非常好用库...那我们只需要将需要处理列表字典转换为pandasdf,这样后续处理就非常高效了 Part 2: 代码 import pandas as pd list_1 = [{"a": 1, "b":...= pd.DataFrame(list_1) print("\ndf内容:") print(df.head(5)) 图1 代码截图 图2 执行结果 Part 3:部分代码说明 df = pd.DataFrame...(list_1),核心就是将该列表传给pd.DataFrame 观察执行结果,规律: 列表中每一个元素是一个字典 每个字典键是一样,转换后对应df列名 生成df索引采用自然数 本文为原创作品

    1.8K10

    Python-科学计算-pandas-18-df拼接concat

    Python科学计算及可视化 今天讲讲pandas模块 对不同df进行按行或者按列拼接 Part 1:场景描述 ?...pd.set_option('display.width', 180) 当不进行一系列set_option进行设置时候,打印出来时存在换行问题 包括如果若有中文字符,可能会出现不同行之间不对齐问题...大家可以参考本文中进行设置,根据实际情况,进行参数调整 df = pd.concat([df_1, df_2, df_3]), 按行方向进行拼接 列索引名相同时,写在同一列 列索引名不同时,写在不同列...,缺值部分用Nan表示 df = pd.concat([df_1, df_2, df_3], axis=1),按列方向进行拼接 行索引名相同时,写在同一行 行索引名不同时,写在不同行,缺值部分用Nan表示...将df_1value3列索引改为value4 ? ? 本文为原创作品,欢迎分享朋友圈

    1.6K10

    数据分析篇 | Pandas 时间序列 - 日期时间索引

    部字符串索引切片 vs. 精准匹配精确索引截断与花式索引日期/时间组件 DatetimeIndex 主要用作 Pandas 对象索引。...DatetimeIndex 类为时间序列做了很多优化: 预计算了各种偏移量日期范围,并在后台缓存,让后台生成后续日期范围速度非常快(仅需抓取切片)。...参阅:重置索引 注意:Pandas 不强制排序日期索引,但如果日期没有排序,可能会引发可控范围之外或不正确操作。 DatetimeIndex 可以当作常规索引,支持选择、切片等方法。...Series Out[133]: 2011-12-01 1 dtype: int64 精确索引 正如上节所述,局部字符串依靠时间精度索引 DatetimeIndex,即时间间隔与索引精度相关...反之,用 Timestamp 或 datetime 索引更精准,这些对象指定时间更精确。注意,精确索引包含了起始时点。

    5.3K20

    Pandas数据分组函数应用(df.apply()、df.agg()和df.transform()、df.applymap())

    这个函数需要自己实现,函数传入参数根据axis来定,比如axis = 1,就会把一行数据作为Series数据 结构传入给自己实现函数中,我们在函数中实现对Series不同属性之间计算,返回一个结果...(df['score_math'].apply(np.mean)) #逐行求每个学生平均分 >>> df.apply(np.mean...(np.mean,axis=1)) apply()返回结果与所用函数是相关: 返回结果是Series对象:如上述例子应用均值函数...()特例,可以对pandas对象进行逐行或逐列处理; 能使用agg()地方,基本上都可以使用apply()代替。...,返回结果中: 在列索引上第一级别是原始列名 在第二级别上是转换函数名 >>> df.transform([lambda x:x-x.mean(),lambda x:x/10]) score_math

    2.2K10

    Python-科学计算-pandas-26-列表转df-2

    系统:Windows 11 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 这个系列讲讲Python科学计算及可视化 pandas模块 今天讲讲如何将一个列表转换为...df Part 1:场景说明 我们在工作中可能需要对一些列表或者字典数据进行运算 当然我们可以通过循环判断一波处理得到想要结果,但着实复杂低效 遇到这种计算问题,自然想到pandas这个非常好用库...那我们只需要将需要处理列表字典转换为pandasdf,这样后续处理就非常高效了 上一篇文章列表内每个元素是一个字典,那么如果列表内元素也是一个列表如何处理呢?...Part 2: 代码 import pandas as pd list_1 = [[1, 2, 3, 4], [2, 3, 4, 5], [6, 3, 8, 5]] print("\n列表内容:...) print("\ndf内容:") print(df) 图1 代码截图 图2 执行结果 Part 3:部分代码说明 df = pd.DataFrame(list_1, columns=list_column

    22420

    Pandas时间序列基础详解(转换,索引,切片)

    时间序列类型: 时间戳:具体时刻 固定时间区间:例如2007年1月或整个2010年 时间间隔:由开始时间和结束时间表示,时间区间可以被认为是间隔特殊情况 实验时间和消耗时间:每个时间是相对于特定开始时间时间量度...freq='D') 时间序列索引,选择,子集 时间序列索引 ts = pd.Series(np.random.randn(1000),index = pd.date_range('1/1/2016...',periods=1000)) s['2018-6'] #时间序列索引 也可用ts.loc[] 2018-06-01 1.371843 2018-06-02 -0.356041 2018-06-03...1.776334 2016-01-02 -0.488550 2016-01-03 -1.299889 2016-01-04 -1.883413 Freq: D, dtype: float64 含有重复索引时间序列分组处理...时间序列基础详解(转换,索引,切片)就是小编分享给大家全部内容了,希望能给大家一个参考。

    1.7K10

    Python-科学计算-pandas-15-df输出Excel和解析Excel

    系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python科学计算及可视化 今天讲讲pandas模块 将Df输出到Excel文件中,以及读取Excel中数据 Part 1:场景介绍 ?...当Df数据较多时,通过print输出效果不好时候,可以考虑将其输出为Excel文件,或者纯粹是为了输出Excel文件 很多输入文件都是Excel格式,通过pandas如何解析 Part 2:代码...输出Excel: df_1.to_excel(excel_address),通过to_excel函数即可,若只是看一下数据结构,可以只输出Df一部分,df_2 = df_1.head(3)即表示df_...1前3行 读入Excel: df_3 = pd.read_excel(excel_address),通过pd.read_excel,默认读取第1张表。

    1.1K10

    Python-科学计算-pandas-19-df分组上中下旬

    系统:Windows 10 语言版本:conda 4.4.10 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 pandas:0.22.0 这个系列讲讲...Python科学计算及可视化 今天讲讲pandas模块 按照时间列,得出每行属于上中下旬,进而对df进行分组 Part 1:场景描述 ?...df["time1"] = pd.to_datetime(df['time'])时间格式转换,新生成数据类型为datetime64 时间格式转换 ?...df["日"] = df["time1"].dt.day获取日期对应具体几号 df["xun"] = np.where((df["flag"] > 10) & (df["flag"] <= 20),..."中旬", np.where(df["flag"] <= 10, "上旬", "下旬")),两重判断 np.where(条件,满足条件结果,不满足条件结果) 支持嵌套,有点VBA公式感觉 对flag列每个元素进行计算

    93120

    Python-科学计算-pandas-09-df列字符串操作2

    系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python科学计算版块 今天讲讲pandas模块: 对列每一个元素进行同样字符串操作 今天讲其中1个操作: split Part 1:目标 已知Df某列都是字符串,每一个字符串都有一个文件与其对应...后文件类型 组合两者 加入到原来Df中 修改前后文件名 Part 2:代码 import pandas as pd dict_1 = {"file_name": ["P10-CD1.txt",...se_1 print("加入新文件名:\n", df_1) print(type(df_1)) 代码截图 执行结果 Part 3:部分代码解读 df_2 = df_1["file_name"]...= df_2["文件名"] + "." + df_3["文件类型"],实现两个Df之间对应每个元素字符串连接操作,生成一个Series对象 df_1["new_file_name"] = se_1,df

    49010
    领券