首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python-科学计算-pandas-12-df单列计算

系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python的科学计算及可视化 今天讲讲pandas模块 计算Dataframe某一列的和、均值、最大值、最小值、样本标准方差 Part 1:背景 ?..._1 = pd.DataFrame(dict_1, columns=["time", "pos", "value1", "value2"]) print(df_1, "\n") # 单列计算 # 求和...求单列的和df_1["value1"].sum(),基本格式df[列名].计算函数() 和:sum 均值:mean 最大值:max 最小值:min 样本标准方差:std,注意是样本标准方差,对应(n-1...),不是总体标准方差 Ps:根据pos列可以将value1进行分组,那么对应每一组的计算值又如何实现?

85620

Python-科学计算-pandas-24-创建空DF

系统:Windows 10 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 pandas:1.1.5 这个系列讲讲Python的科学计算及可视化...今天讲讲pandas模块 生成一个空的df Part 1:场景描述 一些情况下需要对df进行操作,若这个df是中间计算出来,有可能是空字符串,这样后续的很多运算就会报错 其中的一个方法就是给其赋值一个空的...df Part 2:代码1 import pandas as pd df = pd.DataFrame(columns=['A', 'B', 'C', 'D']) print(df) if df.empty...: print("为空的df") print(type(df)) 代码截图 执行结果 Part 3:代码2 import pandas as pd df = pd.DataFrame...df来说,其实可以不需要列名 代码2中无列名,生成的空df更纯粹一点 注意两者的类型都是pandas.core.frame.DataFrame ---- 本文为原创作品,欢迎分享朋友圈

72710

Python-科学计算-pandas-25-列表转df

系统:Windows 11 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 这个系列讲讲Python的科学计算及可视化 pandas模块 今天讲讲如何讲一个列表转换为...df Part 1:场景说明 我们在工作中可能需要对一些列表或者字典数据进行运算 当然我们可以通过循环判断一波处理得到想要的结果,但着实复杂低效 遇到这种计算问题,自然想到pandas这个非常好用的库...那我们只需要将需要处理的列表字典转换为pandasdf,这样后续处理就非常的高效了 Part 2: 代码 import pandas as pd list_1 = [{"a": 1, "b":...= pd.DataFrame(list_1) print("\ndf内容:") print(df.head(5)) 图1 代码截图 图2 执行结果 Part 3:部分代码说明 df = pd.DataFrame...(list_1),核心就是将该列表传给pd.DataFrame 观察执行结果,规律: 列表中的每一个元素是一个字典 每个字典的键是一样的,转换后对应df的列名 生成的df行索引采用自然数 本文为原创作品

1.8K10

Python-科学计算-pandas-26-列表转df-2

系统:Windows 11 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 这个系列讲讲Python的科学计算及可视化 pandas模块 今天讲讲如何将一个列表转换为...df Part 1:场景说明 我们在工作中可能需要对一些列表或者字典数据进行运算 当然我们可以通过循环判断一波处理得到想要的结果,但着实复杂低效 遇到这种计算问题,自然想到pandas这个非常好用的库...那我们只需要将需要处理的列表字典转换为pandasdf,这样后续处理就非常的高效了 上一篇文章列表内每个元素是一个字典,那么如果列表内的元素也是一个列表如何处理呢?...Part 2: 代码 import pandas as pd list_1 = [[1, 2, 3, 4], [2, 3, 4, 5], [6, 3, 8, 5]] print("\n列表内容:...) print("\ndf内容:") print(df) 图1 代码截图 图2 执行结果 Part 3:部分代码说明 df = pd.DataFrame(list_1, columns=list_column

19620

Python-科学计算-pandas-15-df输出Excel和解析Excel

系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python的科学计算及可视化 今天讲讲pandas模块 将Df输出到Excel文件中,以及读取Excel中数据 Part 1:场景介绍 ?...当Df数据较多时,通过print输出效果不好的时候,可以考虑将其输出为Excel文件,或者纯粹是为了输出Excel文件 很多输入文件都是Excel格式的,通过pandas如何解析 Part 2:代码...import pandas as pd import os dict_1 = {"time": ["2019-11-02", "2019-11-03", "2019-11-04", "2019-11-...输出Excel: df_1.to_excel(excel_address),通过to_excel函数即可,若只是看一下数据结构,可以只输出Df的一部分,df_2 = df_1.head(3)即表示df_

1.1K10

Python-科学计算-pandas-19-df分组上中下旬

系统:Windows 10 语言版本:conda 4.4.10 编辑器:JetBrains PyCharm Community Edition 2018.2.2 x64 pandas:0.22.0 这个系列讲讲...Python的科学计算及可视化 今天讲讲pandas模块 按照时间列,得出每行属于上中下旬,进而对df进行分组 Part 1:场景描述 ?...import pandas as pd import numpy as np # 显示所有列 pd.set_option('display.max_columns', None) # 显示所有行 pd.set_option..., "下旬")) print("\n") print(df) df_1 = df[df["xun"] == "上旬"] print("\n") print(df_1) df_1 = df[df["xun..."中旬", np.where(df["flag"] <= 10, "上旬", "下旬")),两重判断 np.where(条件,满足条件结果,不满足条件结果) 支持嵌套,有点VBA公式的感觉 对flag列的每个元素进行计算

91420

Python-科学计算-pandas-09-df列字符串操作2

系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3.2 pandas:0.19.2 这个系列讲讲...Python的科学计算版块 今天讲讲pandas模块: 对列的每一个元素进行同样的字符串操作 今天讲其中的1个操作: split Part 1:目标 已知Df某列都是字符串,每一个字符串都有一个文件与其对应...后的文件类型 组合两者 加入到原来的Df中 修改前后文件名 Part 2:代码 import pandas as pd dict_1 = {"file_name": ["P10-CD1.txt",...se_1 print("加入新的文件名:\n", df_1) print(type(df_1)) 代码截图 执行结果 Part 3:部分代码解读 df_2 = df_1["file_name"]..._2["文件名"] + "." + df_3["文件类型"],实现两个Df之间对应每个元素的字符串连接操作,生成一个Series对象 df_1["new_file_name"] = se_1,df_1新增一列

47210

Pandas 高性能优化小技巧

(df): result = list() for index, row in df.iterrows(): result.append(row['汽车百分比']+row...['火车百分比']) return result def loop_apply_test(row): return row['汽车百分比']+row['火车百分比'] print('...Wall time: 3.8 s apply函数比iterrow提高了4倍 1.3直接使用内置函数进行计算 Dataframe、Series具有大量的矢量函数,比如sum,mean等,基于内置函数的计算可以让性能更好...,比如: %time df['add'] = df['汽车百分比']+df['火车百分比'] 输出结果 Wall time: 546 ms 我们可以看到性能又往上提高了近6倍。...因此,我们在使用pandas进行计算的时候,如果可以使用内置的矢量方法计算最好选用内置方法,其次可以考虑apply方法,如果对于非轴向的循环可以考虑iterrow方法。

2.9K20

30 个小例子帮你快速掌握Pandas

import numpy as np import pandas as pd df = pd.read_csv("/data/churn.csv") df.shape --- (10000,14) df.columns...符合指定条件的值将保持不变,而其他值将替换为指定值。 20.排名函数 它为这些值分配一个等级。让我们创建一个根据客户余额对客户进行排名的列。...您可能需要更改的其他一些选项是: max_colwidth:列中显示的最大字符数 max_columns:要显示的最大列数 max_rows:要显示的最大行数 28.计算列中的百分比变化 pct_change...用于计算一系列值中的百分比变化。...在计算元素的时间序列或顺序数组中的变化百分比时很有用。 ? 从第一元素(4)到第二元素(5)的变化为%25,因此第二个值为0.25。

10.6K10
领券