首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python数据分析笔记——Numpy、Pandas

一维数组索引 多维数组索引 (2)切片索引 一维数组切片索引(与Python列表切片索引一样) 多维数组切片索引 (3)花式索引 元素索引和切片索引都是局限于连续区域值,而花式索引可以选取特定区域值...(3)获取DataFrame值() 通过查找columns值获取对应。(下面两种方法) 通过索引字段ix查找相应。 (4)对进行赋值处理。 对某一可以赋一个标量值也可以是一组值。...Pandas基本功能 1、重新索引 Pandas对象一个方法就是重新索引(reindex),其作用是创建一个索引,pandas对象将按这个索引进行排序。对于不存在索引值,引入缺失值。...(0开始计数) 6、汇总和计算描述统计 就是针对数组进行常用数学和统计运算。大部分都属于约简和汇总统计。 其中有求和(sum)运算、累计(cumsum)运算、平均值(mean)等运算。...这些运算默认都是针对运算,通过使用axis=1进行列运算。 Describe既不是约简型也不是累计型,他是用于一次性产生多个汇总统计指标的运算。

6.4K80

一个数据集全方位解读pandas

DataFrame索引是两个Series索引集: >>> city_data.index Index(['Amsterdam', 'Tokyo', 'Toronto'], dtype='object...我们知道Series对象在几种方面与列表和字典相似之处。也就意味着我们可以使用索引运算符。现在我们来说明如何使用两种特定pandas访问方法:.loc和.iloc。...五、查询数据集 现在我们已经了解了如何根据索引访问大型数据集子集。现在,我们继续基于数据集值选择以查询数据。例如,我们可以创建一个DataFrame包含2010年之后打过比赛。...包含其中值"year_id"大于2010。...首先创建原始副本DataFrame以使用: >>> df = nba.copy() >>> df.shape (126314, 23) 然后基于现有定义: >>> df["difference"

7.4K20
您找到你想要的搜索结果了吗?
是的
没有找到

python数据分析——数据分类汇总与统计

本文将介绍如何使用Python进行数据分类汇总与统计,帮助读者更好地理解和应用数据。 首先,我们需要导入一些常用Python库,如pandas、numpy和matplotlib等。...假设我们有一个包含学生信息CSV文件,我们可以使用以下代码将其加载到DataFrame中: df = pd.read_csv('student_data.csv') 在加载数据后,我们可以使用pandas...例如, DataFrame可以在其(axis=0)或(axis=1)上进行分组。然后,将一个函数应用(apply)到各个分组产生一个值。...具体办法是向agg传入一个列名映射到函数字典: 只有将多个函数应用到至少一时,DataFrame才会拥有层次化 2.3.返回不含索引聚合数据 到目前为止,所有例中聚合数据都有由唯一分组键组成索引...【例16】用特定于分组值填充缺失值 对于缺失数据清理工作,有时你会用dropna将其替换掉,而有时则可能会希望用一个固定值或由数据集本身所衍生出来值去填充NA值。

14410

30 个小例子帮你快速掌握Pandas

我们删除了4,因此列数14减少到10。 2.读取时选择特定 我们只打算读取csv文件中某些。读取时,列表将传递给usecols参数。如果您事先知道列名,则比以后删除更好。...选择特定 3.读取DataFrame一部分行 read_csv函数允许按读取DataFrame一部分。有两种选择。第一个是读取前n。...我们可以看到每组中观察值(数量和平均流失率。 14.将不同汇总函数应用于不同组 我们不必对所有都应用相同函数。例如,我们可能希望查看每个国家/地区平均余额和流失客户总数。...重设索引,但原始索引保留为。我们可以在重置索引时将其删除。...method参数指定如何处理具有相同。first表示根据它们在数组(即)中顺序对其进行排名。 21.中唯一值数量 使用分类变量时,它很方便。我们可能需要检查唯一类别的数量。

10.6K10

直观地解释和可视化每个复杂DataFrame操作

操作数据帧可能很快会成为一项复杂任务,因此在Pandas八种技术中均提供了说明,可视化,代码和技巧来记住如何做。 ?...每种方法都将包括说明,可视化,代码以及记住它技巧。 Pivot 透视表将创建一个“透视表”,该透视表将数据中现有投影为元素,包括索引,和值。...Unstack 取消堆叠将获取多索引DataFrame对其进行堆叠,将指定级别的索引转换为具有相应值DataFrame。在表上调用堆栈后再调用堆栈不会更改该堆栈(原因是存在“ 0 ”)。...合并不是pandas功能,而是附加到DataFrame。始终假定合并所在DataFrame是“左表”,在函数中作为参数调用DataFrame是“右表”,带有相应键。...串联是将附加元素附加到现有主体上,而不是添加信息(就像逐联接一样)。由于每个索引/行都是一个单独项目,因此串联将其他项目添加到DataFrame中,这可以看作是列表。

13.3K20

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

索引值也是持久,所以如果你对 DataFrame重新排序,特定标签不会改变。 5. 副本与就地操作 大多数 Pandas 操作返回 Series/DataFrame 副本。...读取外部数据 Excel 和 pandas 都可以各种来源以各种格式导入数据。 CSV 让我们 Pandas 测试中加载显示提示数据集,这是一个 CSV 文件。...在 Pandas 中,您使用特殊方法/向 Excel 文件读取和写入。 让我们首先基于上面示例中数据框,创建一个 Excel 文件。 tips.to_excel("....pandas 通过在 DataFrame 中指定单个系列来提供矢量化操作。可以以相同方式分配DataFrame.drop() 方法 DataFrame 中删除一。...我们将使用 =IF(A2 < 10, "low", "high")公式,将其拖到存储所有单元格。 使用 numpy 中 where 方法可以完成 Pandas相同操作。

19.5K20

Python 数据处理:Pandas使用

---- 2.基本功能 2.1 重新索引 Pandas对象一个重要方法是reindex,其作用是创建一个对象,它数据符合索引。...它们可以让你用类似 NumPy 标记,使用轴标签(loc)或整数索引(iloc),DataFrame选择子集。...[where] 通过整数位置, DataFrame选取单个子集 df.iloc[:,where] 通过整数位置, DataFrame选取单个或列子集 df.iloc[where_i, where...DataFrame,其索引和列为原来那两个DataFrame集: print(df1 + df2) 如果DataFrame对象相加,没有共用标签,结果都会是空: import pandas...它们大部分都属于约简和汇总统计,用于Series中提取单个值(如sum或mean)或DataFrame中提取一个Series。

22.7K10

超全pandas数据分析常用函数总结:下篇

axis:串联轴,默认为0,即以索引串联(竖直拼接);如果为1,则以串联(水平拼接) ignore_index:清除现有索引并将其重置,默认为False。...5.3 按照特定值排序: 按照索引进行排序: data.sort_index() 按照money值进行排序: data.sort_values(by="money",ascending = True...5.6 切割数据 对date字段值依次进行分列,创建数据表,索引值为data索引,列名称为year\month\day。...6.2.5 用iloc取连续多行和多 提取第3到第6,第4到第5值,取得是交叉点位置。 data.iloc[2:6,3:5] 输出结果: ?...6.2.7 用iloc取具体值 提取第3第7值 data.iloc[2,6] 输出结果:‘high’ 总结:文字变代码,数值少1;代码变文字,数值加1;代码0开始计数;文字1开始计数。

3.9K20

超全pandas数据分析常用函数总结:下篇

axis:串联轴,默认为0,即以索引串联(竖直拼接);如果为1,则以串联(水平拼接) ignore_index:清除现有索引并将其重置,默认为False。...5.3 按照特定值排序: 按照索引进行排序: data.sort_index() 按照money值进行排序: data.sort_values(by="money",ascending = True...5.6 切割数据 对date字段值依次进行分列,创建数据表,索引值为data索引,列名称为year\month\day。...6.2.5 用iloc取连续多行和多 提取第3到第6,第4到第5值,取得是交叉点位置。 data.iloc[2:6,3:5] 输出结果: ?...6.2.7 用iloc取具体值 提取第3第7值 data.iloc[2,6] 输出结果:‘high’ 总结:文字变代码,数值少1;代码变文字,数值加1;代码0开始计数;文字1开始计数。

4.9K20

pandas.DataFrame()入门

pandas.DataFrame()函数​​pandas.DataFrame()​​函数是创建和初始化一个空​​DataFrame​​对象方法。...访问:使用标签和索引可以访问​​DataFrame​​中特定。增加和删除:使用​​assign()​​方法可以添加,使用​​drop()​​方法可以删除现有的。...数据统计和聚合:使用各种统计和聚合函数可以对数据进行分析和汇总。 这只是一小部分可用操作,pandas提供了丰富功能和方法来处理和分析数据。...我们了解了如何创建一个简单​​DataFrame​​对象,以及一些常用​​DataFrame​​操作。 pandas是一个功能强大且灵活库,提供了各种工具和函数来处理和分析数据。...我们还使用除法运算符计算了每个产品平均价格,并将其添加到DataFrame中。 最后,我们打印了原始DataFrame对象和计算后销售数据统计结果。

22410

Pandas实用手册(PART I)

值得注意是参数axis=1:在pandas里大部分函数预设处理轴为(row),以axis=0表示;而将axis设置为1则代表你想以(column)为单位套用该函数。...将剪贴簿内容转换成DataFrame 你可以Excel、Google Sheet 或是网页上复制表格并将其转成DataFrame。...过来人经验,虽然像这样利用pandas 直接网络上下载分析数据很方便,但是有时host 数据网页与机构(尤其是政府机关)会无预期地修改他们网站,导致数据集URL 失效。...优化内存使用量 你可以透过df.info查看DataFrame当前内存用量: ? 最后一可以看出Titanic这个小DataFrame只占了322 KB。...前面说过很多pandas函数预设axis参数为0,代表着以(row)为单位做特定操作,在pd.concat例子中则是将2个同样格式DataFrames依照axis=0串接起来。

1.7K31

Pandas实用手册(PART III)

,今天继续为大家带来三大类实用操作: 基本数据处理与转换 简单汇总&分析数据 与pandas相得益彰实用工具 基本数据处理与转换 在了解如何选取想要数据以后,你可以通过这节介绍来熟悉pandas...这章节也是我认为使用pandas 处理数据时最令人愉快部分之一 对某一轴套用相同运算 你时常会需要对DataFrame 里头每一个栏位(纵轴)或是每一(横轴)做相同运算,比方说你想将Titanic...: 找出栏位里所有出现过针对特定栏位使用unique函数即可: 分组汇总结果 很多时候你会想要把DataFrame里头样本依照某些特性分门别类,依此汇总各组(group)统计数据。...让我们再次拿出Titanic数据集: 你可以将所有乘客()依照它们Pclass栏位值分组,计算每组里头乘客们平均年龄: 你也可以搭配刚刚看过describe函数来汇总各组统计数据: 你也可以依照多个栏位分组...函数相同结果: 当然,你也可以直接使用pivot_table函数来汇总各组数据: 依照背景不同,每个人会有偏好pandas 使用方式。

1.8K20

Pandas 学习手册中文第二版:1~5

以下显示Missoula中大于82度值: 然后可以将表达式结果应用于数据帧(和序列)[]运算符,这导致返回求值为True表达式: 该技术在 pandas 术语中称为布尔选择,它将构成基于特定值选择基础...访问数据帧内数据 数据帧由组成,具有特定中选择数据结构。 这些选择使用与Series相同运算符,包括[],.loc[]和.iloc[]。...这种探索通常涉及对DataFrame对象结构进行修改,以删除不必要数据,更改现有数据格式或其他数据创建派生数据。 这些章节将演示如何执行这些强大而重要操作。...然后,pandasSeries与副本DataFrame对齐,并将其添加为名为RoundedPrice将添加到索引末尾。 .insert()方法可用于在特定位置添加。...此外,我们看到了如何替换特定数据。 在下一章中,我们将更详细地研究索引使用,以便能够有效地 pandas 对象内检索数据。

8.1K10

手把手教你做一个“渣”数据师,用Python代替老情人Excel

我希望用Python取代几乎所有的excel功能,无论是简单筛选还是相对复杂创建分析数据和数组。 我将展示从简单到复杂计算任务。强烈建议你跟着我一起做这些步骤,以便更好地理解它们。...1、“头”到“脚” 查看第一或最后五。默认值为5,也可以自定义参数。 ? 2、查看特定数据 ? 3、查看所有名字 ? 4、查看信息 查看DataFrame数据属性总结: ?...2、查看多 ? 3、查看特定 这里使用方法是loc函数,其中我们可以指定以冒号分隔起始行和结束。注意,索引0开始而不是1。 ? 4、同时分割 ? 5、在某一中筛选 ?...有四种合并选项: left——使用左侧DataFrame共享匹配右侧DataFrame,N/A为NaN; right——使用右侧DataFrame共享匹配左侧DataFrame,N/A为...NaN; inner——显示两个共享重叠数据。

8.3K30

整理了 25 个 Pandas 实用技巧,拿走不谢!

你可以对前两使用astype()函数: ? 但是,如果你对第三也使用这个函数,将会引起错误,这是因为这一包含了破折号(用来表示0)但是pandas并不知道如何处理它。...剪贴板中创建DataFrame 假设你将一些数据储存在Excel或者Google Sheet中,你又想要尽快地将他们读取至DataFrame中。 你需要选择这些数据复制至剪贴板。...如果我们只想保留第0作为city name,我们需要选择那一保存至DataFrame: ? 17....将一个由列表组成Series扩展成DataFrame 让我们创建一个示例DataFrame: ? 这里有两,第二包含了Python中由整数元素组成列表。...让我们回到stocks这个DataFrame: ? 我们可以创建一个格式化字符串字典,用于对每一进行格式化。然后将其传递给DataFramestyle.format()函数: ?

3.2K10

最全面的Pandas教程!没有之一!

构建一个 DataFrame 对象基本语法如下: 举个例子,我们可以创建一个 5 4 DataFrame填上随机数据: 看,上面表中每一基本上就是一个 Series ,它们都用了同一个...增加数据列有两种办法:可以从头开始定义一个 pd.Series,再把它放到表中,也可以利用现有的来产生需要。比如下面两种操作: 定义一个 Series ,放入 'Year' 中: ?...现有的创建: ? DataFrame 里删除/ 想要删除某一或一,可以用 .drop() 函数。...交叉选择数据 我们可以用 .xs() 方法轻松获取到多级索引中某些特定级别的数据。比如,我们需要找到所有 Levels 中,Num = 22 : ?...于是我们可以选择只对某些特定或者进行填充。比如只对 'A' 进行操作,在空值处填入该平均值: ? 如上所示,'A' 平均值是 2.0,所以第二空值被填上了 2.0。

25.8K64

8 个 Python 高效数据分析技巧

具体来说,map通过对列表中每个元素执行某种操作并将其转换为列表。在本例中,它遍历每个元素乘以2,构成列表。请注意,list()函数只是将输出转换为列表类型。...我们用删除一例子: df.drop( Column A , axis=1) df.drop( Row A , axis=0) 如果你想处理,将Axis设置为1,如果你想要处理将其设置为0...无论如何,这些函数本质上就是以特定方式组合DataFrame方式。在哪个时间跟踪哪一个最适合使用可能很困难,所以让我们回顾一下。...Concat允许用户在表格下面或旁边追加一个或多个DataFrame(取决于您如何定义轴)。 ? Merge将多个DataFrame合并指定主键(Key)相同。 ?...Join,和Merge一样,合并了两个DataFrame。但它不按某个指定主键合并,而是根据相同列名或名合并。 ? Pandas Apply pply是为Pandas Series而设计

2.7K20
领券