首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ApacheCN 数据科学译文集 20211109 更新

、预测 十四、回归的推断 十五、分类 十六、比较两个样本 十七、更新预测 利用 Python 进行数据分析 · 第 2 版 第 1 章 准备工作 第 2 章 Python 语法基础,IPython 和...数据清洗和准备 第 8 章 数据规整:聚合、合并和重塑 第 9 章 绘图和可视化 第 10 章 数据聚合与分组运算 第 11 章 时间序列 第 12 章 pandas 高级应用 第 13 章 Python...Pandas 秘籍 零、前言 一、Pandas 基础 二、数据基本操作 三、开始数据分析 四、选择数据子集 五、布尔索引 六、索引对齐 七、分组以进行汇总,过滤和转换 八、将数据重组为整齐的表格 九...Pandas 三、用序列表变量数据 四、用数据表示表格和多元数据 五、数据的结构操作 六、索引数据 七、类别数据 八、数值统计方法 九、存取数据 十、整理数据 十一、合并,连接和重塑数据 十二...五、Pandas 的算术,函数应用以及映射 六、排序,索引和绘图 精通 Pandas 探索性分析 零、前言 一、处理不同种类的数据集 二、数据选择 三、处理,转换和重塑数据 四、像专业人士一样可视化数据

4.9K30

python数据分析——数据的选择和运算

此外,Pandas库也提供了丰富的数据处理和运算功能,如数据合并数据转换、数据重塑等,使得数据运算更加灵活多样。 除了基本的数值运算外,数据分析中还经常涉及统计运算和机器学习算法的应用。...【例】创建两个不同的数据,并使用merge()对其执行合并操作。 关键技术:merge()函数 首先创建两个DataFrame对象。...关键技术:使用’ id’键合并两个数据,并使用merge()对其执行合并操作。...代码和输出结果如下所示: (2)使用多个键合并两个数据: 关键技术:使用’ id’键及’subject_id’键合并两个数据,并使用merge()对其执行合并操作。..."sales.csv" ,使用Python的join()方法,将两个数据表切片数据进行合并

13410
您找到你想要的搜索结果了吗?
是的
没有找到

图解pandas模块21个常用操作

PandasPython 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。...如果传递了索引,索引中与标签对应的数据中的将被拉出。 ? 4、序列数据的访问 通过各种方式访问Series数据,系列中的数据可以使用类似于访问numpy中的ndarray中的数据来访问。 ?...5、序列的聚合统计 Series有很多的聚会函数,可以方便的统计最大、求和、平均值等 ? 6、DataFrame(数据) DataFrame是带有标签的二维数据结构,列的类型可能不同。...19、数据合并 两个DataFrame的合并pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。 ?...21、apply函数 这是pandas的一个强大的函数,可以针对每一个记录进行运算而不需要像其他语言一样循环处理。 ? ? 整理这个pandas可视化资料不易

8.5K12

Pandas 学习手册中文第二版:1~5

要进行此处理,需要使用一种工具,使我们能够对维和多维数据进行检索,索引,清理和整齐,整形,合并,切片并执行各种分析,包括沿着数据自动对齐的异类数据。...建模 建模的重点是第 3 章和“使用 Pandas列表变量数据”,第 4 章“用数据表示表格和多元数据”,第 11 章“组合,关联和重塑数据”,第 13 章“时间序列建模”,以及专门针对金融的第...Pandas 序列和数据简介 让我们开始使用一些 Pandas,并简要介绍一下 Pandas两个主要数据结构Series和DataFrame。...三、用序列表变量数据 Series是 Pandas 的主要构建基块。 它表示单个数据类型的一维类似于数组的集。 它通常用于为单个变量的零个或多个测量建模。...我们将研究以下三个: 使用 Python 列表或字典 使用 NumPy 数组 使用标量值 使用 Python 列表和字典创建序列 可以从 Python 列表中创建Series: [外链图片转存失败,源站可能有防盗链机制

8.1K10

Python pandas十分钟教程

Pandas数据处理和数据分析中最流行的Python库。本文将为大家介绍一些有用的Pandas信息,介绍如何使用Pandas的不同函数进行数据探索和操作。...包括如何导入数据集以及浏览,选择,清理,索引,合并和导出数据等常用操作的函数使用,这是一个很好的快速入门指南,如果你已经学习过pandas,那么这将是一个不错的复习。...数据清洗 数据清洗是数据处理一个绕不过去的坎,通常我们收集数据都是不完整的,缺失、异常值等等都是需要我们处理的,Pandas中给我们提供了多个数据清洗的函数。...df.groupby(by=['Contour', 'Gp'])['Ca'].mean() 合并多个DataFrame 将两个数据合并在一起有两种方法,即concat和merge。...按列连接数据 pd.concat([df, df2], axis=1) 按行连接数据 pd.concat([df, df2], axis=0) 当您的数据之间有公共列时,合并适用于组合数据

9.8K50

Python常用小技巧总结

小技巧 pandas生成数据 导入数据 导出数据 查看数据 数据选择 数据处理 数据分组 数据合并 数据替换--map映射 数据清洗--replace和正则 数据透视表分析--melt函数 将分类中出现次数较少的归为...others Python合并多个EXCEL工作表 pandas中Series和Dataframe数据类型互转 相同字段合并 Python小技巧 简单的表达式 列表推导式 交换变量 检查对象使用内存情况...合并字典 字符串分割成列表 字符串列表创建字符串 Python查看图片 itertools模块combinations itertools中reduce 字典.get()方法 解压zip压缩包指定文件路径...') #与 df1.join(df2, how='outer')效果相同 数据替换–map映射 map() 会根据提供的函数对指定序列做映射。...–replace和正则 分享pandas数据清洗技巧,在某列山使用replace和正则快速完成的清洗 d = {"customer": ["A", "B", "C", "D"], "sales

9.4K20

你的想象力限制了python能力,自动化识别函数调用关系,还能可视化

前言 我喜欢用 python 做一些临时性数据工作,简单情况下,直接一把梭写到底。比如简单的多文件合并数据: 定义函数?一辈子都不可能。...得益于 pandas 的管道功能,我们可以更容易管理复杂的数据任务代码。关于如何以正确的思路使用 pandas 管道(pipe) ,具体可以查看我的 pandas 专栏。...流程图可以缩放,拖动平移 点击每个节点,下方出现函数处理结果的表数据。还可以通过勾选,快速筛选数据 当然,如果不能快速定位代码,那就没有意思。...要做到这样的可视化,必需找到一种方式,可以在 python 中,自动化识别函数调用关系。 今天,我们探讨一下,如何做到这一切。重点是分享里面涉及python 知识。...假设两个简单的函数 在函数 b 中,调用了 函数 a 现在我们需要的是,得到一个记录信息,能反映出,函数 b 中,使用了函数 a。 python 中可以做到吗?

24830

Pandas 秘籍:1~5

数据的rename方法接受将旧映射到新的字典。...这些参数中的每一个都可以设置为字典,该字典将旧标签映射到它们的新。 更多 重命名行标签和列标签有多种方法。 可以直接将索引和列属性重新分配给 Python 列表。...通过名称选择列是 Pandas 数据的索引运算符的默认行为。 步骤 3 根据类型(离散或连续)以及它们的数据相似程度,将所有列名称整齐地组织单独的列表中。...通过使用标签或整数位置选择数据并非 Pandas 所独有。 Python 字典和列表是内置的数据结构,它们以下列其中一种方式选择其数据。...序列和数据索引器允许按整数位置(如 Python 列表)和标签(如 Python 字典)进行选择。.iloc索引器仅按整数位置选择,并且与 Python 列表类似。.

37.3K10

Python数据规整化:清理、转换、合并、重塑

Python数据规整化:清理、转换、合并、重塑 1. 合并数据pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。...pandas.concat可以沿着一条轴将多个对象堆叠一起。 实例方法combine_first可以将重复数据编接在一起,用一个对象中的填充另一个对象中的缺失。 2....2.4 merge的suffixes选项,用于指定附加到左右两个DataFrame对象的重叠列名上的字符串。 3. 索引上的合并 DataFrame有merge和join索引合并。 4....unstack:将数据的行“旋转”为列。 5. 数据转换 5.1 利用函数或映射进行数据转换 Series的map方法可以接受一个函数或含有映射关系的字典型对象。...5.2 替换 replace可以由一个带替换组成的列表以及一个替换 data.replace([-999,-1000],np.nan) 5.3 重命名轴索引 轴标签也可通函数或映射进行转换,从而得到一个新对象轴还可以被就地修改

3K60

精通 Pandas:1~5

使用ndarrays/列表字典 在这里,我们从列表的字典中创建一个数据结构。 键将成为数据结构中的列标签,列表中的数据将成为列。 注意如何使用np.range(n)生成行标签索引。...它不如序列或数据广泛使用。 由于其 3D 性质,它不像其他两个屏幕那样容易在屏幕上显示或可视化。面板数据结构是 Pandas数据结构拼图的最后一部分。 它使用较少,用于 3D 数据。...isin和所有方法 与前几节中使用的标准运算符相比,这些方法使用户可以通过布尔索引实现更多功能。 isin方法获取值列表,并在序列或数据中与列表中的匹配的位置返回带有True的布尔数组。...类似于 SQL 的数据对象的合并/连接 merge函数用于获取两个数据对象的连接,类似于 SQL 数据库查询中使用的那些连接。数据对象类似于 SQL 表。...join函数 DataFrame.join函数用于合并两个具有不同列且没有共同点的数据。 本质上,这是两个数据的纵向连接。

18.8K10

干货!直观地解释和可视化每个复杂的DataFrame操作

操作数据可能很快会成为一项复杂的任务,因此在Pandas中的八种技术中均提供了说明,可视化,代码和技巧来记住如何做。 ?...Melt Melt可以被认为是“不可透视的”,因为它将基于矩阵的数据(具有二维)转换为基于列表数据列表,行表示唯一的数据点),而枢轴则相反。...记住:合并数据就像在水平行驶时合并车道一样。想象一下,每一列都是高速公路上的一条车道。为了合并,它们必须水平合并。...“inner”:仅包含元件的键是存在于两个数据键(交集)。默认合并。 记住:如果您使用过SQL,则单词“ join”应立即与按列添加相联系。...例如,考虑使用pandas.concat([df1,df2])串联的具有相同列名的 两个DataFrame df1 和 df2 : ?

13.3K20

多步时间序列预测策略实战

图(A):递归预测策略 在"基于树的时间序列预测实战"中,我们学会了将变量时间序列表述为基于树的建模问题。...make_reduction()函数可以将变量时间序列转化为数据。该函数有两个主要参数,即strategy("递归"或"直接")和window_length(滑动窗口长度)。...递归策略 递归策略中,滑动窗口前的即为目标值,图(D)滑动 14 窗口,生成了 6 个样本的数据,其中蓝色的 y 为目标值,该数据用于训练模型。...假设目标值是 t+3 的。图(D)滑动 14 窗口,生成一个包含 4 个样本的数据。目标值是 t+3 中的 y 。该数据用于训练预测 t+3 的 y 的模型。...图 (D) 滑动了 14 个窗口并生成了一个包含 3 个样本的数据,用于训练预测 t+4 中 y 的模型。

11910

3.69GB全国POI数据可视化分析

数据预处理之合并 全国poi数据分散在不同省的文件夹中分别以市为单位进行分文件存储,现需要对所有文件进行合并 文件内结构如下 合并全国poi import os import pandas as...data = pd.read_csv(file_path) all_data = all_data.append(data, ignore_index=True) # 将合并后的数据写入新的...根本打不开 数据分析以及可视化都不难,但是在处理庞大的数据时,我们常用的excel,python基本都无法使用。...数据筛选 大数据集筛选方式 针对这种大数据集,使用python来进行处理是不太现实的,每执行一个操作都很耗费时间。...data列表中,并附带一个为1的标签 data.append([row['名称'], 1]) # 为geo对象添加热力图,使用之前准备的数据,设置热力图的类型、是否为大图、模糊大小

47520

Python数据分析 | Pandas核心操作函数大全

数据分析的时候,大部分情况下都会使用Pandas进行操作。...求和、平均值等 [4c686eea24071932103c426df1fe648f.png] 二、DataFrame(数据) DataFrame是Pandas使用最频繁的核心数据结构,表示的是二维的矩阵数据表...df.loc[df.a>50, ‘a’]=888 [90fbf8185bfdf12b71ecae2a2a7b5c10.png] 2.13 pandas Dataframe多数据合并 两个DataFrame...的合并pandas会自动按照索引对齐,可以指定两个DataFrame的对齐方式,如内连接外连接等,也可以指定对齐的索引列。...系列教程推荐 图解Python编程:从入门精通系列教程 图解数据分析:从入门精通系列教程 图解AI数学基础:从入门精通系列教程 图解大数据技术:从入门精通系列教程

3.1K41

Python 数据科学入门教程:Pandas

一个是列表索引,它返回一个数据。 另一个是数据中的一列。 接下来,我们注意第零列中的第一项是abbreviation,我们不想要它。...在我们的房地产投资案例中,我们希望使用房屋数据获取 50 个数据,然后把它们全部合并成一个数据。我们这样做有很多原因。首先,将这些组合起来更容易,更有意义,也会减少使用的内存。...序列基本上是单列的数据。 序列确实有索引,但是,如果你把它转换成一个列表,它将仅仅是这些。 每当我们调用df ['column']时,返回就是一个序列。...六、连接(join)和合并数据 欢迎阅读 PythonPandas 数据分析系列教程的第六部分。 在这一部分种,我们将讨论连接(join)和合并数据,作为组合数据框的另一种方法。...Pandas 数据映射函数到非常有用,可用于编写自定义公式,将其应用于整个数据,特定列或创建新列。

9K10

Pandas 秘籍:6~11

另见 Python 任意参数列表文档 Python 闭包教程 检查分组对象 在数据使用groupby方法的直接结果将是一个分组对象。...True映射到Amy,False映射到Bob。我们突出显示每个月的获胜者,并使用value_counts方法统计最终得分。 更多 看一下第 7 步中的数据输出。...默认情况下,concat函数使用外连接,将列表中每个数据的所有行保留在列表中。 但是,它为我们提供了仅在两个数据中保留具有相同索引的行的选项。 这称为内连接。...merge: 数据方法 准确地水平合并两个数据 将调用的数据的列/索引与其他数据的列/索引对齐 通过执行笛卡尔积来处理连接列/索引上的重复 默认为内连接,带有左,外和右选项 join...merge方法是唯一能够按列对齐调用和传递的数据的方法。 第 10 步向您展示了合并两个数据有多么容易。on参数不是必需的,但为清楚起见而提供。

33.9K10

数据科学 IPython 笔记本 7.11 聚合和分组

在本节中,我们将探讨 Pandas 中的聚合,从类似于我们在 NumPy 数组中看到的简单操作,基于groupby概念的更复杂的操作。...“组合”步骤将这些操作的结果合并到输出数组中。 虽然这肯定可以使用前面介绍的掩码,聚合和合并命令的某种组合来手动完成,但一个重要的认识是,中间的分割不需要显式实例化。...相反,GroupBy可以(经常)只遍历数据来执行此操作,在此过程中更新每个组的总和,均值,计数,最小或其他聚合。...例如,这里是一个apply(),它按照第二列的总和将第一列标准化: def norm_by_data2(x): # x 是分组数据 x['data1'] /= x['data2']...函数 与映射类似,你可以传递任何接受索引并输出分组的 Python 函数: display('df2', 'df2.groupby(str.lower).mean()') df2: data1 data2

3.6K20

加速数据分析,这12种高效Numpy和Pandas函数为你保驾护航

Pandas 也是 Python 环境下的数据操作和分析软件包,以及强大的数据分析库。...Pandas 数据统计包的 6 种高效函数 Pandas 也是一个 Python 包,它提供了快速、灵活以及具有显著表达能力的数据结构,旨在使处理结构化 (表格化、多维、异构) 和时间序列数据变得既简单又直观...: 对象可以显式地对齐至一组标签内,或者用户可以简单地选择忽略标签,使 Series、 DataFrame 等自动对齐数据; 灵活的分组功能,对数据集执行拆分-应用-合并等操作,对数据进行聚合和转换;...简化将数据转换为 DataFrame 对象的过程,而这些数据基本是 Python 和 NumPy 数据结构中不规则、不同索引的数据; 基于标签的智能切片、索引以及面向大型数据集的子设定; 更加直观地合并以及连接数据集...当一个数据分配给另一个数据时,如果对其中一个数据进行更改,另一个数据也将发生更改。为了防止这类问题,可以使用 copy () 函数。

7.5K30
领券