首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python学习手册(第4版).4

文本模式匹配是本书范围之外一个高级工具,但是有其他脚本语言背景读者也许对Python中进行模式匹配很感兴趣,我们需要导入一个名为re模块。...能够以任意组合对其进行嵌套,并可以多个层次进行嵌套(例如,能够让一个列表包含一个字典,并在这个字典包含另一个列表等)。 这种特性一个直接应用就是实现矩阵,或者Python“多维数组”。...例如,假设我们需要从列举矩阵中提取出第二。因为矩阵是按照行进行存储,所以通过简单索引即可获取,使用列表解析可以同样简单地获得。...它是一种通过对序列每一运行一个表达式来创建一个列表方法,每次一个,从左至右。...其结果就是一个包含了矩阵第二列表。

1.2K30

Pandas 2.2 中文官方教程和指南(一)

下一步是创建一个 conda 环境。conda 环境类似于一个允许您指定特定版本 Python 和一组库虚拟环境。从终端窗口运行以下命令。...当特别关注表位置某些和/或时,请在选择括号[]前使用iloc运算符。 使用loc或iloc选择特定和/或时,可以为所选数据分配值。...使用iloc选择特定和/或时,请使用表位置。 您可以基于loc/iloc分配值给选择。 转到用户指南 用户指南页面提供了有关索引和选择数据完整概述。...当特别关注表位置某些和/或时,请在选择括号[]前使用iloc运算符。 使用loc或iloc选择特定和/或时,可以为所选数据分配值。...使用iloc选择特定和/或时,请使用表位置。 您可以根据loc/iloc选择分配值。 前往用户指南 用户指南页面提供了有关索引和选择数据完整概述。

15510
您找到你想要的搜索结果了吗?
是的
没有找到

Python也能进军金融领域?这有一份股票交易策略开发指南

举个例子,Anaconda是一个Python和R高性能分布工作空间,并且包含了100多个最受欢迎Python、R和Scala数据科学工具包。...你可以使用这一个来检验历史回报或者对历史回报做一些细致分析。 请注意标签是如何包含日期信息,以及你标签是如何包含了数值数据。...您可以aapl DataFrame创建一个叫做diff存储结果,然后使用del再次删除它。...空signals DataFrame创建一个名为signal,并将其全都初始化为0.0。 准备工作之后,是时候各自长短时间窗口中创建一组短和长简单移动平均线了。...接下来,你DataFrame创建了一个名为AAPL信号为1时候,短移动平均线跨越长移动平均线(大于最短移动平均窗口),你将购买100股。

2.9K40

Pandas 学习手册中文第二版:1~5

创建一个新笔记本,请转到“新笔记本 -> Python3”: 将在浏览器选项卡创建一个笔记本页面。 其名称将为无标题: 笔记本包含一个准备好输入 Python 代码单元。...从某种意义上讲,数据帧类似于关系数据库表,因为它包含一个或多个异构类型数据(但对于每个相应列所有项目而言都是单一类型)。...这些是数据帧包含Series对象,具有从原始Series对象复制值。 可以使用带有列名或列名列表数组索引器[]访问DataFrame对象。...具体而言,本章,我们将介绍: 重命名列 使用[]和.insert()添加 通过扩展添加 使用连接添加 重新排序列 替换内容 删除 添加 连接 通过扩展添加和替换行 使用.drop...下面的代码创建了一个DataFrame,其中包含了四舍五入价格。

8.1K10

Python机器学习如何索引、切片和重塑NumPy数组

机器学习数据被表示为数组。 Python,数据几乎被普遍表示为NumPy数组。 如果你是Python新手,访问数据时你可能会被一些python专有的方式困惑,例如负向索引和数组切片。...这是一个数据表,其中每一代表一个发现,每一代表一个特征。 也许你通过使用自定义代码生成或加载数据,现在你有了二维列表。每个列表表示一个新发现。...我们可以这样做,将最后一所有分段,然后单独索引最后一。 对于输入要素,在行索引我们可以通过指定':'来选择最后一所有,并且索引中指定-1。...有些算法,如Keras时间递归神经网络(LSTM),需要输入特定包含样本、时间步骤和特征三维数组。 了解如何重塑NumPy数组是非常重要,这样你数据就能满足于特定Python库。...,将该数组重塑为具有51形状,并输出。

19.1K90

NLP项目中使用Hugging FaceDatasets 库

它支持大多数这些数据集数据加载器,并且只需一代码就可以实现,这使得加载数据成为一轻松任务。??...根据网站上提供信息,除了可以轻松访问数据集之外,该库还有以下有趣功能: 大型数据集发展使得数据集自然地将用户从 RAM 限制解放出来,所有数据集都使用高效零序列化成本后端 (Apache Arrow...feature对象包含关于信息——列名和数据类型。我们还可以看到每次拆分行数(num_rows)。很丰富! 我们也可以加载数据集时指定分割。...map()是一个强大方法,灵感来自于tf.data.Dataset map方法。我们可以将这个函数应用于一个例子,甚至一批例子,甚至生成。...这就是本文全部内容。从这里开始,您可以根据项目需求对数据进行预处理,并构建模型或创建良好可视化效果。不可能在一篇文章涵盖所有内容。然而,通过阅读本文,您可以了解如何使用数据集库可用方法。

2.9K40

Numpy 简介

NumPy数组 和 标准Python Array(数组) 之间有几个重要区别: NumPy数组创建时具有固定大小,与Python原生数组对象(可以动态增长)不同。...更改ndarray大小将创建一个数组并删除原来数组。 NumPy数组元素都需要具有相同数据类型,因此在内存大小相同。...如果数据存储两个Python列表a和b,我们可以迭代每个元素,如下所示: 确实符合我们要求,但如果a和b每个包含数百万个数字,我们将为Python循环低效率付出代价。...除了基本类型(整数、浮点数等)之外,数据类型对象还可以表示数据结构。 从数组中提取(例如,通过索引)由Python对象表示,其类型是NumPy构建阵列标量类型之一。...这是一个整数元组,表示每个维度数组大小。对于有n和m矩阵,shape将是(n,m)。因此,shape元组长度就是rank或维度个数 ndim。

4.7K20

Pandas 25 式

目录 查看 pandas 及其支持版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择 把字符串转换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...~ 按多个文件建立 DataFrame ~ 按 从剪贴板创建 DataFrame 把 DataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大类别筛选 DataFrame...操控缺失值 把字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择 重塑多重索引 Series 创建透视表...用多个文件建立 DataFrame ~ 按 上个技巧按合并数据集,但是如果多个文件包含不同,该怎么办? 本例将 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 。 ?...把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两,第二包含Python 整数列表。

8.4K00

Python实现ExcelVLOOKUP、HLOOKUP、XLOOKUP函数功能

尽管表2包含相同客户多个条目,但出于演示目的,我们仅使用第一个条目的值。例如,对于Harry,我们想带入其购买“Kill la Kill”。...第一,我们用一些参数定义了一个名为xlookup函数: lookup_value:我们感兴趣值,这将是一个字符串值 lookup_array:这是源数据框架,我们正在查找此数组/...“lookup_value” return_array:这是源数据框架,我们希望从该返回值 if_not_found:如果未找到”lookup_value”,将返回随后: lookup_array...pandas系列一个优点是它.empty属性,告诉我们该系列是否包含值或空,如果match_value为空,那么我们知道找不到匹配,然后我们可以通知用户在数据找不到查找值。...默认情况下,其值是=0,代表,而axis=1表示 args=():这是一个元组,包含要传递到func位置参数 下面是如何将xlookup函数应用到数据框架整个

6.5K10

使用 HyperTools 正确姿势! | Kaggle 实战教程

这里思路是,我们能够创建一系列(更少)特征,每一特征都由几项旧特征合并得到。举个例子,其中一特征也许会同时代表形状和颜色,另一代表尺寸和毒性。...DataFrame 每一对应着对某一个蘑菇观察值,每一反映出一个蘑菇描述性特征。这里,仅展示了表单一部分。现在,我们可以通过把数据导入 HyperTools,把高维数据低维空间表示出来。...(注:详细解释请参考 pandas 文件 get_dummies 函数) hyp.plot(data, 'o') ? 绘制 DataFrame 上,我们实际上创建了一个三维“蘑菇空间”。...为了用 HyperTools 来准备数据集,我们创建了一个时间/城市矩阵,每一是接下来每月气温记录,每一是不同城市气温值。...现在是压轴戏——创建静态图形之外,HyperTools 还能创建动图,这有时能显露出数据其他模式。

72540

使用 HyperTools 正确姿势! | Kaggle 实战教程

这里思路是,我们能够创建一系列(更少)特征,每一特征都由几项旧特征合并得到。举个例子,其中一特征也许会同时代表形状和颜色,另一代表尺寸和毒性。...DataFrame 每一对应着对某一个蘑菇观察值,每一反映出一个蘑菇描述性特征。这里,仅展示了表单一部分。现在,我们可以通过把数据导入 HyperTools,把高维数据低维空间表示出来。...(注:详细解释请参考 pandas 文件 get_dummies 函数) hyp.plot(data, 'o') ? 绘制 DataFrame 上,我们实际上创建了一个三维“蘑菇空间”。...为了用 HyperTools 来准备数据集,我们创建了一个时间/城市矩阵,每一是接下来每月气温记录,每一是不同城市气温值。...现在是压轴戏——创建静态图形之外,HyperTools 还能创建动图,这有时能显露出数据其他模式。

1.2K90

开发 | Kaggle实战:这才是使用数据降维&可视化工具 HyperTools 正确姿势!

这里思路是,我们能够创建一系列(更少)特征,每一特征都由几项旧特征合并得到。举个例子,其中一特征也许会同时代表形状和颜色,另一代表尺寸和毒性。...如果“菌盖尺寸”这一包含“大”和“小”标签,这一会被转为两个二元,一个针对“大”,另一个针对“小”。 1 代表该特征(“大”或“小”)存在,0 代表不存在。...(AI科技评论注:详细解释请参考 pandas 文件 get_dummies 函数) hyp.plot(data, 'o') 绘制 DataFrame 上,我们实际上创建了一个三维“蘑菇空间...为了用 HyperTools 来准备数据集,我们创建了一个时间/城市矩阵,每一是接下来每月气温记录,每一是不同城市气温值。...我们也可以用二维图形对这两个现象做可视化: hyp.plot(temps, normalize='across', group=years.flatten(), palette='RdBu_r', ndims=2) 现在是压轴戏——创建静态图形之外

1.8K50

数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

目录 查看 pandas 及其支持版本 创建 DataFrame 重命名列 反转行序 反转列序 按数据类型选择 把字符串转换为数值 优化 DataFrame 大小 用多个文件建立 DataFrame...~ 按多个文件建立 DataFrame ~ 按 从剪贴板创建 DataFrame 把 DataFrame 分割为两个随机子集 根据多个类别筛选 DataFrame 根据最大类别筛选 DataFrame...操控缺失值 把字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择 重塑多重索引 Series 创建透视表...用多个文件建立 DataFrame ~ 按 上个技巧按合并数据集,但是如果多个文件包含不同,该怎么办? 本例将 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 。 ?...把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两,第二包含Python 整数列表。

7.1K20

Python 帮运营妹纸快速搞定 Excel 文档

Worksheet(工作表) 或者 Sheet(表)–工作簿单个内容表,电子表格可以包含多个工作表。 Column() – 用英文字母标记垂直数列,以“ A”开头。..., 'Mouse vs Python') 输出是一个 Python 元组,其中包含每一数据。...添加、删除 OpenPyXL 具有几种方法,可用于电子表格添加、删除。...索引从1开始,而工作表索引从0开始。这有效地将A所有单元格移到B。然后从第2开始插入两个。 现在您知道了如何插入列和,是时候来了解如何删除它们了。...总结 由于Excel许多行业得到广泛使用,因此能够使用Python与Excel文件进行交互是一非常有用技能,比如帮妹纸处理运营数据。

4.5K20

利用pandas进行数据分析(二):索引与层次化索引

继上一节基本数据结构介绍之后,本节继续介绍操作和基本手段。一个最常用操作就是索引,如何根据分析目的对和进行索引访问得到数据是利用进行数据分析基本技能之一。...再来看索引和访问方式: 具有行列属性,所以索引上除了习惯性索引之外,按索引也是不错数据访问方式: 按列名进行多个索引时,传入是一个形态。...再看按索引方式: 所以索引也较为方便,特别注意一下方法即可,方法以前版本为,本身即为索引访问之意。除此之外,针对和索引方法还包括、以及等方法,具体大家可以试一试效果。...以上是的层次化索引方式,再来看看层次化索引: 好了,本次推送就给大家介绍到这里啦。关于数据索引和访问方法,除了对基本语法有所熟识之外,更需要在实际数据处理实践练习掌握。...参考资料: python for data analysis

68290

如何为机器学习索引,切片,调整 NumPy 数组

机器学习,数据被表示为数组。 具体 Python ,数据几乎被都被表示为 NumPy 数组。...(切片操作范围包含起始,但不包含结束) data[from:to] 让我们通过一些例子来说明切片用法。 一维切片 可以通过将索引留空,使用“:”来访问数组该维度所有数据。...这是一个切片操作,数据中一部分用于训练模型,其余部分将用于估计训练模型效果。 操作涉及通过索引中指定“:”来获取所有。训练数据集包括从开始一直到分隔行所有数据(不包含分隔行)。...reshape()函数接受一个指定数组形状参数。将一维数组重新整形为具有多行一二维数组情况下,作为参数元组,从 shape[0] 属性获取行数,并将数设定为1。...以下是一个清楚例子,其中每个序列拥有多个步长,每个步长对应其相应观察结果。 我们可以使用数组 shape 属性维数大小来指定样本()和(时间步长)数量,并将观察结果数量固定为1。

6K70

Spread for Windows Forms高级主题(1)---底层模型

如果你想创建你自己单元格类型或自定义用户选择单元格行为,同样可以通过使用模型来到达到目的。 开发一致性:如果你开发团队想在一些自定义风格和行为上保持一致,只需模型上做一些改变即可达到目的。...更完整理解产品:如果你使用控件多种特性,自定义控件最有效方法就是首先理解了对象所基于模型工作原理。 表单模型是一个集合,包含了所有对象基础设置以及某个特定表单设置。...甚至对于参数也同样如此,例如,只要表单未经过排序,数据模型GetValue和SetValue方法参数,与表单中行和参数索引就是相同。 并非所有Spread名字空间内容都包含在模型。...这些可以通过调用 IUnboundRowSupport.AddRowToDataSource函数转换成绑定,并且如果autoFill参数被设置为True,未绑定已绑定数据将以一条记录或一个元素被添加到数据源...设计它目的是为了实现快速创建一个很大模型(2亿*乘以2亿),并且能够以合理速度进行数据获取和设置,直到数据量变得很大(这种情况下,不管怎样你都将会耗尽内存)。

1.8K60

Python读取Excel文件指南

设置Excel文件路径 在这一步,我们用Path创建了一个实例,并且用变量xlsx_file引用,它包含了文件路径和文件名称。...补充:输出行和数量 再补充一个常用操作,就是确定Excel文件数量。 print(sheet.max_row, sheet.max_column) ?...创建了一个字典data,然后循环每一(iter_rows),并且仅仅获取该行值。...接下来使用条件语句,判断一下,如果是第一,就增加字典键,这其实是以键为名称。否则,将根据键(加Excel每一)向字典增加值。...读取多个Excel文件 下面,我们要用openpyxl模块读取多个xlsx文件。 导入模块 除了前面使用过两个模块之外,增加了一个glob。

2.4K20
领券