首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python 全栈 191 问(附答案)

作为程序员,电脑里、书架上,一定少不了 Python 资料和课程。免费电子书,花钱买课,实体书籍... 现在想一下,真正从中学到多少: 正则会用了吗? __getitem__用过?...callable对象怎么实现? 还在觉得yield可有可无? 还觉得装饰器与没有毛关系? NumPy 多维数组reshape 成这个形、那个形,怎么做到啊?...(1) 是元组?(1,) 是什么类型? 元组增删元素? 怎么判断 list 内有无重复元素? 列表如何反转? 如何找出列表中所有重复元素? 如何使用列表创建出斐波那契数列?...说说知道创建字典几种方法? 字典视图是什么? 所有对象都能作为字典? 集合内元素可以为任意类型? 什么是可哈希类型?举几个例子 求集合并集、差集、交集、子集方法?...NumPy 实现统计学描述性变量:求平均值、标准差、方差、最大求和、累乘、累和。

4.2K20

Pandas图鉴(三):DataFrames

即使从未听说过NumPy,Pandas可以让你在几乎没有编程背景情况下轻松拿捏数据分析问题。...这种模式可以在第一种情况下启用(NumPy向量dict),通过设置copy=False。但这简单操作可能在不经意间把它变成一个副本。...把这些列当作独立变量来操作,例如,df.population /= 10**6,人口以百万为单位存储,下面的命令创建了一个新列,称为 "density",由现有列中计算得出: 此外,甚至可以对来自不同...例如,插入一列总是在原表进行,而插入一行总是会产生一个新DataFrame,如下图所示: 删除列需要注意,除了del df['D']起作用,而del df.D不能起作用(在Python层面的限制...默认情况下,Pandas会对任何可远程求和东西进行求和,所以必须缩小选择范围,如下图: 注意,当对单列求和时,会得到一个Series而不是一个DataFrame。

32720
您找到你想要的搜索结果了吗?
是的
没有找到

只需七步就能掌握Python数据准备

数据清洗(data cleaning)可以与数据整理(data wrangling)工具交互执行,可以通过脚本进行批处理。 数据整理(data wrangling)被维基百科定义为:   1....• 将数据集中类似观察聚类分组,通过将数据折叠成几个小数据点,可以更容易地识别行为模式。 要更全面地了解为什么EDA很重要,请阅读Chloe文章。...• 如何处理您数据中缺失:第一部分,雅各布•约瑟夫 • 如何处理您数据中缺失:第二部分,雅各布•约瑟夫 步骤4:处理异常值(Dealing with Outliers) 找到异常?...• 使用百分位数删除Pandas DataFrame中异常值 Stack Overflow 步骤5:处理不平衡数据(Dealing with Imbalanced Data)   如果另一个强大数据集缺少缺失和异常值是由两个类组成...Stack Overflow • 什么时候应该记录一个分配(数字)日志

1.6K71

不用写代码就能学用Pandas,适合新老程序员神器Bamboolib

Bamboolib 开发者们提出了一个解决问题好办法 —— 给 Pandas 增加一个 GUI。 我们希望大家“不用写任何代码可以学习和使用 Pandas”,可以办到?...从上面的图中,我们可以看到,随着手机内存容量增加,价格范围在不断地扩大。我们还看到内存变量加权 F1 分数为 0.676。可以对数据集里面的每个变量都执行这个操作,并尝试分析这些数据。...如果有的话,这里有一个 Pandas 小窍门儿。 通过 Bamboolib,要做事情变得非常容易,并且不会被复杂代码搞得晕头转向。...通过使用简单 GUI,可以进行删除、筛选、排序、联合、分组、视图、拆分(大多数情况下,希望对数据集执行操作)等操作。 例如,这里我将删除目标列中多个缺失(如果有的话)。...当然,还可以添加多个条件。 ? 最好功能就是,Bamboolib 提供了代码。如下所示,用于删除缺失代码将会自动添加到单元格中。

1.5K20

Python科学计算之Pandas

把这些列名变短会让工作更加轻松: ? 有一点需要注意是,在这里我故意让所有列标签都没有空格和横线。后面将会看到,如果我们这样命名变量Pandas会将它们存成什么类型。...在Pandas中,一个条目等同于一行,所以我们可以通过len方法获取数据行数,即条目数。 ? 这将给你一个整数告诉数据行数。在我数据集中,我有33行。...好,我们可以Pandas中做同样事。 ? 上述代码将范围一个布尔dataframe,其中,如果9、10月降雨量低于1000毫米,则对应布尔为‘True’,反之,则为’False’。...例如,如果看我画出我数据图表,可以看到1995年英国可能发生了干旱。 ? 发现英国降雨量明显低于日本,然而人们却说英国雨下得很多!...但是我希望通过介绍,可以开始进行真正数据清理与挖掘工作了。 像往常一样,我非常希望你尽快开始尝试Pandas。找一两个喜欢数据集,开一瓶啤酒,坐下来,然后开始探索数据吧。

2.9K00

手把手教你用Pandas透视表处理数据(附学习资料)

顺便说一下,知道微软为PivotTable(透视表)注册了商标?其实以前我不知道。不用说,下面我将讨论透视表并不是PivotTable。...作为一个额外福利,我创建了一个总结pivot_table简单备忘单。可以在本文最后找到它,我希望它能够对有所帮助。如果它帮到了,请告诉我。...pd.pivot_table(df,index=["Manager","Rep"],values=["Price"]) “Price”列会自动计算数据平均值,但是我们可以对该列元素进行计数或求和。...记住,变量“columns(列)”是可选,它提供一种额外方法来分割所关心实际。然而,聚合函数aggfunc最后是被应用到了变量“values”中所列举项目上。...,为了对选择不同执行不同函数,可以向aggfunc传递一个字典。

3.1K50

python科学计算之Pandas使用(三)

关于csv文件 csv 是一种通用、相对简单文件格式,在表格类型数据中用途很广泛,很多关系型数据库都支持这种类型文件导入导出,并且 excel 这种常用数据表格和 csv 文件之间转换。...逗号分隔(Comma-Separated Values,CSV,有时称为字符分隔,因为分隔字符可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。...用 Pandas 读取 如果对上面的结果都有点不满意的话,那么看看 Pandas 效果: ? 看了这样结果,还不感觉惊讶还不喜欢上 Pandas ?这是多么精妙显示。它是什么?...如果有足够好奇心来研究这个名叫 DataFrame 对象,可以这样: ? 一个一个浏览一下,通过名字可以直到那个方法或者属性大概,然后就可以根据喜好和需要,试一试: ?...可以说,当你已经掌握了通过 dir() 和 help() 查看对象方法和属性时,就已经掌握了 pandas 用法,其实何止 pandas,其它对象都是如此。

1.4K10

《爱上潘大师》系列-与Series初次相见

《爱上潘大师》系列,是Python 高阶部分第二个系列 上一个系列说过,NumPy 是Pandas 基础,如果Pandas 有些问题不是很理解,就去上一个系列看看基础,想必会对有所帮助 上一个系列我根据文章主要内容重新列了标题...Series 由一组数据以及一组与之相关数据标签组成,其中数据可以是NumPy类型各种数据,数据标签我们称之为索引。...调用它 上面例子中,通过一维数组创建一个Series 数据,其中索引在左边,在右边。 即左边【0、1、2、3】是数据索引,右边【1、2、4、5】是数据。...= pd.Series(dict_data) # 输出 a 1 b 2 c 4 d 5 dtype: int64 可以通过字典和索引结合方式创建 Series 这个时候,...如果我们知道索引,当然可以通过索引访问数据 # 通过索引访问数据 series_data2['new_c'] # 输出 4 # 通过多个索引访问数据 series_data2[['new_a', '

52720

面对2000笔金额记录凑数最优问题,学了python竟然束手无策?

相信我,就算只有100多笔数据,它求解速度会难以满足。我可不希望 Excel 卡半天时间。 今天,我就来教大家如何使用 python or tools 解决凑数最优问题。...定义了一组变量 定义了目标函数 定义了一个约束条件,每个 x 只能取0或1 我们目标是,通过修改变量 x ,使得目标函数最大化。但这些定义就足够了吗?我们来测试一下。...行1:实例化 model ,我们将使用它进行变量创建,定义约束等一系列操作。 行4:使用 model 创建一列变量。注意,在创建变量时候,分别指定了最小、最大、以及变量名字。...行1:创建一个求解器 行3:调用求解器函数,传入之前构造 model 行5:其返回可以表示是否找到最优解 可以看到目标函数结果与指定一致。 但我们需要知道,目标函数结果是来自于哪些记录。...可以看到,总共26个组别,其中一些组别被抽取了多于10笔记录 现在可以考虑第二个需求。我们希望在每个组别抽取数量不能多于10笔,这种情况还能找到凑数结果? 回到之前定义约束代码。

1.3K10

通俗易懂 Python 教程

给定一个 DataFrame, shift() 函数可被用来创建数据列副本,然后 push forward (NaN 组成行添加到前面)或者 pull back(NaN 组成行添加到末尾)。...我们通过在顶端插入新一行,用一个时间步(time step)把所有的观察降档(shift down)。由于新一行不含数据,可以用 NaN 来表示“无数据”。 Shift 函数完成该任务。...Shift 操作器可以接受一个负整数值。这起到了通过在末尾插入新行,来拉起观察作用。下面是例子: 运行该例子显示出,新一列最后一个是一个 NaN 。...函数返回一个单个: return: 序列 Pandas DataFrame 转为监督学习。 新数据集创建为一个 DataFrame,每一列通过变量字数和时间步命名。...这使得开发者设计各种各样时间步序列类型预测问题。 当 DataFrame 被返回,可以决定怎么把它行,分为监督学习 X 和 y 部分。这里可完全按照想法。

1.5K50

通俗易懂 Python 教程

给定一个 DataFrame, shift() 函数可被用来创建数据列副本,然后 push forward (NaN 组成行添加到前面)或者 pull back(NaN 组成行添加到末尾)。...我们通过在顶端插入新一行,用一个时间步(time step)把所有的观察降档(shift down)。由于新一行不含数据,可以用 NaN 来表示 “无数据”。 Shift 函数完成该任务。...Shift 操作器可以接受一个负整数值。这起到了通过在末尾插入新行,来拉起观察作用。下面是例子: 运行该例子显示出,新一列最后一个是一个 NaN 。...函数返回一个单个: return: 序列 Pandas DataFrame 转为监督学习。 新数据集创建为一个 DataFrame,每一列通过变量字数和时间步命名。...这使得开发者设计各种各样时间步序列类型预测问题。 当 DataFrame 被返回,可以决定怎么把它行,分为监督学习 X 和 y 部分。这里可完全按照想法。

2.4K70

开启数据科学之旅

Pandas:很重要库,比如加载数据集、创建DataFrame对象,Pandas在分析和预测方面能够实现你想做任何事情。...我们可以用tail()查看最后5条记录(默认是5)。 下面是head()输出结果: 到现在,已经从DataFrame数据集中得到了前5条记录了。...我们能够设置标签,xlable意味着x轴,ylable意味着y轴,titile用于设置图示标题。 通过图示,我们能够从数据中得到一些信息,推论出以下各项? 年轻人更多在甲板上。...本文中变量用二级制形式表示,即只取两个数,“0”或者“1”,这种二进制方式可以代表不同输出结果,比如通过/挂科、赢/输、生/死,或者健康/生病等。...如果因变量是超过两个值得分类数据,可以用多元Logistic回归。如果多个类型是有顺序可以用序数Logistic回归。在经济领域,Logisti回归是一种反应定性问题或者离散问题模型示例。

57110

用Python能进军金融领域?这有一份股票交易策略开发指南

交易策略通常通过回测来验证:利用历史数据,利用你已开发交易策略重新构建那些过去应该发生交易。借此,获知策略有效性如何,可以以此作为新策略投入市场前优化和提升起始点。...以及,除此之外,还能通过它获取 Jupyter Notebook 和 Spyder IDE。 听起来像是工作量很大,对?...您可以Pandas帮助下轻松执行这项算术运算;只需将aapl数据Close列减去Open列。或者说,aapl.Close减去aapl.Open。...取而代之是,将在下面看到如何开始创建一个可以生产订单并管理损益投资组合: 首先,创建一个initial_capital 变量来设置初始资本和新DataFrame positions。...但是,可以看到,很容易犯错,而且这可能不是每次使用最万无一失选项:因为需要从头开始构建大部分组成部分,即使已经利用Pandas来获取结果。

2.9K40

多了解Python一点点,为什么我们需要定义变量

前言 定义变量还需要讲解? 能说出来,以下代码定义了多少个变量: 如果答案是2个,那么希望看完本文后会有不一样回答。...本文不是讲解如何定义变量不打算按照市面上教程逻辑讲解,希望我能让变量带来一些新理解。 ---- 为什么变量这么重要 如下代码生成了一个列表: 执行过程中,这里面到底发生了什么事情?...但是赋是什么样?那是对象 id 行4:所以,此时通过 s2 对 列表操作,做事情是"对象区" 上列表对象。...其中,如果是默认参数,里面还会保留其默认(实际上保存只是默认对象 id) 如下自定义函数: 在一次完整代码运行期间(就是上述整个代码从上到下执行一次),由于函数对象只创建了一次,他默认参数...导入后其实我们可以随意使用新变量: ---- 答疑 以下代码定义了多少个变量? 5个变量。分别是 pd、numpy、load_data、a、b 以下代码会报错? 会。

89040

pandas透视表分析

会用Excel做透视表? 2 pandas如何做透视表分析?使用什么函数?函数参数如何选择和设置? 1 透视表介绍 数据透视表是一个用来总结和展示数据强大工具。...变量集数据类型以及类型转换 代码 # 查看变量集数据类型 df.dtypes # 变量Status类型转换和设置要检视顺序 df['Status'] = df['Status'].astype('category...计算逻辑默认是对数值型变量做平均,通过参数aggfunc设置所要聚合计算逻辑,比方说求和,最小,最大等。...参数aggfunc可以接受一个聚合计算列表,例如:求和与计数 代码 pd.pivot_table(df, index=['Manager', 'Rep'], values=['Price'], aggfunc...5 总结 pandas通过pivot_table()函数可以实现透视表,通过设置函数里面的不同参数以达成不同目标。

2.1K20

用Python将时间序列转换为监督学习问题

这篇教程里,将学到如何把单变量、多变量时间序列问题转为机器学习算法能解决监督学习问题。...给定一个 DataFrame, shift() 函数可被用来创建数据列副本,然后 push forward (NaN 组成行添加到前面)或者 pull back(NaN 组成行添加到末尾)。...由于新一行不含数据,可以用 NaN 来表示“无数据”。 Shift 函数完成该任务。我们可以把处理过列插入到原始序列旁边。...函数返回一个单个: return: 序列 Pandas DataFrame 转为监督学习。 新数据集创建为一个 DataFrame,每一列通过变量字数和时间步命名。...这使得开发者设计各种各样时间步序列类型预测问题。 当 DataFrame 被返回,可以决定怎么把它行,分为监督学习 X 和 y 部分。这里可完全按照想法。

3.8K20

Python数据分析笔记——Numpy、Pandas

PandasPandas数据结构 1、Series (1)概念: Series是一种类似于一维数组对象,它由一组数据以及一组与之相关数据标签(即索引)组成。...可以创建Series时候为直接创建索引。 b、通过字典形式来创建Series。 (3)获取Series中 通过索引方式选取Series中单个或一组。...(3)获取DataFrame(行或列) 通过查找columns获取对应列。(下面两种方法) 通过索引字段ix查找相应行。 (4)对列进行赋值处理。 对某一列可以赋一个标量值可以是一组。...Pandas基本功能 1、重新索引 Pandas对象一个方法就是重新索引(reindex),其作用是创建一个新索引,pandas对象将按这个新索引进行排序。对于不存在索引,引入缺失。...8、计数 用于计算一个Series中各出现次数。 9、层次化索引 层次化索引是pandas一个重要功能,它作用是使在一个轴上拥有两个或多个索引级别。

6.4K80

Python数学建模算法与应用 - 常用Python命令及程序注解

生成器会依次生成由索引和对应元素组成元组。通过使用 enumerate() 函数,可以在循环遍历列表或其他可迭代对象时,同时获取元素索引和,这样可以更方便地进行处理或记录。...¶ 是的,可以通过适当导入语句来导入不同路径下 Python 模块。...这个函数可以是一个普通命名函数,可以是一个匿名函数(lambda 函数)。...通过这些求和操作,可以计算数组中元素总和以及沿指定轴进行求和结果。使用方法 sum() 可以直接对数组进行求和,而函数 np.sum() 则可以指定轴进行求和,并可以保持结果维度。...计算范数方法可以通过数学公式进行计算,可以使用相关函数或库进行计算,如NumPy中numpy.linalg.norm函数可以用来计算向量或矩阵范数。

1.1K30

懂Excel轻松入门Python数据分析包pandas(29):轻松做出筛选控件

Excel 操作便利性在于只需要鼠标点击就可以完成操作,这对于查看数据是非常方便。 难道我们用 Python 就不能做到?本文将结合一些工具,使得 pandas 处理过程变得灵活动态。...,我们通过最上方选择不同年份,下方数据表马上显示此年份总销量 top 10 地区数据 用 Python 快速简单做出这种效果?...widgets 库用于完成各种小组件,他生成网页内容,不仅仅在 Jupyter Notebook 使用,但本文只讲解在 Jupyter Notebook 上使用 ---- 修饰 pandas...处理 本文需要导入库是这些: 首先使用 pandas 得到透视表结果,这非常简单: 行3,4:为了突出可以变化东西,这里定义2个变量 通过修改2个变量,我们得到对应结果数据 但是这远远不够...10种选择,界面同样可以看到下拉框 现在,我们只需要简单从下拉框选择条件,下方结果会马上刷新,这与 Excel 中透视表一模一样 不过,大家都知道 Excel 中还能根据透视表制作透视图,这里我们同样可以制作出动态变化图表

90520

最全面的Pandas教程!没有之一!

DataFrames Pandas DataFrame(数据表)是一种 2 维数据结构,数据以表格形式存储,分成若干行和列。通过 DataFrame,很方便地处理数据。...可以从一个包含许多数组列表中创建多级索引(调用 MultiIndex.from_arrays ),可以用一个包含许多元组数组(调用 MultiIndex.from_tuples )或者是用一对可迭代对象集合...假如你不确定表中某个列名是否含有空格之类字符,可以通过 .columns 来获取属性,以查看具体列名。 ?...Pandas 数据透视表自动帮你对数据进行分组、切片、筛选、排序、计数、求和或取平均值,并将结果直观地显示出来。比如,这里有个关于动物统计表: ?...可以Pandas 官方文档 中找到更多数据透视表详细用法和例子。 于是,我们按上面的语法,给这个动物统计表创建一个数据透视表: ? 或者可以直接调用 df 对象方法: ?

25.7K63
领券