首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NumPy 笔记(超级全!收藏√)

参数说明:  参数描述start起始值,默认为0stop终止值(不包含)step步长,默认为1dtype返回ndarray的数据类型,如果没有提供,则会使用输入数据的类型。...如果endpoint为true,该值包含于数列中num要生成的等步长的样本数量,默认为50endpoint该值为 true 时,数列中中包含stop值,反之不包含,默认是True。...如果在行位置使用省略号,它将返回包含行中元素的 ndarray。  NumPy 高级索引  NumPy 比一般的 Python 序列提供更多的索引方式。...函数返回的是数组值从小到大的索引值。 ...NumPy 线性代数  NumPy 提供了线性代数函数库 linalg,该库包含了线性代数所需的所有功能,可以看看下面的说明:  函数描述dot两个数组的点积,即元素对应相乘。

4.6K30

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

在 Pandas 中,索引可以设置为一个(或多个)唯一值,这就像在工作表中有一列用作行标识符一样。与大多数电子表格不同,这些索引值实际上可用于引用行。...索引值也是持久的,所以如果你对 DataFrame 中的行重新排序,特定行的标签不会改变。 5. 副本与就地操作 大多数 Pandas 操作返回 Series/DataFrame 的副本。...列的选择 在Excel电子表格中,您可以通过以下方式选择所需的列: 隐藏列; 删除列; 引用从一个工作表到另一个工作表的范围; 由于Excel电子表格列通常在标题行中命名,因此重命名列只需更改第一个单元格中的文本即可...如果找到子字符串,则该方法返回其位置。如果未找到,则返回 -1。请记住,Python 索引是从零开始的。 tips["sex"].str.find("ale") 结果如下: 3....获取第一个字符: =MID(A2,1,1) 使用 Pandas,您可以使用 [] 表示法按位置位置从字符串中提取子字符串。请记住,Python 索引是从零开始的。

19.6K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    在Python中实现Excel的VLOOKUP、HLOOKUP、XLOOKUP函数功能

    尽管表2包含相同客户的多个条目,但出于演示目的,我们仅使用第一个条目的值。例如,对于Harry,我们想带入其购买的“Kill la Kill”。...“lookup_value” return_array:这是源数据框架中的一列,我们希望从该列返回值 if_not_found:如果未找到”lookup_value”,将返回的值 在随后的行中: lookup_array...==lookup_value返回一个布尔索引,pandas使用该索引筛选结果。...return_array.loc[]返回一个带有基于上述布尔索引的值的pandas系列,只返回True值。...最后,因为我们只想保留第一个值(如果有多个条目),所以我们通过从返回的列表中指定[0]来选择第一个元素。 让我们测试一下这个函数,似乎工作正常!

    7.4K11

    Pandas 数据分析技巧与诀窍

    拥有一个简单的工具或库来生成一个包含多个表的大型数据库,其中充满了您自己选择的数据,这不是很棒吗?幸运的是,有一个库提供了这样一个服务—— pydbgen。 pydbgen到底是什么?...请注意,所有内容都以字符串/文本的形式返回。第一个参数是条目数,第二个参数是为其生成假数据的字段/属性。...2 数据帧操作 在本节中,我将展示一些关于Pandas数据帧的常见问题的提示。 注意:有些方法不直接修改数据帧,而是返回所需的数据帧。...要直接更改数据帧而不返回所需的数据帧,可以添加inplace=true作为参数。 出于解释的目的,我将把数据框架称为“数据”——您可以随意命名它。...当然,如果愿意的话,您可以让它们保持原样,但是如果您想添加值来代替空值,您必须首先声明哪些值将被放入哪些属性中(对于其空值)。 所以这里我们有两列,分别称为“标签”和“难度”。

    11.5K40

    Pandas 25 式

    操控缺失值 把字符串分割为多列 把 Series 里的列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合的输出结果 选择行与列 重塑多重索引 Series 创建透视表...使用 Python 内置的 glob 更方便。 ? 把文件名规则传递给 glob(),这里包括通配符,即可返回包含所有合规文件名的列表。...用多个文件建立 DataFrame ~ 按列 上个技巧按行合并数据集,但是如果多个文件包含不同的列,该怎么办? 本例将 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 列。 ?...把 Series 里的列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两列,第二列包含的是 Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何将这两列显示的小数位数标准化? 用以下代码让这两列只显示 2 位小数。 ? 第一个参数是要设置的选项名称,第二个参数是 Python 的字符串格式。

    8.4K00

    PostgreSQL 教程

    集合运算 主题 描述 UNION 将多个查询的结果集合并为一个结果集。 INTERSECT 组合两个或多个查询的结果集并返回一个结果集,该结果集的行都出现在两个结果集中。...EXCEPT 返回第一个查询中未出现在第二个查询的输出中的行。 第 6 节. 分组集、多维分组和汇总 主题 描述 分组集 在报告中生成多个分组集。...CUBE 定义多个分组集,其中包括所有可能的维度组合。 ROLLUP 生成包含总计和小计的报告。 第 7 节. 子查询 主题 描述 子查询 编写一个嵌套在另一个查询中的查询。...ANY 通过将某个值与子查询返回的一组值进行比较来检索数据。 ALL 通过将值与子查询返回的值列表进行比较来查询数据。 EXISTS 检查子查询返回的行是否存在。 第 8 节....COALESCE 返回第一个非空参数。您可以使用它将NULL替换为一个默认值。 NULLIF 如果第一个参数等于第二个参数则返回NULL。

    59210

    数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

    操控缺失值 把字符串分割为多列 把 Series 里的列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合的输出结果 选择行与列 重塑多重索引 Series 创建透视表...使用 Python 内置的 glob 更方便。 ? 把文件名规则传递给 glob(),这里包括通配符,即可返回包含所有合规文件名的列表。...用多个文件建立 DataFrame ~ 按列 上个技巧按行合并数据集,但是如果多个文件包含不同的列,该怎么办? 本例将 drinks 数据集分为了两个 CSV 文件,每个文件都包含 3 列。 ?...把 Series 里的列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两列,第二列包含的是 Python 整数列表。...年龄列有 1 位小数,票价列有 4 位小数,如何将这两列显示的小数位数标准化? 用以下代码让这两列只显示 2 位小数。 ? 第一个参数是要设置的选项名称,第二个参数是 Python 的字符串格式。

    7.2K20

    【说站】python查找计算函数的整理

    python查找计算函数的整理 1、len计算字符串的字符数量。 一个汉字或一个字母算一个字符。...# a.find()  # 从0开始找对应索引;如果有多个,则找从左数的第一个 msg = 'The day is a sunny day' result1 = msg.find('d') print(...result1) result2 = msg.find('d',5,-1)   # 从第五个索引开始到最后一个索引之间,'d'出现的第一个索引 print(result2) result3 = msg.find...('d',5,9)   # 从第五个索引开始到第九个索引之间(包含5不包含9),'d'出现的第一个索引 print(result3)   输出: 4 19 -1 3、rfind功能与find相同,不同之处在于从右边开始寻找相应的索引...'da')  # 找多个字符,会返回找到的'd'的索引 print(result1) print(result2)   输出: 19 19 4、index/rindex返回所需值的索引。

    41520

    数据分析利器--Pandas

    (参考:Python 科学计算 – Numpy) Series: Series是一个一维的类似的数组对象,包含一个数组的数据(任何NumPy的数据类型)和一个与数组关联的数据标签,被叫做 索引。...Datarame有行和列的索引;它可以被看作是一个Series的字典(每个Series共享一个索引)。...在底层,数据是作为一个或多个二维数组存储的,而不是列表,字典,或其它一维的数组集合。因为DataFrame在内部把数据存储为一个二维数组的格式,因此你可以采用分层索引以表格格式来表示高维的数据。...skip_footer 文件末尾需要忽略的行数 verbose 输出各种解析输出的信息 encoding 文件编码 squeeze 如果解析的数据只包含一列,则返回一个Series thousands...(): 将无效值替换成为有效值 具体用法参照:处理无效值 4、Pandas常用函数 函数 用法 DataFrame.duplicated() DataFrame的duplicated方法返回一个布尔型

    3.7K30

    如何使用Python找出矩阵中最大值的位置

    实际工程中发现,Python做for循环非常缓慢,因此转换成numpy再找效率高很多。numpy中有两种方式可以找最大值(最小值同理)的位置。1....其中,np.random.randint函数的第一个参数是生成随机整数的下界(包含),第二个参数是上界(不包含),第三个参数size指定了数组的大小。...np.max(a)返回数组a中的最大值,然后np.where(a == np.max(a))返回一个包含最大值位置索引的元组。这个元组被解包给了变量r和c,其中r表示行索引,c表示列索引。...接着我们使用divmod(m, a.shape[1])来计算最大值索引m对应的行索引和列索引。divmod函数将除法和取模运算结合起来,接受两个参数,第一个参数是被除数,第二个参数是除数。...在我们这里,被除数是m,除数是a.shape[1],也就是二维数组a的列数。函数返回一个元组,包含商和余数。这里将商(整除结果)保存在变量r中,余数(模数)保存在变量c中。

    1.3K10

    变量、简单数据类型、列表

    列表: 列表让你能够在一个地方存储成组的信息,其中可以只包含几个元素,也可以包含数百万个元素。列表由一些列按特定顺序排列的元素组成。...索引:在Python中,第一个列表元素的索引为0,而不是1。Python为访问最后一个列表元素提供了一种特殊语法。...这种约定也适用于其他负数索引,例如,索引 -2返回倒数第二列表元素,索引-3返回倒数第三列元素,以此类推。修改列表元素:修改列表元素的语法与访问列表的语法类似。...处理列表的部分元素,Python称之为切片。要创建切片,可指定要使用的第一个元素的索引和最后一个元素的索引加1。与函数range( )一样,Python在到达你指定的第二个索引前面的元素停止。...复制列表:要复制列表,可创建一个包含整个列表的切片,方法是同时省略起始索引和终止索引([ : ])。这让Python创建一个始于第一个元素,终止于最后一个元素的切片,即复制整个列表。

    1.6K20

    Python进阶之NumPy快速入门(四)

    函数格式如下: numpy.arg 函数返回的是数组值从小到大的索引值。...运行结果: [[3 7] [1 9]] [[3 1] [9 7]] [[3 7] [1 9]] numpy.argsort() 函数返回的是数组值从小到大的索引值。...其中数组a中最大元素是90,总索引为7。当axis=0的时候,从左到右每一列最大数字对应的索引值分别为[1,2,0]。当axis=1的时候,从上到下每一行最大数字对应的索引值分别为[2,0,1]。...一个有六个元素是非零的,运行结果的形式是先给定行索引,然后是列索引。然后我们再把索引作为数组b的索引就可以挑选出数组b中所有非零元素,返回形式为一维数组。...1, 2, 2, 2], dtype=int64), array([1, 2, 0, 1, 2], dtype=int64)) [4 5 6 7 8] 线性代数 NumPy 提供了线性代数函数库,该库包含了线性代数所需的所有功能

    85530

    12 个 Python 程序员面试必备问题与答案

    负索引是什么? Python中的序列索引可以是正也可以是负。如果是正索引,0是序列中的第一个索引,1是第二个索引。如果是负索引,(-1)是最后一个索引而(-2)是倒数第二个索引。 5....分区有四类: RANGE 分区:基于属于一个给定连续区间的列值,把多行分配给分区。 LIST 分区:类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。...HASH分区:基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL 中有效的、产生非负整数值的任何表达式。...KEY 分区:类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL 服务器提供其自身的哈希函数。必须有一列或多列包含整数值。 8. 如何对查询命令进行优化? a....使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用。 e. 很多时候可考虑用 exists 代替 in f.

    66220

    python数据分析——数据分类汇总与统计

    第一个阶段,pandas对象中的数据会根据你所提供的一个或多个键被拆分(split)为多组。拆分操作是在对象的特定轴上执行的。...关键技术:任何被当做分组键的函数都会在各个索引值上被调用一次,其返回值就会被用作分组名称。...df['data1'].groupby(df['key1']).describe() 关键技术: size跟count的区别是: size计数时包含NaN值,而count不包含NaN值。...具体的办法是向agg传入一个从列名映射到函数的字典: 只有将多个函数应用到至少一列时,DataFrame才会拥有层次化的列 2.3.返回不含行索引的聚合数据 到目前为止,所有例中的聚合数据都有由唯一的分组键组成的索引...【例12】采用参数as_index返回不含行索引的聚合数据。 关键技术:可以向groupby传入as_index=False以禁用索引功能。

    83910

    Python与Excel协同应用初学者指南

    避免在名称或值字段标题中使用空格或由多个单词组成的名称之间有间隙或空格。...考虑使用Python的标准PET-8格式,例如:下划线、破折号、驼峰式大小写,文本每一部分的第一个字母大写,或者偏向使用短名字而不是长名字或句子。 尽量避免使用包含特殊字符的名称,例如?...通过这种方式,可以将包含数据的工作表添加到现有工作簿中,该工作簿中可能有许多工作表:可以使用ExcelWriter将多个不同的数据框架保存到一个包含多个工作表的工作簿中。...这将在提取单元格值方面提供很大的灵活性,而无需太多硬编码。让我们打印出第2列中包含值的行的值。如果那些特定的单元格是空的,那么只是获取None。...另一个for循环,每行遍历工作表中的所有列;为该行中的每一列填写一个值。

    17.4K20

    MySQL EXPLAIN,数据库调优的秘密通道

    如果查询包含多个子查询或联合查询,MySQL 会为每个子查询分配一个唯一的 id。 如果 id 相同,表示这些查询是并行执行的。...在某些情况下,不是索引的全部部分都会被使用。 ref: 显示索引的哪一列或常量被用于查找值。 rows: 估计为了找到所需的行而要检查的行数。这是一个估计值,不一定完全准确。...filtered: 表示返回结果的行占开始查找行的百分比。 Extra: 包含不适合在其他列中显示但对执行计划非常重要的额外信息。常见值有: Using where: 使用 WHERE 过滤。...使用覆盖索引 假设我们现在在 name 和 salary 列上创建了一个复合索引,并且我们想要查询这两个列的值。...Extra: Using index 表示只通过索引树读取数据(覆盖索引),因为查询的列 name 和 salary 都包含在索引中。

    4910

    TutorialsPoint NumPy 教程

    当索引的元素个数就是目标ndarray的维度时,会变得相当直接。 以下示例获取了ndarray对象中每一行指定列的一个元素。 因此,行索引包含所有行号,列索引指定要选择的元素。...可以跟踪 C 顺序的索引 2. f_index 可以跟踪 Fortran 顺序的索引 3. multi-index 每次迭代可以跟踪一种索引类型 4. external_loop 给出的值是具有多个值的一维数组...2. hsplit 将一个数组水平分割为多个子数组(按列) 3. vsplit 将一个数组竖直分割为多个子数组(按行) numpy.split 该函数沿特定的轴将数组分割为子数组。...该函数能够返回一个元组,包含去重数组和相关索引的数组。 索引的性质取决于函数调用中返回参数的类型。...舍入函数 numpy.around() 这个函数返回四舍五入到所需精度的值。 该函数接受以下参数。

    3.9K10
    领券