首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

70个NumPy练习:在Python下一举搞定机器学习矩阵运算

难度:1 问题:找出 iris sepallength平均值,中位数,标准差(第1) 答案: 29.如何标准化一个数组0到1之间?...难度:2 问题:找出数组iris_2d是否有缺失值。 答案: 38.如何在numpy数组中使用0替换所有缺失值? 难度:2 问题:在numpy数组中用0替换nan。...答案: 44.如何按排序二维数组? 难度:2 问题:根据sepallength对iris数据集进行排序。 答案: 45.如何在numpy数组中找到最频繁出现值?...难度:3 问题:针对给定二维numpy数组计算每行min-max。 答案: 58.如何在numpy数组中找到重复记录?...难度:4 问题:从给定一维数组arr,使用步长生成一个二维数组,窗口长度为4,步长为2,[[0,1,2,3],[2,3,4,5],[4,5,6,7]..]

20.6K42

NumPy能力大评估:这里有70道测试题

如何计算 NumPy 数组平均值、中位数和标准差? 难度:L1 问题:找出 iris sepallength(第一平均值、中位数和标准差。...如何在多维数组中找到一维第二最大值? 难度:L2 问题:在 species setosa petallength 中找到第二最大值。...如何在 NumPy 数组中找到最频繁出现值? 难度:L1 问题:在 iris 数据中找到 petallength(第三)中最频繁出现值。...如何找到第一个大于给定值位置? 难度:L2 问题:在 iris 数据 petalwidth(第四中找到第一个值大于 1.0 位置。...如何找到 NumPy 分组平均值? 难度:L3 问题:在 2 维 NumPy 数组类别中找到数值平均值

6.6K60
您找到你想要的搜索结果了吗?
是的
没有找到

NumPy能力大评估:这里有70道测试题

如何计算 NumPy 数组平均值、中位数和标准差? 难度:L1 问题:找出 iris sepallength(第一平均值、中位数和标准差。...如何在多维数组中找到一维第二最大值? 难度:L2 问题:在 species setosa petallength 中找到第二最大值。...如何在 NumPy 数组中找到最频繁出现值? 难度:L1 问题:在 iris 数据中找到 petallength(第三)中最频繁出现值。...如何找到第一个大于给定值位置? 难度:L2 问题:在 iris 数据 petalwidth(第四中找到第一个值大于 1.0 位置。...如何找到 NumPy 分组平均值? 难度:L3 问题:在 2 维 NumPy 数组类别中找到数值平均值

5.7K10

70道NumPy 测试题

如何计算 NumPy 数组平均值、中位数和标准差? 难度:L1 问题:找出 iris sepallength(第一平均值、中位数和标准差。...如何在多维数组中找到一维第二最大值? 难度:L2 问题:在 species setosa petallength 中找到第二最大值。...如何在 NumPy 数组中找到最频繁出现值? 难度:L1 问题:在 iris 数据中找到 petallength(第三)中最频繁出现值。...如何找到第一个大于给定值位置? 难度:L2 问题:在 iris 数据 petalwidth(第四中找到第一个值大于 1.0 位置。...如何找到 NumPy 分组平均值? 难度:L3 问题:在 2 维 NumPy 数组类别中找到数值平均值

6.3K10

Numpy常用random随机函数

本文将深入探讨NumPy中常用随机函数,为你揭示其背后原理以及如何在数据科学项目中充分利用这些功能。...写0都行,但是不能为空,为空就相当于没有用seed seed只限在这一台电脑,如果换台电脑值就变了 rand 返回[0,1]之间,从均匀分布中抽取样本 import numpy as np 一维 =...(x,y) plt.show() 结果如图所示: randn 返回标准正态分布随机数(浮点数)平均数0,方差1 randn生成一个从标准正态分布中得到随机标量,标准正态分布即N(0,1)。...函数曲线下68.268949%面积在平均值左右一个标准差范围内 4. 95.449974%面积在平均值左右两个标准差2σ范围内 5. 99.730020%面积在平均值左右三个标准差3σ范围...numpy as np 数组 = np.random.uniform(1,10,(2,3)) print(f'在1到10之间生成2行3共计6个随机数:\n{数组}') 结尾: 在数据科学世界里,随机性是不可避免

23610

盘点8个数据分析相关Python库(实例+代码)

导读:Python中常会用到一些专门库,NumPy、SciPy、Pandas和Matplotlib。...只看最外面一层,它相当于一个一维数组,该一维数组每个元素也是一维数组。那么,这个一维数组即二维数组。...了解了以上概念,接着来看NumPy数组中比较重要ndarray对象属性: ndarray.ndim:秩,即数量或维度数量 ndarray.shape:数组维度,如果存是矩阵,n×m矩阵则输出为...▲图2-14 正弦和余弦函数绘制 03 PySpark 在大数据应用场景中,当我们面对海量数据和复杂模型巨大计算需求时,单机环境已经难以承载,需要用到分布式计算环境来完成机器学习任务。...08 Keras Keras是一个用于处理神经网络高级库,可以运行在TensorFlow和Theano,现在发布新版本可以使用CNTK或MxNet作为后端。

2.1K20

PySpark 数据类型定义 StructType & StructField

虽然 PySpark数据中推断出模式,但有时我们可能需要定义自己列名和数据类型,本文解释了如何定义简单、嵌套和复杂模式。...PySpark StructType 和 StructField 类用于以编程方式指定 DataFrame schema并创建复杂嵌套结构、数组和映射。...其中,StructType 是 StructField 对象集合或列表。 DataFrame PySpark printSchema()方法将 StructType 显示为struct。...下面的示例演示了一个非常简单示例,说明如何在 DataFrame 创建 StructType 和 StructField 以及它与示例数据一起使用来支持它。...如果要对DataFrame数据进行一些检查,例如,DataFrame中是否存在或字段或数据类型;我们可以使用 SQL StructType 和 StructField 几个函数轻松地做到这一点

70230

NumPy入门指南(二) | Day2

沿0-行添加元素:') print (np.append(a, [[7,8,9]],axis = 0)) print ('\n') # 末尾添加一行数据,不改变结构 print ('沿1-添加元素...) 按照方向计算统计最大值与最小值之差 np.mean(arr,axis) 按照方向计算平均值 np.median(arr,axis) 按照方向计算中位数 np.percentile(arr...,p,axis) 按照方向统计数组百分位数;p取值0-100 np.average(arr,weights=wts,axis) 统计数组加权平均值;***默认每个元素权重相同,可以通过赋值数组...获取某一个数据最大值 ans02 = np.max(score,axis=0) print(ans02) #[82 88] # 3....求平均值 ans07 = np.mean(score) # 获取所有数据平均值 ans08 = np.mean(score,axis=0) # 获取一个平均值 print(ans07,ans08

3.1K20

seaborn介绍

其面向数据绘图功能对包含整个数据数据数组进行操作,并在内部执行必要语义映射和统计聚合,以生成信息图。 以下是这意味着什么一个例子: ?...此特定图显示了提示数据集中五个变量之间关系。三个是数字,两个是绝对。两个数值变量(total_bill和tip)确定每个点位置,第三个(size)确定每个点大小。..._images / introduction_19_0.png 或者,您可以在每个嵌套类别中显示唯一平均值及其置信区间: ?...这些函数称为“级”,因为它们绘制到单个matplotlib,否则不会影响图其余部分。...我们上面使用“fmri”数据集说明了整齐时间序列数据集如何在不同行中包含每个时间点: 学科 时间点 事件 区域 信号 0 S13 18 STIM 顶叶 -0.017552 1 S5 14 STIM

3.9K20

Python:Numpy详解

= False, ndmin = 0) NumPy 数据类型  numpy 支持数据类型比 Python 内置类型要多很多,基本可以和 C 语言数据类型对应,其中部分类型对应为 Python...axis=0,表示沿着第 0 进行操作,即对每一进行操作;axis=1,表示沿着第1进行操作,即对每一行进行操作。 ...如果提供了,则沿其计算。  算术平均值是沿元素总和除以元素数量。 ...numpy.average() numpy.average() 函数根据在另一个数组中给出各自权重计算数组中元素加权平均值。  该函数可以接受一个参数。 如果没有指定,则数组会被展开。 ...考虑数组[1,2,3,4]和相应权重[4,3,2,1],通过将相应元素乘积相加,并将和除以权重和,来计算加权平均值。  标准差 标准差是一组数据平均值分散程度一种度量。

3.5K00

挑战NumPy100关,全部搞定你就NumPy大师了 | 附答案

何在向量中找到最接近值(给定标量)?(★★☆) 51. 创建一个表示位置(x,y)和颜色(r,g,b)结构化数组(★★☆) 52....减去矩阵每行均值 (★★☆) 59. 如何按第n排序数组?(★★☆) 60. 如何判断一个二维数组里是否有空? (★★☆) 61....设有一个四维数组,如何一次获取最后两个上元素总和?(★★★) 68. 设有一个单一维度向量D, 如何计算D一个子集平均值 (该子集使用一个和D相同大小向量S来存子集元素索引?...如何使用数组滑动窗口计算平均值?(★★★) 76....(即,对数组重复N次采样, 每次采样更换部分元素, 然后计算每个样本平均值,最后计算均值百分位数) (★★★) 答案:https://aistudio.baidu.com/aistudio/projectDetail

4.7K30

数据科学篇| Numpy 库使用(一)

统计函数 如果你想要对一堆数据有更清晰认识,就需要对这些数据进行描述性统计分析,比如了解这些数据最大值、最小值、平均值,是否符合正态分布,方差、标准差多少等等。...你可以用 median() 和 mean() 求数组中位数、平均值,同样也可以求得在 axis=0 和 1 两个中位数、平均值。你可以自己练习下看看运行结果。...标准差是方差算术平方根。在数学意义,代表是一组数据平均值分散程度。所以 np.var(a)=1.25, np.std(a)=1.118033988749895。...axis=0 代表跨行(实际就是按),axis=1 代表跨(实际就是按行)。...排序结果,axis=0 代表是跨行(跨行就是按照),所以实际是对 [4, 2] [3, 4] [2, 1] 来进行排序,排序结果是 [2, 4] [3, 4] [1, 2],对应是每一排序结果

1.5K41

NumPy 笔记(超级全!收藏√)

= False, ndmin = 0) 参数说明:  名称描述object数组或嵌套数列dtype数组元素数据类型,可选copy对象是否需要复制,可选order创建数组样式,C为行方向,F为方向...内存块以行顺序(C样式)或顺序(FORTRAN或MatLab风格,即前述F样式)来保存元素  NumPy 数据类型  numpy 支持数据类型比 Python 内置类型要多很多,基本可以和 C...axis=0,表示沿着第 0 进行操作,即对每一进行操作;axis=1,表示沿着第1进行操作,即对每一行进行操作。 ...如果提供了,则沿其计算。  算术平均值是沿元素总和除以元素数量。 ...numpy.average()  numpy.average() 函数根据在另一个数组中给出各自权重计算数组中元素加权平均值。  该函数可以接受一个参数。 如果没有指定,则数组会被展开。

4.6K30

Numpy和pandas使用技巧

替换为90 print(b) 指定求和 np.sum(参数1: 数组; 参数2: axis=0/1,0表示1表示行) 指定最大值np.max(参数1: 数组; 参数2: axis...=0/1,0表示1表示行) 指定最小值np.min(参数1: 数组; 参数2: axis=0/1,0表示1表示行) 行或最大值索引np.argmax(参数1: 数组; 参数2: axis...=0/1,0表示1表示行) 行或最小值索引np.argmin(参数1: 数组; 参数2: axis=0/1,0表示1表示行) 指定平均值mean(参数1: 数组; 参数2: axis...=0/1,0表示1表示行) 指定方差 std (参数1: 数组; 参数2: axis=0/1,0表示1表示行) 5、数组与数运算(包括+-*/,是元素与元素运算) 矩阵库(Matrix...△ n.transpose()对换数组维度,矩阵转置 △ ndarray.T 与类似,用于矩阵转置 △ n.concatenate((a1, a2, ...), axis)沿指定连接同形数组

3.5K30

Pandas速查卡-Python数据科学

('1900/1/30', periods=df.shape[0]) 添加日期索引 查看/检查数据 df.head(n) 数据前n行 df.tail(n) 数据后n行 df.shape() 行数和数...) 所有唯一值和计数 选择 df[col] 返回一维数组col df[[col1, col2]] 作为新数据返回 s.iloc[0] 按位置选择 s.loc['index_one'] 按索引选择...df.iloc[0,:] 第一行 df.iloc[0,0] 第一第一个元素 数据清洗 df.columns = ['a','b','c'] 重命名列 pd.isnull() 检查空值,返回逻辑数组...(col1).agg(np.mean) 查找每个唯一col1组所有平均值 data.apply(np.mean) 在每个列上应用函数 data.apply(np.max,axis=1) 在每行应用一个函数...df.describe() 数值汇总统计信息 df.mean() 返回所有平均值 df.corr() 查找数据之间相关性 df.count() 计算每个数据非空值数量 df.max

9.2K80

如何使用Apache Spark MLlib预测电信客户流失

Spark MLLib是一个用于在海量数据执行机器学习和相关任务库。使用MLlib,可以对十亿个观测值进行机器学习模型拟合,可能只需要几行代码并利用数百台机器就能达到。...完整源代码和输出可在IPython笔记本中找到。该仓库还包含一个脚本,显示如何在CDH群集启动具有所需依赖关系IPython笔记本。...该数据集仅包含5,000个观察者,即订阅者,比Spark能够处理要小很多个数量级,但使用这种大小数据可以轻松地在笔记本电脑试用这些工具。...我们将使用MLlib来训练和评估一个可以预测用户是否可能流失随机森林模型。 监督机器学习模型开发和评估广泛流程如下所示: 流程从数据集开始,数据集由可能具有多种类型组成。...在我们例子中,我们会将输入数据中用字符串表示类型变量,intl_plan转化为数字,并index(索引)它们。 我们将会选择一个子集。

4K10

NumPy 1.26 中文官方指南(二)

NumPy 库包含多维数组和矩阵数据结构(你会在后面的章节中找到更多关于这个信息)。它提供ndarray,一个同构 n 维数组对象,并提供了一些有效操作方法。...这意味着如果你有一个看起来像这样 2D 数组: [[0., 0., 0.], [1., 1., 1.]] 您数组有 2 个。第一个长度为 2,第二个长度为 3。....npy 和 .npz 文件存储数据、形状、数据类型以及其他信息,以便在需重建数组情况下以一种允许正确检索数组方式。即使文件位于具有不同架构另一台机器,也能正确检索数组。...如果对 NumPy 不熟悉,可以从数组值中创建一个 Pandas 数据,然后使用 Pandas 将数据写入 CSV 文件。...NumPy 库包含多维数组和矩阵数据结构(你将在后面的部分中找到更多信息)。它提供了ndarray,一个同构 n 维数组对象,并提供了方法来高效地对其进行操作。

12710

Python数据分析之Numpy入门

重在于数值计算,也是大部分Python科学计算库基础,多用于在大型,多维数组执行数值运算。...[0,1)均匀分布随机数组 import numpy as np # 创建2行2取值范围为[0,1)数组 np.random.rand(2,2) ''' 输出: array([[0.99449146...产生正态分布(平均值0,标准差为1)样本值,类似于MATLAB接口 binomial 产生二项分布样本值 normal 产生正态(高斯)分布样本值 beta 产生Beta分布样本值 5、数组维度...,最大值 numpy.ptp():计算数组中元素最大值与最小值差(最大值-最小值) numpy.median()函数用于计算数组a中元素中位数(中值) 标准差std():标准差是一组数据平均值分散程度一种度量...也就是说,结果矩阵第m行与第n交叉位置那个值,等于第一个矩阵第m行与第二个矩阵第n,对应位置每个值乘积之和。

3.1K30

最全NumPy教程

:' print b 输出如下: 原始数组: [0 1 2 3 4 5 6 7] 修改后数组: [[0 1] [2 3] [4 5] [6 7]] numpy.ndarray.flat 该函数返回数组一维迭代器...numpy.median()函数用法如下面的程序所示。 numpy.mean() 算术平均值是沿元素总和除以元素数量。 numpy.mean()函数返回数组中元素算术平均值。...如果提供了,则沿其计算。 numpy.average() 加权平均值是由每个分量乘以反映其重要性因子得到平均值。...numpy.average()函数根据在另一个数组中给出各自权重计算数组中元素加权平均值。该函数可以接受一个参数。如果没有指定,则数组会被展开。...y对应值存储在另一个数组对象y中。这些值使用matplotlib软件包pyplot子模块plot()函数绘制。 图形由show()函数展示。 上面的代码应该产生以下输出: ?

4.1K10
领券