首页
学习
活动
专区
工具
TVP
发布

70个NumPy练习:在Python下一举搞定机器学习矩阵运算

翻译| 王柯凝

责编 | suisui

【导读】Numpy是一个开源的Python科学计算库,专用于存储和处理大型矩阵,相比Python自身的嵌套列表结构要高效很多,是数据分析、统计机器学习的必备工具。Numpy还是深度学习工具Keras、sk-learn的基础组件之一。

此处的70个numpy练习,可以作为你学习numpy基础之后的应用参考。练习难度分为4层:从1到4依次增大。

快来试试你的矩阵运算掌握到了什么程度:

1.导入模块numpy并以np作为别名,查看其版本

难度:1

问题:导入模块numpy并以np作为别名,打印版本号

答案:

你必须将模块numpy导入,以np命名,练习中的其他代码才能正常运行。

安装numpy,建议使用anaconda提供的安装方案。

anaconda链接:https://www.anaconda.com/download/

2.如何创建一个一维数组?

难度:1

问题:创建一个含有从0到9数字的一维数组,并输出

答案:

3.如何创建布尔数组?

难度:1

问题:创建一个3×3的所有值为True的numpy数组。

答案:

4.如何从1维数组中提取满足给定条件的元素?

难度:1

问题:从arr数组中提取所有奇数元素。

输入:

输出:

答案:

5.在numpy数组中,如何用另一个值替换满足条件的元素?

难度:1

问题:用-1替换arr数组中所有的奇数。

输入:

输出:

答案:

6.如何替换满足条件的元素而不影响原始数组?

难度:2

问题:将arr数组中的所有奇数替换为-1而不更改arr数组

输入:

输出:

答案:

7.如何重塑数组?

难度:1

问题:将1维数组转换为2行的2维数组

输入:

输出:

答案:

8.如何垂直堆叠两个数组?

难度:2

问题:垂直堆叠数组a和b。

输入:

输出:

答案:

9.如何水平堆叠两个数组?

难度:2

问题:水平堆叠数组a和b。

输入:

输出:

答案:

10.没有硬编码的情况下,在numpy中如何生成自定义序列?

难度:2

问题:创建以下模式而不使用硬编码。只能使用numpy函数和输入数组a。

输入:

输出:

答案:

11.如何获得两个python numpy数组之间的共同元素?

难度:2

问题:获取数组a和b之间的共同元素。

输入:

输出:

答案:

12.从一个数组中删除存在于另一个数组中的元素?

难度:2

问题:从数组a中删除在数组b中存在的所有元素。

输入:

输出:

答案:

13.获取两个数组元素匹配的索引号。

难度:2

问题:获取数组a和b的元素匹配的索引号

输入:

输出:

答案:

14.从numpy数组中提取给定范围内的所有数字?

难度:2

问题:从数组a提取5到10之间的所有元素。

输入:

输出:

答案:

15.如何将处理标量的python函数在numpy数组上运行?

难度:2

问题:将处理两个标量函数maxx在两个数组上运行。

输入:

输出:

答案:

16.如何交换2维numpy数组中的两个列?

难度:2

问题:交换数组arr中的第1列和第2列。

答案:

17.如何交换2维numpy数组中的两个行?

难度:2

问题:在数组arr中交换第1行和第2行。

答案:

18.如何反转2维数组的行?

难度:2

问题:反转二维数组arr的行。

答案:

19.如何反转二维数组的列?

难度:2

问题:颠倒二维数组arr的列。

答案:

20.如何创建一个包含5到10之间随机浮点数的二维数组?

难度:2

问题:创建一个5×3的二维数组,以包含5到10之间的随机浮点数。

答案:

21.打印python numpy数组并保留3位小数?

难度:1

问题:打印或显示numpy数组rand_arr,并三位小数。

输入:

答案:

22.如何使用科学记数法(如1e10)漂亮地打印一个numpy数组?

难度:1

问题:使用科学记数法(如1e10)漂亮的打印数组rand_arr

输入:

输出:

答案:

23.如何限制numpy数组输出中打印元素的数量?

难度:1

问题:将python numpy数组a中打印的元素数量限制为最多6个。

输入:

输出:

答案:

24.如何在不截断的情况下打印完整的numpy数组?

难度:1

问题:打印完整的numpy数组a,且不截断。

输入:

输出:

答案:

25.如何在python numpy中导入含有数字和文本的数据集,并保持的文本完整性?

难度:2

问题:导入iris数据集并保持文本不变。

答案:

由于我们想保留物种,一个文本字段,我已经把dtype设置为object。设置dtype = None,则会返回一维元组数组。

26.如何从一维元组数组中提取特定的列?

难度:2

问题:从上一个问题中导入的一维iris数组中提取species文本列。

输入:

答案:

27.如何将一维元组数组转换为二维numpy数组?

难度:2

问题:通过省略species文本字段将一维iris数组转换为二维数组iris_2d。

输入:

答案:

28.如何计算numpy数组的平均值,中位数,标准差?

难度:1

问题:找出 iris的 sepallength平均值,中位数,标准差(第1列)

答案:

29.如何标准化一个数组至0到1之间?

难度:2

问题:创建一个规范化形式的iris的sepallength,其值的范围在0和1之间,最小值为0,最大值为1。

输入:

答案:

30.如何计算softmax值?

难度:3

问题:计算sepallength的softmax分数。

答案:

31.如何找到一个numpy数组的百分位的值?

难度:1

问题:找到iris的sepallength第5位和第95百分位的值。

答案:

32.如何在数组中的随机位置插入一个值?

难度:2

问题:在iris_2d数据集的20个随机位插入np.nan值

答案:

33.如何找到numpy数组中缺失值的位置?

难度:2

问题:在iris_2d的sepallength(第1列)中查找缺失值的数量和位置。

答案:

34.如何根据两个或多个条件过滤一个numpy数组?

难度:3

问题:过滤具有petallength(第3列)> 1.5和sepallength(第1列)

答案:

35.如何从numpy数组中删除包含缺失值的行?

难度:3:

问题:选择没有nan值的iris_2d数组的行。

答案:

36.如何找到numpy数组的两列之间的相关性?

难度:2

问题:在iris_2d数组中查找SepalLength(第1列)和PetalLength(第3列)之间的关系。

答案:

37.如何查找给定数组是否有空值?

难度:2

问题:找出数组iris_2d是否有缺失的值。

答案:

38.如何在numpy数组中使用0替换所有缺失值?

难度:2

问题:在numpy数组中用0替换nan。

答案:

39.如何查找numpy数组中的唯一值的数量?

难度:2

问题:找出iris的species中的唯一值及其数量。

答案:

40.如何将数值转换为分类(文本)数组?

难度:2

问题:将iris_2d的花瓣长度(第3列)组成一个文本数组,如果花瓣长度为:

3-5则为'中'

'> = 5则为'大'

答案:

41.如何从numpy数组的现有列创建一个新的列?

难度:2

问题:在iris_2d中为volume创建一个新列,其中volume是(pi x petallength x sepal_length ^ 2)/ 3。

答案:

42.如何在numpy中进行概率抽样?

难度:3

问题:随机抽样iris的species,使setose是versicolor和virginica的数量的两倍。

答案:

方法2是首选,因为它创建了一个可用于采样二维表格数据的索引变量。

43.用另一个数组分组时,如何获得数组中第二大的元素值?

难度:2

问题:第二长的物种的最大价值是什么?

答案:

44.如何按列排序二维数组?

难度:2

问题:根据sepallength列对iris数据集进行排序。

答案:

45.如何在numpy数组中找到最频繁出现的值?

难度:1

问题:找到iris数据集中最常见的花瓣长度值(第3列)。

输入:

答案:

46.如何找到首次出现的值大于给定值的位置?

难度:2

问题:查找在iris数据集的第4列花瓣宽度中第一次出现值大于1.0的位置。

答案:

47.如何将所有大于给定值的值替换为给定的cutoff值?

难度:2

问题:从数组a中,替换大于30包括30且小于10到10的所有值。

输入:

答案:

48.如何从numpy数组中获取n个值的位置?

难度:2

问题:获取给定数组a中前5个最大值的位置。

答案:

49.如何计算数组中所有可能值的行数?

难度:4

问题:计算有唯一值的行数。

输入:

输出:

输出包含10列,表示1到10之间的数字。这些值是相应行中数字数量。

例如,单元(0,2)的值为2,这意味着数字3在第一行中恰好出现2次。

答案:

50.如何将多维数组转换为平坦的一维数组?

难度:2

问题:将array_of_arrays转换为平坦的线性一维数组。

输入:

输出:

答案:

51.如何为numpy中的数组生成独热编码?

难度:4

问题:计算独热编码。

输入:

输出:

答案:

52.如何创建按分类变量分组的行号?

难度:3

问题:创建由分类变量分组的行号。使用iris的species中的样品作为输入。

输入:

输出:

答案:

53.如何根据给定的分类变量创建分组ID?

难度:4

问题:根据给定的分类变量创建组ID。使用以下iris的species中样品作为输入。

输入:

输出:

答案:

54.如何使用numpy排列数组中的元素?

难度:2

问题:为给定的数字数组a排序。

输入:

输出:

答案:

55.如何使用numpy对多维数组中的元素进行排序?

难度:3

问题:创建一个与给定数字数组a相同形式的排列数组。

输入:

输出:

答案:

56.如何找到numpy二维数组每一行中的最大值?

难度:2

问题:计算给定数组中每一行的最大值。

答案:

57.如何计算numpy二维数组每行中的最小值?

难度:3

问题:针对给定的二维numpy数组计算每行的min-max。

答案:

58.如何在numpy数组中找到重复的记录?

难度:3

问题:在给定的numpy数组中找到重复的条目(从第2个起),并将它们标记为True。第一次出现应该是False。

输出:

答案:

59.如何找到numpy中的分组平均值?

难度:3

问题:查找由二维numpy数组中的分类列分组的数值列的平均值

输入:

输出:

答案:

60.如何将PIL图像转换为numpy数组?

难度:3

问题:从以下URL中导入图像并将其转换为numpy数组。

URL='https://upload.wikimedia.org/wikipedia/commons/8/8b/Denali_Mt_McKinley.jpg'

答案:

61.如何从一个numpy数组中删除所有缺失的值?

难度:2

问题:从一维numpy数组中删除所有nan值

输入:

输出:

答案:

62.如何计算两个数组之间的欧氏距离?

难度:3

问题:计算两个数组a和b之间的欧式距离。

输入:

答案:

63.如何在一维数组中找到所有局部最大值(或峰值)?

难度:4

问题:在一维numpy数组a中查找所有峰值。峰值是两侧较小值包围的点。

输入:

输出:

其中,2和5是峰值7和6的位置。

答案:

64.如何从二维数组中减去一维数组,其中一维数组的每个元素都从相应的行中减去?

难度:2

问题:从二维数组a_2d中减去一维数组b_1d,使得每个b_1d项从a_2d的相应行中减去。

输出:

答案:

65.如何找到数组中第n个重复项的索引

难度:2

问题:找出x中第1个重复5次的索引。

答案:

66.如何将numpy的datetime64对象转换为datetime的datetime对象?

难度:2

问题:将numpy的datetime64对象转换为datetime的datetime对象。

答案:

67.如何计算numpy数组的移动平均值?

难度:3

问题:计算给定一维数组窗口大小为3的移动平均值。

输入:

答案:

68.如何只给出起点,长度和步长来创建一个numpy数组序列?

难度:2

问题:创建一个长度为10的numpy数组,从5开始,在连续数字之间有一个3的步长。

答案:

69.如何填写不规则的numpy日期系列中的缺失日期?

难度:3

问题:给定一个不连续的日期数组。通过填补缺失的日期,使其成为连续的日期序列。

输入:

答案:

70.如何在给定一个一维数组中创建步长?

难度:4

问题:从给定的一维数组arr,使用步长生成一个二维数组,窗口长度为4,步长为2,如[[0,1,2,3],[2,3,4,5],[4,5,6,7]..]

输入:

输出:

答案:

原文地址:

https://www.machinelearningplus.com/101-numpy-exercises-python/

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180228B1EPFL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券