从机器学习学python(一)——numpy中的shape、tile、argsort (原创内容,转载请注明来源,谢谢) 注:本系列是我在学习机器学习过程中,遇到的python的没见过的语法或函数,在此进行学习。当前我主要学习的语言还是php和java,对于python,我目前的打算是遇到没见过的就学一下,暂时还没打算太深入学习这个语言。 一、shape shape返回的是数组的行、列数。 例如,a.shape()返回的是[2,3],表示a数组是2行3列的数组。a.shape[0]表示
花哨的索引探索花哨的索引组合索引Example:选择随机点利用花哨索引修改值数组排序Numpy中的快速排序:np.sort,np.argsort部分排序:分割
从机器学习学python(一)——numpy中的shape、tile、argsort
NumPy的全名为Numeric Python,是一个开源的Python科学计算库,它包括:
决策树算法的三个步骤:特征选择、决策树生成、决策树剪枝。其中特征选择要解决的核心问题就是:
本文主要演示numpy的argsort()函数的用法。这个函数的返回值是数组中的元素排序后的原下标,例如np.argsort([3,1,2])的返回结果是array([1, 2, 0], dtype=int64),表达的是意思是原来下标1对应的元素最小,然后是原来下标2的元素,最后是原来下标0的元素最大。 下面的小代码演示了该函数的用法,并在最后按数组中原来的位置顺序返回了最大的5个元素。 >>> import numpy as np >>> x = np.random.randint(1, 100, 10
对于一维数组或者列表,unique函数去除其中重复的元素,并按元素由大到小返回一个新的无元素重复的元组或者列表
<<机器学习实战>>一书非常注重实践,对每个算法的实现和使用示例都提供了python实现。在阅读代码的过程中,发现对NumPy有一定的了解有助于理解代码。特别是NumPy中的数组和矩阵,对于初次使用者而言,有点难以理解。下面就总结一下NumPy基础知识。
Syntax argsort(a, axis=-1, kind=’quicksort’, order=None) 返回 数组值 从小到大 的 索引值 。 实验代码 # coding: utf-8 import numpy as np # 返回 数组值 从小到大 的 索引值 x = np.array([[20, 10, 30, 40], [100, 200, 300, 400]]) print np.argsort(x) ---- ----
测试结果表明,运行了一千次,取有价值的7次,平均每次耗时324+/-5.7 μs(有多少次循环是由Jupyter Notebook自动决定的)
numpy.argsort(a, axis=-1, kind=’quicksort’, order=None) 功能: 将矩阵a按照axis排序,并返回排序后的下标 参数: a:输入矩阵, axis:需要排序的维度 返回值: 输出排序后的下标 import numpy as np x1 = np.array([3, 1, 2]) print(np.argsort(x1)) # [1 2 0] # axis=0 #沿着行向下(每列)的元素进行排序 x2 = np.array([[1, 5, 7], [3,
前者是引入numpy包中的所有类,后续代码中可以直接使用类的方法。后者是引入numpy包,如果需要使用同名类的方法,需要加类名。 Eg:
一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等 反过来转换则可以使用numpy.ndarray.tolist()函数,如a.tolist() 创建数组:np.zeros((2,3)),或者np.ones((2,3)),参数是一个元组分别表示行数和列数 对应元素相乘,a * b,得到一个新的矩阵,形状要一致;但是允许a是向量而b是矩阵,a的列数必须等于b的列数,a与每个行向量对应元素相乘得到行向量。 + - / 与 * 的运
一、数组方法 创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等 反过来转换则可以使用numpy.ndarray.tolist()函数,如a.tolist() 创建数组:np.zeros((2,3)),或者np.ones((2,3)),参数是一个元组分别表示行数和列数 对应元素相乘,a * b,得到一个新的矩阵,形状要一致;但是允许a是向量而b是矩阵,a的列数必须等于b的列数,a与每个行向量对应元素相乘得到行向量。 + - / 与
有监督学习--分类模型--K 近邻(kNN)0.引入依赖1.数据的加载和预处理2.核心算法实现3.测试4.自动化测试
import numpy as np evals=np.array([0,2,5,3,1]) evecs=np.array([[1,1],[2,3],[4,5],[7,7],[6,8]]) print evecs.shape # 默认按升序排列 sorted_indices = np.argsort(evals) # 取相反数 变为按降序排列 sorted_indices = np.argsort(-evals) print sorted_indices k=3 # 切片取特征向量列向量 topk_eve
NumPy是Python的一个扩展库,负责数组和矩阵运行。相较于传统Python,NumPy运行效率高,速度快,是利用Python处理数据必不可少的工具。
随着degree越大,均方误差肯定会越来越小,模型的效果肯定会更好。不过这样会使得模型的泛化能力变差,也就是对别的数据的预测效果会非常差。这也是我们用train_test_split划分数据集的原因。
在图片分类的中经常可以看到Top-1,Top-5等TopN准确率(或者时错误率)。
导读:在数据分析当中,Python用到最多的第三方库就是Numpy。本文内容是「大数据DT」内容合伙人王皓阅读学习《Python 3智能数据分析快速入门》过后的思考和补充,结合这本书一起学习,效果更佳。
领取专属 10元无门槛券
手把手带您无忧上云