知识框架图如下
2.1 无监督学习
无监督学习和其他两种学习方法的主要区别在于无监督学习不需要提前知道标签数据集的类别标签。无监督学习算法使用场景通常为聚类和降维,如使用k-means聚类、系统聚类、密度聚类等算法进行数据聚类,使用主成分分析、流形降维等算法减少数据的特征数量。
2.2 半监督学习
半监督学习是一种介于有监督学习和无监督学习之间的学习算法,半监督学习的特点就是利用极少量的标签数据和大量的无标签数据进行学习,通过学习得到的经验对无标签的测试数据进行预测。
2.3 有监督学习
有监督学习的主要特性是使用大量有标签的训练数据来建立模型,以预测新的未知标签的数据。用来指导模型建立的标签可以是类别数据、连续数据等。如果标签是可以分类的,如0~9手写数字识别,则称这样的有监督学习为分类,如果标签是连续的数据,如身高、年龄、股票等,则称其为回归。
3.2 深度学习算法与传统机器学习算法的差异
深度学习算法和传统的机器学习算法相比,其最大的特点是端到端的学习,在进行学习之前无须进行特征提取等操作,可以通过深层的网络结构自动从原始数据中提取有用的特征。两者的学习过程的差异性如下图2所示。
从图中可以看出,在传统的机器学习过程中,需要更多的人为干预,尤其是在特征提取阶段,需要使用者具备足够的图像处理相关知识,才能够找到有效的数据特征,这给建模难度和预测效果增加了不确定性。相比之下,深度学习的方法由于具有端到端的特性,可以直接从原始数据中找到有用的信息,在预测时只使用对预测目标有用的内容,增强了其预测能力,而且不需要过多的人为干预,提高了预测结果的稳定性。
在众多深度学习框架当中,PyTorch是基于动态图计算的深度学习框架,也是非常年轻的深度学习框架之一,在2017年1月18日,PyTorch由Facebook发布,凭借着其易用性和生态完整性的特点,迅速引起学术界和工业界的关注,并且在2018年12月发布了稳定的1.0版本。
PyTorch主要有两大特点:一是可以非常好的使用Numpy,而且可以使用GPU加速;二是使用动态图计算使网络更加灵活,并且可以构建基于自动微分系统的深度神经网络。下表1给出了常见集中流行框架的比较。
表1 常用深度学习框架比较
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。