使用统计及其工具进行的传统预测分析与使用机器学习和深度学习的传统预测分析有什么区别?我们如何利用机器学习和深入学习来更好地建立预测模型?如何确定何时使用传统模型的边界,何时使用ML和DL?我们有很多有效的统计工具可用Stata,SPSS。它们更容易使用。同时,计算效率也很高。
谢谢
我无法找到一些令人满意和令人信服的答案与优点的谷歌。
发布于 2019-10-11 12:28:54
这个问题很难回答,因为ML是非常新的,在语义和学术上不像统计那样定义。
但是,通过将重点放在工具和方法以及目标和用例上,可以帮助我们看到一些不同的问题。
机器学习本身使用统计和数学算法来解决计算问题,特别是预测问题。传统的预测分析和工具也是如此。
随机森林模型不是本质上的传统或ML,我确实可以在SPSS和python中进行拟合。
那么,如果有什么区别呢:
首先,我们必须理解ML来自一个与经典统计分析不同的领域。在许多情况下,没有真正的区别,但一个CS学生可能称之为ML,而社会学家会称之为预测分析。
所以让我们来看看你的更具体的问题:
你可以的!事实上,STATA和SPSS本身就具有ML能力,可以用来建模现代ML算法。然而,对于ML领域的许多具体用例,STATA和SPSS缺乏计算能力和高效建模大数据集的能力。
并不是每一个问题和每种类型的数据都符合经典方法。例如,线性回归不能处理稀疏的数据和大量的NAs实例,如果我们使用大量的预测器(例如,一幅简单的图像可以转换为786个预测器),它不能预测非线性关系和崩溃的速度。
另外,ML方法只是通过使用最先进的技术来实现经典预测分析的更新。ML不同于传统的统计,主要是在使用上,我们有增量学习和自我优化等内容。
另外,请理解,经典的ML算法,如增强树、随机森林、朴素贝叶斯等,与深度学习有很大的不同。
发布于 2022-08-27 09:14:38
没有区别,机器学习只是统计,而是使用更现代的技术。统计学理论也适用于机器学习方法,它们也不例外。传统的统计往往更感兴趣的是推理(而不是预测),而不是机器学习,但是没有什么可以阻止您使用ML进行推理。
统计和机器学习之间的错误划分,而不是把它看作一个连续体,对两个社区都是不利的,因为它们彼此之间有很多东西需要学习。其主要原因是许多机器学习研究人员来自计算机科学、物理或工程背景(就我的例子来说,我现在教的是CS),只是不知道很多在统计学中已经众所周知的事情。幸运的是,有一些统计学家已经在ML中广为人知,这是有帮助的(例如Vapnik)。类似地,许多统计数据可以从(平均)更好地理解ML领域的计算中获益。
毫升往往在计算上要求更高,但没有真正的除法。
发布于 2019-09-11 11:01:17
这是个有趣的问题。根据我的理解,首先,如果说统计方法和机器学习是相同的(尽管它们看起来可能是一样的),那将是完全不正确的。
-统计在建立任何机器学习模型方面发挥着重要作用。但是机器学习的目的是根据训练集预测一些东西,并与测试集进行比较,而统计数据则帮助我们建立变量之间的关系。
--以线性回归的基本例子为例,似乎两者的统计方法和ML是相同的(这不是真的)。线性回归是一种统计方法,我们可以训练一个线性回归器,得到与统计回归模型相同的结果,目的是最小化数据点之间的平方误差。但是在ML中,您将将数据集划分为一个训练数据集,并从它构建模型,并在“测试集”上测试它,以查看它是如何工作的。但统计数据只关注变量之间的基本关系。虽然这可以用于你在问题中提到的预测分析,但是评估不会基于训练和测试结果,而是通过评估模型参数的重要性和稳健性。
-ML可用于建立有监督和无监督的模型,其中统计方法可以帮助您预测连续变量、回归和分类。毫升肯定会使用它,但对它有更客观的认识,而不仅仅是找到一段关系。
我希望这个答案能给你一些考虑。
https://datascience.stackexchange.com/questions/60020
复制相似问题