大家好,又见面了,我是你们的朋友全栈君。
机器学习框架意味着一个能够整合包括机器学习算法在内的所有机器学习的系统或方法,使用户最有效的使用它们。具体来讲,这包括数据表示与处理的方法、表示和建立预测模型的方法、评价和使用建模结果的方法。
在所有可用的机器学习框架中,着重于迭代算法和交互处理的框架被公认为是最好的,因为这些特性可以促进复杂预测模型估计和研究人员与数据间的良好交互。当下,优秀的机器学习框架依旧需要包含大数据功能、大量快速处理能力,以及容错能力。优秀的机器学习框架通常包括大量的机器学习算法和可用的统计检验。
相比较于Spark,Hadoop MR对于一些无法放入内存或者由于有经验的研究人员追求更好的可用性的这类大数据来说更加高效。虽然,Spark由于采用了内存处理技术,拥有卓越的交互计算性能和较高的性价比,但Hadoop MR是一个更加成熟的平台,其就是为解决批处理问题应运而生的。此外,由于具有更多的支持项目、工具和云服务,Hadoop MR目前拥有更加庞大的生态系统。
总之,一个机器学习框架包括如何处理数据,分析方法,分析计算,结果评估和结果利用。 一个好的机器学习框架需要处理大规模数据提取和数据预处理,还需要处理快速计算、大规模和高速的交互式评估,以及简单易懂的结果解释和部署。
这里简单介绍下部分主流框架:
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/149705.html原文链接:https://javaforall.cn