Spark MLlib基础入门_LS-Spark MLlib 机器学习算法与源码解析

什么是机器学习

机器学习可以看做是一门人工智能的科学,该领域的主要研究对象是人工智能。机器学习利用数据或以往的经验,以此优化计算机程序的性能标准。一种经常引用的英文定义是:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E。

MLlib

是Spark的机器学习(ML)库。其目标是使实际的机器学习可扩展和容易。在高层次上,它提供了如下工具:

ML算法:通用学习算法,如分类,回归,聚类和协同过滤

特征提取,特征提取,转换,降维和选择

管道:用于构建,评估和调整ML管道的工具

持久性:保存和加载算法,模型和管道

实用程序:线性代数,统计,数据处理等

什么是“Spark ML”?

依赖

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181207G1DCIF00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券