前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >资料推荐:Spark-mllib 源码分析之逻辑回归

资料推荐:Spark-mllib 源码分析之逻辑回归

作者头像
double
发布2018-12-29 11:13:36
8000
发布2018-12-29 11:13:36
举报
文章被收录于专栏:算法channel算法channel

Spark-mllib 源码分析之逻辑回归(Logistic Regression)

这篇博客详细的列出了逻辑回归用Spark计算时的原理:

https://blog.csdn.net/u011724402/article/details/79089257

Spark能够对Logistic Regression进行并行化,因此通过对Spark1.6.1源码的分析,文章解决下述问题:

Spark在哪里对LR算法进行了并行化?

如何并行化?

我们可以先猜测一下可能的并行化的部分是在哪里? 我们知道,如果使用一阶方法,通常使用SGD方法进行求解,涉及到梯度的计算,如果使用二阶方法,通常使用Newton方法进行求解,涉及到梯度和Hessian矩阵的计算,二阶的计算量较大,如果使用近似二阶的方法,通常是LBFGS,也涉及到梯度的计算。

因此,LR算法的计算量都在梯度的计算上。而梯度计算通常是可以分开同时计算的,因此我们大胆猜测一下Spark可能是在这里对LR进行并行计算的。

上述提到的二阶优化算法:Newton, L-BFGS等属于机器学习算法中经常碰到非线性优化问题。还有: Sparse Filtering 算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是 L-BFGS。可以参考以下博客了解这个算法的数学机理,

原文:https://blog.csdn.net/itplus/article/details/21897715

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员郭震zhenguo 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
GPU 云服务器
GPU 云服务器(Cloud GPU Service,GPU)是提供 GPU 算力的弹性计算服务,具有超强的并行计算能力,作为 IaaS 层的尖兵利器,服务于深度学习训练、科学计算、图形图像处理、视频编解码等场景。腾讯云随时提供触手可得的算力,有效缓解您的计算压力,提升业务效率与竞争力。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档