如何使用Scala Breeze和LBFGS编写Logistic回归？ - 腾讯云开发者社区

文章/答案/技术大牛

发布

【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

Angel 项目简介 Angel是一个基于参数服务器（Parameter Server）理念开发的高性能分布式机器学习框架，在其之上，用户能轻松开发适用于高维度模型的机器学习算法，并使用基于PS Service...操作，可以自定义复杂的psFunc 提供多种同步控制机制（BSP/SSP/ASP） 2、开发运行语言支持：系统基于Scala和Java开发，用户也可以自由选择部署方便：可以直接在Yarn社区版本中运行...，为其他分布式计算平台提供PS服务基于PS-Service，不需要修改Spark核心代码，直接开发Spark-on-Angel算法，该模式无缝支持Breeze数值运算库 4、算法库集成Logistic...Regression，SVM，KMeans，LDA，MF，GBDT等机器学习算法多种优化方法，包括ADMM，OWLQN， LBFGS和GD 支持多种损失函数、评估指标，包含L1、L2正则项 5、算法优化...LDA采用了F+LDA算法用于加速采样的速度，同时利用流式参数获取的方法减少网络参数获取的延迟 GBDT使用两阶段树分裂算法，将部分计算转移到PS，减少网络传输，提升速度官方开源地址： https

1K7 0

Spark 机器学习的加速器：Spark on Angel

4.2 强 --- 功能强大，支持breeze库 breeze库是scala实现的面向机器学习的数值运算库。Spark MLlib的大部分数值优化算法都是通过调用breeze来完成的。...如下所示，Spark和Spark on Angel两种实现都是通过调用breeze.optimize.LBFGS实现的。...Spark的L-BFGS实现 import breeze.optimize.LBFGS val lbfgs = new LBFGS[DenseVector](maxIter, m, tol) val...变成 BreezePSVector import breeze.optimize.LBFGS val lbfgs = new LBFGS[BreezePSVector](maxIter, m,...该实验代码请前往Github SparseLRWithX.scala .

4.3K4 1

您找到你想要的搜索结果了吗？

是的

没有找到

“轻易强快”的Spark on Angel，大数据处理爽到爆！

强 --- 功能强大，支持breeze库 breeze库（GitHub地址：https://github.com/scalanlp/breeze）是scala实现的面向机器学习的数值运算库。...Spark MLlib的大部分数值优化算法都是通过调用breeze来完成的。如下所示，Spark和Spark on Angel两种实现都是通过调用 breeze.optimize.LBFGS 实现的。...BreezePSVector是指Angel PS上的Vector，该Vector实现了breeze NumericOps下的方法，如常用的 dot，scale，axpy，add等运算，因此在LBFGS[...如下代码所示，LBFGS在Spark和Spark on Angel上的实现，二者代码的整体思路是一样的，主要的区别是梯度向量的Aggregate和模型 $w$ 的pull/push。...快 --- 性能强劲我们分别实现了SGD、LBFGS、OWLQN三种优化方法的LR，并在Spark和Spark on Angel上做了实验对比。

1.2K7 0

sklearn 实现 logistic 算法

引言前面两篇文章中，我们介绍了 logistic 回归的原理和实现： Logistic 回归数学公式推导梯度上升算法与随机梯度上升算法本文，我们来看看如何使用 sklearn 来进行 logistic...回归呢。...Sklearn 的 logistic 回归 sklearn 通过 sklearn.linear_model.LogisticRegression 实现了逻辑斯蒂回归算法。...newton-cg、sag 和 lbfgs 算法只能使用 l2 正则化。 ‘elasticnet’ 只适用于 saga 算法。具体算法由 solver 参数指定。...’, ’sag’, ’saga’ liblinear — 开源的liblinear库实现，内部使用了坐标轴下降法来迭代优化损失函数，适用于小数据集 lbfgs — 拟牛顿法，利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数

7112 0

腾讯Angel 1.0正式版发布：基于Java与Scala的机器学习高性能计算平台

Java 和 Scala 语言开发的面向机器学习的高性能分布式计算框架。...Angel 基于 Java 和 Scala 开发，能在社区的 Yarn 上直接调度运行，并基于 PS Service，支持 Spark on Angel，未来将会支持图计算和深度学习框架集成。...算法库集成 Logistic Regression，SVM，KMeans，LDA，MF，GBDT 等机器学习算法多种优化方法，包括 ADMM，OWLQN，LBFGS 和 GD 支持多种损失函数...Angel-PS 架构上的程序，开始之前，你最好掌握以下能力：会编写简单的 Scala 或者 Java 代码掌握向量、矩阵和张量的基础知识，了解其定义和基础计算。...回归（Logistic Regression）矩阵分解（Matrix Factorization）支持向量机（SVM） K-均值（KMeans） GBDT LDA Spark on Angel Optimizer

9685 0

【开源工具】国外程序员整理的机器学习资源大全

Regression—回归分析算法包（如线性回归和逻辑回归）。 Local Regression —局部回归，非常平滑！...使用Python编写，可以在Mac、Windows以及Ubuntu上运行。...Numba —Python的低级虚拟机JIT编译器，Cython and NumPy的开发者编写，供科学计算使用 NetworkX —为复杂网络使用的高效软件。...Scala 自然语言处理 ScalaNLP—机器学习和数值计算库的套装 Breeze —Scala用的数值处理库 Chalk—自然语言处理库。...bioscala —Scala语言可用的生物信息学程序库 BIDMach—机器学习CPU和GPU加速库。

1.9K9 1

【机器学习笔记】：逻辑回归实战练习（二）

使用sklearn构建逻辑回归模型可视化逻辑回归分类效果评估逻辑回归模型 ▍两个变量的简单数据集上一篇，我们已经推导出了逻辑回归参数求解的迭代公式，自己通过numpy和scipy的使用就可以很容易地实现一个逻辑回归模型...下面将对逻辑回归参数进行总结分类和解释。 ▍Logistic模型参数解释正则化参数：属于该分类的参数有 C 和 penalty。...penalty：提供我们正则化的类型，L1范数正则化和L2范数正则化（在线性回归中相当于lasso回归和岭回归），默认情况下使用L2正则化，但此参数也需要与solver类型配合使用，因为一些solver...▍Logistic模型参数调试下面我们手动调节几个参数，来感受一下这些参数是如何影响最终结果的。...那么如何找到这样的搭配呢？除了凭借经验手动调参以外，还可以使用sklearn的一个工具。

7712 0

快速入门Python机器学习（33）

文末有惊喜 12.6 神经网络回归算法 12.6.1类、参数、属性和方法类 class sklearn.neural_network.MLPRegressor(hidden_layer_sizes=...activation {'identity', 'logistic', 'tanh', 'relu'}, default='relu'隐藏层的激活功能。...'identity'，无操作激活，用于实现线性瓶颈，返回f(x) = x'logistic'，即logistic sigmoid函数，返回f(x) = 1 / (1 + exp(-x))。'...'adam'指的是由金马、迪德里克和吉米巴提出的基于梯度的随机优化器注意:就训练时间和验证分数而言，默认解算器'adam'在相对较大的数据集(有数千个或更多的训练样本)上工作得相当好。...t_ int 数学上等于n iters*X.shape[0]，表示时间步长，由优化器的学习率调度器使用。方法 fit(X, y) 将模型拟合到数据矩阵X和目标y。

3371 0

SoftMax回归详解

深度学习 deep learning logistic回归 logistic regression 截距项 intercept term 二元分类...引言本篇文章，我们介绍Softmax回归模型，该模型是logistic回归模型在多分类问题上的推广，在多分类问题中，类标签 y 可以取两个以上的值。...此时的 Hessian矩阵变为可逆矩阵，并且因为是凸函数，梯度下降法和 LBFGS等算法可以保证收敛到全局最优解。为了使用优化算法，我们需要求得这个新函数 J(θ) 的导数，如下： ?...6. softmax回归与logistics回归的关系当类别数 k=2 时，softmax 回归退化为 logistic 回归。这表明 softmax 回归是 logistic回归的一般形式。...此时的 Hessian矩阵变为可逆矩阵，并且因为是凸函数，梯度下降法和 LBFGS等算法可以保证收敛到全局最优解。为了使用优化算法，我们需要求得这个新函数 J(θ) 的导数，如下： ? ?

1.6K8 0

资料推荐：Spark-mllib 源码分析之逻辑回归

Spark-mllib 源码分析之逻辑回归(Logistic Regression) 这篇博客详细的列出了逻辑回归用Spark计算时的原理： https://blog.csdn.net/u011724402.../article/details/79089257 Spark能够对Logistic Regression进行并行化，因此通过对Spark1.6.1源码的分析，文章解决下述问题：问 Spark在哪里对...问如何并行化？我们可以先猜测一下可能的并行化的部分是在哪里？...我们知道，如果使用一阶方法，通常使用SGD方法进行求解，涉及到梯度的计算，如果使用二阶方法，通常使用Newton方法进行求解，涉及到梯度和Hessian矩阵的计算，二阶的计算量较大，如果使用近似二阶的方法...，通常是LBFGS，也涉及到梯度的计算。

8263 0

scikit-learn 逻辑回归类库使用小结

之前在逻辑回归原理小结这篇文章中，对逻辑回归的原理做了小结。这里接着对scikit-learn中逻辑回归类库的我的使用经验做一个总结。重点讲述调参中要注意的事项。 1....LogisticRegression， LogisticRegressionCV 和logistic_regression_path。...logistic_regression_path类则比较特殊，它拟合数据后，不能直接来做预测，只能为拟合数据选择合适逻辑回归的系数和正则化系数。主要是用在模型选择的时候。...也意味着如果我们需要相对精确的多元逻辑回归不能使用L1正则化了。　　　　具体OvR和MvM有什么不同我们下一节讲。 4....但是如果选择了multinomial,则只能选择newton-cg, lbfgs和sag了。 5.

1.1K5 0

Logistic回归实战篇之预测病马死亡率（三）

作者：崔家华编辑：李文臣四、使用Sklearn构建Logistic回归分类器开始新一轮的征程，让我们看下Sklearn的Logistic回归分类器！...，比如Logistic回归、Lasso回归、贝叶斯脊回归等，可见需要学习的东西还有很多很多。...参数说明如下： penalty：惩罚项，str类型，可选参数为l1和l2，默认为l2。用于指定惩罚项中使用的规范。newton-cg、sag和lbfgs求解算法只支持L2规范。...五、总结 1、Logistic回归的优缺点优点：实现简单，易于理解和实现；计算代价不高，速度很快，存储资源低。缺点：容易欠拟合，分类精度可能不高。...本系列篇章： Logistic回归实战篇之预测病马死亡率(一) Logistic回归实战篇之预测病马死亡率(二) Logistic回归实战篇之预测病马死亡率(三)

2K9 0

【技术分享】Spark机器学习的加速器：Spark on Angel

24.png 4.2 强 --- 功能强大，支持breeze库 breeze库是scala实现的面向机器学习的数值运算库。Spark MLlib的大部分数值优化算法都是通过调用breeze来完成的。...如下所示，Spark和Spark on Angel两种实现都是通过调用breeze.optimize.LBFGS实现的。...BreezePSVector是指Angel PS上的Vector，该Vector实现了breeze NumericOps下的方法，如常用的 dot，scale，axpy，add等运算，因此在LBFGS[...如下代码所示，LBFGS在Spark和Spark on Angel上的实现，二者代码的整体思路是一样的，主要的区别是梯度向量的Aggregate和模型 w 的pull/push。...该实验代码请前往Github SparseLRWithX.scala .

1.1K3 0

【机器学习笔记】：逻辑回归实战练习（二）

9042 0

除了 Python ，这些语言写的机器学习项目也很牛

Kaldi —— 语音识别工具包 https://github.com/kaldi-asr/kaldi Kaldi 是用 C ++ 编写的语言识别工具包，旨在供语音识别研究人员使用，且易于修改和扩展。...、回归、特征选择和结构分析。...和 Scala 编写的分布式神经网络库，集成了 Hadoop 和 Spark ，设计用于运行在分布式 GPU 和 CPU 上的商业环境。...➤ 10、Scala Breeze —— 数值处理库 https://github.com/scalanlp/breeze Breeze 是一个数值处理库，是 ScalaNLP 的核心库，包括线性代数、...ScalaNLP 包含 Breeze 和 Epic（一个高性能的统计解析器和结构化预测库）。

1.6K8 1

Scala里面如何使用break和continue

好多从Java转过来使用Scala的人会发现Scala里面竟然没有break和contine关键字，其实不是这样的，Scala里面推荐使用函数式的风格解决break和contine的功能，而不是一个关键字...如何在Scala中实现break和continue呢？...._ 从上面的例子中，我们能看到scala中使用的是函数块的风格来解决break和continue的问题，相比java的一个关键词搞定的写法，有点复杂，但符合函数式编程的风格。

1.4K3 0

史上最全！国外程序员整理的机器学习资源

Regression—回归分析算法包（如线性回归和逻辑回归）。 Local Regression —局部回归，非常平滑！...使用 Python 编写，可以在 Mac、Windows 以及 Ubuntu 上运行。...Scala 自然语言处理 ScalaNLP—机器学习和数值计算库的套装 Breeze —Scala 用的数值处理库 Chalk—自然语言处理库。...和 Storm 进行 Streaming MapReduce Algebird —Scala 的抽象代数工具 xerial —Scala 的数据管理工具 simmer —化简你的数据，进行代数聚合的...bioscala —Scala 语言可用的生物信息学程序库 BIDMach—机器学习 CPU 和 GPU 加速库。

2.2K10 0

Python3《机器学习实战》学习笔记（七）：Logistic回归实战篇之预测病马死亡率

三从疝气病症状预测病马的死亡率实战背景准备数据使用Python构建Logistic回归分类器四使用Sklearn构建Logistic回归分类器 LogisticRegression 编写代码...下面将首先介绍如何处理数据集中的数据缺失问题，然后再利用Logistic回归和随机梯度上升算法来预测病马的生死。 2 准备数据数据中的缺失值是一个非常棘手的问题，很多文献都致力于解决这个问题。...3 使用Python构建Logistic回归分类器在使用Sklearn构建Logistic回归分类器之前，我们先用自己写的改进的随机梯度上升算法进行预测，先热热身。...---- 四使用Sklearn构建Logistic回归分类器开始新一轮的征程，让我们看下Sklearn的Logistic回归分类器！...参数说明如下： penalty：惩罚项，str类型，可选参数为l1和l2，默认为l2。用于指定惩罚项中使用的规范。newton-cg、sag和lbfgs求解算法只支持L2规范。

8782 0

R语言如何和何时使用glmnet岭回归

p=3373 这里向您展示如何在R中使用glmnet包进行岭回归（使用L2正则化的线性回归），并使用模拟来演示其相对于普通最小二乘回归的优势。...岭回归当回归模型的参数被学习时，岭回归使用L2正则化来加权/惩罚残差。在线性回归的背景下，它可以与普通最小二乘法（OLS）进行比较。OLS定义了计算参数估计值（截距和斜率）的函数。...当训练数据的极端变化很大时尤其如此，当样本大小较低和/或特征的数量相对于观察次数较多时这趋向于发生。下面是我创建的一个模拟实验，用于比较岭回归和OLS在训练和测试数据上的预测准确性。...对于不同数量的训练数据（对多个特征进行平均），两种模型对训练和测试数据的预测效果如何？ ? 根据假设，OLS更适合训练数据，但Ridge回归更好地归纳为新的测试数据。...对于不同的相对特征比例（平均数量的训练数据），两种模型对训练和测试数据的预测效果如何？ ? 再一次地，OLS在训练数据上表现稍好，但Ridge在测试数据上更好。

5.2K1 0

如何使用Vim编写和调试Python代码

如何使用Vim编写和调试Python代码 1.部署环境要想在Ubuntu下使用VIM编写和调试Python代码，请下安装如下的链接进行配置： https://segmentfault.com/a/1190000003962806...使用set更改shell特性时，符号"+"和"-"的作用分别是打开和关闭指定的模式。set命令不能够定义新的shell变量。...许多命令的输出是以空格分隔的值，如果要使用其中的某个数据域，使用 set 非常有效。 #!...call调用函数 vim的配置信息 Vim把它所有的配置存在两个相当简单的地方：一个简明的~/.vimrc文件和全是纯文本文件的~/.vim目录。...这样可以在不同模式下使用同一个按键产生不同的效果。 noremap 和 map 的区别是，被映射的序列不会再被递归映射。 nnoremap是什么意思？

4K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

【开源公告】腾讯第三代高性能计算平台Angel 正式全面开源

Spark 机器学习的加速器：Spark on Angel

“轻易强快”的Spark on Angel，大数据处理爽到爆！

sklearn 实现 logistic 算法

腾讯Angel 1.0正式版发布：基于Java与Scala的机器学习高性能计算平台

【开源工具】国外程序员整理的机器学习资源大全

【机器学习笔记】：逻辑回归实战练习（二）

快速入门Python机器学习（33）

SoftMax回归详解

资料推荐：Spark-mllib 源码分析之逻辑回归

scikit-learn 逻辑回归类库使用小结

Logistic回归实战篇之预测病马死亡率（三）

【技术分享】Spark机器学习的加速器：Spark on Angel

【机器学习笔记】：逻辑回归实战练习（二）

除了 Python ，这些语言写的机器学习项目也很牛

Scala里面如何使用break和continue

史上最全！国外程序员整理的机器学习资源

Python3《机器学习实战》学习笔记（七）：Logistic回归实战篇之预测病马死亡率

R语言如何和何时使用glmnet岭回归

如何使用Vim编写和调试Python代码

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐