红色石头的机器学习之路

95 篇文章
38 人订阅

其他

红色石头

台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No

上节课,我们主要简述了机器学习的定义及其重要性,并用流程图的形式介绍了机器学习的整个过程:根据模型H,使用演算法A,在训练样本D上进行训练,得到最好的h,其对应...

28800
红色石头

台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

上一节课,我们主要探讨了当M的数值大小对机器学习的影响。如果M很大,那么就不能保证机器学习有很好的泛化能力,所以问题转换为验证M有限,即最好是按照多项式成长。然...

23500
红色石头

台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension

前几节课着重介绍了机器能够学习的条件并做了详细的推导和解释。机器能够学习必须满足两个条件: 假设空间H的Size M是有限的,即当N足够大的时候,那么对于假设空...

23700
红色石头

台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing

上节课,我们主要介绍了机器学习的可行性。首先,由NFL定理可知,机器学习貌似是不可行的。但是,随后引入了统计学知识,如果样本数据足够大,且hypothesis个...

23000
红色石头

台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error

上一节课,我们主要介绍了VC Dimension的概念。如果Hypotheses set的VC Dimension是有限的,且有足够多N的资料,同时能够找到一个...

27400
红色石头

Ubuntu 16.04 Spark单机环境搭建

说道大数据和机器学习,就少不了Spark.本文主要介绍在Linux下搭建单机环境的Spark的步骤。 安装Java SE 1、下载JAVA SE linux版本...

25800
红色石头

台湾大学林轩田机器学习基石课程学习笔记9 -- Linear Regression

上节课,我们主要介绍了在有noise的情况下,VC Bound理论仍然是成立的。同时,介绍了不同的error measure方法。本节课介绍机器学习最常见的一种...

23200
红色石头

台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

上节课我们主要讲了为了避免overfitting,可以使用regularization方法来解决。在之前的 上加上一个regularizer,生成 ,将其最...

26300
红色石头

台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression

上一节课,我们介绍了Linear Regression线性回归,以及用平方错误来寻找最佳的权重向量w,获得最好的线性预测。本节课将介绍Logistic Regr...

25000
红色石头

台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

上节课我们介绍了过拟合发生的原因:excessive power, stochastic/deterministic noise 和limited data。并...

25900
红色石头

台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

上一节课,我们介绍了Logistic Regression问题,建立cross-entropy error,并提出使用梯度下降算法gradient descnt...

22700
红色石头

台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

上节课我们主要介绍了非线性分类模型,通过非线性变换,将非线性模型映射到另一个空间,转换为线性模型,再来进行分类,分析了非线性变换可能会使计算复杂度增加。本节课介...

22800
红色石头

台湾大学林轩田机器学习技法课程学习笔记1 -- Linear Support Vector Machine

关于台湾大学林轩田老师的《机器学习基石》课程,我们已经总结了16节课的笔记。这里附上基石第一节课的博客地址: 台湾大学林轩田机器学习基石课程学习笔记1 – Th...

26800
红色石头

台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

上一节课,我们介绍了分类问题的三种线性模型,可以用来解决binary classification和multiclass classification问题。本节...

24400
红色石头

台湾大学林轩田机器学习技法课程学习笔记2 -- Dual Support Vector Machine

上节课我们主要介绍了线性支持向量机(Linear Support Vector Machine)。Linear SVM的目标是找出最“胖”的分割线进行正负类的分...

24900
红色石头

台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles

上节课我们讲了一个机器学习很重要的工具——Validation。我们将整个训练集分成两部分:DtrainD_{train}和DvalD_{val},一部分作为机...

22100
红色石头

台湾大学林轩田机器学习技法课程学习笔记3 -- Kernel Support Vector Machine

上节课我们主要介绍了SVM的对偶形式,即dual SVM。Dual SVM也是一个二次规划问题,可以用QP来进行求解。之所以要推导SVM的对偶形式是因为:首先,...

26900
红色石头

台湾大学林轩田机器学习技法课程学习笔记4 -- Soft-Margin Support Vector Machine

上节课我们主要介绍了Kernel SVM。先将特征转换和计算内积这两个步骤合并起来,简化计算、提高计算速度,再用Dual SVM的求解方法来解决。Kernel ...

24400
红色石头

台湾大学林轩田机器学习技法课程学习笔记5 -- Kernel Logistic Regression

上节课我们主要介绍了Soft-Margin SVM,即如果允许有分类错误的点存在,那么在原来的Hard-Margin SVM中添加新的惩罚因子C,修正原来的公式...

25900
红色石头

台湾大学林轩田机器学习技法课程学习笔记6 -- Support Vector Regression

上节课我们主要介绍了Kernel Logistic Regression,讨论如何把SVM的技巧应用在soft-binary classification上。方...

27100

扫码关注云+社区

领取腾讯云代金券