学习
实践
活动
专区
工具
TVP
写文章

统计学习】写给在学习统计的学弟学妹

对于我所处的这个统计学院(素以经济统计强势著称),从收集数据角度来说,国民经济核算与经济社会统计也是两门比较重要的课程,搞经济统计不能不对于经济数据的来龙去脉了如指掌,要不然统计指标都是从何计算而来有何意义都搞不清楚 也要先思考一下,不要轻易删除,一个穷山村中冒出一个大富翁的可能性不一定就是0,在离群点中反而有可能隐藏对我们有启发的信息(比如一位同学的学分绩太高以至于成了“野值”,我们就不能把他/她从班里“删除”,而应该借鉴学习经验 推断统计中,根据是否需要对分布作假设又可以分为参数统计和非参数统计,后者出现的年代要晚,因此在理论和应用方面可能不如前者,二者的比较又足以写一大篇文章,此处作罢,但是无论如何,从参数统计到非参数统计,你的统计思维必将经历一个重大转变 稍微再谈谈我所见到的统计学发展趋势:一方面是学科结合的趋势,单单只会一门统计学恐已难以立足,统计学的发展动力,越来越多地来自于其它各个学科,若不是这些学科给统计学“出难题”,统计学的发展可能早已经停止了 学习方面说这样几点吧: 首先,不要指望你的老师会教给你所有的知识,同时也要明白你所学的知识是很不全面的。大学与高中不一样,这里不是一个纯粹的教学的地方,更多地是思想碰撞交流的地方。

33990

统计学习概述

【注】学习笔记参考自《统计学习方法第二版》——李航。 1. 定义 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也称为统计机器学习。 特点 统计学习以计算机及网络为平台,是建立在计算机及网络上的。 统计学习以数据为研究对象,是数据驱动的学科。 统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。 统计学习的目的是对数据进行预测与分析的。 统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析。 核方法:使用核函数表示和学习非线性模型的一种机器学习方法。 4. 研究 统计学习研究一般包括统计学习方法、统计学习理论及统计学习应用三个方面。 统计学习方法的研究旨在开发新的学习方法。 统计学习理论的研究旨在探索统计学习方法的有效性和效率。 统计学习应用的研究旨在奖统计学习方法应用到实际问题中,解决实际问题。

10220
  • 广告
    关闭

    年末·限时回馈

    热卖云产品年终特惠,2核2G轻量应用服务器7.33元/月起,更多上云必备产品助力您轻松上云

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    机器学习统计学习

    曾经被问及机器学习统计分析有什么区别——实际上我对统计分析并不是很了解,我想它应该主要就是用概率统计的方法去分析数据的一门学科吧,看起来确实和机器学习很像(特别是现在“机器学习”已经快要等价于“统计学习 统计分析的主要目的应该是去分析或者解释存在的数据,例如,用某个概率模型,从数据去估计分布的参数,并计算置信度之类的。 而机器学习,虽然看起来也比较类似,但是本质的区别在于,机器学习的目的不在于分析当前数据,而是在于对未来的预测。 对于这个具体的例子来说,即便同样是在做 density estimation ,统计分析里可能通常都会假设数据确实是满足某个具体的带参数的分布,从而去研究如何更精确更健壮地估计对应的参数的问题(例如试验设计 这些才是机器学习所关心的问题。

    5320

    统计学习方法(一)——统计学习方法概论

    统计学习方法概论 本文是统计学习方法(李航)第一章的学习总结。 1.1 统计学习 1.统计学习的特点 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。 统计学习也称为统计机器学习(statistical machine learning)。现在人们提到的机器学习往往是指统计机器学习。 5.统计学习的研究 统计学习的研究包括统计学习方法(算法创新)、统计学习理论(算法效率及有效性)及统计学习应用(解决问题)三个方面。 6.统计学习的重要性 统计学习的重要性体现在三个方面:(1)统计学习是处理海量数据的有效方法。(2)统计学习是计算机智能化的有效手段。(3)统计学习是计算机发展的重要组成部分。

    40820

    统计学习方法》笔记一 统计学习方法概论

    统计学习 统计学习时关于计算机基于数据构建概率统计模型 并运用模型 对数据进行预测与分析。 统计学习的三要素: 方法 = 模型+策略+算法 统计学习由监督学习、非监督学习、半监督学习和强化学习等组成。 实现统计学习方法的具体步骤如下: (1)得到一个有限的训练数据集合; (2)确定包含所有可能的模型的假设空间,即学习模型的集合; (3)确定模型选择的准则,即学习的策略; (4)实现求解最优模型的算法, ,应用这一模型,对给定的输入预测相应的输出,这个模型的一般形式为决策函数:Y=f(X)或者条件概率分布P(Y|X) 统计学习三要素 模型 模型就是要学习的条件概率分布或决策函数。 标注常用的统计学习方法有:隐马尔可夫模型、条件随机场。 回归问题 回归用于预测输入变量和输出变量之间的关系,回归模型表示从输入变量到输出变量之间映射的函数,回归问题的学习等价于函数拟合。

    34420

    统计学习方法》笔记-统计学习方法概论-1

    1.1 统计学习 1.统计学习的特点 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。 统计学习的主要特点是 统计学习以计算机及网络为平台,是建立在计算机及网络之上的 统计学习以数据为研究对象,是数据驱动的学科 统计学习的目的是对数据进行预测与分析 统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析 现在,当人们提及机器学习时,往往是指统计机器学习。 2.统计学习的对象 统计学习的对象是数据(data)。 4.统计学习的方法 统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。 统计学习的基本理论问题 统计学习应用(application of statistical learning) 将统计学习方法应用到实际问题中去,解决实际问题 6.统计学习的重要性 统计学习是处理海量数据的有效方法

    27440

    统计机器学习理论

    依据测试数据集对模型的泛化能力加以评价是不可靠的,统计学习理论试图从理论上对学习方法的泛化能力进行分析。 泛化误差: 图片 事实上,泛化误差就是所学习到的模型的期望风险 泛化误差上界 学习方法的泛化能力分析往往是通过研究泛化误差的概率上界进行的,简称为泛化误差上界(generalization error 生成方法是指根据给定的数据学习他们的联合概率分布,求出条件概率分布作为预测的模型。如朴素贝叶斯法和隐马尔可夫模型 判别方法是直接根据给定的数据直接学习出决策函数或者条件概率分布。 如感知机,决策树,支持向量机 生成方法的特点: 生成方法的学习收敛速度更快 当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用。 判别方法的特点: 直接面对预测,往往学习的准确率更高: 由于直接学习 或 ,可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

    7140

    如何学习统计

    可能学习和工作还有兴趣都跟统计沾些边,一些朋友和网友也问我些如何学习统计之类的问题,他们当然一样是非统计出身。 结合自己的学习经历,这里一并回答了,也权当一个成长备忘录,所以这里取一个柏拉图“《智者篇》,或论正名,逻辑”式的标题。 先说说自己在统计方面的学习经历,相信很多非统计出身的朋友会有共鸣。 回顾我的统计学习之旅,一个明显的特征就是统计软件一路同行。我的感受是,对于一个非统计出身的统计爱好者,不借助统计软件,几乎无法领略统计之妙——你没法通过推导公式研究算法而得到乐趣。 再说统计工具的选用,先是初学时的工具,然后是工作的工具。初学者的工具,就是比如你第一次学习安德森或林德的基础统计学,需要选用的统计软件。 ; 继续学习统计,不要迷信工具。

    30030

    算法与统计学习

    算法是指学习模型的具体计算方法。 统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方法来求解最优模型。 这时,统计学习问题归结为最优化问题,统计学习的算法成为求解最优化问题的算法。 统计学习可以利用已有的最优算法,有时也需要开发独自的最优化算法。 统计学习方法之间的不同,主要来自其模型、策略、算法的不同,确定了模型、策略、算法,统计学习的方法也就确定了,这也就是将其称为统计学习三要素的原因。 统计学习方法的步骤 (1)得到一个有限的训练数据集合 (2)确定包含所有可能的模型的假设空间,即学习模型的集合 (3)确定模型选择的准则,即学习的策略 (4)实现求解最优模型的算法,即学习的算法 (5)

    9340

    数据挖掘学习笔记:分类、统计学习

    中提名数据挖掘算法分属 10 大数据挖掘主题,蓝色部分即为最终选出的十大算法: 分类(Classification) C4.5 CART K Nearest Neighbours Naive Bayes 统计学习 PrefixSpan 集成挖掘(Integrated Mining) CBA 粗糙集(Rough Sets) Finding Reduct 图挖掘(Graph Mining) gSpan 以下是其中关于分类和统计学习主题的笔记 SVM 学习问题可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。 在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计(一种统计方法,它用来求一个样本集的相关概率密度函数的参数。)或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量。 最大期望经常用在机器学习和计算机视觉的数据聚类领域。

    10810

    【机器学习】机器学习背后的统计思想

    学习是一项复杂的智能活动,学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种——机械学习、通过传授学习、类比学习和通过事例学习学习中所用的推理越多,系统的能力越强。” 基于学习策略的分类 学习策略是指学习过程中系统所采用的推理策略。一个学习系统总是由学习和环境两部分组成。 分析学习的目标是改善系统的性能,而不是新的概念描述。分析学习包括应用解释学习、演绎学习、多级结构组块以及宏操作学习等技术。 在综合分类中,经验归纳学习、遗传算法、联接学习和加强学习均属于归纳学习,其中经验归纳学习采用符号表示方式,而遗传算法、联接学习和加强学习则采用亚符号表示方式;分析学习属于演绎学习。 这一类学习主要应用于分类和预测 (regression & classify)。在统计中,回归,判别分析被包装成了机械学习

    42480

    统计学习及监督学习概论

    统计学习 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。 统计学习也称为统计机器学习(statistical machine learning)。 统计学习分类 2.1 基本分类 2.1.1 监督学习 supervised learning 数据都是带有标注的 本质: 学习输入到输出的映射的统计规律。 ? 2.1.2 无监督学习 unsupervised learning 是指从无标注数据中学习预测模型。 本质: 学习数据中的统计规律或潜在结构。 ? 统计学习方法三要素 方法=模型+策略+算法方法 = 模型+策略+算法方法=模型+策略+算法 模型:输入空间,输出空间,决策函数集合 策略:按什么准则选择最优模型 损失函数(代价函数):度量预测错误程度

    25630

    统计学习方法概论

    1.统计学习 统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。 统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。 统计学习的目的就是考虑学习什么样的模型和如何学习模型。 统计学习假设数据存在一定的统计规律,X和Y具有联合概率分布的假设就是监督学习关于数据的基本假设。 3.统计学习三要素 统计学习=模型+策略+算法 3.1 模型 统计学习中,首先要考虑学习什么样的模型,在监督学习中,模型就是所要学习的条件概率分布或决策函数,由决策函数表示的模型为非概率模型 3.3 算法 统计学习问题归结为以上的最优化问题,这样,统计学习的算法就是求解最优化问题的算法。

    48040

    统计学习方法:概述

    这个系列是对李航写的《统计学习方法》的一个读书笔记。统计学习方法是我在机器学习领域的入门书籍。比起别的书这本相对简单一些。非常感谢李航的这本好书,把我带入了机器学习这个领域。 统计学习 特点 统计学习是机器学习中的一个重要分支。它是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测分析的一门学科。它是以计算机及网络为平台,以数据为研究对象的学科。 我们用统计学习方法对数据进行预测、分析。 对象 统计学习的对象是数据。我们从数据中提取特征,抽象出数据的模型,从数据中发现知识,利用得到的知识对新的数据进行预测、分析。 话又说回来,既然这是统计学习方法,那么我们就可以用概率来描述问题。这就牵扯到一些概率统计方面的知识了。学习统计学习方法要求读者有一定的概率思想。 方法 那么统计学习的方法指的是什么呢? 对于统计学习方法李航先生有个很精炼的描述: 方法=模型+策略+算法 等式右边就是统计学习三要素。

    35220

    关注

    腾讯云开发者公众号
    10元无门槛代金券
    洞察腾讯核心技术
    剖析业界实践案例
    腾讯云开发者公众号二维码

    相关产品

    • 机器翻译

      机器翻译

      腾讯机器翻译(TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。

    相关资讯

    热门标签

    活动推荐

    扫码关注腾讯云开发者

    领取腾讯云代金券