首页
学习
活动
专区
工具
TVP
发布

机器学习与统计学

专栏作者
793
文章
1097112
阅读量
96
订阅数
「回归分析」知识点梳理
这正是回归分析所追求的目标。它是最常用的预测建模技术之一,有助于在重要情况下做出更明智的决策。在本文中,我们将讨论什么是回归分析,它是如何工作的。
统计学家
2020-12-08
8430
深度研究:回归模型评价指标R2_score
回归模型的性能的评价指标主要有:RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、R2_score。但是当量纲不同时,RMSE、MAE、MSE难以衡量模型效果好坏。这就需要用到R2_score,实际使用时,会遇到许多问题,今天我们深度研究一下。
统计学家
2019-12-12
7.3K0
Adaboost, GBDT 与 XGBoost 的区别
最近总结树模型,尝试将主流 Boosting 实现方式做一个分析汇总,文中部分内容借鉴了知乎答案,已于参考链接中标识。
统计学家
2019-08-06
1.6K0
机器学习算法之岭回归、Lasso回归和ElasticNet回归
作者:biaodianfu https://www.biaodianfu.com/ridge-lasso-elasticnet.html
统计学家
2019-07-17
1.5K0
打破机器学习中的小数据集诅咒
最近深度学习技术实现方面取得的突破表明,顶级算法和复杂的结构可以将类人的能力传授给执行特定任务的机器。但我们也会发现,大量的训练数据对深度学习模型的成功起着至关重要的作用。就拿Resnet来说,这种图像分类结构在2015年的ILSVRC分类竞赛中获得了第一名,比先前的技术水平提高了约50%。
统计学家
2019-06-28
6680
从「线性回归」到「强化学习」(一)
线性回归(linear regression)是最基础的机器学习、统计学习模型,一般出现在教材或者科普读物的前两章。今天要从线性回归为起点,串讲一些机器学习的概念。这篇文章更像是地图,只给出了地名,而非具体过程。但当你有了地图,按图索骥即可。所以本文的目标是把分散的概念联系起来,从最简单的线性回归说到...主动学习(可能也会包含一点强化学习)。
统计学家
2019-06-18
9380
揭秘LinkedIn!全球最大的招聘推荐系统如何被机器学习驱动?
大数据文摘出品 来源:towardsdatascience 编译:夏雅薇、Stats熊
统计学家
2019-05-30
5650
数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面:
统计学家
2019-05-14
7.4K0
统计学和机器学习到底有什么区别?
例如,诺奖得主托马斯·萨金特曾经说过人工智能其实就是统计学,只不过用了一个很华丽的辞藻。
统计学家
2019-05-10
2930
100天搞定机器学习|Day8 逻辑回归的数学原理
Day7,我们学习了K最近邻算法(k-NN),了解了其定义,如何工作,介绍了集中常用的距离和k值选择。Day8,作者转回之前的逻辑回归内容,推荐了Saishruthi Swaminathan的一篇文章。
统计学家
2019-04-23
3340
100天搞定机器学习|Day11 实现KNN
Day7,我们学习了K最近邻算法(k-NN),了解了其定义,如何工作,介绍了集中常用的距离和k值选择。Day11,通过一个案例实现该算法。
统计学家
2019-04-23
3540
R in action读书笔记(8)-第八章:回归
口同方差性因变量的方差不随自变量的水平不同而变化。也可称作不变方差,但是说同方差性感觉上更犀利。
统计学家
2019-04-10
5920
【温故知新】应用多元统计分析 第四章 回归变量的选择与逐步回归 多因变量的多元线性回归
4.2回归变量的选择与逐步回归 一、变量选择问题 1、选择“最优”回归子集的方法 1)“最优”子集的变量筛选法 2)计算量很大的全子集法 3)计算量适中的选择法 2、变量选择的几个准则 (1)残差平方
统计学家
2019-04-10
1.6K0
《spss统计分析与行业应用案例详解》实例26非线性回归分析 27加权最小二乘回归分析
它是一种功能更强大的处理非线性问题的方法,它可以使用户自定义任意形式的函数,从而更加准确地描述变量之间的关系
统计学家
2019-04-10
1.7K0
《spss统计分析与行业应用案例详解》实例24 多重线性回归分析 25曲线回归分析
最常用的一种回归分析方法,多重线性回归分析涉及多个自变量,它用来处理一个因变量与多个自变量之间的线性关系。
统计学家
2019-04-10
9910
《spss统计分析与行业应用案例详解》实例22距离分析 实例23简单线性回归
基本功能是对样本观测值之间差异或相似程度进行度量从而对数据形成一个初步的了解,这种分析方法主要应用在分析之前对数据背后的专业知识不够充分了解,进行探索性研究的情形。
统计学家
2019-04-10
8500
【数据分析 R语言实战】学习笔记 第九章(上)一元线性回归分析
回归分析的主要目的是根据估计的模型用自变量来估计或预测因变量取值,但我们建立的回归方程是否真实地反映了变量之间的相关关系,还需要进一步进行显著性检验。对于一元线性回归模型而言,回归方程的显著性检验有三种等价的方法,分别为t检验、F检验和相关系数检验。在R中给出的方法是F检验,原假设为:两个变量之间的线性关系不显著,即
统计学家
2019-04-10
3.5K0
【R语言进行数据挖掘】回归分析
其中,x1,x2,...,xk都是预测变量(影响预测的因素),y是需要预测的目标变量(被预测变量)。
统计学家
2019-04-10
1.1K0
R语言教程之-线性回归
回归分析是一种非常广泛使用的统计工具,用于建立两个变量之间的关系模型。 这些变量之一称为预测变量,其值通过实验收集。 另一个变量称为响应变量,其值从预测变量派生。
统计学家
2019-04-10
1.2K0
多元线性回归容易忽视的几个问题(1)多重共线性
最近在看《R数据分析——方法与案例详解》,感觉很不错,本书精华是统计学理论与R的结合,尤其是多元统计部分,因为本书其中一个作者朱建平是厦大统计系教授,曾编写过《应用多元统计分析》一书,可能有同学用过这本教材。《R数据分析》的理论部分建议研究透彻,公式部分最好都演算一遍。因为已经看过《R inaction》,所以笔记就只做我比较感兴趣的部分,也是我认为比较重要的部分。
统计学家
2019-04-10
4.6K0
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战,赢鹅厂证书、公仔好礼!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档