机器学习与统计学

459 篇文章
45 人订阅

数据分析

统计学家

7步搞定数据清洗-Python数据清洗指南

作者:KOALA https://zhuanlan.zhihu.com/p/60241672

942
统计学家

学会五种常用异常值检测方法,亡羊补牢不如积谷防饥

在统计学中,是并不属于特定族群的数据点,是与其它值相距甚远的异常观测。离群点是一种与其它结构良好的数据不同的观测值。

772
统计学家

现代统计学的发展史

「统计」这个名词的意义因人而异,对一般人而言,统计是任何方面专家们用以支持其论点的一大堆数字;对于略具常识的人来讲,这个名词代表用以摘要和解释一堆数据如计算平均...

781
统计学家

除了技术能打,成为一名优秀数据分析师还需要的三种能力

就算我不说大家也心知肚明,任何一家公司(不仅仅是技术公司)都需要那些强大的数据分析师来帮助他们实现目标。到2022年,数据分析师将会和软件工程师和数据科学一样,...

1185
统计学家

给「转行人工智能」泼一盆理性的冷水

上图列举了以不同关键字进行搜索返回的岗位数:软件(11113) vs 生物(216) vs 生物信息(44) vs 数据科学家(152) vs 机器学习(280...

1142
统计学家

临别给《生活大爆炸》做个台词数据分析,你猜谢耳朵最爱说什么?

2019年5月1日,美剧《生活大爆炸》最后一集正式宣布杀青,于北京时间5月17日早8点播出,时长达一个小时。这部陪伴观众成长了12年的美剧,已与全球观众告别。

904
统计学家

【温故知新】应用多元统计分析-第二章 多元正态分析及参数估计(下)

852
统计学家

【温故知新】应用多元统计分析- -第二章 多元正态分布及参数的估计(上)

772
统计学家

R Programming week2 Control Structures

Control structures in R allow you tocontrol the flow of execution of the program...

762
统计学家

Duke@coursera 数据分析与统计推断 unit2 probability and distributions

In a random process we know what outcomes couldhappen, but we don't know which p...

742
统计学家

Duke@coursera 数据分析与统计推断 unit1 part2 introduction to data

roughly the average deviation around themean, and has the same units as the data

881
统计学家

Duke@coursera 数据分析与统计推断 unit1 part1 introduction to data

‣ observations, variables, and datamatrices

891
统计学家

R in action读书笔记(15)第十一章 中级绘图 之二 折线图 相关图 马赛克图

> plot(t1$age,t1$circumference,xlab="Age(days)",ylab="circumference (mm)",main="...

903
统计学家

【温故知新】应用多元统计分析 第四章 4.1经典多元回归分析

792
统计学家

北大@Coursera 医学统计学与SPSS软件 第五周 分类变量比较的假设检验

一般情况下,由于我们研究的是样本,p未知,所以常 用p代替p,得到率的标准误的估计值:

871
统计学家

R in action读书笔记(13)第十章 功效分析

功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某样本量内能检测到给定效应值的概率...

852
统计学家

北大@Coursera 医学统计学与SPSS软件 第四周多组数值变量比较的假设检验

多组数值变量比较的假设检验常用方差分析(Analysis of Variance,简称为ANOVA)。检验目的是推断多个总体均数是否相等。

812
统计学家

【数据分析 R语言实战】学习笔记 第四章 数据的图形描述 (下)

ggplot2是R中用于绘图的高级程序包,它将绘图视为一种映射—数学空问到图形元索空间的映射,例如将不同的数值映射为不同的颜色或其他图形属性。ggplot2在画...

752
统计学家

【数据分析 R语言实战】学习笔记 第三章 数据预处理 (下)

R中缺失值以NA表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na()它可以应用于向量、数据框等多种对象,返回逻辑值。

902
统计学家

【数据分析 R语言实战】学习笔记 第三章 数据预处理 (上)

数据是分析的核心,在做数据分析之前,首先要对数据进行一定的处理。数据预处理指当录入或读取数据后,对数据进行必要的清理,包括查错纠错、异常观察值和无效样本的处理、...

1041

扫码关注云+社区

领取腾讯云代金券