机器学习与统计学

417 篇文章
41 人订阅

全部文章

统计学家

整理一份详细的数据预处理方法

作者:lswbjtu https://zhuanlan.zhihu.com/p/51131210

161
统计学家

机器学习100问|在对数据进行预处理时,应该怎样处理类别型特征?

低、中、高三档,并且存在“高>中>低”的排序关系。序号编码会按照大小关系对类别型特征赋予一个数值ID,例如高表示为3、中表示为2、低表示为1,转换后依然保留了大...

313
统计学家

资源|《美团机器学习实践》PDF+思维导图

本书包括通用流程(问题建模、特征工程、常用模型、模型融合)、数据挖掘(用户画像、POI实体链接、评论挖掘)、搜索和推荐(O2O场景下的查询理解与用户引导、O2O...

372
统计学家

备战机器学习面试001|为什么需要对数值类型的特征做归一化?

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。最常用的方法主要有以下两种。

201
统计学家

机器学习算法优缺点对比及选择(汇总篇)

本文的目的,是务实、简洁地盘点一番当前机器学习算法。文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将...

322
统计学家

概率论与数理统计公式整理(完整版)

292
统计学家

学会五种常用异常值检测方法,亡羊补牢不如积谷防饥

在统计学中,是并不属于特定族群的数据点,是与其它值相距甚远的异常观测。离群点是一种与其它结构良好的数据不同的观测值。

292
统计学家

统计学最全思维导图,值得收藏!

原创:ZOE酱 https://zhuanlan.zhihu.com/p/25884239

1043
统计学家

2019年最亟待解决的11个AI伦理困境

现在是时候讨论A.I.的道德问题了。虽然机器学习不是一项新的技术发展,但现在是人工智能发展的关键时刻。要面对的道德问题有很多,包括以下提到的十一种。

871
统计学家

现代统计学的发展史

「统计」这个名词的意义因人而异,对一般人而言,统计是任何方面专家们用以支持其论点的一大堆数字;对于略具常识的人来讲,这个名词代表用以摘要和解释一堆数据如计算平均...

641
统计学家

数据挖掘竞赛利器-Stacking和Blending方式

https://blog.csdn.net/maqunfi/article/details/82220115

832
统计学家

14 幅思维导图 | Python 编程核心知识体系

原创:ZOE酱 https://zhuanlan.zhihu.com/p/25884239

801
统计学家

模型评估思维导图

“虽然没有人这样说,但我认为人工智能几乎是一门人文学科。这是一种试图理解人类智力和人类认知的尝试。”

1044
统计学家

4 幅思维导图:学会 Python 爬虫

原创:ZOE酱 https://zhuanlan.zhihu.com/p/36204695

843
统计学家

10个可以快速用Python进行数据分析的小技巧

一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。

902
统计学家

除了技术能打,成为一名优秀数据分析师还需要的三种能力

就算我不说大家也心知肚明,任何一家公司(不仅仅是技术公司)都需要那些强大的数据分析师来帮助他们实现目标。到2022年,数据分析师将会和软件工程师和数据科学一样,...

1145
统计学家

基于matplotlib和keras的神经网络结果可视化

在使用神经网络进行模型训练的时候,我们可以通过误差损失函数、精度等一系列指标来判断最终神经网络的拟合效果,一般的问题中,无论是回归还是拟合,本质上都是“一个拟合...

642
统计学家

要强大的“黑匣子”,还是“可解释”的机器学习?| 清华AI Time激辩

要不要用准确性换可解释性?这可能是许多资源有限的创业公司,在技术研发中面临的重要问题,同时也是机器学习可解释性研究中的重要议题。

1193
统计学家

打破机器学习中的小数据集诅咒

最近深度学习技术实现方面取得的突破表明,顶级算法和复杂的结构可以将类人的能力传授给执行特定任务的机器。但我们也会发现,大量的训练数据对深度学习模型的成功起着至关...

712
统计学家

给「转行人工智能」泼一盆理性的冷水

上图列举了以不同关键字进行搜索返回的岗位数:软件(11113) vs 生物(216) vs 生物信息(44) vs 数据科学家(152) vs 机器学习(280...

952

扫码关注云+社区

领取腾讯云代金券