首页
学习
活动
专区
工具
TVP
发布

数据分析1480

专栏作者
433
文章
618889
阅读量
99
订阅数
【干货】特征选择的通俗讲解!
据《福布斯》报道,每天大约会有 250 万字节的数据被产生。然后,可以使用数据科学和机器学习技术对这些数据进行分析,以便提供分析和作出预测。尽管在大多数情况下,在开始任何统计分析之前,需要先对最初收集的数据进行预处理。有许多不同的原因导致需要进行预处理分析,例如:
1480
2021-12-20
5050
引用次数在15000次以上的都是什么神仙论文?
本文结合总结梳理了知乎上“引用次数在15000次以上的都是什么论文?”这一问题的经典回答,希望能帮助到各位进一步了解领域内的相关进展。并且通过阅读这些经典论文或许也会给您带来不少启发。
1480
2021-07-12
9090
扎心了!5.33亿Facebook用户数据又遭泄露!
公开的数据包括来自106个国家和地区的超过5.33亿Facebook用户的个人信息,其中包括超过3200万条美国用户记录,1100万条英国用户记录和600万条印度用户记录。
1480
2021-04-21
1.1K0
【干货!】统计学最常用的「数据分析方法」清单(下)
根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。
1480
2020-06-01
6440
干货分享--统计学知识大梳理(第二部分)
为了让读者更好理解,笔者概率论中最核心的概念以及概念之间彼此的关系绘制成了下图,那么接下来笔者开始“讲故事”了。
1480
2020-03-05
5340
实战:手把手教你用朴素贝叶斯对文档进行分类
朴素贝叶斯分类最适合的场景就是文本分类、情感分析和垃圾邮件识别。其中情感分析和垃圾邮件识别都是通过文本来进行判断。所以朴素贝叶斯也常用于自然语言处理 NLP 的工具。
1480
2020-02-19
1.4K0
小白也能看懂的seaborn入门示例
Seaborn就是让困难的东西更加简单。它是针对统计绘图的,一般来说,能满足数据分析90%的绘图需求。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图,应该把Seaborn视为matplotlib的补充,而不是替代物。
1480
2019-11-07
4.5K0
机器学习与深度学习核心知识点总结
来源 | SIGAI 编辑:小小挖掘机 image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png image.png imag
1480
2019-11-07
3210
教你如何灵活地用数据驱动的方式讲故事
首先,你有思考过一个问题吗?当你的直觉与你所掌握的数据矛盾的时候,你是听从于直觉还是相信你所掌握的数据呢?2016年的一项调查发现,90%的决策者会更偏向听从自己的直觉,即凭借以往的经验来做决策。这听起来很不可思议,但它是真实存在的。决策者有时候会因为对数据的来源不确信,有时不确定数据的准确性,也有可能仅仅是因为决策者自身性格的原因。各种各样的因素都会导致决策者不相信数据,反而遵从直觉去做决策。
1480
2019-10-21
5560
决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结
决策树是一个有监督分类模型,本质是选择一个最大信息增益的特征值进行输的分割,直到达到结束条件或叶子节点纯度达到阈值。下图是决策树的一个示例图:
1480
2019-10-15
9130
机器人“快递小哥”上岗,但被AI淘汰的却是程序员?
2016年AlphaGo以总比分4:1轻松战胜围棋世界冠军李世石,这是AI第一次震惊世界。
1480
2019-10-15
5170
推荐收藏 | 统计学常用的数据分析方法大总结!
描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
1480
2019-10-10
8420
围观SVM模型在分类和预测问题上的强悍表现!
在上一期的《手把手教你如何由浅入深地理解线性SVM模型》中我们分享了线性SVM模型的来龙去脉,得到很多读者朋友的点赞和支持,本期我们继续分享SVM模型的其他知识,即两个实战的案例,分别用于解决分类问题和预测问题。本文所使用到的数据集,读者朋友可以在文末找到下载链接。
1480
2019-09-29
5640
机器学习中常用的5种回归损失函数,你都用过吗?
“损失函数”是机器学习优化中至关重要的一部分。L1、L2损失函数相信大多数人都早已不陌生。那你了解Huber损失、Log-Cosh损失、以及常用于计算预测区间的分位数损失么?这些可都是机器学习大牛最常用的回归损失函数哦!
1480
2019-09-19
7740
手把手教你如何由浅入深地理解线性SVM模型
SVM模型的核心是构造一个“超平面”,并利用“超平面”将不同类别的数据做划分。问题是“超平面”该如何构造,并且如何从无数多个分割面中挑选出最佳的“超平面”,只有当这些问题解决了,SVM模型才能够起到理想的分类效果。
1480
2019-09-17
8790
数据分析师职业漫谈
但为了避免“刻板印象”或者“职业想象”,了解一个职业尤其是自己可能要用来养家糊口的职业,最好的方式还是亲临现场亲自实践。
1480
2019-08-05
7410
卡尔曼滤波及其在配对交易中的应用--Python落地
感谢周航和郭增岳的投稿,人工智能与量化交易公众号的运营者,他们热衷于人工智能和量化投资方面的研究。
1480
2019-08-05
1.7K0
【机器学习笔记】:从零开始学会逻辑回归(一)
逻辑回归是一个非常经典,也是很常用的模型。之前和大家分享过它的重要性:5个原因告诉你:为什么在成为数据科学家之前,“逻辑回归”是第一个需要学习的
1480
2019-08-05
5900
随机森林:这或许是集成学习中最经典的一个 Bagging 算法了
在 集成学习概述 中已经知道了常用的集成算法有两种:Bagging 和 Boosting。而在 Bagging 中,随机森林(Random Forest,RF)又是其中典型的代表了。没错,这篇文章我们就是来介绍随机森林的。
1480
2019-07-22
1.3K0
决策树学习笔记(一):特征选择
相信很多朋友已经对决策树很熟悉了,决策树是机器学习中的一种基本的可用于分类与回归的方法,它是一些集成学习如GBDT,XGboost等复杂模型的基础。这些高级模型比如XGboost可以非常好地拟合数据,在数据挖掘比赛以及工业界中都有着非常出色的表现,受到了无数爱好者的追捧。
1480
2019-07-14
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档