数据分析1480-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据分析1480

专栏成员

433

文章

651907

阅读量

100

订阅数

【干货】特征选择的通俗讲解！

机器学习神经网络深度学习人工智能编程算法

据《福布斯》报道，每天大约会有 250 万字节的数据被产生。然后，可以使用数据科学和机器学习技术对这些数据进行分析，以便提供分析和作出预测。尽管在大多数情况下，在开始任何统计分析之前，需要先对最初收集的数据进行预处理。有许多不同的原因导致需要进行预处理分析，例如：

2021-12-20

5990

引用次数在15000次以上的都是什么神仙论文？

腾讯云开发者社区深度学习机器学习神经网络人工智能

本文结合总结梳理了知乎上“引用次数在15000次以上的都是什么论文？”这一问题的经典回答，希望能帮助到各位进一步了解领域内的相关进展。并且通过阅读这些经典论文或许也会给您带来不少启发。

2021-07-12

1K0

干货分享--统计学知识大梳理（第二部分）

机器学习神经网络深度学习人工智能

为了让读者更好理解，笔者概率论中最核心的概念以及概念之间彼此的关系绘制成了下图，那么接下来笔者开始“讲故事”了。

2020-03-05

5590

实战：手把手教你用朴素贝叶斯对文档进行分类

数据挖掘机器学习神经网络深度学习人工智能

朴素贝叶斯分类最适合的场景就是文本分类、情感分析和垃圾邮件识别。其中情感分析和垃圾邮件识别都是通过文本来进行判断。所以朴素贝叶斯也常用于自然语言处理 NLP 的工具。

2020-02-19

1.5K0

小白也能看懂的seaborn入门示例

编程算法机器学习神经网络深度学习人工智能

Seaborn就是让困难的东西更加简单。它是针对统计绘图的，一般来说，能满足数据分析90%的绘图需求。Seaborn其实是在matplotlib的基础上进行了更高级的API封装，从而使得作图更加容易，在大多数情况下使用seaborn就能做出很具有吸引力的图，应该把Seaborn视为matplotlib的补充，而不是替代物。

2019-11-07

4.6K0

教你如何灵活地用数据驱动的方式讲故事

数据可视化神经网络深度学习人工智能

首先，你有思考过一个问题吗？当你的直觉与你所掌握的数据矛盾的时候，你是听从于直觉还是相信你所掌握的数据呢？2016年的一项调查发现，90%的决策者会更偏向听从自己的直觉，即凭借以往的经验来做决策。这听起来很不可思议，但它是真实存在的。决策者有时候会因为对数据的来源不确信，有时不确定数据的准确性，也有可能仅仅是因为决策者自身性格的原因。各种各样的因素都会导致决策者不相信数据，反而遵从直觉去做决策。

2019-10-21

5930

决策树、随机森林、bagging、boosting、Adaboost、GBDT、XGBoost总结

决策树深度学习人工智能机器学习神经网络

决策树是一个有监督分类模型，本质是选择一个最大信息增益的特征值进行输的分割，直到达到结束条件或叶子节点纯度达到阈值。下图是决策树的一个示例图：

2019-10-15

9570

围观SVM模型在分类和预测问题上的强悍表现！

机器学习神经网络深度学习人工智能

在上一期的《手把手教你如何由浅入深地理解线性SVM模型》中我们分享了线性SVM模型的来龙去脉，得到很多读者朋友的点赞和支持，本期我们继续分享SVM模型的其他知识，即两个实战的案例，分别用于解决分类问题和预测问题。本文所使用到的数据集，读者朋友可以在文末找到下载链接。

2019-09-29

6830

机器学习中常用的5种回归损失函数，你都用过吗？

线性回归机器学习神经网络深度学习人工智能

“损失函数”是机器学习优化中至关重要的一部分。L1、L2损失函数相信大多数人都早已不陌生。那你了解Huber损失、Log-Cosh损失、以及常用于计算预测区间的分位数损失么？这些可都是机器学习大牛最常用的回归损失函数哦！

2019-09-19

8930

手把手教你如何由浅入深地理解线性SVM模型

机器学习神经网络深度学习人工智能

SVM模型的核心是构造一个“超平面”，并利用“超平面”将不同类别的数据做划分。问题是“超平面”该如何构造，并且如何从无数多个分割面中挑选出最佳的“超平面”，只有当这些问题解决了，SVM模型才能够起到理想的分类效果。

2019-09-17

9220

数据分析师职业漫谈

编程算法机器学习神经网络深度学习人工智能

但为了避免“刻板印象”或者“职业想象”，了解一个职业尤其是自己可能要用来养家糊口的职业，最好的方式还是亲临现场亲自实践。

2019-08-05

7800

卡尔曼滤波及其在配对交易中的应用--Python落地

神经网络深度学习人工智能编程算法

感谢周航和郭增岳的投稿，人工智能与量化交易公众号的运营者，他们热衷于人工智能和量化投资方面的研究。

2019-08-05

1.7K0

【机器学习笔记】：从零开始学会逻辑回归（一）

线性回归机器学习神经网络深度学习人工智能

逻辑回归是一个非常经典，也是很常用的模型。之前和大家分享过它的重要性：5个原因告诉你：为什么在成为数据科学家之前，“逻辑回归”是第一个需要学习的

2019-08-05

6110

随机森林：这或许是集成学习中最经典的一个 Bagging 算法了

决策树机器学习神经网络深度学习人工智能

在集成学习概述中已经知道了常用的集成算法有两种：Bagging 和 Boosting。而在 Bagging 中，随机森林（Random Forest，RF）又是其中典型的代表了。没错，这篇文章我们就是来介绍随机森林的。

2019-07-22

1.4K0

决策树学习笔记（一）：特征选择

决策树神经网络深度学习人工智能机器学习

相信很多朋友已经对决策树很熟悉了，决策树是机器学习中的一种基本的可用于分类与回归的方法，它是一些集成学习如GBDT，XGboost等复杂模型的基础。这些高级模型比如XGboost可以非常好地拟合数据，在数据挖掘比赛以及工业界中都有着非常出色的表现，受到了无数爱好者的追捧。

2019-07-14

1.5K0

Python数据科学，用这些库就够了

python 机器学习人工智能深度学习

为了方便学习，本文列出的20个Python库将按领域进行分类，有些你可能并不熟悉，但是真的能提高你的模型算法实现效率，多一点尝试，多一些努力！

2019-06-03

5120

从零开始学Python【38】--朴素贝叶斯模型（实战部分）

机器学习神经网络深度学习人工智能编程算法

在《从零开始学Python【37】--朴素贝叶斯模型（理论部分）》中我们详细介绍了朴素贝叶斯算法的基本概念和理论知识，在这一期我们继续介绍该算法的实战案例。将会对高斯贝叶斯、多项式贝叶斯和伯努利贝叶斯三种分类器案例的做实战讲解。希望通过这部分内容的讲解，能够使读者对贝叶斯算法有一个较深的理解（文末有数据和源代码的下载链接）。

2019-06-03

2.5K0

从零开始学Python【37】--朴素贝叶斯模型（理论部分）

机器学习神经网络深度学习人工智能

在介绍如何使用贝叶斯概率公式计算后验概率之前，先回顾一下概率论与数理统计中的条件概率和全概率公式：

2019-05-28

5270

什么是机器学习？进来带你参观参观

机器学习神经网络人工智能深度学习线性回归

首先我们需要了解几个机器学习中的起码要知道是怎么回事的概念，了解了后面看代码才不会一脸懵逼。

2019-05-23

4520

【干货】推荐19款最常用的数据挖掘工具

sql 数据处理数据可视化数据库人工智能

数据在当今世界意味着金钱。随着向基于app的世界的过渡，数据呈指数增长。然而，大多数数据是非结构化的，因此需要一个过程和方法从数据中提取有用的信息，并将其转换为可理解的和可用的形式。

2019-05-23

1.5K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态