数据科学与人工智能

703 篇文章
111 人订阅

全部文章

陆勤_数据人网

模型|利用Python语言做逻辑回归算法

问题是这些预测对于分类来说是不合理的,因为真实的概率必然在0到1之间。为了避免这个问题,我们必须使用一个函数对p(X)建模,该函数为X的所有值提供0到1之间的输...

592
陆勤_数据人网

好书|第一章:The Machine Learning Landscape

【需要英文电子书籍和配套的EPUB阅读器的朋友,请把这篇文章分享到您的朋友圈,添加我的个人微信:luqin360,截图给我,我会发给您;若是需要一起参与读书和讨...

562
陆勤_数据人网

我是如何学习Python语言?

我是一位数据工作者,经常会使用到各种软件和工具帮助我解决各种数据问题,比方说数据的抽取与解析,数据的加工与探索,数据的建模与展示等。我会使用Python语言来做...

823
陆勤_数据人网

学习| 如何处理不平衡数据集

分类是机器学习中最常见的问题之一。处理任何分类问题的最佳方法是从分析和探索数据集开始,我们称之为探索性数据分析(EDA)。唯一目的是生成尽可能多的关于数据的见解...

1023
陆勤_数据人网

应用|使用正则化线性模型和XGboost对价格建模

好消息是我们有很多特征可以使用(81),坏消息是有19个特征有缺失值,其中4个特征缺失值超过80%。对于任何一个特征,如果它缺失了80%的值,那么它就没有那么重...

1152
陆勤_数据人网

模型|“请解释”黑盒机器学习模型的解释性

2019年2月,波兰政府对银行法进行了修订,赋予客户在做出信贷拒绝时获得解释的权利。这是在欧盟实施GDPR的直接后果之一。这意味着,如果决策过程是自动的,银行需...

732
陆勤_数据人网

敏捷数据科学研究的最佳建议

几天前,我读了Shay Palachy和Ori Cohen关于敏捷数据科学项目管理的两篇很棒的文章。这些文章讨论了数据科学项目的不同阶段,以及它们与常规软件项目...

872
陆勤_数据人网

传统机器学习技术概述

虽然新闻天天提到机器学习、深度学习和人工智能,但这些领域已经存在了几十年。然而,如果你越过自动驾驶汽车和数字助理,你会发现,今天应用的大多数都是传统的。

861
陆勤_数据人网

pandas0.24本月将放弃对Python2的支持

Python库pandas的下一个版本 0.24.0将不支持Python 2。pandas是一个流行的Python库,广泛用于数据操作和数据分析。它用于数值表和...

733
陆勤_数据人网

进行机器学习和数据科学常犯的错误

首先,您应该可视化连续特征的分布,以了解如果有许多异常值,分布将是什么,以及它是否有意义。

1002
陆勤_数据人网

【ML】机器学习项目清单

我发现编写和比较特定过程的各种解释的活动,以实现自己对所述过程的解释是有价值的。 我先前已经对我们可以称之为机器学习过程的其他解释做了这样的事情(至少在某种程度...

1332
陆勤_数据人网

掌握机器学习中数据准备的六个步骤

当今组织继续寻找快速,准确地准备数据的方法,以解决他们的数据挑战并实现机器学习(ML)。 但在将数据引入机器学习模型或任何其他分析项目之前,确保其数据清晰,一致...

873
陆勤_数据人网

如何从头开始构建数据科学项目

有许多关于数据科学和机器学习的在线课程将指导您完成理论,并为您提供一些代码示例和对非常干净数据的分析。

1092
陆勤_数据人网

【ML】支持向量机是什么?我为什么要使用它?

支持向量机是一种有监督的机器学习算法,可以用于分类或回归问题。它使用一种称为核技巧的技术来转换数据,然后根据这些转换在可能的输出之间找到一个最佳边界。简单地说,...

1583
陆勤_数据人网

【ML】逻辑回归——详细概述

逻辑回归在20世纪早期被用于生物科学。它后来被用于许多社会科学应用。因变量(目标)为分类变量时采用Logistic回归。

953
陆勤_数据人网

【ML】机器学习的不同类型

什么是输入和标签(目标)?例如,两个数字相加a=5,b=6结果=11,输入为5,6,目标为11。

983
陆勤_数据人网

【ML】机器学习介绍

在我们理解机器学习之前,让我们先来谈谈为什么需要机器学习,以及我们为什么要关心它?

862
陆勤_数据人网

【DS】利用Keras长短期记忆(LSTM)模型预测股票价格

在本教程中,我们将构建一个Python深度学习模型,用于预测股票价格的未来行为。我们假设读者熟悉Python中的深度学习概念,特别是LSTM。

2227
陆勤_数据人网

【DS】Doc2Vec和Logistic回归的多类文本分类

Doc2vec是一个NLP工具,用于将文档表示为向量,是word2vec方法的推广。 为了理解doc2vec,最好理解word2vec方法。但是,完整的数学细节...

1804
陆勤_数据人网

【DS】Keras深度学习介绍

现在让我们继续解决一个真正的业务问题。一家保险公司向你提供了他们客户先前索赔的数据。保险公司希望你开发一个模型来帮助他们预测哪些索赔看起来是欺诈的。通过这样做,...

862

扫码关注云+社区