Python数据科学

120 篇文章
38 人订阅

全部文章

用户2769421

15分钟带你入门sklearn与机器学习——分类算法篇

【导读】众所周知,Scikit-learn(以前称为scikits.learn)是一个用于Python编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算...

732
用户2769421

对编程非常有用的资源分享(工具+电子书)

独特且强悍的JavaScript 算法,能极速压缩 80% 的图片大小,而不损害其质量。

572
用户2769421

数据科学新人需要知道的13个雷区

看来你已经决定要进入数据科学这个领域了。数据正在驱动越来越多的业务,世界的联系正在变得越来越紧密,似乎每个业务都需要数据科学实践。因此,对数据科学家的需求是巨大...

563
用户2769421

4个数据分析师的必备技能,让你不走弯路!

优秀的数据分析师需要具备这样一些素质:有扎实的 SQL 基础,熟练使用 Excel,有统计学基础,至少掌握一门数据挖掘语言(R、SAS、Python、SPSS)...

783
用户2769421

带领拼多多超越京东后,黄峥依旧不想“搭理”五环内人群

2015 年,一个电商 App 在互联网横空出世。谁也不会想到,到 2018 年 12 月,它的月活用户达 2.71 亿,在电商领域仅次于淘宝,它就是拼多多。

683
用户2769421

数据科学家需要掌握的几大命令行骚操作

对于许多数据科学家来说,数据操作起始于Pandas或Tidyverse。从理论上看,这个概念没有错。毕竟,这是为什么这些工具首先存在的原因。然而,对于分隔符转换...

462
用户2769421

知网是个什么东西啊,好暴利

2019 年年初,青年演员翟天临遭遇了来自学术界的“雷神之锤”,成为全网群起而攻的学术打假对象,知名学府北京大学、北京电影学院也被拖下水,一时成为众矢之的。

663
用户2769421

数据分析师必掌握的统计学知识!

概率是指的对于某一个特定事件的可能性的数值度量,且在0-1之间。我们抛一枚硬币,它有正面朝上和反面朝上两种结果,通常用样本空间S表示,S={正面,反面},而正...

882
用户2769421

收藏 | 一文洞悉Python必备50种算法(附解析)

其主要特点有以下三点:选择了在实践中广泛应用的算法;依赖最少;容易阅读,容易理解每个算法的基本思想。希望阅读本文后能对你有所帮助。

844
用户2769421

清华大学 | 88页人工智能之知识图谱(附链接)

导读:知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,成为建立大规模知识的杀手锏应用,在搜索、自然语言处理、智能助...

912
用户2769421

进阶指南 | 如何从数据分析师转型为数据科学家?

如何从数据分析师华丽转型,成为一名数据科学家?好比“把大象装进冰箱”,成为“数据科学家”仅需简单三步:

582
用户2769421

数据清洗预处理入门完整指南

数据预处理是建立机器学习模型的第一步(也很可能是最重要的一步),对最终结果有决定性的作用:如果你的数据集没有完成数据清洗和预处理,那么你的模型很可能也不会有效—...

502
用户2769421

经验分享 | 如何写好数据分析师简历?

我们要确定怎么样简历是一份好数据分析师简历呢?那我们就要涉及到如何评价一个好数据分析师?一般来说,优秀的数据分析师有着很好的表达能力,能通过在二分钟对自己工作内...

692
用户2769421

【机器学习笔记】:解读正则化,LASSO回归,岭回归

在机器学习的学习过程中,我们会经常听到正则化这个词,在开始入门学习的时候还经常与标准化混淆。到底什么是正则化呢?本篇我们将由浅入深详细解读什么是正则化,以及LA...

1724
用户2769421

动态IP池

IP的抓取我选择的是西刺代理,这个网站的IP是免费提供的,但是它的IP极其不稳定,可能几分钟前能用,几分钟后就失效了。从西刺要抓取IP地址以及端口,类型。

1152
用户2769421

作为一个Python爱好者,如何写出高可读性的代码?

推荐导读:Python的初学者,开发者都应该知道的代码可读性提高技巧,本篇主要介绍了如下内容:

1024
用户2769421

高效方法 | Jupyter Notebook 比你想象中的还要强大

Jupyter Notebook是一个非常赞的可用于教学,探索和编程的环境,但最原始的Jupyter Notebook是缺乏一些强功能的。但幸运的是,有很多方法...

1994
用户2769421

实例解析:怎么撰写一份产品数据报告?

产品数据报告是产品和运营人必不可少的工作,无论是周报、月报,还是新版本表现的分析报告,都需要在围绕报告目标的基础上,对数据进行整理、分析并提炼要点,最后形成一份...

552
用户2769421

还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法

当大家谈到数据分析时,提及最多的语言就是Python和SQL。Python之所以适合数据分析,是因为它有很多第三方强大的库来协助,pandas就是其中之一。pa...

1041
用户2769421

数据科学大佬的简历上都有哪些技能?

如果你是一个数据科学的求职者,那么你一定想知道在你的简历上应该写些什么技能会有更大的概率接到面试。如果你想进入这个领域,你可能已经多次想要知道哪些技术可以成为一...

903

扫码关注云+社区