首页
学习
活动
专区
工具
TVP
发布

一个爱吃西瓜的程序员

莫道君行早,更有早行人。
专栏作者
70
文章
84801
阅读量
23
订阅数
什么是数据挖掘?
近年来,数据分析,数据挖掘和数据科学等领域不可谓不火热。而且人工智能、算法、数据科学领域的薪酬普遍高于传统互联网行业。既然决定从事互联网行业,那就得给自己找一个不错的方向,并为之不断学习~ 数据挖掘的概念: 数据挖掘可以简单的理解为从大量数据中提取或挖掘知识或者说是知识发现。 数据挖掘应用了众多领域的思想,包括来自统计学的抽样、估计和假设检验;来自人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论等。 数据挖掘的步骤: 数据挖掘作为知识发现的过程,一般由三个主要阶段组成: 数据准备 数据挖掘 结果的
爱吃西瓜的番茄酱
2018-04-04
1.6K0
每天学习一点儿算法--选择排序
很多算法只有在数据经过排序后才管用,比如我们之前学习的二分查找。当然,很多语言都内置了排序算法,比如Python中的sort()函数和sorted()函数。我们可以直接调用内置函数完成排序,而不需要从
爱吃西瓜的番茄酱
2018-04-04
5750
每天学习一点儿算法--快速排序
快速排序是一种常用的优雅的排序算法,它使用分而治之的策略。 那么分而治之(D&C)是一种怎样的策略呢? 分而治之 分而治之(D&C)的要点只有两个: 找出简单的基线问题 确定如何缩小问题的规模,使其符合基线条件 D&C不是一种解决问题的算法,而是一种解决问题的思路。比如看下面这个例子: 这是一个数字数组: 你需要将这些数字相加,并返回结果。使用循环可以很轻松地解决这个问题: def sum(arr): """一个数组元素相加的循环""" total = 0 fo
爱吃西瓜的番茄酱
2018-04-04
5690
每天学习一点儿算法--散列表
在之前我们已经学过了二分查找和简单查找,我们知道二分查找的运行时间为O(㏒ n), 简单查找的运行时间为O(n)。除此之外,还有没有更快的查找算法呢? 可能有人会说数组的查找速度更快,查找速度为O(1)。没错,但是我们今天讲的是一种进化版的类似于数组的数据结构—散列表。 散列表的性能取决于散列函数,那什么是散列函数呢? 散列函数 散列函数是这样的函数,即无论你给它什么数据,它都还你一个数字。专业术语来描述就是:将输入映射到数字。 散列函数需要满足一些要求: 它必须是一致性的,就是同样的输入必须映射到相同
爱吃西瓜的番茄酱
2018-04-04
9030
每天学习一点儿算法--广度优先搜索
广度优先搜索(BFS)是我们学的第一种图算法,它可以让你找出两样东西之间的最短距离。 这里提到了一个新的概念:图, 那什么是图呢? 图简介 图用于模拟不同的东西是如何相连的: 图由节点(node)和边(edge)组成。一个节点可以与众多的节点直接相连。 再来看这个图: 从1到5的最短路径是怎样的呢?由于节点比较少,我们一眼就可看出这条路径是最短的: 其实这就是一个广度优先搜索的例子。解决最短路径问题的算法称之为广度优先搜索。 解决这种最短路径问题需要两个步骤: 使用图来建立问题
爱吃西瓜的番茄酱
2018-04-04
8900
成为一名数据分析师,应该掌握怎样的技术栈?
数据分析师是不易被人工智能取代的新兴职业,相比算法工程师、人工智能工程师而言比较好入门。学好数据分析,也可为进一步的数据科学、机器学习打下一定的基础。 最近我知乎了各种如何学习数据分析之类的话题,get到了许多打开数据分析的正确姿势,现在就好好归纳总结一哈。 一:编程能力 是否会编程是区别初级数据分析师和高级数据分析师的分水岭。在这里,我定位的是高级数据分析师,所以编程能力尤为重要,我把它放在了第一位。 有关数据分析的编程语言有Python和R语言。R语言倾向于统计分析、绘图等。统计学家或者学统计学的喜欢用
爱吃西瓜的番茄酱
2018-04-03
1.5K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档