首页
学习
活动
专区
工具
TVP
发布

奇点大数据

专栏作者
243
文章
215881
阅读量
50
订阅数
统计、概率和数据挖掘
统计、概率、数据挖掘,这几个词经常伴随出现,尤其是统计和概率两个概念,几乎就像自然界的伴生矿一样分不了家,有很多出版社都出版过叫做《概率统计》的书籍。 我们这本书本身也不准备从学术的角度给统计和概率做严格的区分,在平时工作中我们用的统计大多为计数功能,例如使用SQL语言对数据库的某些字段进行计数(count)、求和(sum)、求平均(avg)等。而概率的应用大多则是根据样本的数量以及占比得到“可能性”和“分布比例”等描述数值。当然,概率的用法远其实不止这些,在数据挖掘中同样用到大量概率相关的算法,我们后面会
刀刀老高
2018-04-11
6870
什么是信息
说到这里,我的同事王小妹非常认真且煞有介事地跟我说:“我觉得数字、字母、图像,这些都是数据,跟信息不信息的没啥关系。”看着她认真地跟我抬杠,我觉得蛮好,至少在认识数据过程中积极思考只有好处。 信息一词,在没有学术背景的情况下其实有着很多解释,例如,声音、消息、通讯系统传输和处理的对象,也就是人类社会传播的一切内容。1948年,数学家香农(Claude Elwood Shannon)在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。这句话如果要我们来举个例子说明的话,大概可以想象这样一
刀刀老高
2018-04-11
7270
大数据变现十日谈之一:大数据变现的本质
大数据变现十日谈之一:大数据变现的本质 大数据火热已经有至少两三年的样子了。不管每个人心中对大数据都是什么一个印象,这个词起码到现在我们已经不那么陌生了。 从学习Hadoop到学习各种数据挖掘机器学习算法,再到人工智能,这些无一不是广义大数据所讨论的一个子范畴。 大数据能否成为盈利工具?答案是肯定的。 我们使用Hadoop或者Spark这些框架进行分布式计算,目的是为了缩短计算和统计的时间,为运营与决策提供数据成本更为低廉和具有时效性。我们使用机器学习算法对数据进行深度的挖掘和处理,是为了深埋于其中的数据量
刀刀老高
2018-04-11
6510
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档