数据到信息到知识到智慧

数据到信息到知识到智慧

这是大数据时代,这是人工智能时代,这是一个数据驱动一切的时代。

中文确实博大精深,大家都在说大数据,说数据挖掘,说知识图谱,说人工智能。那这儿个词的定义,还真有必要仔细区分一下。

数据是测量的结果

无论是古埃及人夜观天象,得到日月星辰的运转,还是今天我们用仪器设备去测定各种指标。本质都是”观察“,观察的结果就是数据。

观察的角度不同,得到的数据也不一样。这取决于我们观察的目的,所以数据分析一定是业务需求导向

比如我们要做网站SEO。那么我们最直接就是观察排在最靠前的网站,都有什么特征。

几个可能影响排名的因素:网页大小、下载速度、网页链接数量、正文字数、url的目录层级、query在正文的出现次数、query分词后的词项在正文中的出现次数、query在title中的出现次数等十几个指标。

如果观察5000个网页,那将得到5000个结果,维度就是这些指标值。这就是数据,像日志,天天观察,那得到的结果,就是大数据。

信息是对数据的整理分析

比如,经过统计,比较等分析操作:

排在第一页的结果,平均正文字数500,第二页~第五页的结果依次递减;

排在第一页的结果,平均网页包含的链接数量130,第二页~第五页的结果依次递增;

其他指标,在所有分页中均无明显波动。

知识是对信息的提炼,本质表达

比如,上述信息,很容易表达成知识:网页正文字数和网页包含的链接会影响长尾词的排名

覆盖长尾词的页面,保证正文字数控制在500字以上,网页中包含的链接控制在130以下,会提高网页出现在百度首页的概率

智慧是人类的事情,这是一种悟

AI就是希望机器,在数据到知识的基础上,进一步能够产生智慧,目前看,还很难。

关于作者:魏佳斌,互联网产品/技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理/码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。致力于使用最前沿的认知技术去理解这个复杂的世界。

本文来自企鹅号 - AI量化实验室媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我是攻城师

你选的不是专业,而是阶级

46150
来自专栏FreeBuf

极客DIY:如何利用树莓派提高睡眠质量?

众所周知睡眠是人类生活不可或缺的一部分,如果睡眠不足会引发很多问题(身体、情绪等),那么怎么和树莓派有关系呢?请看看下面文章相信对你会很有帮助。 写在前面 过去...

29050
来自专栏hbbliyong

每个人都应该看的--怎样管理您的知识

知识管理方法论解决的是效率和效果的问题,其实没有方法论的时候,足够的专注和努力也是可以的,许三多就是这方面的典型代表,他几乎没有什么技巧性的方法,完全是靠执着...

301110
来自专栏互联网数据官iCDO

为什么对比测试可能会扼杀转化率

前言:对比测试可能导致产品转化率下降?你没听错,看完本文你就会找到答案! 如果你已经尝试了所有方法,但产品的转化率依然处于下滑趋势,那么对比测试可能是导致这种现...

29960
来自专栏大数据和云计算技术

大数据和云计算技术周报(第53期)

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

9340
来自专栏知晓程序

微信小程序新版二维码出炉!居然一眼就记住了

仍是熟悉的夜间模式,仍是熟悉的出人意料。但这次发布的,并不是熟悉的新能力,而是把大家再熟悉不过的二维码换了个并不熟悉的新造型。

13810
来自专栏数据的力量

数据分析工具--R语言各种优点

23830
来自专栏ThoughtWorks

基于GitHub的敏捷学习方法之道与术|洞见

持续行动,持续反思,持续进步。—— via. 敏捷学习宣言 前言 对时间的敬畏 需要好多年才能懂得,最好不是去震惊世界,而是要像易卜生所说的,生活在世界上...

37330
来自专栏web前端教室

刚进公司,接手了一个烂项目,要不要继续?

如题,刚进公司,说是做新项目,刚开始有一些眉目。结果领导不知从哪接了个活儿过来,代码各种烂,重复代码一堆,一个大函数1000多行。说是临时抽你过来顶上去做,做一...

31480
来自专栏腾讯数据中心

Google对数据中心成本模型的分析——下

(接上文《Google对数据中心成本模型的分析——上》) 三、案例分析 虽然变量繁多,但通过观察不同行业的小部分数据中心案例,仍有助于我们理解这些成本因素的影响...

81280

扫码关注云+社区

领取腾讯云代金券