首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据到信息到知识到智慧

数据到信息到知识到智慧

这是大数据时代,这是人工智能时代,这是一个数据驱动一切的时代。

中文确实博大精深,大家都在说大数据,说数据挖掘,说知识图谱,说人工智能。那这儿个词的定义,还真有必要仔细区分一下。

数据是测量的结果

无论是古埃及人夜观天象,得到日月星辰的运转,还是今天我们用仪器设备去测定各种指标。本质都是”观察“,观察的结果就是数据。

观察的角度不同,得到的数据也不一样。这取决于我们观察的目的,所以数据分析一定是业务需求导向

比如我们要做网站SEO。那么我们最直接就是观察排在最靠前的网站,都有什么特征。

几个可能影响排名的因素:网页大小、下载速度、网页链接数量、正文字数、url的目录层级、query在正文的出现次数、query分词后的词项在正文中的出现次数、query在title中的出现次数等十几个指标。

如果观察5000个网页,那将得到5000个结果,维度就是这些指标值。这就是数据,像日志,天天观察,那得到的结果,就是大数据。

信息是对数据的整理分析

比如,经过统计,比较等分析操作:

排在第一页的结果,平均正文字数500,第二页~第五页的结果依次递减;

排在第一页的结果,平均网页包含的链接数量130,第二页~第五页的结果依次递增;

其他指标,在所有分页中均无明显波动。

知识是对信息的提炼,本质表达

比如,上述信息,很容易表达成知识:网页正文字数和网页包含的链接会影响长尾词的排名

覆盖长尾词的页面,保证正文字数控制在500字以上,网页中包含的链接控制在130以下,会提高网页出现在百度首页的概率

智慧是人类的事情,这是一种悟

AI就是希望机器,在数据到知识的基础上,进一步能够产生智慧,目前看,还很难。

关于作者:魏佳斌,互联网产品/技术总监,北京大学光华管理学院(MBA),特许金融分析师(CFA),资深产品经理/码农。偏爱python,深度关注互联网趋势,人工智能,AI金融量化。致力于使用最前沿的认知技术去理解这个复杂的世界。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171225G0Q4B200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券