数据的概念很大,数据本身有不同的载体,可以是文本、可以是表格、可以是音频、也可以是视频…… 如果我问:数据有没有价值?如果有,有什么价值;如果没有,为什么? 你会怎么回答? 我个人觉得这个问题有点不好回答。 首先,数据从格式上来讲,分为格式化数据与非格式化数据。打个比方:如果把数据也作为一种能源来看的话。非格式化数据就像是原油一样,而格式化数据,就是汽油、柴油!如果把我们的系统看成是需要能源驱动的机械设备,那我们需要的是能直接使用的柴油、汽油! 你说原油有没有价值,当然有!但是对于广大的私家车车主来说,原油有什么用?能让小汽车跑起来吗?我们需要的是汽油!
如上所言,从数据到最终的应用,中间需要进行大量的处理(精炼石油)。我们做的系统,就像私家车,系统需要的是标准的数据,不是什么数据都能处理。而原始数据,就像原油。把原始数据,变成可用的数据,你选择哪种方式?给私家车加上炼油装备?还是直接买成品油?你往大街上瞅瞅,有没有加石油的车!
反应到技术层面,我认为:与其给系统增加接入多源数据的能力(炼油装备),不如将数据处理的能力拆分出来,形成专门的数据团队。让开发做开发,让分析做分析,让数据做数据! 没有油,你小车再高级,跑两圈看看!