这是《数据要素十节课》第十篇,数据基础设施。
这就第十篇了,还真略微有些不舍呢。那就再写第十一篇第十二篇啥的,凑合看吧。
一,数据基础设施是啥?
18.数据基础设施,是从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施,是集成硬件、软件、模型算法、标准规范、机制设计等在内的有机整体。
国家数据局《数据领域常用名词解释》
解读一下,之前我以为围绕存力、算力、运力的硬件是数据基础设施,看来我还是草率了,这只是数字基础设施。而数据成为关键生产要素之后,数字基础设施要向数据基础设施升级了,在数据要素处理全链条上的软件系统和平台都是数据基础设施,包括数据采集系统,数据管理平台,数据加工处理平台,数据运营平台,数据开放共享平台,数据流通交易平台,可信数据空间,数据安全系统等。
二,数据基础设施有啥机会?
大逻辑就是和行业关联性不大的、比较通用的数据基础设施已经机会不大了,与行业强相关的还有机会。因为人么总是想先做通用的,后做难度大的。一来做好了可以平推,貌似收益很大;二来不需要啥业务知识,懂技术似乎就行,行业门槛不高。
先说没机会不大的。数据汇聚、数据管理、数据加工处理、传输、数据安全等相关的系统已经机会不大了,数据还不是生产要素的时候这些系统就都在使用,都是旧东西。这些系统的使用方式和习惯也形成了,市场的格局和品牌影响力已经很稳固了,新入局者基本上没啥机会,千万别拿你的兴趣去battle别人的专业,那就会是传说中的以卵击石。不过一定要入局也不是不行,可能会是努力了半天连先入局者的尾灯都还没看到,加油吧少年!
再说比较有机会的。数据开放共享平台,数据运营平台,数据流通交易平台,这些还都是比较有机会的,这些都是新概念新东西,且与行业甚至地区都关联性很大,定制化的需求会比较多,那只要你踏踏实实弄一两个点,还是可以弄出一些成绩的。
特别说一下,可信数据空间,这里是个机会。因为数据本身就没咋流通,且现在各方都在大力推动可信数据空间的事儿,那谁的可信数据空间高效,安全,那自然就会成为给力的数据流通的基础设施,那自然就会占据更多市场咯,毕竟事实胜于雄辩嘛。这里涉及到大量隐私计算、区块链啥的技术知识,对技术选手比较友好。
还有模型,这里也是个机会。这是为了数据更好利用,只是数据干巴巴地杵在那儿,其实价值不大,很糙很难用也很难显现价值。数据要想赋能到行业,必须得与模型结合,这里面就涉及到垂类的行业/业务模型了,无论是小模型还是大模型现在都向垂类去发展,因为再漂亮的东西也要给到行业带来价值,否则都是绣花大枕头。这里涉及到大量的行业知识,对深耕行业很多年的选手比较友好。
16.可信数据空间,是指基于共识规则,联结多方主体,实现数据资源共享共用的一种数据流通利用基础设施,是数据要素价值共创的应用生态,是支撑构建全国一体化数据市场的重要载体。可信数据空间须具备数据可信管控、资源交互、价值共创三类核心能力。
国家数据局《数据领域常用名词解释》
三,数据基础设施谁来干?
数据基础设施业务有一个鲜明的特点,那就是扫完一屋才可扫天下。你得先把自己的数据放在你的数据基础设施上、用你自己的数据技术去跑通了跑好了跑顺了,你才能说你的东西是中用的,别人才会信你的东西。所以核心还是数据,你的数据基础设施到底中不中用数据说了算,数据跑得多数据跑得快数据跑得好,那就行。否则吹得再天花乱坠,也不太行。
所以,最合适的还是拥有数据的选手来干,毕竟你自己的数据都敢在你的数据基础设施上跑,那这个数据基础设施也不会差到哪儿去。当然,如果你是一个疯起来连自己都坑的狠人,也没辙了。次合适的就是拥有爆炸技术的选手来干,这些选手没别的,就是出了名的技术好,耐得住寂寞,也应该可以干好。
数据基础设施真的很基础,共勉!
领取专属 10元无门槛券
私享最新 技术干货