现在国内市场上活跃的BI软件有很多,从界面上看,琳琅满目
有这样的:
还有这样的:
以及这样的:
看起来确实是五花八门,各有特色
我们知道,BI的终极目标是做数据分析,这些花哨的可视化效果也是要为数据分析服务的,那么,从数据角度上看,这些BI有多大区别呢?
仔细研究这些产品会发现,无论什么样的界面,似乎都仅仅是做了个多维分析而已
先看交互界面:
这些不同的BI软件在界面上的各种操作,其实都是多维分析那些动作:切片、旋转,钻取等。所有BI软件都支持,本质上也就是对着一个数据集做个分组统计的交叉表,以及再把交叉表以图形的形式再呈现出来
比如我们先拖拽出一个表格出来,再把它的行列互换一下查看效果,也就是分析中常见的旋转动作,有的软件是这样的,把行列里的字段重新拖拽交换位置就可以
或者是这样的,也是拖拽,但是位置对应更直观一些
还有这样的,直接在表格上点击按钮实现的
但不管界面和操作方式有什么不同,最后都殊途同归,实现的功能都是一样的,包括其他的分析动作,也都一样,就是对这个交叉表改变一下维度,增加一些过滤条件,或者添加一些超链接,你能做我也能做,彼此并没有什么你强我弱的地方。不考虑界面操作的差异时,大家能干的活都是一样的,而且都和Excel那个透视表没什么区别,多维分析这么几十年来也一直就是这个样子
有个别产品在跨行组运算上有些扩充,但差别也不是很大
再看数据源:
BI产品用到的数据源通常也都是数据库(SQL),BI工具的作用就是用界面拖拽出一句SQL,然后再把SQL查询出的结果用来做上述的多维分析(即交互式的表格和图形呈现)。理论上这个界面可以拼出很复杂的SQL,但因为受业务人员的技能限制,结果也只有简单SQL能被拖拽出来,大抵是这样
SELECT D,…, SUM(M), … FROM C WHERE D’=d’ AND … GROUP BY D,…
也就是对着一个单一数据集(俗称宽表)按条件过滤后再按不同维度做统计汇总,各家产品基本都超不出这个范畴,没多大啥区别
比如稍复杂一些且较常见的多表关联(涉及JOIN),大部分BI产品也支持在界面上拖拽出来,但却要把表间关系直接暴露给用户让用户去选,这东西连技术人员理解起来都挺困难,业务人员就更无从理解了,就像给你一支笔,告诉你不管是蒙娜丽莎还是清明上河图,这支笔都可以画出来一样,
业务人员不会用,所谓的支持关联也就成了摆设,最终能用的上的,还是宽表,大部分厂家也都没有更好的解决方式,难点痛点也都一样
也有BI产品自己做CUBE,但那个也就是个速度更快一点的宽表(事实做了些准备和优化)而已,逻辑上和一个单表是一样的
至于交付形式:
绝大多数BI产品也都是一个大平台,用户管理,资源管理,权限,调度…各种功能都齐全,都是独立成体系一套系统。是否方便集成,能否DIY页面和功能,答案基本是NO
由上面罗列的种种可见,拨开不同的外观和界面后,其实都是相同的功能和逻辑了
就像买车一样,奔驰宝马能有多大根本的不同? 外观和内饰会各有特色,但整体的操控方式,乘坐感受却很难说出什么大的差异来
所以,BI产品其实没什么好选型的,功能基本都一样,基本不存在某个产品比另一款产品能做出更多更深刻的数据分析的现象(虽然厂商都会这么喊),选一个自己看着顺眼就行了,期望某个产品能比其它产品对业务指导更有意义,那就想多了
但还是有个例外。润乾报表的BI有点与众不同:
上面说到过,涉及JOIN的关联查询分析是BI厂商们共同的难题,让用户自助JOIN用户看不懂,用宽表提前JOIN好又存在很多弊端,最突出的一点是:宽表的关联是固定的,分析只能基于这些事先做好的关联进行,如果需求有变,那就分析不了了,就得等技术人员去修改或者重新制作宽表以后才能继续,这样就失去了分析的灵活性和自由度,是用户不能忍受的
润乾有一个独特的DQL引擎,可以很好地解决关联查询分析的难题,它不需要事先关联,也不是把技术人员都头疼的数据表直接让用户去自助关联,而是采用实时关联的方式,基于用户在页面拖拽实时生成关联查询,不仅解决了了关联的问题,也保证了分析的及时自由
至于BI软件大都解决不了关联分析的的难题,详情可以参考:
需要BI的用户本身大多都有自己的业务系统,选用了BI产品 后,通常只能独立部署、独立管理,这无疑会增大工作量和后期维护成本,也会存在风险和隐患
集成后,功能和页面还需要能随需而动才可以,可以根据用户的风格、需求去改造页面,修改功能,否则风格不匹配,功能不顺手,用起来也很别扭
润乾报表的BI部分是开源的。
开源和可集成其实一直以来都是技术人员对于BI软件的很大的诉求,只是因为大部分BI软件都是商用的独立的平台,大家也就渐渐不提这个事情,习惯于忍受了
真正找到一个功能全面又开源的,也就不用再忍受了
奔驰宝马没啥区别,但特斯拉是完全不同的
一个系统中,BI 和报表往往是共生的,有自助 BI 需求,大都会伴随有固定报表的需求,这就需要有一个固定报表的配套解决方案才行
因为BI不是万能的,它的能力边界在哪里,可以参考这个帖子
遗憾的是,大部分的BI软件,这方面都做的很不好,市场上只有极少数的BI厂商附带的报表工具能够解决复杂报表的难题。
润乾报表这方面就更具优势了,因为润乾本身就是专业的报表厂商,像这里的报表 传说中的中国复杂报表都长什么样?有什么特点? 都可以轻松搞定。润乾报表内置开源BI,直接就是一站式的完整解决方案了
BI基础功能方面,各厂商并没有太大差异,不同的就是界面及操作方式,但是BI的价值不在于颜值的高低,能够完成期望的数据分析目标以及方便地改造并适配自己的项目才更有价值
BI的开源与可集成性,以及关联分析能力高低,报表能力配套等,才是差异大的地方,才是更需要重点去考察的地方