很多朋友安装好Power BI Desktop后,就马上开始导入数据、清洗、建模、写公式、出图表……很爽,对不对?
别急!在正式开始数据处理之前,这几个选项,我个人建议先修改一下。
一、关于缓存
在数据加载选项卡里,应确保当前已使用缓存比允许的最大值低,如果已使用缓存接近允许的最大值,而硬盘还有足够空间的话,建议修改允许的最大值。
除以下两种情况,一般不建议清理缓存,因为清理缓存会导致在查询编辑设计的时候运行效率降低:
二、关于自动检测数据类型
在“全局”菜单的“数据加载”项下,可设置是否对PBI导入数据源时是否检查列的类型,可按需要选择始终检测、按每个文件设置、从不检测三种情况。
如果选择“始终检测”或“从不检测”,则在“当前文件/数据加载”的“类型检测”中不能再单独设置。
对于这个选项,可按照自身工作所面对数据的实际情况来选择,如果发现自动数据类型检测经常存在错误,需要事后手工调整,建议取消自动类型检测。
比如我工作中的数据,存在多个数值类型文本的代码列,每次自动检测都会被转换为数值,因此,我通常会取消自动类型检测的功能。
实际上,取消了该自动检测功能,在Power Query中,要对列进行类型检测操作,也非常简单方便,按需要选择部分(配合ctrl或Shift键)或全部(Ctrl+A),然后点击“检测数据类型”按钮即可:
三、取消自动关系
这又是一项看似很“智能”的功能,即,数据加载的时候,PBI会检测表里的列跟其他表列的数据情况,给可能存在匹配关系的两表列自动建立关系。
但是,我一般建议也是取消掉。
表少的时候,省不了多少工夫,表多的时候,自动创建的关系经常有很多时多余的,且容易存在错误,出错时,找错比较麻烦;而且,有时还不会直接报错,直到后期叠加数据或做某些数据计算时才发现,这时处理起来就会比较麻烦!
比如,很多朋友在使用中碰到这样一个问题,一开始导入数据的时候,没有什么错误,导入更多的数据的时候,提示某些表中的数据存在重复项,结果无法实现数据的加载应用:
这个时候,往往就是因为一开始导入部分数据的时候,没有重复数据,而此时Power BI自动将这个表和其他表建立了你并不需要的或是错误的数据关系,并且将这个没有重复的数据列用作两表关系的一端,当导入更多数据时,出现重复值……
这个功能对于初学者来说,看似很智能、自动,但实际上并不实用,只要稍微深入学习Power BI,并要应用到实际工作当中,就应该自己动手去创建表间的关系,而不是直接丢给Power BI去做自动的判断。
四、取消自动日期
很多朋友估计都遇到一个很烦的事情:日期列直接变成了“年>季度>月份>日”的层级结构,每次放入图表时,也是整个层次结构:
这其实就是来自于“自动日期/时间”的选项设置!
这个选项设置的本意是:为模型中的日期列自动创建一个隐形的日期表,为使用时间智能函数提供便利,但是,每个日期列背后都自动带上一个日期表,其实是很冗余的。
但是,从实际应用来说,应该自己动手建立统一的日期表,既避免前面所说的日期应用时层次结构化带来的麻烦,又能减少pbi背后生成大量日期表导致的效率问题,尤其是当数据中日期类型的列比较多的时候。
以上几项,都是基于我个人在实际工作中的一些经验总结,供大家参考,希望对大家有一定的帮助。
本文分享自 Excel到PowerBI 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!