健康医疗大数据,数据自身“健康”是关键

众所周知,数据是事实或结果,是用于表示客观事物的未经加工的的原始“素材”。这种“素材”应当具备真实性、完整性、一致性、准确性和自洽性,这是数据的基本属性,亦称数据的绝对质量。保证原始数据的可靠性,是大数据分析利用的前提。

数据是信息的表现形式和载体,信息是数据的结果和内涵。影响数据质量“健康”的因素主要来源于信息因素、技术因素、流程因素、管理因素和环境因素。

信息因素

产生数据质量问题的信息因素主要有:数据采集人或获取人信息意识,对数据来源、数据产生、数据价值、数据用途、数据描述的认知程度和理解程度,以及采集数据的操作技能等。

技术因素

影响数据“健康”的技术因素包括数据创建、数据获取、数据传输、数据装载、数据使用、数据维护等方面。

流程因素

作业流程和人工操作流程设置不当可造成的数据质量问题,主要来源于系统数据的创建流程、传递流程、装载流程、使用流程、维护流程和稽核流程等各个环节。

管理因素

管理因素是由于管理机制不畅、约束机制不严、管控措施不当导致的管理缺失或管理缺陷等问题,造成数据质量良莠不齐。

环境因素

环境因素主要包括与此相关的政策法律环境、设备设施环境、分析应用环境、技术保障环境、配套服务环境等。

医疗数据来源分析示意

来自:《中国数字医学》

医院信息系统是产生医疗数据的重要来源。信息化的医疗数据、临床科研教学数据、病人特征数据,以及移动设备、社交网络产生的医疗健康相关数据,为医疗健康大数据提供了多元化和多态性保障数据。

完善规章制度,确保数据质量管控有章可循;建立管控机制,确保原始数据可靠可信,不断强化数据质量管控理念,是确保数据自身“健康”的关键所在。豪厘不伐,将用斧柯。我们应当以狮子搏兔之举,动中窾要,从数据源头抓起,切实关注高楼之基的数据“健康”,以焕发数据的价值与生机。

原文发布于微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文发表时间:2017-07-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

如何设计一个不讨人厌的AI?“恐怖谷”了解一下

1172
来自专栏AI科技评论

线性资本王淮:明年人工智能泡沫将达到顶点

虽然说当下几乎各行各业都在拥抱人工智能,但你是否知道人工智能曾经有过一段时间被忽视,且只能以数据挖掘、机器学习等其他称呼来进行代替? ? 近日由网易科技和网易智...

2999
来自专栏企鹅号快讯

与AI赛跑?麻省理工发布AI指数 称人类常常“错估”人工智能

原标题:与AI赛跑?麻省理工发布AI指数 称人类常常“错估”人工智能 一份新的报告试图具体衡量人工智能混乱的进展。 ? 人工智能到底有多聪明?进展有多快? 这些...

1935
来自专栏人工智能头条

【AI创新者】第四范式首席架构师胡时伟:机器学习应用要坚持价值和结果导向

951
来自专栏AI科技大本营的专栏

谷歌AI正式来中国了,机器学习三大职位正在招聘...如果你想跟李飞飞一起工作的话

12月13日上午,在谷歌开发者大会上,Google Cloud人工智能和机器学习团队的首席科学家李飞飞宣布,谷歌AI中国中心在北京成立。 谷歌AI中国中心将由李...

3649
来自专栏数据派THU

独家 | 王海峰:百度大数据与人工智能

1月28日上午,由中国工程院和清华大学联合主办的“长城工程科技会议”第四次会议工业大数据分会在清华大学信息科技大楼召开。中国工程院院士李伯虎、工业和信息化部信息...

42014
来自专栏ATYUN订阅号

赫尔辛基大学AI基础教程:关于预测未来(6.1节)

说些你可能会感到失望的话,我们不是巫师,不会有一个水晶球可以向我们展示未来世界会是什么样子,以及AI如何改变我们的生活。

1274
来自专栏大数据文摘

机器人“女神”亮相GMIC:大数据与人工智能关系几何?

22610
来自专栏顶级程序员

2017年一线城市程序员工资大调查

编者按:作者爬了某招聘网站,获取近一周的程序员工资18275条。其中,有工资的17628条(北京4892,上海5073,广州3386,深圳4277)。本文分别...

3237
来自专栏人工智能头条

阿里A.I. Labs王刚:找到合适的应用场景是实现AI商业化的关键

1361

扫码关注云+社区

领取腾讯云代金券