数据质量,数据质量究竟是何物?
今年上半年,中国船级社(CCS)发布了《船舶数据质量评估指南》,用于支持业界开展船舶数据质量、数据管理成熟度、数据安全等方面的评估。在指南研究的基础上,CCS积极响应行业需要,建立并推出数据质量评估服务。近日,NK船级社也发布了《数据质量指南》,对船上数据质量控制进行了概述。那么,如何衡量数据质量呢?
数据质量是什么?
数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度。在不同的业务场景中,数据消费者对数据质量的需要不尽相同,有些人主要关注数据的准确性和一致性,另外一些人则关注数据的实时性和相关性。因此,只要数据能满足使用目的,就可以说数据质量符合要求。
元数据:定义和描述其他数据的数据以及描述属性和描述数据的相关信息的数据。
船上数据:指在船舶上产生的数据(包括运行数据、报告数据等)。大部分数据有机载传感器自动检测和生成,但也包括手动输入数据。
如何评价数据质量
完整性(Completeness):完整性用于度量哪些数据丢失了或者哪些数据不可用。
规范性(Conformity):规范性用于度量哪些数据未按统一格式存储。
一致性(Consistency):一致性用于度量哪些数据的值在信息含义上是冲突的。
准确性(Accuracy):准确性用于度量哪些数据和信息是不正确的,或者数据是超期的。
唯一性(Uniqueness):唯一性用于度量哪些数据是重复数据或者数据的哪些属性是重复的。
关联性(Integration):关联性用于度量哪些关联的数据缺失或者未建立索引。
如何提高数据质量
指对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。

来源:NK
NK指南指出,管理数据生命周期和继续创建所需的值也需要数据管理。数据质量管理是数据管理的基本组成部分。数据管理和数据质量都需要一个像ISO9001中描述的ONC那样的系统。以确保不断提供良好的产品和客户满意的服务。
数据管理控制,其中PDCA循环(如ISO9001中的质量管理体系)用于实时数据质量管理活动。
由于数据质量管理的过程取决于从数据使用计划时开始计划,还是针对已在使用的数据,因此有必要根据实际情况引入PDCA循环。

来源:NK
数据质量维度
用来衡量数据质量的支部叫做“维度”。在衡量数据质量是,有必要使用与数据性质相匹配的维度;此外,在某些情况下,甚至可能需要使用多个维度。NK指南介绍的维度如下:
● 完整性
● 唯一性
● 时效性
● 有效性
● 准确性
● 一致性
本文标题:数据质量,数据质量究竟是何物?
本文链接:http://www.hniuzsjy.cn/caixun/18945.html
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。
