DB23_T 3820—2024 工业互联网综合平台数据质量管理规范.docx
ICS35.24050CCS1.67DB2311n龙江省地方标准DBXX/TXXXXXXXX工业互联网综合平台数据质量管理规范(报批稿)XXXXXXWtIXXXX-XX-XX复布黑龙江省市场监督曾理局发布本文件按照GBb1.12020标准化I:作导则第I部分:标准化文件的结构和起草规则:的规定起草.请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的黄任.本文件由廛龙江铃工业和信纪化厅提出并归I本文件起电单位:哈尔滨理工大学、双龙江省标准化研究院、黑龙江省网络空间研究中心、中数(深圳)时代科技有限公司、哈尔滨工业大学、国家电网有跟公司.国网黑龙江省电力有B1.公司电力科学研究院,本文件主要起草人:马超、刘志«5、吴宏伟、张罗刚、周廷桶、张颇遵、赵天诚、陈晓明、李双翼、叶子、关志卿.黄海、曲家兴、方舟、白瑜、于海宇、吴英东、王孝氽、乔羽、史心月、尚方、刘生.工业互联网综合平台数据质管理规范1»本文件界定了I:业互联网综合平台数据场fit管理的术语和定义,规定了数据质方管理要求等内容.本文件适用于工业互联网煤合平台数据质量的定义、测量、分析、改进、控制.2短范性引用文件下列文件中的内容通过文中的现也性引用而构成本文件必不可少的条款.其中,注日期的引用文件仅该日期对应的版本Ifi用于本文件:不注H期的引用文件,其最新版本(包括所有的修改单)Jfi用于本文件.GB,T250.12-2017系统软件I:程系统。软件场属要求和评价(SQUaRE)第12部分:数据质垃模型GB,T36344信息技术数据历fit评价指标GB1T394002020工业数据榜Ift通用技术规范GET42381.8数据Afi1.ft第8部分:信息和数据质量:概念和测量3术重和定义GB-T394002020界定的以及下列术语和定义适用于本文件,3.1工A互联川媒合平台以工业互联忖平台为基础,支持汇聚数据、嵌务、用户等谷类资源,具备数据蛆成分折、应用支撑能力和基础双用能力.支林省域内特色组、专业型、企业级等平台的槊成和接入,支撵制造费源泛在连接、井性供给、高效配置和亦同创新的载体.3.2MAS在指定条件下使用时.数擀的特性满足明确的和Ra含的要求的程度.来源:GBT23000.122017.4.3)3.3敷量g指导和控制某机构数据质!的协调活动,来源:GB.T394002020.3.2)3.4M1.tBnTA运用信息化技术和管理方法来规划、实施数据版t的定义、测啦、分析、改进、控制等一系列活动的工具.3.5定元家用来描述数据岖的定地侦盘信息,用来农达符合数据规范的科度.1 来源;GB,T39400-2020.5.214Rf1.MVMfi4.1 依据质量管理模型包括“定义-熏-分析-改进-控制“把环(DMAK:)的5个阶段,其中:A义U)Cfine):明确项1.1.范困和I1.标.识别并定义需要改进的问咫或机会;b)MW(Measure):收集当IW过程的数纲和度以了解过程的性能和识别关健质哒特性,O分析(Ana1.”x>:理解数据,识别问三S的根本旗因,以及确定影响过程较出的关键因素;d)改进(Improve):开发和实施解决方案,消除存在的何期;e)控制(Con1.MI):确保改进的成果得以推持,并防止过程I可白到.晚来的状态.4.2工业互联网综合平台数据质号:管理翻型见图1.定义Mf1.MX测量用最4式电求收疑及破物性加分费控制教此整改和的拄报的分析MMMft效据施依内依次M1.H小由口测质力SaaBa*ditAAain««ftWHitj1工业互联川修合平台事K三6我宸义5.1 定义要求5.1.1 应依据工业互联网炼合平行的泞理而术.4,三讦讨程中的数据需求进行洋早的分析,井参考外部监管机构的相关规量,以确保数据Min管理目标与企业故略相匹配.5.1.2 应依据I:业互联网烁合平台的数据质台管理目标,结合数据类型和数据Wifft特性,全面评估数据的来源、使用僧境及用户需求,以界定数据旗量代理的关键箍度.5.2 AMASWtt1.2.1 -Btt描述数据应遵循统一的规范,数据集合保持统一格式.1.2.2 般范性描述数据应遵册预定的语法规则,数据类型、格式、取值范惕、存储格式等应符合定义.1.2.3 制性描述数据不应存在脱失记录或缺失字段.1.2.4 时效性描述数据的产生和供应应及时.1.2.5 Wft描述数据应与其对应的客观实体的特征相一致,1.2.6 可访问性描述数据应能够被用户使用.1.2.7 分类工业互联网综合平台数据包括但不限于电力、制造、物流运输、煤炭、燃气、建筑、水务、现代服务、化J冶金等行业短域产品和服务全生命周期产生和陶川的数据,结合行业要求、业务规模、数据2底等实际情况,可将数据分为以下类型:a)研发数据;包括研发设计数据、开发测试数据等;b)生产数据:包括控制信息、工况状态、工艺参数、系统FI志、生产质状数据、生产实统数据等:O供应处数据:包括供需计划数据、仓储物流数据等:d)营镣数据:包括投标次数.U单数屋、交易金叔、客户异议数据等:e)运的数据:包括产品运行状况数据、产品竹后服务数据等:0管理数据;包括客户基本信息、业务合作数据、人事财务数据、系统设备货产信息、产品基本信息'项目进度致招、业务统计致掘(仙资源量数据'能耗监测数据)等:g)金融服务数据:包括信贷服务数据、融资租赁服务数抠、征信服务故如等:h)平台运花数据I接入的设的数据、工业模型库数据.工业APP数据、平台运行数据等:i)外就数据:与其他主体共享的数据.6 *f1.*M*6.1 *1RAMS*H按GBrr42381.8的燮求.数据质地测他的应满足以下准Wha)谙法:数据质量应符合其特定谱法的程度:b)语义:可识别的数据定录元素与所表示的实体之间唯一且无:义性的对应关系:O语用:数据使用性要求的符合度.6.2 数据质费量方法对可用于数据集的所有数据质Ift定量元素加以测盘.判断这些元素是否符合数据质量定义和测址准则.7 IMMt分析7.1 数据国量分析准则7.1.1对数据质及测网过程中发现的数据质敬向题应迸行深入分析,并探究影响数据顷M的根本原因。7.1.2对测域出的数据砥求问魄依据严Hi性和影响范阳应进行优先级持序,确保关键问题得到及时解决-7.1.3应时数据质量趋势进行定期监测和分析,以使侦测潜在的数据风险.并制定欣防措施.7.1.4应时数据顷以改进措施的效果诳行分析,确保所采取的行动能够实旗性地提升数班质量,并根据分析结果调整改进策略.7.2 MAfttt1.E应根据数据质证分析准则对平台企业的数据质收情况进行核查,若发现数抵质以问题及时向数据管理人员进行反馈并生成阿即报告88.1 改进指籁8.1.1 应根据数据质奴分析结果,提供针对同鹿数据的质状提升建议,制定相关数据的修正、格式的标准化以及数据源的优化等改进措施。&1.2应提供数据标准化、数据清洗、数据转换和数据整合等工具,对不符合质量标准的数据进行£效处理,纠正存在的数据质量同Sfi.8.1.3 应建立一个系统化的数据质阜整改流程,包括将改任务的分配、执行、审核和反馈,确保整改措施得到有效实施.&1.4对整改过程应进行监控和记录,包括整改效果的评估和记录,以便持续追踪数据质量改进的成效,为未来的质砥控制提供舒考,&2敷据质量合"J*8.2.1 应时数据麻法进行持续跟踪,详细记录数据质的事件的评估过程、初步诊断结果以及采取的后续行动,确保能修蛤证数据质玳改进措施的有效性,8.2.2 对系统中发现的问虺应及时修正,并对数据标准进行完善.以提高数据而Ift的整体水平.8.2.3 应建立数据质豉合规跟踪的反馈机制,收集数据使用过程中的反馈信息,为数据质衣的持续改进提供依据,9KBMff1.M9.1 ft*AU三9.1.1应对数据流向迸行控制,确保能纷清晰识别数据的来源和目的地。9.1.2 对数据处理的每个环节应进行严格控制,确保数据处理活动的透明性和可追溯性。9.1.3 对规则校验结果应进行实时监控和深入分析,确保校验结果能鲂准隔关联到具体的原始数据项。9.1.1应建立多维度的数据质仪评估体系,从不同角度控艇数据横加,以全面识别潜在何意9.1.5应建立动态调整机制,根据监控结果和业务发展需求,灵活调整控制规则,以适应不断变化的数据环境。9.2朋量警报9.2.I应提供定制化的数据质量警报设跣,允许用户根据特定噩求和偏好定义告警条件、通知方式和紧急程度.9 .2.2应确保数据质显管理I:具的可用性和实时性.以便在数擀问遨发生时,能绯不间断地向相关人员发送准确及时的警报信息.10 2.3对识别出的问题数据应及时触发结果告警机制,价保相关人员能修迅速获得通知并采收相应措施,9.3 数1R整改按本文将8I条的要求,对向翅数幅进行用改.9.4 航控报告9.4.1 应对数据质雄北i校结果详细记录,并形成数据质小监控报告。9.4.2 应支持在线杳看材项业务规则同冠数据的详细情况,以及打包卜我对应的问题数据,便于进步分析和处理.9.4.3 应提供数据质量检测报告的查看和下载功能,以及数据质量监控报告的访问,确保用户能够方便地获取所需信息“9.4.4 应支持定制化报告功能.允许用户根据检定需求选择报告内容、格式和详细程度,以满足不同场景下的报告需求,数据质后监控报告应包括但不限产以下内容:a)历史检测记玳的数据波动梢况,展示数据桢戕的时间的演变趋势,为趋势分析遑供数据支持:b)本次短出检测的执行时间、检测济果等基地信息以及数据旗盘的动态变化怡况,梢助识别改进或退化的领域:C用项业务规则的检测数据盘、问即数据S1.合格率等详细信息.提供显化的数据质fit管理指标.考文Itt11IGBT360732018数据管理能力成熟度评估模型(2018年)2GB.T42021-2022工业互联网总体网络架构国家标准(2022年)3)工业互联网创新发屣行动计划(2021-2023年)4工业互联网标准体系(版本3.0)(2021年)5工业互联网综合标准化体系建设指南(2021版)6工业互联网标识解析体系“宽通”行动计划(2024-2026年)