什么是元数据(元数据管理架构解析)

seoxin 06-07 11:38 13次浏览

元数据管理是企业数据治理的基础。企业以元数据为抓手进行数据治理,帮助企业更好地对数据资产进行管理,理清数据之间的关系,实现精准高效的分析和决策。今天就带大家深度解析下元数据管理。

认识元数据和元数据管理

元数据的定义是“关于数据的数据”,元数据与数据的关系就像数据与自然界的关系,数据反映了真实世界的交易、事件、对象和关系,而元数据则反映了数据的交易、事件、对象和关系等。简单来说,只要能够用来描述某个数据的,都可以认为是元数据。

什么是元数据以及元数据管理架构

举个例子:如果将图书馆里面的某一本书当作数据,那么所有用来形容这本书的数据比如书名、书的作者、书的所属类别等都是这本书的元数据。

对于企业而言,元数据是跟企业所使用的物理数据、业务流程、数据结构等有关的信息,描述了数据(如数据库、数据模型)、概念(如业务流程、应用系统、技术架构)以及它们之间的关系。

元数据管理是对数据采集、存储、加工和展现等数据全生命周期的描述信息,帮助用户理解数据关系和相关属性。元数据管理工具可以了解数据资产分布及产生过程。实现元数据的模型定义并存储,在功能层包装成各类元数据功能,最终对外提供应用及展现;提供元数据分类和建模、血缘关系和影响分析,方便数据的跟踪和回溯。

元数据管理平台架构

元数据管理统一管控分布在企业各个角落的数据资源,企业涉及的业务元数据、技术元数据、管理元数据都是其管理的范畴,按照科学、有效的机制对元数据进行管理,并面向开发人员、最终用户提供元数据服务,以满足用户的业务需求,对企业业务系统和数据分析平台的开发、维护过程提供支持。

作为企业数据治理的基础,元数据管理平台从功能上主要包括:元数据采集服务,应用开发支持服务,元数据访问服务、元数据管理服务和元数据分析服务。

1、元数据采集服务:能够适应异构环境,支持从传统关系型数据库和大数据平台中采集从数据产生系统到数据加工处理系统到数据应用报表系统的全量元数据,包括过程中的数据实体(系统、库、表、字段的描述)以及数据实体加工处理过程中的逻辑;

什么是元数据以及元数据管理架构

亿信华辰元数据管理平台内置多种采集适配器,支持多种存储格式的元数据自动获取,如:数据库、报表工具、ETL工具、文件系统等,同时无法完成自动获取的元数据,提供了可自定义的元数据采集模版完成元数据的批量导入。

2、元数据访问服务:元数据访问服务是元数据管理软件提供的元数据访问的接口服务,一般支持REST或Webservice等接口协议。通过元数据访问服务支持企业元数据的共享,是企业数据治理的基础。

3、元数据管理服务:实现元数据的模型定义并存储,在功能层包装成各类元数据功能,最终对外提供应用及展现;提供元数据分类和建模、血缘关系和影响分析,方便数据的跟踪和回溯。

什么是元数据以及元数据管理架构

亿信华辰元数据管理平台提供各类元数据管理,包括:业务元数据、技术元数据和管理元数据,支持元数据的基本信息、属性、依赖关系、组合关系的增删改查操作。最新元数据和定版元数据隔离,在最新元数据中的改动不影响定版元数据的正常使用,同时每次发布都有版本留痕,支持各版本的对比分析。

4、元数据分析服务:元数据的应用一般包括数据地图,数据的血缘、影响分析,全链分析等;

什么是元数据以及元数据管理架构

亿信华辰元数据管理平台提供了丰富的元数据分析功能,包括血缘分析、影响分析、全链分析、关联度分析、属性值差异分析等,分析出元数据的来龙去脉,快速识别元数据的价值,掌握元数据变更可能造成的影响,以便更有效的评估变化带来的风险,从而帮助用户高效准确的对数据资产进行清理、维护与使用。

血缘分析:告诉你数据来自哪里,都经过了哪些加工。

影响分析:告诉你数据都去了哪里,经过了哪些加工。

冷热度分析:告诉你哪些数据是企业常用数据,哪些数据属于僵死数据。

关联度分析:告诉你数据和其他数据的关系以及它们的关系是怎样建立的。

数据资产地图:告诉你有哪些数据,在哪里可以找到这些数据,能用这些数据干什么。

元数据管理价值

元数据管理到底有什么用?图书馆的目录卡片只是一个很简单的元数据管理,在企业中,元数据管理会更为全面,难度更高,同时也将带来更多的收益:

元数据管理平台为用户提供高质量、准确、易于管理的数据,它贯穿数据中心构建、运行和维护的整个生命周期。同时,在数据中心构建的整个过程中,数据源分析、ETL过程、数据库结构、数据模型、业务应用主题的组织和前端展示等环节,均需要通过相应的元数据的进行支撑。

通过元数据管理,形成整个系统信息数据资的准确视图,通过元数据的统一视图,缩短数据清理周期、提高数据质量以便能系统性地管理数据中心项目中来自各业务系统的海量数据,梳理业务元数据之间的关系,建立信息数据标准完善对这些数据的解释、定义,形成企业范围内一致、统一的数据定义,并可以对这些数据来源、运作情况、变迁等进行跟踪分析。

总结:元数据是企业数据资源的应用字典和操作指南,元数据管理有利于统一数据口径、标明数据方位、分析数据关系、管理数据变更,为企业级的数据治理提供支持,是企业实现数据自服务、推动企业数据化运营的可行路线。当然这一切离不开元数据管理工具的推动。

  • 暂无推荐