数据架构整合企业的数据并标准化,支持整个企业信息最有价值的工作,关联图:
(资料图片)
一、概念
1、企业架构 数据架构是企业架构中的一部分。企业架构整合了数据、 流程 、组织、应用和技术架构。帮助组织进行变更 管理 ,提高效率、灵活性,以及明确管理责任。使得组织可以应对不断变化的 市场 机会、业界挑战和技术进步,帮忙评估业务风险、管理变革、改进业务有效性、敏捷性和可问责性。企业架构包括: 1)信息架构:业务实体、关系、属性、定义、代码项(参考值); 2)流程架构:职能、活动、工作流、事件、周期、产品、步骤; 3)业务架构:目标、战略、角色、组织结构、场所(场景); 4)系统架构:应用、软件组件、接口、 项目 ; 5)技术架构:网络、硬件、软件平台、标准、协议; 6)信息价值链分析构件:绘制数据、流程、业务、系统和技术之间的关系; 所有的组织都是基于对业务需要和业务风险的理解来开发和维护企业架构。企业架构是规划、IT治理和组合管理的工具。它可以有效的整合数据、流程、技术和改进措施,使信息系统与业务策略一致,改善跨组织的沟通与理解,更有效的使用和协同资源,降低管理IT基础设施成本,为业务流程改善提供方向。 2、架构框架 架构框架提供了一种思考和理解架构的方法。其中Zachman企业架构是应用比较广泛的架构框架。为不同角度的使用者,提供了其角度内的 内容 、问题以及对问题的通用答案,使得理解更加清晰简单。(书中是2.0框架,下图为3.0)第一个维度以利益相关者进行划分,Zachman从以下视角进行描述:
1)规划者视角(范围背景) 2)所有者视角(业务概念) 3)设计者视角(系统逻辑) 4)建造者视角(技术物理) 5)实施者视角(组件组装) 6)参与者视角( 运营 等级) 第二个维度从问题的不同方面来回答问题: 1)用什么做(数据列) 2)如何做(功能列) 3)何地做(网络列) 4)何人做(人员列) 5)何时做(时间列) 6)为何做(目标列) 如下图:Zachman架构是一种思考工具,可以与其他工具方法、设计理念相结合。既考虑了整体,又兼顾了局部,可以展现不同层面的很多信息。
3、企业数据架构 数据架构是一套规范和文档的集合,包括: 1)企业数据模型 2)信息的价值链分析:使数据与业务流程及其他企业架构的组件相一致; 3)相关数据交付架构:包括数据库架构、数据整合架构、数据仓库/商务智能架构、文档和内容架构,以及元数据架构。 企业数据架构最重要的就是建立一套关于业务实体及其重要属性(特征)的通用业务术语。 Zachman框架应用: 1)规划者视角(范围背景):一系列主题域和业务实体 2)所有者视角(业务概念):表达实体间的关系的概念性数据模型 3)设计者视角(系统逻辑):具有全部属性的规范化(范式化)逻辑数据模型 4)建造者视角(技术物理):在既定技术限制下优化的物理模型 5)实施者视角(组件组装):数据结构的具体实现,通常是SQL中的数据定义语言DDL 6)参与者视角(运营等级):实际实施的实例 数据架构管理是定义和维护数据架构的过程,包括: 1)提供标准、通用的业务术语; 2)表达战略性的数据需求; 3)为满足数据需求,概述高层次的整合设计; 4)使企业战略和相关业务架构一致;信息系统具有较高的复杂性,特别是相对简单的系统越来越多的情况下。如果仅仅是采用方法在不同的孤立的业务应用系统之间进行移动、共享数据,那么理解和维护这些系统的成本就会越来越高。因此,根据整体结构来重构应用系统和数据层,是企业架构设计的重点,也是数据架构的重要作用。
二、数据架构管理职能(活动)
1、理解企业信息需求
数据模型是获取和定义企业信息需求和数据需求的一种方法。它表述了企业范围内数据整合的主蓝图,是所有未来系统开发的关键,也是数据需求分析和数据建模的基础。在设计企业数据模型时,要使用可以有效体现数据实体、数据属性和计算的系统文档和材料对参与者进行访谈。这些内容以业务单元和主题域的形式予以体现,便于参与者审核,以确保其适用性和完整性。
2、开发和维护企业数据模型
业务实体是业务实体是企业真实的事物、人员、地点的概念和类别(分类)。数据是一系列采集的关于业务实体的事实。数据模型定义的是业务实体以及其应用所需的事实(数据属性)。因此,数据模型是定义和分析数据需求,设计满足这些数据的逻辑和物理数据结构,是规范和相关图表。
企业数据模型EDM是企业范围内的整合的、面向主题的数据模型,用来定义关键的数据生产者和消费者。
整合的:组织中所有数据和规则都被描述一次并无缝配合,是一个整体。不管组织内如何划分业务和职能,就数据来说只有一个版本,一个唯一的名字、定义,并规定同一个词在不同业务实体下的不同含义。
面向主题:数据模型可以分解为跨多个业务流程和应用系统的共识主题域,主题域关注的是业务实体。
关键的:企业的数据模型不能定义组织内的全部数据,应该关注关键的数据需求。这些需求可能是共享的,也可能只是单个系统生产和使用。但不管现在如何,随着时间的推移,企业的重要数据也会发生变化。关键数据的范畴会随着企业的变化而变化,应保持同步。
企业数据模型可以是自建,也可以外购。不同的企业数据模型在细节上差异较大,但成功的企业数据模型经常是通过递增和迭代开发出来的。分层次建造:
1)主题域模型
主题域模型是一种“范围”视角,在企业数据模型中起着引领性作用。是通过一系列主要的主题域来共同表达企业最关键的领域。可以使用纲要(层级结构)和图形来表达。
一般主题域与中心业务实体用同样的名称,主要主题域必须与之匹配。非主要的主题域可以围绕解决中心业务实体的主要主题域问题。
主题域是数据管理制度和数据治理的重要工具,它用来确定基于主题域的数据管理制度团队的责任范围。
2)概念数据模型概念数据模型定义业务实体及这些实体间关系,不包括业务实体的数据属性,也不会对数据进行规范化。
业务实体的命名方式采用业务术语。业务实体会出现在若干主题域的范围内,不同主题域范围的边界经常会相互重叠。对于数据治理和数据管理专员来说,业务实体的管理目标是:每个业务实体都应该由一个主要的主题域决定这个实体的主版本。(明确规定业务实体的生产方,或者管理方)
企业概念数据模型需要提供一个词汇表,用以明确业务定义、与所有业务实体及其关系相关联的其他元数据。其他元数据包括同义词、实例样本以及数据安全等级分类等。概念数据模型可以促进对业务的理解,以及有利于语义上的一致性。(详见第5篇)
3)逻辑数据模型
逻辑数据模型是在概念数据模型下,增加更多细节来反映每个实体的关键数据属性。它用以识别每个业务实体实例所需的数据。(业务实体实例:业务实体的一个例子,可以理解为一个类的运行实例)逻辑数据模型依旧反映企业视角,但一般是中立的且不依赖于任何特定的需求、用途和应用背景。
逻辑数据模型只包含部分属性,不可能定义所有的数据实体和数据属性,可以在某种程度上规范化。逻辑数据模型也应该包括所有业务定义的词汇表,和其他相关业务实体及其数据属性的元数据。(详见第5篇)
4)其他组件
数据管理专员负责的工作,如主题域、实体、属性和参考数据值集合。
有效的参考数值:代码、标签及其业务含义的受控值集合。(详见第8篇)
关键数据属性的数据质量要求和规范。(详见第12篇)
实体生命周期对业务实体各状态的合理值集(见“定义和维护数据整合架构”)
3、分析并与其他业务模型匹配
信息价值链分析来源于业务价值链。业务价值链是定义组织中直接或间接贡献于组织最高目标的职能。如下图:(从左到右体现其依赖关系和事件发生顺序)
信息价值链分析映射出企业模型元素和其他业务模型的关系。是数据架构的输出,其每个矩阵是某一业务流程、组织或应用架构的一部分。是企业架构中不同类型的模型的粘合剂,需要数据管理领域不同角色共同负责。
4、定义和维护数据技术架构
数据技术架构指导数据相关技术选择和整合,定义了标准的工具分类、每类中首选工具、技术标准以及技术整合协议等。(详见第6篇)5、定义和维护数据整合架构
数据整合架构定义了数据如何在各系统中流转。(又称为数据血缘关系或数据流)每个模型元素之间的关系,如同元素自身之间的关系一样重要。可以通过一系列的二维矩阵描述这些关系。除流程以外,还包括:
业务角色相关数据:描述哪些角色在哪些业务实体上负责创建、更新、删除和使用数据CRUD。
关于这些职责的特定业务组织数据。
关于跨业务职能的应用数据。
关于存在区域差异的不同区域数据。
矩阵是传统的企业建模方法。企业信息工厂CIF概念是数据整合架构的例子。一般来说,数据整合架构划分为支持商务智能的数据仓库、临时数据库、数据集市以及支持交易处理和 操作 型报表的源数据库、操作型数据存储ODS、主数据管理和参考数据/编码管理。(详见第8篇)
数据/流程关系矩阵可以有不同的细节层次。主题域、业务实体,甚至关键数据属性都可以在不通过层次上表达数据。高层的职能、中层的活动、底层的任务都代表了业务流程。通过数据整合架构对数据流的梳理,可以明确的体现出不同业务实体的生命周期状态,及状态转换。
6、定义和维护数据仓库/商务智能
数据仓库架构关注数据变化,快照如何在数据仓库系统中存储以达到最大可用性和最高性能。数据整合架构显示了数据从源系统通过临时数据库进入数据仓库和数据集市的过程。商务智能架构定义了如何使数据用于决策支持,包括工具的选择和使用。(详见第9篇)
7、定义和维护企业分类方法和命名空间
分类方法为话题提供大纲的层级结构,便于组织和查找。全面的企业数据架构应包括组织的分类方法。这样的分类使用的术语定义应与企业数据模型以及其他模型和分类系统一致。
8、定义和维护元数据架构
元数据架构定义元数据的受控流程,定义元数据如何创建、整合、控制和访问。元数据存储是元数据架构的核心。
元数据架构是关于元数据如何在各类软件工具、数据存储、目录、术语和数据词典中的整合设计。数据整合架构关注如何确保参考数据、主数据、商务智能数据的质量、整合和有效使用。元数据架构则关注如何确保元数据的质量、整合和有效使用。(详见第11篇)
三、数据架构管理的指导原则
数据架构只是企业架构中的一部分,数据架构为数据整合提供指导。如:
定义和评估新信息系统项目:对信息系统规划起到分区规划作用。能够影响项目目标、优先级、项目边界和版本发布等。
定义项目的数据需求:提供需求,加速需求的识别和定义过程。
评估项目的数据设计:确保概念、逻辑和物理数据模型的一致性
数据架构管理职能融入一个组织需要遵循8个指导原则:
数据架构是一系列规范构件(主蓝图)的整合,用于定义数据需求、指导数据整合、控制数据资产,使数据投资与业务战略相一致;
企业数据架构与流程架构、业务架构、系统架构、级数架构一起,是企业架构的一部分;
企业数据架构包括3个规范:企业数据模型、信息价值链分析、数据交付架构;
企业数据架构不仅仅涉及数据,它还采用通用的业务术语来帮助建立企业内的含义;
企业数据模型是整合的面向主题的数据模型,定义了跨越整个组织的关键数据。按照层级关系建立,包括主题域总览、实体概念视图、主题域间关系,以及更细节的,相同主题域的属性级别视图;
信息价值链分析定义数据、流程、角色、机构以及其他企业元素之间的关键关系;
数据交付架构定义数据如何在数据库和应用之间流转的蓝图。保证数据质量和完整性,以及支持事务的业务处理和商务智能报告分析;(包含了上面描述的多个活动)
如TOGAF和Zachman之类的架构框架在组织关于架构的集体思考上有很大帮助。可以让目标和视角不同的人共同工作并达成一致;
四、过程总结
详见链接:
五、组织和 文化的影响
在企业数据架构实施过程中,组织可以有很多选择。
组织中每个人都必须认识到整体数据架构的价值。在实施过程中一定会发现问题,继而需要对组织、角色、责任进行调整。因此,要消除因这些变化(调整、裁员)等对员工的影响;
当业务需要或技术迭代变更时,组织中的每个人应及时确保数据架构及时更新;
根据不同的企业文化,选择适合自己的做法。但都必须加强数据意识,并更加注重应用间的数据流转,而不仅仅是关注应用本身。
免责声明 : 本号所载内容为本号原创或作者授权或公开资料整理,版权归原作者或原出处所有,仅代表作者个人观点,与本号立场无关。文章仅供读者学习参考,禁止用于商业。因部分内容无法找到真正来源,如有标错来源或文章所使用的图片文字链接等涉及侵权,请尽快与我们联系处理,谢谢!