数据架构将业务需求转化为数据和系统要求,并寻求管理数据及其在企业中的流动。数据架构在制造业中具有广泛的应用前景,可以帮助企业提高生产效率、降低成本、优化运营、提升竞争力。构建合理的数据架构是制造业企业实现数字化转型和智能制造的重要基础。
来源:Brandon Mowinkel
一、数据架构定义
根据开放群组架构框架(TOGAF) ,数据架构描述了组织的逻辑和物理数据资产以及数据管理资源的结构。它是企业架构的一个分支,包括管理组织中数据收集、存储、整理、集成和使用的模型、政策、规则和标准。组织的数据架构是数据架构师的职权范围。
二、数据架构目标
数据架构的目标是将业务需求转化为数据和系统要求,并管理数据及其在企业中的流动。如今,许多组织都希望实现数据架构的现代化,以此作为充分利用人工智能和实现数字化转型的基础。咨询公司麦肯锡数字指出,许多组织未能实现数字化和人工智能转型目标,是因为流程复杂,而不是技术复杂。
三、数据架构原则
语义层平台AtScale 创始人兼首席技术官David Mariani 认为,现代数据架构的基础由六项原则组成:
1、将数据视为共享资产。现代数据架构需要消除部门数据孤岛,让所有利益相关者全面了解公司:全方位的客户洞察,以及关联来自制造和物流等所有业务职能的宝贵数据信号的能力。
2、提供使用数据的用户界面。除了打破数据孤岛之外,现代数据架构还需要提供界面,让用户能够使用适合其工作的工具轻松使用数据。数据必须能够自由地在数据仓库、数据湖和数据集市之间移动,并且界面必须让用户能够轻松地使用这些数据。
3、确保安全性和访问控制。现代数据架构必须以安全性为设计目标,并且必须直接在原始数据上支持数据策略和访问控制,而不是在下游数据存储和应用程序的网络中。
4、建立通用词汇表。共享数据资产(例如产品目录、财务日历维度和 KPI 定义)需要通用词汇表,以帮助避免分析过程中出现争议。
5、管理数据。投资执行数据管理的核心功能,例如建立重要关系模型、清理原始数据以及管理关键维度和指标。
6、优化数据流以提高敏捷性。限制必须移动数据的次数,以降低成本、提高数据新鲜度并优化企业敏捷性。
三、数据架构组件
根据IT 咨询公司 BMC 的说法,现代数据架构由以下组件组成:
1、数据管道。数据管道是收集、移动和提炼数据的过程。它包括数据收集、提炼、存储、分析和交付。
2、云存储。并非所有数据架构都利用云存储,但许多现代数据架构都使用公共云、私有云或混合云来提供灵活性。
3、云计算。除了使用云进行存储之外,许多现代数据架构还利用云计算来分析和管理数据。
4、应用程序编程接口。现代数据架构使用API 来轻松公开和共享数据。
5、人工智能和机器学习模型。人工智能和机器学习用于自动化系统,以完成数据收集和标记等任务。同时,现代数据架构可以帮助组织释放大规模利用人工智能和机器学习的能力。
6、数据流。数据流是数据从源头连续流向目的地,以进行实时或近实时的处理和分析。
7、容器编排。容器编排系统(例如开源 Kubernetes)通常用于自动化软件部署、扩展和管理。
8、实时分析。许多现代数据架构的目标是提供实时分析,即在新数据到达环境时对其进行分析的能力。
四、数据架构与数据建模
根据《数据管理知识手册》(DMBOK 2),数据架构将管理数据资产的蓝图定义为与组织战略保持一致,以建立战略数据需求和设计来满足这些需求。另一方面,DMBOK 2将数据建模定义为“以精确的形式(称为数据模型)发现、分析、表示和传达数据需求的过程”。
虽然数据架构和数据建模都试图弥合业务目标和技术之间的差距,但数据架构是一种宏观视角,旨在理解和支持组织的功能、技术和数据类型之间的关系。数据建模则更侧重于特定系统或业务案例。
五、数据架构框架
有几种企业架构框架通常作为构建组织数据架构框架的基础。
DAMA-DMBOK 2 . DAMA International的数据管理知识体系是专门针对数据管理的框架。它为数据管理功能、可交付成果、角色和其他术语提供了标准定义,并提出了数据管理的指导原则。
Zachman企业架构框架。Zachman框架是IBM 的 John Zachman 于 20 世纪 80 年代创建的企业本体。Zachman 框架的数据列包含多个层,包括对业务很重要的架构标准、语义模型或概念/企业数据模型、企业/逻辑数据模型、物理数据模型和实际数据库。
开放群组架构框架。TOGAF是一种企业架构方法,为企业软件开发提供高级框架。TOGAF的 C 阶段涵盖开发数据架构和构建数据架构路线图。
六、现代数据架构最佳实践
数据架构是一个模板,它控制着数据在公司内的流动、存储和访问方式。现代数据架构必须设计为利用人工智能、自动化和物联网(IoT) 等技术。根据数据平台 Acceldata 的说法,数据架构有三个核心原则:
1、可扩展性。现代数据架构必须具有可扩展性,才能在不影响性能的情况下处理不断增长的数据量。可扩展的数据架构应该能够纵向扩展(向单个机器添加更多资源或处理能力)和横向扩展(添加更多机器以分配数据库负载)。
2、灵活性。灵活的数据架构可以集成新的数据源、采用新技术并随着业务需求而发展。
3、数据完整性。现代数据架构必须确保数据在其生命周期内保持准确、一致和不变,以保持其分析和决策的可靠性。它们必须防止数据损坏、重复或丢失等问题。
七、现代数据架构还应遵循以下最佳实践:
1、与业务需求保持一致。有效的企业数据架构应与业务目标保持一致。为此,组织应根据战略目标确定需要收集、分析和存储的数据。
2、确保数据治理和合规性。强大的数据架构需要确保数据治理和合规性,以建立明确的政策来管理整个数据生命周期内的数据访问、质量和安全。
3、选择正确的工具和技术。选择适合您的企业数据架构的工具至关重要,包括关系数据库和 NoSQL 数据库、基于云的存储解决方案和处理工具。
咨询公司Protiviti 的技术咨询高级总监 Dan Sutherland为现代数据架构添加了更多最佳实践:
1、云原生。现代数据架构应设计为支持弹性扩展、高可用性、动态数据和静态数据的端到端安全性以及成本和性能可扩展性。
2、可扩展的数据管道。为了利用新兴技术,数据架构应该支持实时数据流和微批量数据突发。
3、无缝数据集成。数据架构应使用标准 API 接口与旧式应用程序集成。它们还应进行优化,以便跨系统、跨地区和跨组织共享数据。
4、实时数据支持。现代数据架构应支持部署自动化和主动数据验证、分类、管理和治理的能力。
5、解耦且可扩展。现代数据架构应设计为松散耦合,使服务能够独立于其他服务执行最少的任务。
八、数据架构角色
根据Indeed的数据,以下是一些与数据架构相关的最受欢迎的职位以及每个职位的平均薪资:
数据架构师:67,000-173,000美元
项目经理:57,000-142,000美元
数据工程师:83,000-195,000美元
数据分析师:50,000-128,000美元
数据科学家:76,000-195,000美元
【睿观:制造业场景应用的三个案例展示了数据架构如何在制造业中发挥关键作用:
1. 智能制造和预测性维护:
业务需求: 提高设备利用率,减少意外停机时间,降低维护成本。
数据架构应用: 通过在生产设备上部署传感器,实时采集温度、压力、振动等数据。利用数据管道将数据传输到云平台进行存储和分析。构建机器学习模型,根据历史数据和实时数据预测设备故障,提前进行维护,避免生产中断。
关键组件: 数据管道、云存储、云计算、人工智能和机器学习模型、数据流。
带来的益处: 提高设备运行效率,降低维护成本,提高产品质量。
2. 供应链优化:
业务需求: 提高供应链效率,降低库存成本,优化物流。
数据架构应用: 集成来自供应商、生产、物流、销售等环节的数据,构建统一的数据视图。利用数据分析工具,分析供应链瓶颈,优化库存管理,提高物流效率,实现供应链的协同运作。
关键组件: 数据管道、API、数据流。
带来的益处: 降低库存积压,缩短交货周期,提高客户满意度。
3. 产品质量追溯:
业务需求: 实现产品质量的全程追溯,快速定位质量问题,提高产品质量。
数据架构应用: 在生产过程中记录每个产品的生产参数、原材料信息、检验结果等数据。构建数据平台,将这些数据关联起来,形成完整的产品追溯链。一旦出现质量问题,可以快速追溯到问题的根源。
关键组件: 数据管道、数据存储、数据流。
带来的益处: 提高产品质量,降低召回风险,增强品牌信誉。
通过以上案例可以看出,数据架构在制造业中具有广泛的应用前景,可以帮助企业提高生产效率、降低成本、优化运营、提升竞争力。构建合理的数据架构是制造业企业实现数字化转型和智能制造的重要基础。】