你好,欢迎您来到福建信息主管(CIO)网! 设为首页|加入收藏|会员中心
您现在的位置:>> 新闻资讯 >>
从宜家的在线配镜场景解读零售业数据战略:提升客户体验的四大关键
作者:CIO&睿观 来源:CIOCDO 发布时间:2024年12月25日 点击数:

如果你想挖掘数据的潜力,你需要制定数据战略。这不仅包括技术,还应审查流程、组织和文化。


图片来源:alphaspirit.it/Shutterstock

数据策略如何发挥作用?企业是否真的需要数据策略?这个问题是当今许多企业领导者的思考问题。与此同时,他们面临着越来越大的保持竞争力和创新的压力。实现这一目标的一个关键因素是有效利用数据:它使企业能够识别流程中的效率储备,并更好地了解客户,以调整产品和服务,甚至开发新产品。

一旦就希望利用数据实现的目标达成共识,就可以从中得出数据策略,即制定具体行动框架,以制定措施并追求总体目标“北极星”。数据策略将公司不同领域的许多不同个人决策转化为实现共同目标的一致努力。

在下面的例子中,我们看到宜家公司的目标是成为领先的在线眼镜商:为了成功地在线销售眼镜,该公司需要结合来自不同来源的数据,包括来自镜片和镜架制造商的产品数据、来自客户的营销数据和医疗数据,以及仓库和生产能力利用率的信息。

此外,在线眼镜商需要将大量眼镜商的专业知识编码到其产品数据中。例如,这些专业知识可以确定最佳镜框尺寸,同时考虑到客户的视力和镜片的几何形状等因素。通过将这些知识编码到产品数据中,公司可以确保客户收到合适的眼镜。

有了所有这些数据,参与该流程的各个部门(采购、生产和电子商务)可以无缝协作,提供高质量的结果,优化材料使用计划并对未来发展做出预测。

一、没有数据策略就没有数据价值

数据战略不仅仅是管理数据,还包括如何以最佳方式将业务知识存储在数据中并通过数据进行理解。数据战略伴随着适当的组织文化,这种文化提供了平衡不同利益相关者需求的机制,包括促进协作和知识共享。

如果没有数据战略来构建各种工作,那么在具有一定规模或复杂性的任何组织中,数据带来的附加值都远远达不到预期。在这种情况下,数据仅在本地使用或沿着相对固定的路径聚合。结果如何?公司在必要变更方面的敏捷性仍然受到抑制。如果没有这样的战略,技术概念和架构也很难增加这一价值。

一个经过深思熟虑的数据战略可以通过多种方式制定。它涵盖多个不同的方面,例如可用性、可搜索性、安全性、个人数据保护、成本控制等。然而,从各种与数据相关的项目中,可以确定构成数据战略基础的四个关键方面:身份、双向性、网络化和联邦制。

二、数据战略的四个关键方面

1.身份

数据策略的第一个核心要素是身份:如何识别实体、属性及其值,即如何明确地确定数据记录指的是哪个物理或虚拟制品,以及/或多个数据记录是否指的是同一件事?谁负责决定两个实体是否相同?身份意味着什么?

在我们的在线配镜商的例子中,我们必须问自己是否必须识别某种类型的镜框或某种特定尺寸、颜色或材质的镜框,甚至是特定的单个镜框。

在最简单的情况下,身份由单一事实来源【可信单一数据源(SSOT),它是一种数据管理策略和实践,旨在确保每个数据元素只能在一个地方被掌握和管理。这意味着在理想情况下,企业的所有相关数据都源自一个统一、可靠的来源确定,可信单一数据源(SSOT)是识别实体的单一来源或中央参考点。所有后续系统都可以使用来自可信单一数据源(SSOT)的身份。但是,这种简单的模型不能应用于大量数据。例如,产品数据。由于历史原因,不同类别的产品数据在不同的系统中识别,并由不同的部门负责。有时,如果产品变体使用相同的代码但仍必须通过颜色或尺寸属性指定,则使用不同组合的键进行识别。因此,数据策略必须回答如何识别实体、属性和属性值。

2.双时间性

数据策略的第二个核心要素是双时态性,大致可以翻译为“两个时间”。这将数据查询的时间与查询所指的时间分开:产品当前(即查询时的现在)是否可用?它(可能)在14天内可用吗?该产品是否在2024年3月3日10:17CET可用,如果是,2024年3月3日销售的产品中有哪些预产品?它的供应链是什么样的?因此,数据策略必须阐明如何区分有关实体当前状态的信息与有关早期状态的信息。

3.网络能力

数据策略的第三个因素必须明确哪些信息可以链接,即有意义地相互关联。例如,在电子商务中,可以将类似或匹配的产品链接起来,以便推荐它们。

4.联邦制

联邦制,顾名思义,是一种组织原则,它基于各个单位的广泛独立性,但这些单位共同构成一个整体。因此,数据战略的第四个方面涉及对所考虑数据的责任组织。联邦制意味着,尽管数据的责任在地方层面,但在这个层面之外,数据的处理方式也是明确的。联邦制结构定义了每个责任级别的责任范围。这意味着,谁有权对数据做什么以及如何存储/提供数据以便其他级别也可以访问数据都是明确的。

一个非常具体的例子,即品牌标识,说明了数据策略的这四个要素:

品牌被识别后,徽标才会以特定形式出现(例如文件格式或分辨率)。品牌和徽标的数据显然是关联的,这一点从识别中已经可以看出来。如果徽标发生变化,例如在品牌重塑的情况下,这可确保参考的一致性。

考虑双时态性可确保徽标更改在所有相关系统中按规定的时间点实施:双时态性会考虑预期更改的通知,并允许查询未来内容以缓存新徽标以备不时之需。相反,针对过去的查询也很有用,但通常对于成分、价格、交付条件等比品牌徽标更有用。

确定哪些品牌、如何识别格式等不能仅靠采购或营销来确定。这需要必要的网络。

这些决定必须由一个共同的权威机构,即数据战略联邦体系中的一个机构来做出。

产品数据现象也体现了企业数据战略的本质。产品数据来源多种多样,例如,企业自己的产品开发,也有“外国”制造商和中间商。它们是重要业务流程的重要组成部分,在各种部门都需要,并用于各种系统:

  • 在目录中,包括价格信息、可用性、图片

  • 在库存管理中

  • 在退货管理中结合仓库和物流信息l用于规划和报告

  • 在项目或类别级别

  • 用于汇总销售和收入数据以及时间或空间标准

  • 在主数据中

  • 订单处理

  • 电子商务

  • 控制系统

  • 在许多其他情况下


如果不清楚产品数据标识什么、它与其他数据有何关系以及哪些规则适用于其跨域提供,就会形成无法穿透的数据沼泽,无法进行有效利用或分析。公司规模越大、差异化程度越高,这种情况就越严重。许多大公司运营着多个电子商务系统、不同国家的多条生产线,并管理着不同的品牌和产品类别。

三、数据是经过编码的员工知识

数据策略还决定了公司如何编码有关其产品、服务、流程和商业模式的知识。这使得解决方案能够实现自动化决策支持。为了在线销售眼镜,必须编码大量专业的配镜师知识,以便客户在配置眼镜时不会犯严重错误。渐进镜片的最佳尺寸取决于视力和镜片几何形状等因素。为了成功地在线销售眼镜,配镜师的这些经验知识必须编码在产品数据中,各个部门(采购、生产、电子商务)必须维护、连接和使用这些数据。

知识图谱捕捉数据的含义,在识别和链接数据方面发挥着特殊作用:Dave McComb(戴夫·麦库姆)【Dave McComb(戴夫·麦库姆)是Semantic Arts公司的总裁和联合创始人。他专注于企业信息系统和企业架构领域已有40年,持有模型驱动开发领域的四项专利。此外,Dave McComb还提出了一个三层知识图谱模型,这个模型扩展了传统的两层视图,即模式或类别以及数据或实例,通过引入一个中间层来承担混合角色,并将这三个层次称为概念、类别和数据的三层知识图谱模型扩展了典型的两层视图,一方面是模式或类,另一方面是数据或实例。McComb(麦库姆)引入了一个承担混合角色的中间层,并将这三层称为概念、类别和数据。

Inter Ikea Systems(Inter Ikea Systems是宜家品牌理念和全球宜家特许经营授权的所有者。它负责将宜家理念、产品系列开发、供应链管理以及企业沟通等关键职能分配给不同的宜家公司首席本体论专家Katariina Kari(卡塔瑞娜·卡里)【Katariina Kari(卡塔瑞娜·卡里)是Inter IKEA Systems的首席本体学家。她持有科学硕士和音乐硕士双学位,专长于语义网技术。在宜家,她负责构建宜家知识图谱,这是一个共同的词汇表,用于在数字空间为客户提供引人注目的室内设计解决方案】和她的团队以非常实用的方式引入了这种知识图谱。我们将以这个例子为指南,但将其应用于在线配镜师示例。

  • 1.最上层包含核心概念,例如“框架”和“属性”。概念数量达数百个。它们紧密协调,并受到严格的中央治理。

  • 2.在中间层,“颜色”类别被定义为具有“玳瑁色”或“哈瓦那色”特征的属性。类别数量通常多达数千个,但类别可以按主题细分,相应的主题专家定义各个主题领域。

  • 3.McComb(麦库姆)将最低层描述为数据,这一层包括所有有颜色的东西,例如眼镜的鼻梁。数据级别的实体数量可能达到数百万。数据层细分为区域,每个区域都受域的控制。联邦主义原则在这里尤为明显。



通过参考更高级别的信息,可以将类别(尤其是数据)集成到整个景观中,从而实现跨级别的联网。例如,所有框架都可以与颜色相关联。可以通过相似性在电子商务系统中推荐类似的产品。

四、数据策略的要素与数据网格原则相对应

数据网格的概念是目前备受关注的话题,它是由IT咨询公司ThoughtWorks(ThoughtWorks是一家全球性的软件及咨询公司,成立于1993年,以追求技术卓越和用科技驱动商业变革而闻名。公司致力于通过整合战略、设计和软件工程帮助企业开启流畅的数字化之路,引航未来征程的技术总监Zhamak Dehghani(扎马克·德哈尼)【Zhamak Dehghani(扎马克·德哈尼)是ThoughtWorks的技术总监,专注于分布式系统架构和新兴技术领域。她拥有超过20年的技术专家经验,并在分布式计算通信以及嵌入式设备技术方面贡献了多项专利】提出的,它只不过是数据战略的具体体现。这一社会技术概念基于四个原则:域所有权、数据作为产品、自助数据平台和联合治理。我们将从身份、双向性、互联互通和联邦制四个关键方面来讨论这一概念。

1.域所有权

该原则规定,数据的责任不应由中央数据团队承担,而应由创建数据的领域承担。具体来说,这意味着负责端到端业务功能的团队也对与该业务功能相关的数据负责。

2.数据即产品

收集、处理和提供数据本身并不是目的,而必须像任何产品一样为用户创造价值。然而,这也需要战略规划、合适的产品市场契合度和相应数据产品的营销:数据产品关注数据消费者及其需求,但也要平衡不同消费者的不同愿望。数据产品的形式,例如作为API、作为数据库访问或作为可视化,取决于消费者的需求,当然可以根据不同的需求从同一数据生成不同的数据产品。

3.自助数据平台

为了使产品团队能够快速高效地提供数据产品,他们需要合适的工具以及某种数据产品的生产和分销线。理想情况下,这些工具应该相互关联,以便消费者可以轻松链接不同的数据产品。“自助服务”——或者也许最好说“符合辅助性原则”——意味着数据所有者可以独立提供数据产品。与“数据平台”这个名称所暗示的相反,这同样是一个可用的基础设施和组织结构的问题,以便以可以实现这种独立性的方式组建团队。

这一原则在复杂性方面代表了实现数据网格方法的最大障碍。这并不是因为缺乏相应的数据平台,而是因为必须相应地重新平衡组织内部的能力平衡。

4.联合治理

为了创造附加值,数据网格方法强调由当地负责的数据产品。根据我们上面的观点,附加值恰恰出现在不同领域的联网中,出现在数据生产者和消费者之间的关系中。有些领域,最迟由外部法规在安全、数据保护等方面规定,不能由数据所有者在当地进行监管。必须有总体结构和指导方针来确定如何在更大的背景下组织和使用数据。联邦辅助性原则适用于此:就像市政当局、州和联邦政府之间的互动一样,决策是在机构层面做出的,而机构层面的能力刚好够用。如果个人,即最低机构层面的最小群体缺乏能力,那么更高的机构就会采取行动。

5.数据网格中的身份、双时态、网络和联邦主义

根据业务需求和公司数据流的复杂性,数据网格可能是实施数据策略最明智的方式。人们往往更强调技术方面,而不是社会方面。然而,我们也看到,领域所有权、数据作为产品、自助数据平台和联合治理这四个原则几乎没有提供具体的方向:数据产品包含什么?它与其他数据产品有何关系?自助数据平台应该实现什么?

这让我们回到数据战略的四个关键方面:身份、双向性、互联性和联邦制。这些关键方面将数据战略集中在特定的点上,因此可以为数据网格的实现提供结构:

数据产品中暴露了哪些身份?哪些数据产品需要引用共同身份以实现互联互通?数据产品是否只需要“暂时”实现,还是需要向前或向后看——关键词双时性?

最重要的是,存在一个问题:谁有权力识别实体?在这里,权力既指业务、技术和设计知识,也指设计相应信息空间的普遍认可的授权。

数据网格方法明确地将联邦原则应用于治理,即行政管理,包括行政设计。凭借对联邦主义的理解,我们更进一步明确地包括了数据空间的设计:知识图中概念、类别和数据的创建和维护也被组织为联邦结构。类别级别可以分解并在本地实施。特别是,第二级的不同子区域可以由不同的团队管理。然后在域中本地创建数据级别,并受数据产品的各自所有者的约束。

6.数据策略需要文化

正如Peter Drucker(彼得·德鲁克)【Peter Drucker(彼得·德鲁克)是现代管理学之父,他的许多观点和理论对商业世界产生了深远的影响。关于“文化胜过战略”的名言,德鲁克强调的是企业文化在组织成功中的重要性。他认为,一个强大的企业文化能够为公司提供持续的竞争优势,甚至比短期的战略规划更为重要的名言“文化胜过战略”,相应的文化也是成功数据战略的必要先决条件。企业文化涵盖了组织创造性成就的无形基础。

例如,关于数据文化,联邦结构是如何设计的,这是一个问题:一个组织倾向于强调中央责任还是地方责任?联邦级别是否也对应于层级,即决策是通过管理层上报的,还是由具有决策权的主管委员会以不同的方式组建?与集中提供的平台相比,如何平衡各领域的分散能力?这些平台的使用需要尽可能缩短领域用户的学习曲线,但运营成本却相当高昂。

7.一步步走向“北极星”

正在重新思考数据战略的公司应该制定一个北极星,然后以非常务实的方式进行。北极星代表着期望的最终状态:您是想提高效率、根据现有数据的洞察改进产品或服务,还是开辟新的业务领域?如果数据战略和相应举措的目标不明确,那么实现注定会失败。只有方向明确,切实可行的步骤才能取得成功。

例如,可以对组织进行仔细的修改,以建立联邦治理结构,对顶层本体层实施中央控制,并在与域的交互中对其进行调整和改进。必须授权域独立实施数据产品,并对必须适用于所有域的政策进行集中定义,例如关于身份和访问管理的政策。在这里,在创建平台时(由于只有松散协调的举措以减少通信开销,因此是计划中的或突发的),数据策略接近经典的IT策略,尤其是关于云架构的策略。

8.结论:明智决策的数据策略

通过创新实现竞争力需要深思熟虑的数据战略。通过关注身份、双时性、网络和联邦制等关键方面,公司可以释放其数据的潜力并做出明智的决策。

这不仅仅是收集和分析数据,而是要创造一种数据驱动的决策文化。它需要在集权和分权之间取得平衡的能力。在这种背景下,联邦制——我们社会的核心要素——成为结构要素。

作者:Christian Betz(克里斯蒂安·贝茨)

译者:穿山甲

【睿观:明智决策的数据策略是企业通过创新保持竞争力的关键,它需要关注身份、双时态性、网络和联邦制四个关键方面,并与数据网格原则和企业文化相协调。

一、数据战略的重要性及核心目标

  • 没有数据策略就没有数据价值: 数据战略不仅仅是管理数据,更重要的是如何存储、理解和利用业务知识。“如果没有数据战略来构建各种工作,那么在具有一定规模或复杂性的任何组织中,数据带来的附加值都远远达不到预期。”

  • 数据战略的目标: 将公司不同领域的决策转化为实现共同目标的一致努力,提高效率、改进产品/服务或开辟新业务领域。制定“北极星”,明确目标是成功实施数据战略的前提。

二、数据战略的四个关键方面(构成数据战略的基础)

  • 身份: 如何识别实体、属性及其值,明确数据记录的指代对象。“在我们的在线配镜商的例子中,我们必须问自己是否必须识别某种类型的镜框或某种特定尺寸、颜色或材质的镜框,甚至是特定的单个镜框。”单一事实来源(SSOT)是识别实体的单一来源或中央参考点。

  • 双时态性: 区分数据查询的时间与查询所指的时间,例如产品当前是否可用,以及过去或未来的可用性。“因此,数据策略必须阐明如何区分有关实体当前状态的信息与有关早期状态的信息。”

  • 网络能力: 明确哪些信息可以链接并有意义地相互关联,例如电子商务中类似产品的推荐。“例如,在电子商务中,可以将类似或匹配的产品链接起来,以便推荐它们。”

  • 联邦制: 明确数据责任的组织划分,确保地方层面的责任与整体处理方式相协调。“联邦制意味着,尽管数据的责任在地方层面,但在这个层面之外,数据的处理方式也是明确的。”这决定了谁有权对数据做什么以及如何存储/提供数据。

三、数据战略与数据网格原则的对应关系

数据网格是数据战略的具体体现,基于四个原则:域所有权、数据作为产品、自助数据平台和联合治理。这四个原则与数据战略的四个关键方面相对应:

  • 域所有权: 与联邦制相呼应,强调数据责任应由创建数据的领域承担。

  • 数据即产品: 强调数据的价值创造,需要战略规划和市场契合度。

  • 自助数据平台: 为产品团队快速高效地提供数据产品的工具和平台。

  • 联合治理: 强调在本地责任的基础上,建立总体结构和指导方针,确保数据在更大背景下的组织和使用。联邦辅助性原则适用于此。数据网格方法明确地将联邦原则应用于治理,包括行政设计。凭借对联邦主义的理解,更进一步明确地包括了数据空间的设计。

四、数据战略与企业文化的关系

  • 文化胜过战略: 相应的文化是成功数据战略的必要先决条件。企业文化决定了联邦结构的具体设计,例如强调中央责任还是地方责任,以及如何平衡各领域的分散能力。“正如Peter Drucker(彼得·德鲁克)的名言‘文化胜过战略’,相应的文化也是成功数据战略的必要先决条件。”

  • 知识编码: 数据策略还决定了公司如何编码有关其产品、服务、流程和商业模式的知识,实现自动化决策支持。知识图谱(McComb的三层模型:概念、类别和数据)在识别和链接数据方面发挥特殊作用,通过参考更高级别的信息,可以将类别(尤其是数据)集成到整个景观中,从而实现跨级别的联网。

结论重申: 通过关注身份、双时态性、网络和联邦制等关键方面,并将其与数据网格原则和企业文化相结合,公司可以释放其数据的潜力,创造一种数据驱动的决策文化,从而做出明智的决策,保持竞争力。】

【睿观:McComb的三层知识图谱模型是一种理解和组织复杂数据关系的有效方法,它通过引入中间层“类别”,在传统的两层视图(模式/概念与数据/实例)之间建立了更精细的连接,从而更好地捕捉数据的含义,并在识别和链接数据方面发挥特殊作用。下面将详细解释这个模型,并结合宜家和在线配镜商的例子进行说明。

McComb三层知识图谱模型:

该模型包含三个层次:

  1. 概念层(Concept): 这是最高层,包含最抽象和通用的概念,例如“产品”、“属性”、“颜色”、“尺寸”等。这些概念是领域的核心构建块,定义了领域的基本框架。概念层数量相对较少,需要严格的中央治理,以确保一致性和通用性。

  2. 类别层(Category): 这是中间层,连接了概念层和数据层。类别层定义了概念的特定类型或子类,例如“颜色”概念下的“玳瑁色”、“哈瓦那色”、“黑色”等,“尺寸”概念下的“S”、“M”、“L”等。类别层数量通常比概念层多,但可以按主题或领域进行划分,由相应的主题专家进行定义和维护。类别层起到了桥梁作用,将抽象的概念与具体的数据实例联系起来。

  3. 数据层(Data): 这是最底层,包含具体的实例或数据记录,例如某个具体的眼镜框的颜色是“玳瑁色”,尺寸是“M”。数据层数量巨大,通常由各个业务部门或领域负责维护和管理,体现了联邦制的原则。

该模型如何发挥作用:

  • 识别数据: 通过将数据实例关联到类别,再将类别关联到概念,可以清晰地识别数据的含义和上下文。例如,一个颜色值为“玳瑁色”的数据,通过类别层可以明确其属于“颜色”概念,从而避免歧义。

  • 链接数据: 通过共享相同的概念和类别,可以将不同来源、不同格式的数据连接起来。例如,来自产品数据库的“玳瑁色”和来自客户订单的“玳瑁色”,可以通过“颜色”概念和“玳瑁色”类别进行链接,从而实现数据的整合和分析。

  • 跨级别联网: 通过参考更高级别的信息(概念和类别),可以将数据集成到更大的知识体系中,实现跨级别的联网。例如,所有眼镜框都可以通过“颜色”概念和不同的颜色类别进行关联,从而在电子商务系统中实现基于颜色的产品推荐。

结合宜家和在线配镜商的例子:

  • 宜家示例(原文引用):

    • 概念层: “框架”、“属性”等。

    • 类别层: “颜色”类别下的“玳瑁色”、“哈瓦那色”等。

    • 数据层: 具体眼镜的鼻梁颜色是“玳瑁色”等。

  • 在线配镜商示例:

    • “镜框”类别下的“圆形镜框”、“方形镜框”、“飞行员镜框”等。

    • “镜片”类别下的“单光镜片”、“渐进镜片”等。

    • “尺寸”类别下的“S”、“M”、“L”等。

    • “颜色”类别下的“黑色”、“金色”、“玳瑁色”等。

    • 概念层: “镜框”、“镜片”、“尺寸”、“材质”、“颜色”、“度数”等。

    • 类别层:

    • 数据层: 某个具体的镜框是“圆形镜框”,尺寸是“M”,颜色是“金色”,匹配的镜片是“渐进镜片”,度数是“近视300度”等。

详细解释跨级别联网:

以在线配镜商为例,假设我们需要在电子商务网站上实现基于颜色的产品推荐:

  1. 用户浏览了一款“金色”的“圆形镜框”。

  2. 通过数据层,我们知道这款镜框的颜色属性值为“金色”。

  3. 通过类别层,我们知道“金色”属于“颜色”概念下的一个类别。

  4. 通过概念层,我们知道“颜色”是“镜框”的一个属性。

  5. 因此,我们可以通过“颜色”概念和“金色”类别,找到所有其他颜色属性值为“金色”的镜框,并推荐给用户。

通过这种方式,McComb的三层模型实现了数据的有效组织和连接,为数据的理解、分析和应用提供了强大的支持。它不仅帮助我们更好地理解数据的含义,还使得跨系统、跨领域的数据集成和共享变得更加容易。】