谈谈建立数据质量团队需要考虑的角色和职责

CIOAge
据统计,44%的企业数据丢失,只有56%的数据可供使用。此外,在这56%中,只有57%被实际使用,而其余43%则没有有效使用并产生价值。这表明只有32%的数据真正被投入使用。

据统计,44%的企业数据丢失,只有56%的数据可供使用。此外,在这56%中,只有57%被实际使用,而其余43%则没有有效使用并产生价值。这表明只有32%的数据真正被投入使用。

多种因素导致企业数据采用和使用量减少。有时候员工缺乏数据素养技能会阻碍他们有效地使用数据,有时候员工对使用手头的数据没有信心,因为其质量较差。

由于数据会对整个企业产生影响,因此实施纠正措施并弥补这些差距需要共同努力。这意味着,组织中的每个角色都以某种方式有助于实现和维持数据质量。

这就是为什么了解在数据的整个生命周期(从捕获到使用)中建立和维护数据质量所涉及的关键角色和职责非常重要。保持组织数据质量的责任与管理数据本身的责任高度集成。本文仅关注与数据质量直接相关的角色及其职责。

一、数据质量团队涉及的角色和职责

在建立数据质量团队或为现有角色指定职责时,首先在企业中区分以下三个领域非常重要:

1.管理数据的角色

2.从数据中创造价值的角色

3.使用数据的角色

区分这些角色就能了解每个角色在数据质量管理中的贡献级别。下面我们更详细地介绍每个领域。

A. 管理数据的角色

这些角色通常专注于采用更好的数据管理实践,以最大限度地减少数据丢失并最大限度地提高数据质量。他们被认为是组织数据的看护者或监督者。下面,我们将了解公司中管理数据及其质量的角色。

1.首席数据官(CDO)

比获得高层管理人员在建立数据质量方面的批准或支持更重要的是,我们需要为此目的在高层有完整的代表。这就是 CDO 的用武之地。

首席数据官 (CDO) 是一个执行级别的职位,全权负责设计在整个企业内实现数据利用、数据质量监控和数据治理的策略。

CDO 了解业务目标,并且能够设计与数据相关的功能,以帮助团队实现既定目标。最初,当这个角色在 2000 年初引入时,CDO 仅负责数据治理。但随着时间的推移,这个角色的职责发生了变化,现在包括:

  • 规划数据管理系统,用于收集、处理和移动数据,同时最大限度地减少数据丢失。
  • 通过加强数据素养技能的获取以及员工之间数据的智能处理和共享来实现数据文化。
  • 通过提供单一事实来源、消除业务流程中的数据障碍以及实现数据驱动的决策,最大限度地提高整个组织的数据使用和采用率。

2. 数据管家(数据管理员)

数据管理员是公司中处理与数据相关的所有事务的首选人员。他们完全掌握组织如何捕获数据、将数据存储在哪里、数据对不同部门意味着什么,以及如何在整个生命周期中保持数据质量。

数据管理员负责:

  • 监督整个数据生命周期——从数据创建和捕获,到数据处理、存储和使用。
  • 从高层次以及具体细节理解数据的含义,例如存储在跨数据集字段中的数据的含义。
  • 帮助同事利用数据作为竞争优势,并使他们具备数据素养。
  • 根据组织数据的性质选择数据质量测量的指标。
  • 监控数据质量,解决可能出现的问题,并实施数据质量改进计划。
  • 确保数据保护、合规性和安全性,同时监控与数据相关的潜在风险和挑战。

3. 数据保管人

人们通常对数据管理员和数据保管人的角色感到困惑。这些角色之间最简单的区别是,数据管理员负责数据字段中存储的内容,而数据保管人负责这些数据字段的结构 - 包括数据库结构和模型。

数据保管人的职责包括:

  • 从技术上控制数据访问,只允许授权个人获取数据。
  • 根据数据需求设计数据库结构并建模数据对象。
  • 与数据管理员合作,了解数据字段中的内容,并决定支持数据质量的数据结构,包括适当的数据类型、大小和格式。
  • 对数据输入系统进行验证检查,以确保传入数据遵循数据质量指南。
  • 管理数据存储的技术环境。
  • 维护对数据对象所做的所有更改的数据版本和历史日志。

B. 从数据中创造价值的角色

这些角色主要专注于从数据中创造价值-这包括收集正确的数据、执行分析和解释结果以解决业务问题。他们充当数据中间人——从监督数据的角色获取数据,并向使用数据的角色提供可操作的见解。

1.数据分析师

数据分析师是能够获取原始数据并将其转化为有意义的见解的人——尤其是在特定领域。数据分析师的角色非常简单,包括四个主要领域:

  • 通过对人们进行调查或收集已经捕获的数据,从不同来源收集数据。
  • 根据分析的要求清理和准备数据,以确保结果的准确性。
  • 分析数据和解释结果——这涉及识别数据中的趋势或模式,有助于做出明智的决策。
  • 通过可视化或书面报告向团队传达分析结果。

2. 数据与分析 (D&A) 领导者

正如组织在数据管理员在场时需要 CDO 一样,他们也需要在数据分析师在场时 D&A 领导者。

数据分析师的工作水平较低,他们直接处理手头的数据并对其进行处理以获得所需的结果。D&A 领导者负责监督从数据中创造价值的战略目标。D&A 领导者的职责如下:

  • 了解数据在不同部门所需的准确决策中所扮演的角色。
  • 设计现代策略以实现高效和改进的决策。
  • 需要向 CDO 传达数据,并解释哪些数据以及以何种格式有助于分析过程。
  • 教育整个组织的各个职能部门了解如何利用数据和分析。
  • 创建和启用数据治理策略。

C. 使用数据的角色

这些角色被认为是数据消费者,这意味着他们使用数据——无论是原始形式还是转化为可操作的见解。组织中几乎所有部门都需要数据用于运营,因此它们确实会影响数据质量。让我们看看一些常见的角色以及他们使用的数据类型:

1.销售和营销团队:客户数据是企业最大的资产之一,主要由销售和营销团队产生、操纵和消费,因此在这些活动中客户数据质量很可能受到影响。

2.产品团队:产品数据是另一个对企业极具价值的主数据对象。每天生成和使用产品数据可能对其质量产生巨大影响。

3.业务开发团队:他们通常使用商业智能数据来识别可能的市场机会。

数据消费者的数据素养

当涉及到使用数据的角色时,他们的最大责任就是具备数据素养。如果组织拥有使用/操作数据的各种功能组,但最终用户不了解数据质量要求,并且无法满足这些要求,那么组织就处于危险境地。

二、建立数据质量团队时需要考虑的重要因素

1. 优先考虑数据素养

数据素养是有效处理数据的能力,包括读取、创建、交流和使用数据作为信息。数据质量团队的主要目标应该是优先考虑整个企业的数据素养。这样可以主动防止有质量问题的数据进入系统,而不是始终以反应模式工作并修复错误。

这可以通过创建数据素养计划和设计向团队介绍组织数据并解释以下内容来实现:

  • 每个数据集包含什么?
  • 每个数据属性的含义是什么?
  • 其质量的可接受标准是什么?
  • 输入/操作数据的错误和正确方法是什么?
  • 使用什么数据来实现给定的结果?

2. 创建RACI模型

当涉及多个角色来实现共同结果时,确定每个角色的贡献水平始终至关重要。这就是 RACI 模型非常有用的地方。RACI 模型或矩阵确定角色是否负责、批准、咨询或了解成功完成目标所需的任务。在管理数据质量时,需要确定以下角色:

  • 负责完成任务。
  • 审批交付任务的结果。
  • 征求意见,听取工作任务完成情况。
  • 通报了任务进展情况。

3. 定义角色层次结构

为数据相关角色构建组织结构可以识别:

  • 层级结构:谁向谁汇报?
  • 协作者:哪些角色协同工作以实现数据质量?
  • 职能职责:哪些角色或部门负责管理数据,哪些角色或部门负责管理数据质量,哪些角色使用产生的结果?

4.根据数据和业务需求选择角色和职责

在构建数据质量团队时,不一定需要所有这些角色。角色和职责的选择取决于数据和业务需求。需要探索什么对组织有用,在角色和层次结构方面并在组织中实施。

有一点是肯定的:确立正确角色是成功的一半。然后是为他们提供正确的流程、工具和技术,以成功实现业务成果。众所周知,数据分析师 80% 的时间用于准备数据,其余 20% 的时间用于分析,这清楚地表明他们需要一种能够以更高效的方式完成工作的技术。

5. 为数据质量团队提供正确的工具和技术

这就是数据质量管理工具可以派上用场的地方。一种一体化的自助服务工具,可以分析数据、执行各种数据清理活动、匹配重复项并输出单一事实来源,可以成为数据管理员和数据分析师绩效的一大差异化因素。数据质量工具,它可以帮助数据团队快速、准确地纠正数据质量错误,并让他们能够专注于更重要的任务。数据质量团队可以在几分钟内分析、清理、匹配、合并和清除数百万条记录,并节省通常浪费在此类任务上的大量时间和精力。

责任编辑:华轩 来源: 数据驱动智能
相关推荐

2023-09-25 15:39:47

数据管理数据治理

2021-07-23 10:07:27

数字化转型数据分析IT

2023-05-15 10:08:15

人工智能软件交付工具

2022-10-11 11:06:59

首席信息官企业

2014-04-23 09:18:39

软件定义数据中心SDDCSDN

2012-06-26 11:11:44

架构师

2021-03-23 11:56:47

安全工程师职业

2022-05-24 15:02:04

CIOCTOIT领导者

2022-04-21 14:09:42

人工智能机器学习机器人

2010-10-28 11:42:28

Oracle只读用户角

2014-03-07 09:25:00

2023-02-06 16:50:46

数据治理工具

2019-10-30 11:00:14

大数据工业4.0技术

2018-08-17 09:35:19

数据团队数据科学工程师

2022-10-17 08:00:00

机器学习数据驱动数据科学

2021-09-03 14:41:21

数据中心托管设施设施管理

2018-07-06 10:47:26

数据

2023-06-09 15:28:33

数据质量数据价值

2023-02-02 14:28:33

数据质量数据集

2010-06-21 16:50:02

数据中心策略

51CTO技术栈公众号