搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
技术学习(版主发帖区)
›
大数据学习
›
数据治理
›
总结型
›
数据治理项目启动灵魂三问:为啥治?治什么?怎么治?
1
1
3
分享
数据治理项目启动灵魂三问:为啥治?治什么?怎么治?
nettman
2022-8-8 20:07:12
发表于
总结型
[显示全部楼层]
只看大图
阅读模式
关闭右栏
1
3227
问题导读
1.为什么要治理?
2.治理实现什么?
3.怎么实现治理?
近一年以来,越来越多的企业在考虑或正在启动数据治理的项目。
作为在该领域从业多年的人士,也常会被咨询到:
数据治理不是很多年前就有的概念么?
为什么忽然很多企业都在提及?
是不是新瓶装旧酒?
和数据中台之间是什么关系?
......
本文主要围绕下文中数据治理领域的三个核心问题来梳理,更重要的是,这三个问题,也是一家企业启动数据治理项目前必须要想清楚的三个问题。
一问:为什么要治理?
这是一个数据治理项目启动前必须要拉齐认知的问题。并不是为了治理而治理,治理本身并无价值。
我们认为:治理的价值在于构建企业内一份质量可靠、安全可控、服务便捷的好数据,让数据价值得以释放。也就是说:数据治理的终极目的是为了释放数据价值,奠定数据价值释放的基础。
随着各行各业数字化转型进程的加速,业务数字化的基础日渐扎实,数据驱动业务或数据化运营,不再是传统头部企业及大型互联网公司的专利,越来越多的企业也在拥抱数据、消费数据。因此,数据治理的诉求呈现出日渐强烈的趋势。
在数据资产治理的强烈诉求之下,启动项目前,自上而下,企业必须达成一个统一认知:数据治理的终极目的是为了驱动数据消费、释放数据价值。
二问:治理实现什么?
这是数据治理项目启动前,需要细化和明确答案的一个问题。
数据治理并非一蹴而就,我们需要明确长期目标是什么,但同时也要明确短期项目范围和目标又是什么。
数据治理的目的不难理解,制定数据治理项目的阶段性目标可以从终极目的的数据价值释放出发,也可以从数据体系的完善度出发。一般来说,后者是常见的直接目标。
当然,在数据领域摸爬多年的领域人士都知道,数据治理并非一蹴而就。一般围绕四大关键领域“成本、质量、安全、服务”开展工作,进行目标设定。目标设定的可以借鉴以下思路。
1、生产经济即成本方面,以控制甚至节约成本为目标,实际运作则需要拆解到业务线或者不同领域范围的成本控制,比如销售业务线、市场投放线等,再比如基础数据线、流量日志数据线等。
2、质量可靠即质量方面,以减少数据质量问题、收窄数据质量风险敞口为目标,实际运作则需要拆解到应用场景或不同数据等级,如商品数据、销售数据等,再如优先保障高管数据看板、驱动业务运行涉及的数据质量等。
3、安全可控即安全方面,以满足合规要求、防止数据泄漏为目标,实际运作则需要拆解到不同的数据类型或流程环节,如隐私数据、监管报送数据等,往往安全体系能力建设是其中重要的工作。
4、服务便捷即服务方面,以盘点供给丰富的数据、驱动数据消费为目标,实际运作则需要拆解到不同的业务线、数据类型及服务场景,如营销推广、业务决策等。
从具体的工作开展来看,成本是数据到一定体量再重点关注的领域,质量是其中最重点也是最具挑战的领域,安全是基础,服务则是需要高度重视并投入打造数据价值的关键领域。
因此,在项目启动之前,必须明确本次项目范围重点的是哪个或哪几个领域(如:成本、质量)、治理范围是什么(如:客户数据、监管报送场景、流量日志线数据)、核心目标是什么(如:3个月项目上线、XXX成本的节约、6个月P0级数据质量故障数为0、完成XXX数据的上架、数据服务体系能力建设形成XXX、XXX用户的服务)。
总而言之,启动治理项目前,必须对领域、范围、核心目标进行选择和设定。
三问:怎么实现治理?
目的目标明确,具体的数据治理应该如何实施呢?
这是保障数据治理项目成功的关键问题,涉及到人员组织及权责的设计、流程规范的设计、工具选型三方面的基础工作,同时还要围绕目标设定的领域、范围及核心目标进行工作开展。
1、由于数据质量出现问题引发的原因很多,可能有技术层面的数据建设开发不规范,可能有业务层面的填报输入有纰漏,可能有管理层面的组织机制不健全导致无人推进等,所以要对数据质量及管理进行摸底,确定质量的水位线及风险敞口,并制定事前事中事后全链路的数据质量治理方案。
2、数据价值释放是数据治理项目的终极目标,所以一方面通过对企业所有数据盘点及管理,在数据供给侧汇聚全域数据,体系化地组织数据,并丰富数据信息,另一方面强化数据运营培训及推广,建立良好的资产检索和确信体验,并和取数、分析等数据服务链接,实现数据资产在需求侧消费扩大。与此同时,体系化呈现资产能力大图及资产价值评估也是必不可少的。
3、数据安全方面,重点是数据识别后对数据的分类分级,同时对隐私及不同安全等级的数据采取不同的授权策略。不论从源头的数据采集、授权,还是从外部引入合作,合规性都是今天数据安全范畴内非常重要的命题,因此相关流程机制及能力建设也可以是实施中的重要组成部分。
4、数据成本方面,重点对数据存储及计算的浪费问题进行发现和处理,通过分析、设定治理项、启动治理,实现成本的节约。
因此,启动治理项目前,必须对基本的治理实施路径进行定义,包括组织保障、流程规范、工具提效,并对涉及的领域如质量:进行全面评估、用全链路的视角对项目范围内的数据建设进行质量风险控制、建立数据质量故障体系提升响应能力,同时重点关注价值出口,对数据资产进行盘点和运营推广,让数据被用起来。
写在最后:
作为从业多年的数据人,也一直在反思,为什么数据治理提了那么多年,以前做治理项目成功的案例并不多见。如今再次被业内频繁提起,项目成功的可能性已有了很大提升,主要原因在以下几方面:
1、数字化转型浪潮下,对数据治理都有了更客观的认知,是长期能力建设而非运动式项目。
2、数据中台和数据治理结合,数据的统一汇聚为数据治理提供了基础,体系规范的数据建设又让数据治理前置到事前事中,全链路式的数据治理而非点状、事后的数据治理。
3、一批真正懂数据、实践过大规模数据建设和数据运营的人员为数据治理提供服务,实战沉淀而非纸上谈兵。
最新经典文章,欢迎关注公众号
原文链接:
https://mp.weixin.qq.com/s/_l02uXYcaRlFVv-TG4qfNg
加微信w3aboutyun,可拉入技术爱好者群
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
wang_pl
发表于 2023-2-6 09:19:42
不错学习
回复
使用道具
举报
显身卡
还有一些帖子被系统自动隐藏,点此展开
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
nettman
超级版主
关注
2911
主题
3204
帖子
478
粉丝
TA的主题
谷歌版o1模型发布
2024-12-20
避坑大厂基础架构
2024-11-26
Flink CDC:新一代实时数据集成框架
2024-11-26
蚂蚁面试就是不一样
2024-11-26
招聘1万人
2024-11-21
24小时热文
矩阵分析引论罗家洪(第四版)
互联网大厂年终福利曝光:看看别人家老板怎
像高手一样发言:七种常见工作场景的说话之
携程允许员工春节回乡办公2个月
数据治理实施方案
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈