• 自动秒收录
  • 软件:1973
  • 资讯:56215|
  • 收录网站:181185|

IT精英团

透彻理解数据资产、数据资源、数据管理、数据治理等概念的区别

透彻理解数据资产、数据资源、数据管理、数据治理等概念的区别

浏览次数:
评论次数:
编辑: 乐咏
信息来源: ITPUB
更新日期: 2022-04-24 21:20:27
摘要

以下文章来源于公众号-大鱼的数据人生,作者讨厌的大鱼先生数据成为生产要素后,各种跟数据相关的概念就出来了,其实很多概念没有权威定义,大家各有各的理解,这导致了理解上的歧义。数据管理、数据治理、数据资源

  • 正文开始
  • 相关阅读
  • 推荐作品

以下文章来自微信官方账号——大鱼的数据生活,作者深恶痛绝。

数据成为生产要素后,各种与数据相关的概念就出来了。其实很多概念都没有权威定义,每个人都有自己的理解,导致理解模糊。

数据管理、数据治理、数据资源管理、数据资产管理这四个概念现在频繁出现,但我还是无法有效区分。连续看了几篇老师的讲解文章,还是觉得有些歧义,于是有了这篇辨析文章,不一定准确,但至少反映了我目前的认知水平。

1、数据、数据资源及数据资产的定义

数据:指“原始数据”,即记录事实结果并用于描述事实的原始资料。

数据:指经过处理后具有经济价值的数据。注意这个值是未来的,需要人工判断。

数据资产:指可控制的、有价值的数据。

2、数据、数据资源及数据资产的区别

数据在某个地方,但你不知道它在哪里,所以这个数据对你来说不能称为数据资源;你知道数据在哪里,但是处理完就没用了。也不叫数据资源;你知道有些数据有潜在价值,但你还没有处理它。最多是数据资源。经过数据处理后产生经济效益的数据称为数据资产。数据是否具有资产属性,不是由数据本身决定的,而是由市场决定的。

例子如下:

CRM系统建好之后,会有很多数据,这些数据都是原始数据。业务人员对这些原始数据进行价值判断,发现有些配置数据没有有效用途,有些行为日志可以用来完善客户画像。然后这些行为日志就变成了数据资源,被收集到数据仓库中进行处理,服务于营销,这些处理后的数据就可以被认定为数据资产。

3、数据管理与数据治理的区别

从狭义上讲,数据管理是具体的日常活动,数据治理是对活动的权力控制。一般有很强的目的性,多指组织机制、流程文化等。更好的数据管理依赖于数据治理的保证,而数据治理依赖于数据管理活动的投入。对于有一定数据管理水平的企业来说,数据治理是非常必要的。

古代的开国皇帝靠管理称霸天下,却想靠治理创造盛世。商鞅变法和王安石变法都在进行中。我也是活生生的例子。我先做数据仓库,后做数据产品,现在从事数据管理。

4、数据管理和数据资源管理的区别

看到这两个葫芦娃真的是两眼一抹黑,不过还是通过开人物发现了一些秘密。我是这样理解的:

数据资源管理的目的是让数据本身获得更高的价值,让自己成功,通过自己的成功让别人成功;数据管理的目的只是基于数据运行应用,一般是为了让别人成功。就像DBA做的事情一样,数据本身的价值提升与否并不是关键。

现在数据资源管理的地位之所以这么高,是因为数据让自己成功之后,别人也会因为数据的成功而更加成功,也就是具有乘数效应,这是数据资源独有的特性。

5、数据资产管理和数据资源管理的区别

数据资产管理和数据资源管理会比较傻,分不清,但是要注意,数据资产管理的起点是数据资产,终点是数据资产,而数据资源管理的起点是数据资源,终点是数据资产。当数据资源被处理成数据资产后,数据资源管理就退出了舞台,下一步就是数据资产管理。

例如,创建源系统的数据目录就是数据资源管理的范畴。数据资源入湖后成为数据资产,对数据资产的处理属于数据资产管理的范畴。但是数据资源管理和数据资产管理采用的方法可能是类似的,包括元数据管理、数据质量管理、数据标准管理等等。

当然,数据资产管理除了数据资产的处理,还包括数据资产的流转、评估和运营。

在一个概念没有权威定义的时候,我采用的方法是把常用词汇拆解一下,了解本质,然后尽量绕开,比如资源、资产、治理、管理等。不然真的很混乱。当初提出这些新词的人,可能没有仔细想过,与他们无关。但如果大家都想引用,就必须统一认知,否则就会出现混乱。反正我看到这几个字也挺慌的。

阿帕奇建筑师遵循的30条设计原则
« 上一篇 2022-04-24
如何执行超过100M的SQL脚本?
下一篇 » 2022-04-24
  • 胡迪核心知识点详解(好文章合集)
    1阅读 0条评论 个赞
    以下文章来源于公众号-3分钟秒懂大数据,作者在IT中穿梭旅行在Flink实时流中,经常会通过FlinkCDC插件读取Mysql数据,然后写入Hudi中。所以在执行上述操作时,需要了解……
  • 前端面试必须解决网络中的跨域问题
    0阅读 0条评论 个赞
    什么是跨域浏览器有一个重要的安全策略,称之为「同源策略」其中,源=协议+主机+端口源=协议+主机+端口源=协议+主机+端口,两个源相同,称之为同源,两个源不同,称之为跨源或跨域比如:源1源2是否同……
  • 如何在Bash脚本中使用强大的Linux测试命令
    0阅读 0条评论 个赞
    Linuxtest命令是Shell内置命令,用来检测某个条件是否成立。test通常和if语句一起使用,并且大部分if语句都依赖test。可以将一个元素与另一个元素进行比较,但它更常……
  • 真正的建筑设计是什么样子的?
    1阅读 0条评论 个赞
    什么是架构和架构本质在软件行业,对于什么是架构,都有很多的争论,每个人都有自己的理解。此君说的架构和彼君理解的架构未必是一回事。因此我们在讨论架构之前,我们先讨论架构的概念定义,概念是人认识这个世界的……
  • 10分钟了解云原生 值得收藏~
    0阅读 0条评论 个赞
    文章转载:奇妙的Linux世界我们已经进入云计算下半场,不再像上半场在纠结要不要上云,而是讨论怎么上云?才能把云计算的价值发挥到淋漓尽致。如何把云计算与不同的业务场景深度结合?如何让技术真正作用于企业……
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
  • 真正的建筑设计是什么样子的?
    1阅读 0条评论 个赞
    什么是架构和架构本质在软件行业,对于什么是架构,都有很多的争论,每个人都有自己的理解。此君说的架构和彼君理解的架构未必是一回事。因此我们在讨论架构之前,我们先讨论架构的概念定义,概念是人认识这个世界的……
  • Python字符串深度摘要
    2阅读 0条评论 个赞
    以下文章来源于公众号-萝卜大杂烩,作者周萝卜今天我们来学习字符串数据类型相关知识,将讨论如何声明字符串数据类型,字符串数据类型与ASCII表的关系,字符串数据类型的属性,以及一些重要的字符串方法和……
  • JD.COM面试问题:ElasticSearch深度分页解决方案
    0阅读 0条评论 个赞
    以下文章来源于月伴飞鱼,作者日常加油站前言Elasticsearch是一个实时的分布式搜索与分析引擎,在使用过程中,有一些典型的使用场景,比如分页、遍历等。在使用关系型数据库中,我们被告知要注意甚至……
  • 高可用性架构设计的无状态服务
    2阅读 0条评论 个赞
    笑谈架构设计事故的发生是量的积累的结果,任何事情都没有表面看起来那么简单,在软件运行的过程中,随着用户量的增加,不考虑高可用,迟早有一天会发生故障,不得事先考虑高可用设计,而高可用是一门庞大的学问。在……
  • 本文将带您了解kubernetes的架构和组件!
    1阅读 0条评论 个赞
    kubernetes架构目标kubernetes是生产级的,用于跨主机部署,扩展,管理和组合应用程序容器的基础设施。kubernetes不仅仅是“容器编排”,他更加主要的解决方向是消除协调计算资源,网……
  • 高并发服务的几点优化经验
    1阅读 0条评论 个赞
    前言:如何优化高并发服务,这里指的是qps在20万以上的在线服务,注意不是离线服务,在线服务会存在哪些挑战呢?①无法做离线缓存,所有的数据都是实时读的②大量的请求会打到线上服务,对于服务的响应时间要……
  • 在Linux中检查磁盘空间的12个有用的df命令
    1阅读 0条评论 个赞
    1.检查文件系统磁盘空间使用情况这df命令显示文件系统上的设备名称、总块数、总磁盘空间、已用磁盘空间、可用磁盘空间和挂载点信息。[root@local~]#dfFilesystem1K-bloc……
  • Docker 从入门到实战 未雨绸缪收藏~
    1阅读 0条评论 个赞
    一、概述1.1基本概念Docker是一个开源的应用容器引擎,基于Go语言并遵从Apache2.0协议开源。Docker可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中……
  • Linux最常用的命令:解决95%以上的问题
    1阅读 0条评论 个赞
    Linux是目前应用最广泛的服务器操作系统,基于Unix,开源免费,由于系统的稳定性和安全性,市场占有率很高,几乎成为程序代码运行的最佳系统环境。linux不仅可以长时间的运行我们编写的程序代码,还可……
  • 代码| C语言根据可执行文件名获取进程运行信息
    1阅读 0条评论 个赞
    如下示例可根据可执行文件名获得线程数、虚拟内存占用大小、物理内存占用大小、进程PID、CPU占用率和进程启动次数等信息。1.程序源码main.c:#include#include<……
  • 运维数字化转型的几点思考
    1阅读 0条评论 个赞
    这个月底要召开一个企业运维数字化转型的研讨会,昨天一个合作伙伴和我讨论一些研讨会的话题问题。数字化转型是近期十分热门的话题,各大国企央企也把数字化转型作为未来几年的工作重点。不过针对于IT运维,数字化……
  • 40幅最完整的计算机网络思维导图
    1阅读 0条评论 个赞
    传输介质简介以太网帧结构IP编址ICMP协议ARP协议传输层协议路由基础静态路由基础距离矢量路由协议——RIP链路状态协议——OSPFHDLC&PPP原理与应用帧中继原理与配置PPPoENAT网络地址……
  • Linux预定任务调度(crontab) 好实用!
    0阅读 0条评论 个赞
    概述crontab命令用于设置周期性被执行的指令。该命令从标准输入设备读取指令,并将其存放于“crontab”文件中,以供之后读取和执行。可以使用crontab定时处理离线任务,比如每天凌晨2点更新数……
  • PostgreSQL并行框架分析
    3阅读 0条评论 个赞
    作者简介施博文,目前就职于腾讯云PG团队概览PostgreSQL并行框架提供了一系列方便的函数,支持在插件或内核中直接调用相关函数,启动若干个后台进程进行并行操作。目前,PG的并行框架主要用来……
  • 基础巩固——至少需要多少行代码才能实现深度复制?
    1阅读 0条评论 个赞
    前言深度克隆(深拷贝)一直都是初、中级前端面试中经常被问到的题目,网上介绍的实现方式也都各有千秋,大体可以概括为三种方式:JSON.stringify+JSON.parse,这个很好理解;全量判断类……
  • Linux中的交互式进程查看命令htop
    1阅读 0条评论 个赞
    htop界面展示HtopLinux进程监控工具“Htop是一个用于Linux/类Unix系统的交互式实时进程监控应用程序,也是top命的替代品,它是所有Linux操作系统上预装的默……
  • 如何优雅地升级Kubernetes集群的Docker和Containerd版本
    1阅读 0条评论 个赞
    前言公司用的k8s集群是“多环境合一”的方式,集群流量入口也摒弃了常见的traefik和ingress-nginx,直接用了一个国内不常见的底层基于Envoy的APIGateway网关服务。当然还有……
  • MySQL 5.7 和 8.0 几处细节上的差异
    9阅读 0条评论 个赞
    MySQL8.0相对于MySQL5.7,有很多新特性,比如:快速加列、原子DDL、不可见索引、额外端口、角色管理等。这一节内容,就不讲这些新特性了,只来聊聊最近在工作学习过程中遇到的几处细节……
  • 说说春云的全链路灰度发布方案~
    1阅读 0条评论 个赞
    以下文章来源于公众号-码猿技术专栏,作者不才陈某大家好实际生产中如有需求变更,并不会直接更新线上服务,最通常的做法便是:切出线上的小部分流量进行体验测试,经过测试后无问题则全面的上线。这样做的好处也是……
  • 一天一技能:协调与多流程的完美结合
    7阅读 0条评论 个赞
    我们知道,协程本质上是单线程单进程,通过充分利用IO等待时间来实现高并发。在IO等待时间之外的代码,还是串行运行的。因此,如果协程非常多,多少每个协程内部的串行代码运行时间超过了IO请求的等待时间,那……
最近发布资讯
更多