数字化转型中的大数据治理架构

2023-11-08

转载本文需注明出处:EAII企业架构创新研究院(微信号:eaworld),违者必究。如需加入微信群参与微课堂、架构设计与讨论直播请直接回复此公众号:“加群 姓名 公司 职位 微信号”。

『发送关键字“BDTC”至此公众号,获取完整PPT下载』

大家好,我今天分享的主题是大数据治理。我们如何使用好大数据资产,才能够更好地发挥其中的价值?

主要大纲:

一、数字化时代大数据向服务化发展

二、数字化时代的大数据治理架构

三、大数据治理的12个技术原则

四、总结


一、数字化时代大数据向服务化发展

数字化时代,我们的数据来源比以前更广了。第一,之前传统企业政府的IT系统主要是面向内部使用,产生了一些信息,现在已经面向外部使用了;第二,更多行为信息、社交信息都会变成企业的数据;第三,我们有很多非结构化的数据,比如媒体、视频数据等;第四,还有物联网传感器方面的数据等。

0?wx_fmt=jpeg

这些数据大部分是非结构化的,如媒体数据、视频数据,包括物联网传感器等信息,这些信息远比以前更加难以管理,怎么样把这些信息管理好,充分发挥这些信息中的价值,就是我今天跟大家分享的主要内容。

1、以大数据为驱动的企业数字化转型

我们先看企业、政府是如何发挥大数据价值的。

  • 红领集团——以大数据为驱动的企业数字化转型

0?wx_fmt=jpeg

我们先来看红领集团。红领集团是做工业4.0比较领先的企业,以生产男式西装为主。下图是红领集团的生产模式:用户在手机APP上下单之后,测量师会到你家里做定式测量,然后在版型库里做自动设计,自动排产之后就能生产使用了。

红领集团每个工人在生产的时候从布料里拿一张卡到屏幕上刷一下,屏幕上就能显示出订单编号和工序要求。所以对于红领集团来说所有订单都是个性化订单,所有生产都是个性化生产,整个生产流程都是由数据驱动的,其中男装生产中的两个非常关键的环节,也是用大数据解决的。

第一个关键环节是西装设计。就是根据你的身材来裁剪版型,西装设计非常重要,要求领子里面衬衣露不到一指,裤子盖脚面一指等。在订单量很大的情况下,版型师难免会供不应求,红领集团把以前做的一亿多套数据灌到数据库里,通过大数据的方式,自动给新订单生成版型,并抽查现有设计的版型是否合理,另外还有20几个版型师专门针对特别高、特别胖的人做版型设计,因为这些是机器做不出来的。

第二个关键环节是自动排产。生产工序是什么样的,什么地方钉扣子,什么地方挖扣眼,这些都是在自动排产里面进行的。排产也是数据驱动的,在红领生产工艺里面很少有人工审批,各个环节都是用数据驱动的方式在做。

0?wx_fmt=jpeg

通过这样一个模式,红领基本上把整个工业的生产线、传感器、车床、用于排产的MES系统、ERP系统、订单系统、物流系统等通过云和大数据的模式进行了整合。生产的时候有排产,排产是否有工艺流程、艺工的应用效率是什么样的,都是通过数据驱动的方式。

我们发现领的数据已经不是像传统一样仅仅用在了决策分析或某一个地方,而是贯穿了整个生产部门。这个数据是从哪来的,怎么来的,怎么管好,怎么发挥价值,实际上就是红领集团做数据管理带来的作用。

  • 苏州工业园区——实现政务信息共享

我们再来看看苏州工业园区。作为政府机构,苏州工业园区很早就实现了机器物理的大集中,但是集中之后该如何做?现在政府都在提数据共享,物理服务器集中只能算数据共享的第一步,但是只做这个就能数据共享吗——显然不是,所以苏州工业园要做“三库、三通、九枢纽”。

0?wx_fmt=jpeg

三库即企业信息库、人口库、地理库,这个大部分政府都在做,但是九枢纽和三通是苏州工业园区自己做的规划。三通无非是跟政府、居民和企业打交道的业务,所有的应用都在三通框架下做,九枢纽把三库之外的信息做了分割聚类,比如到工商注册一个公司,可能环保对我有要求,工商对我有要求,税务对我也有要求,那么这些信息从哪里来,可能从九枢纽上面的各种应用来,这就是发挥数据功效的时候。

2、大数据治理是大数据服务化的关键

目前很多企业也意识到了数据管理的重要性,CDO也逐渐成为数字化企业的标准岗位,成为企业组织结构中的一部分,CDO已经不仅仅是一个职位了,而代表着数据部门职能的改变。

0?wx_fmt=jpeg
现在不少企业为了更加明确数据部门的目标,已经把数据管理部的名字改为数据服务部了,由数据管理转变为数据服务,以前是数据部门是自己准备数据给自己用,自己做一些分析报表等,现在更多是要把这些提供给别人用,为业务创新服务,像苏州工业园区的九枢纽就是给委办局用的。怎么把数据管理好,用服务的方式提供出来,这是大数据治理的核心。

0?wx_fmt=jpeg

3、大数据治理需要新一代架构

作为数据管理部门的一个管理手段,大数据治理在数据服务化上扮演着重要的角色。举一个例子,我们在看足球赛的时候,看的是运动员如何把球踢进去,但一场球踢得如何与裁判也有很大关系,大数据治理就像是足球赛的裁判,如何做好裁判的工作,就是我们今天要讨论的问题。

0?wx_fmt=jpeg裁判通常的做法是向大家传输规定好的比赛流程,给大家定好比赛规则,然后再按照规定的流程和规则来监督大家执行,其实好的裁判应该不只是向大家传输规则和流程,还要考虑如何让运动员把球踢得更流畅。企业大数据治理也一样,治理本质上其实是帮业务把数据用好,让业务发挥更好的作用,而不只是通过一系列流程和规章制度给大家上套,增加大家的额外工作量。

裁判之前的工具只有哨子、红黄牌、旗子,想要把裁判的工作落实下去有一定的难度,现在裁判有各种先进的工具,有鹰眼、有录像的回放,通过一系列工具手段能把裁判工作落实得更好。在大数据时代还按传统方式做数据治理是行不通的,因为现在需要让每个人都能发现数据的价值,让每个人都能发挥创新能力,所以更好的工具和手段很重要。

大数据治理应该是自动化、自助化、智能化的,把大数据治理当做一系列服务给别人提供出来,可以让大家更好地开展大数据治理,这个我在后面会详细介绍。

0?wx_fmt=jpeg

二、数字化时代的大数据治理架构

1、目前的大数据平台难以满足数字化时代的要求

0?wx_fmt=jpeg

目前的大数据平台在管理、业务、技术都有很大优化空间,比如,管理上缺乏服务化,业务上数据难使用、难查找,用户不知道到底哪些数据能够用来创新;技术上,工具链条很复杂,比如报表发生错误之后,因为报表本身的数据可能是通过几次数据处理才形成的,最后的错误源头在哪儿?大家的一般做法是检查数据处理存储过程脚本等,查了好多个文件后,最后发现原来是某个数据不对,诸如此类的工具链让数据业务的开发和创新变得非常困难。

2、大数据治理从管理、业务、技术上全面提升创新能力

0?wx_fmt=jpeg

在大数据治理时,要转变管理定位,支撑好业务,而且要有技术落地。我们作为一个裁判不能只有哨子、红黄牌和旗子,我们还需要有鹰眼和视频回放,自动看到到底哪些球员越位了。传统的数据管理部门,正需要使用这样一些工具手段帮助业务人员、使用人员、开发人员、运维人员把事情做好,给他们提供数据服务,而不是给他们增加负担。

0?wx_fmt=jpeg

大家知道以前做数据治理,有个很重要的系统叫元数据系统,传统情况下一个企业里只有几个人在用这个系统,其他人不知道这个系统能干什么,也不会使用。如果将元数据系统变成服务,再将这个服务嵌入到企业每个人的工具里,这样一旦出现数据质量问题,就能定位到问题来源,一旦发现问题就自动查询数据,我们需要的就是这样一个平台,帮我们大数据治理做好,使企业更容易获得大数据的好处。

0?wx_fmt=jpeg

大数据平台中有各种类型的数据,前端有各种类型的业务应用,但是业务应用和大数据之间是有鸿沟的,怎么让他们匹配起来?按照解耦性,加入中间层,在中间解耦会让业务更简单、更方便地取得数据。

0?wx_fmt=jpeg

三、大数据治理的12个技术原则

如何用技术手段来做大数据治理,我们总结出了以下12个原则:

0?wx_fmt=jpeg

因为时间关系,我主要结合我们的具体实践讲三个原则。

  • 可视化管理企业数据资产

企业有各种来源的数据,包括第三方购买的、自动产生的、从网络爬过来的等,现在领集团连之前不需要的传感器生产数据也拿过来了,这些海量数据之间的传递,实际上是知识的传递,或者说是知识工作者之间的传递,可视化的方式能极大地提升知识传递的效率。可视化有很多手段,比如树、思维脑图、流程图等,所以可以用数据地图来描述企业数据资产,通过思维脑图、流程图等形式可视化出企业的数据资产,嵌到各个数据应用系统中去。

0?wx_fmt=jpeg

  • 大数据服务智能化

以前我做数据的时候发现很多热点数据是频繁使用的,每次都去数据仓库或者大数据平台抓这些热点数据会浪费大量的资源,现在通过大数据治理平台,把这些热点数据缓存起来,能够方便大家的下一次使用。

以大运河为例,在大运河边上能发现很多湖,这些湖就是用来调节运河水位的,同样我们也应该有这样一个“湖”,通过这个“湖”把前端的应用用好,刚才我讲的热点数据只是之一,数据的脱敏、安全性管理都是要做的,我们在中间提供了非常好的手段把这些来自很多维度的数据管理好。

0?wx_fmt=jpeg

  • 数据管理能力服务化

将数据治理平台变为服务平台,用工具把IT的各个环节做一个串联。比如数据地图能不能是对外的API,形成页面组件供应用使用,数据字典能不能嵌入到管理的系统里去,数据标准能不能跟设计连接起来,让人家在设计库表结构、数据结构的时候就能用到数据标准,而不是到你的系统里用?能不能让需求人员在开发的需求工具里就能看到业务语义,用这样的业务语义来写需求?这需要把数据治理能力服务化,为开发者、运维者、架构师提供方便。

0?wx_fmt=jpeg

四、总结

苏州工业园区、领集团在数字化转型中都以大数据为支撑,支撑过程当中,数据治理是关键,要用技术手段做治理,而不是只靠规章制度。要想把大数据治理做好,需要很多原则引导,以是否实现这些原则判断大数据治理效果的好坏。

0?wx_fmt=jpeg

欢迎大家和我们一起沟通!愿大家能用好、管好大数据,让其真正发挥出价值,创造作用。谢谢大家!


欢迎扫描二维码加入作者焦烈焱所在的“普元云计算架构设计群”,讨论更多关于微服务、大数据等相关技术内容,加群暗号“BDTC”。(已在微信群中的群友请勿重复添加哦!)


0?wx_fmt=jpeg

关于作者

焦烈焱

EAII-企业架构创新研究院 常务理事

2001年加入普元信息,现任CTO,全面负责普元信息技术与产品的运营工作,公司技术发展战略的重要决策人。焦烈焱在企业技术架构研究方面有二十余年的经验,长期致力于分布式环境的企业计算、 SOA与云计算技术研究与实践。加入普元信息后组织完成一系列核心产品的研发工作,包括SOA应用平台、以BPM &/ESB为核心的业务集成平台、以复杂事件处理/数据治理/作业调度为核心的大数据平台,期间主持了中国工商银行、中国建设银行等多家大型企业技术平台的规划与研发。著有《SOA中国路线图—实施版》一书。

640?wx_fmt=jpeg


关于EAII

EAII(Enterprise Architecture Innovation Institute)企业架构创新研究院,致力于软件架构创新与实践,加速企业数字化转型。


eaworld项目(微信号:eaworld,长按二维码关注)

640?wx_fmt=jpeg

eaworld是EAII的官方微信账号。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数字化转型中的大数据治理架构 的相关文章

  • 常见的几何算法库

    常见的几何算法库包括 ACIS Parasolid和OpenCASCADE 简称OCC 前两个是商业的 后者是开源的 在CAD CAE这个领域 开源算法库基本上没有多大优势 基于ACIS和Parasolid至少有很多知名的产品 比如ACIS
  • 高效能,一键批量剪辑,AI智剪让创作更轻松

    在今天的数字化时代 视频制作已经成为各种行业和领域的必备技能 然而 视频剪辑过程往往繁琐且耗时 大大降低了我们的工作效率 幸运的是 随着人工智能技术的发展 我们有了新的解决方案 AI智剪软件 AI智剪软件 如同其名字一样 使用人工智能技术进
  • 计算机组成原理--基于Logisim的8位可控加减法器实验的应用(超详细/设计/实验/作业/练习)

    目录 课程名 计算机组成原理 内容 作用 设计 实验 作业 练习 学习 基于Logisim的8位可控加减法器实验 一 前言 二 环境与设备 三 内容 四 结果与分析 课程名 计算机组成原理 内容 作用 设计 实验 作业 练习 学习 基于Lo
  • 【计算机视觉】BYOL 讲解

    BYOL 论文信息 标题 Bootstrap your own latent A new approach to self supervised Learning 作者 Jean Bastien Grill 期刊 NeurIPS 2020
  • 微软正式提供Visual Studio 2013正式版下载(附直接链接汇总)

    转自 http www iruanmi com visual studio 2013 微软已经向MSDN订阅用户提供了Visual Studio 2013正式版镜像下载 不过非MSDN用户可以在微软的Visual Studio 2013官方
  • 猜数字游戏(比大小)

    import random Sn random randint 0 100 函数返回n 生成一个在范围内的整数 例子 0 lt n lt 100 也可以用random random的函数 Gn int input 输入猜的数 N 1 whi
  • 2019安恒杯一月新春贺岁赛writeup

    WEB babyGo 提交你找到的字符串的md5值 考点 php反序列化 POP链构造
  • 字典树:Trie树(持续更新)

    字典树 Trie树 持续更新 今天开始学习字典树 顺便做做笔记 等多刷几道题再来更新一波经验 一 基本介绍 1 什么是字典树 字典树 又称单词查找树 前缀树 键树 是一种树形结构 是一种哈希树的变种 2 基本性质 1 根节点不包含字符 除根
  • 第十三届蓝桥杯单片机组—PCF8591使用

    蓝桥杯 PCF8591使用 00 了解PCF8591 01 PCF8591手册主要部分解读 控制字节 02 程序部分 ADC部分程序 DAC部分程序 03 总结 00 了解PCF8591 蓝桥杯的PCF8591是ADC DAC驱动芯片 大家
  • python 中定义的函数 如何在main中调用_python中main函数的用法

    什么场景下会有main函数 当该python脚本被作为模块 module 引入 import 时 其中的main 函数将不会被执行 main函数的作用 name main 是Python的main函数入口 并非说 加入这句才能使用pytho
  • js插件汇总

    1 NProgress显示顶部进度条 nprogress js 2 Decimal 浮点数运算的精度 decimal js 3 jquery画小图插件 jquery sparkline js 4 侧边栏导航 sidebar nav js B
  • apache模块开发 request_rec结构体中变量的值

    request rec结构体中用很多成员变量 这里只输出了char和int两种类型的值 source 1 include httpd h 2 include http config h 3 include http protocol h 4
  • STM32-(16):Systick 系统时钟

    上一篇 STM32 15 如何用ID号保护自己的劳动成果 下一篇 STM32 17 SPI与数码管 数码管 Systick的两大作用 1 可以产生精确延时 原先的Delay只是盲等 2 可以提供给操作系统一个单独的心跳 时钟 节拍 通常实现
  • 2021你有想尝试过副业吗?不如来学习3D游戏建模

    从2020 2021 我们会害怕 害怕经历这次疫情 自己会失业 但是同时也想保住一份工作 不知如果去做 那到底要不要先去找一条后路去做呢 起码还能给自己一条 活路 可是往往试着用哪一条活路 反而更多的是一事无成 我主业是一个3D模型模型师
  • 继承。。。

    继承 上节回顾 static 静态的 作用 可以用来修饰成员变量 gt 静态变量 类变量 静态变量它是随着类的加载而加载 它被这个类的所有对象共享 普通成员变量 实例变量 它是随着对象的创建而产生 在不同的对象之间 是相互独立的 可以用来修
  • java中的IO整理

    写在前面 本文章基本覆盖了java IO的全部内容 文章以例子为主 因为讲解内容的java书很多了 我觉的学以致用才是真 代码是写出来的 不是看出来的 最后欢迎大家提出意见和建议 案例1 创建一个新文件 1 2 3 4 5 6
  • linux安装nginx+php

    在centos服务器下 mkdir docker cd docker mkdir nginx mkdir php mkdir www 2 拉取镜像 docker pull nginx docker pull php 7 4 fpm dock
  • CentOS 7 分区方案

    通常系统盘都会选择性能较好SSD 一般在500G左右 这里就以500G硬盘为例 以下为CentOS 自动分区方案 分区应该按照实际服务器用途而定 自动分区方案将 home 空间分配太多了 多数情况下并不适用 必须存在的分区 分区是必须存在的
  • 如何卸载、删除Anaconda?

    Anaconda这么好用 为啥要删呢 当然是我之前装得乱七八糟 导致现在心情不好 我要把它全部删掉 ok 开始 删除思路 首先利用anaconda clean清理包清理配置文件 然后直接用安装目录下的卸载程序卸载即可 一 anaconda
  • 算法分析基础

    问题 如何比较不同算法的性能 分析算法的运行时间 算法分析的原则 归纳基本操作 如 运算 赋值 比较 统一机器性能 假设基本操作代价均为1 统一机器性能后 算法运行时间依赖于问题输入规模与实例 相同输入规模 实例影响运行 最好情况 不常出现

随机推荐

  • spark 参数调优3-Shuffle Behavior

    spark参数调优系列 目录地址 https blog csdn net zyzzxycj article details 81011540 Shuffle Behavior spark reducer maxSizeInFlight 默认
  • JSP中使用element-ui

    首先需要下载element ui 可以直接在github下载即可 script 引入 这样就可以使用了 如 this message 已经上传过了 无需重复上传 注 vue里面直接使用 this即可 jsp里面想使用的可以试试了
  • 浏览器客户端生成唯一标识码

    created this getFinger methods getFinger const canvas document createElement canvas const ctx canvas getContext 2d const
  • 人工智能:深度学习算法及应用——简单理解CNN卷积神经网络并python实现(带源码)

    深度学习算法及应用 一 实验目的 二 实验要求 三 实验的硬件 软件平台 四 实验原理 1 1 深度学习概述 1 2 深度学习的常见结构 1 3 卷积神经网络 CNN 卷积 池化 全连接网络 1 4 卷积神经网络的大致结构 1 5 参数学习
  • 动态规划—分割回文串-ii 解析+代码

    分割回文串 ii 题目链接 分割回文串 ii 思路 分割字符串s 使得子串都是回文串 最后获得最小分割次数 那么我们可以不断把字符串缩短 判断子串是否可以被分割成回文串 并且最小分割次数 这就是子问题分割了 所以我们可以使用动态规划 状态
  • python3 发送邮件 send mail 使用 163 smtp服务器

    监控本地网络速度 通过api 请求速度 发现速度异常 发送报警邮件 usr bin env python3 coding UTF 8 import smtplib time from email mime text import MIMET
  • 深入理解equals和==的区别

    今天在群里面看到这个问题 equals和 的区别是什么 我有点迟钝 不就是如果是String类型的话equals比较的是内容 非字符串类型则比较的是内容吗 我想里面的考点也没有多少吧 然后我就回复了一个 equals本来就是为了比较内容出现
  • c++ STL中sort函数的三种使用方法

    复习一下 STL C 中的标准模板库 使用起来方便并且效率较高 sort函数有三种用法 一 对基本类型数组从小到大排序 sort 数组名 n1 数组名 n2 将数组中下标从n1到n2的元素进行从小到大排序 不包括n2 通过n1 n2 可以对
  • 已经有dll文件,报错:“缺少XXXXX.dll 无法继续执行代码。重新安装程序可能会解决此问题”解决方案

    解决方案 尝试了博客的很多方法 都建议直接复制dll到工程目录 觉得特别繁琐 而且会导致项目文件夹很大 从这篇文章得到启发 链接 项目 gt 属性 gt 调试 gt 环境 输入path 不要空格 你存储dll的目录 注意 不要有空格 例如我
  • MES相关名词解释

    SOA Service Oriented Architecture SOA 面向服务的体系结构AMR Advanced Manufacturing Research 先进制造研究机构CIM Computer Integrated Manuf
  • 【react】react全家桶介绍

    1 react基础 2 react router 路由库 3 pubsub 消息管理的库 4 redux 集中式状态管理的库 5 ant design UI库 react是用于构建用户界面的javascript库 1 发送请求获取数据 2
  • JAVA基础知识(五)

    5 4 构造方法 构造方法的主要作用就是为类中的属性初始化 类名称 对象名称 new 类名称 从格式中发现 在最后有一个类名称 的代码 在程序中只要是一看见有 就表示调用方法 那么这个方法实际上就是要表示调用构造方法 构造方法可视为一种特殊
  • 移动端如何浏览EXCEL、word、ppt、pdf等文件在线预览?

    1 简单的前端处理方式 a href 文档地址 a 或者JS window open 文档地址 新建窗口打开链接预览 window location href 文档地址 本页面内跳转链接实现预览 这种方式在不同浏览器上表现不一样 部份手机浏
  • 对所有数据类型可通用的快速排序算法

    1 引子 快速排序算法可能是最优秀的排序算法了 此算法是1960年C A Hoare发明出来的 它被列为20世纪十大算法之一 快速排序也属于广义上的冒泡排序 这是简单冒泡排序法的优化升级 两者都是通过比较大小 交换元素来排序的 不过它增大了
  • 如何构建Python软件包并上传到Pypi

    因为最近在做Python包 所以也了解了一下这个 这里我把我自己的学习经验写出来 如果哪里写的不好也请大家提出来 本文的内容大多数都来自 Packaging Python Projects Pypi 我根据我的理解进行描述一下 演示配置 操
  • Opencv图像处理总结(持续更新)

    这几天在进行印章提取 识别的代码开发 其中用到了几个opencv库的几个函数 脑袋中想到了要用到什么处理 但是却忘记了各个函数库比如二值化 膨胀 腐蚀等函数的参数 因此每个函数都查找了好久才想起来每个函数参数中的意思 因此在这篇blog中想
  • 003-sarsa

    本学习笔记转自https morvanzhou github io 什么是 Sarsa 今天我们会来说说强化学习中一个和 Q learning 类似的算法 叫做 Sarsa 注 本文不会涉及数学推导 大家可以在很多其他地方找到优秀的数学推导
  • vue - element ui 实现 tab 选项卡的动态增删

    注意 this refs tabs i 的属性对应 参考的原帖貌似是没对应好 本人在使用时出现几个问题 title无法显示 只能添加一个tab tab会重复添加 默认打开的首页也能再创建 修改之后 功能正常
  • 冒险岛开服服务端教程自己搭建服务器需要那些东西

    冒险岛开服服务端教程自己搭建服务器需要那些东西 冒险岛Online 是由韩国WIZET和NEXON制作开发的一款2D横版卷轴网络游戏 故事以被 黑暗力量 不断入侵 因而进入了 浑沌期 的世界为背景 勇士们组成了联盟 再次与 黑暗力量 展开激
  • 数字化转型中的大数据治理架构

    转载本文需注明出处 EAII企业架构创新研究院 微信号 eaworld 违者必究 如需加入微信群参与微课堂 架构设计与讨论直播请直接回复此公众号 加群 姓名 公司 职位 微信号 发送关键字 BDTC 至此公众号 获取完整PPT下载 大家好