BI数据系统的设计流程

2023-11-11

BI大数据产品:
数据管理平台可以通过报表或者BI模块来搭建。在专栏《帆软数据应用研究院》里有关于企业数据管理和BI报表平台建设的案例。

站在项目实施的角度,可以从技术和业务两个层面来考虑。

前期进行需求调研。罗列了一张建设思路图。

建立一个全数据管理的分析平台,该如何落实?

技术上需要考虑两大主体,一是公司的数据量,而是具体的需求情况。

数据情况

1、数据来源:考虑数据主要来源的业务系统有哪些?是否需要建立数据仓库?以及前期准备工作,比如相关数据字典准备,甚至是取数接口等问题。

举个例子,比如财务数据来自EAS,管理数据来自OA,销售数据来自SAP,以及各个业务系统的数据库类型。

2、数据情况:业务系统内最大单表的数据量及数据增量是多少。通过了解最大单表的数据量及数据增量,初步规划数据处理方案,是否要建立中间层,索引,GP等,选择合适的分析平台,是BI还是一般的报表平台。

比如销售数据子表已有2000W的数据,月增量50W,那么处理方案可以考虑通过报表平台FineReport来展示,建立中间层与索引,以提高查询效率与展示性能。又或者通过大数据BI平台FineBI建立前台分析,采用FineIndex的方式,以提高展示性能。

3、数据补录:主要是维度数据维护与事实数据补录,具体的工作就是填报页面的维护。比如人力分析中的工资分析,一般是财务线下数据,那么需要开发填报导入页面以作数据录入。

这项工作需要考虑补录的数据录到什么地方:如果建立数据仓库就直接填入数仓中;但是如果通过直连开发报表,是否需要将补录的数据直接录入到业务系统中。

4、数据仓库:针对需求主体、分析指标及数据情况判定是否需要建立数据仓库。如果需要将财务数据、费用数据整合分析,但是财务数据来自EAS,费用数据来自OA,那么这样的情况就需要建立数据仓库以实现整合分析。这里需要考虑在建立数据仓库之后,相关维度数据的对应关系是否和人员组织架构有效对应。

需求情况

需求分析的主要是业务指标、主题模块和分析场景的确定。

1、前期需要确定这个平台面向的适用对象,不同层级的领导人员关注的指标不同,需要

规划分析指标及分析形式。比如领导只关注销售额、利润率等等几个主要数据,而业务层在指标的基础之上可能还涉及到钻取分析、联动分析等。

2、需求的主体主要包含三部分的内容:需求模块+模块指标+分析形式。通过需求模块+模块指标+分析形式,初步框定需求内容,评估工作量及实施报价。比如销售分析,涉及到客户分析、订单分析、产品分析、渠道分析等分析指标,各个指标可能需要层级钻取分析、同比分析等分析形式。

困难点

首先,对于这样一个平台要有良好的定位——面向业务的敏捷相应开发平台。

其次,如何调配人员,如何推动项目的顺利进行?个人建议是,如果人员充分可以试着让一线业务人员能参与甚至直接进行系统开发,这样既能提高开发效率,切实满足业务需求,同时还能减轻IT部门压力。二是一定要有领导高层亲自参与,从上之下推动执行。


本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BI数据系统的设计流程 的相关文章

  • 爬取天眼查数据 附代码

    摘要 一 常规抓包分析 比如要爬取企业注册信息查询 企业工商信息查询 企业信用信息查询平台 发现人与企业关系的平台 天眼查该页面的基础信息 通过火狐浏览器抓包 可以发现 所要数据都在下图的json文件里 查看其请求 伪装成浏览器爬取该文件
  • Power bi 3.24 矩阵

    关注微信公共号 小程在线 关注CSDN博客 程志伟的博客 数据集链接见微信公共号底端 1 单击 可视化 窗格中的 矩阵 图标 在画布区域会出现矩阵的模板 由于没有填入数据 因此矩阵是灰色的 2 在 字段 窗格中勾选 类型 年份 实际产量 预
  • Cloudera 简介、安装和升级、管理、操作文档

    http cwiki apachecn org pages viewpage action pageId 1540344 Cloudera 简介 Cloudera 提供一个可扩展 灵活 集成的平台 可用来方便地管理您的企业中快速增长的多种多
  • ETL工具

    这些年 几乎都与ETL打交道 接触过多种ETL工具 现将这些工具做个整理 与大家分享 一 ETL工具 国外 1 datastage 点评 最专业的ETL工具 价格不菲 使用难度一般 下载地址 ftp ftp seu edu cn Pub D
  • PRD 发布报表(2)

    发布报表 发布到bi Server 1 首先启动bi Server 这个在我其他的博文中已经有记述 可以参考 Pentaho学习笔记 bi Server配置 2 然后在PRD中如下图所示 选择发布 注意填写bi Server的账号和密码 选
  • PRD概述

    一 Pentaho 整体架构 cc 二 Client tools 1 Report Designer 报表创建工具 如果想创建复杂数据驱动的报表 这是合适工具 2 Design Studio 这是基于eclipse的工具 你可以使用它来创建
  • Kettle变量和自定义java代码的实例应用

    1 kettle properties参数配置数据源连接和FTP连接 由于测试环境和生产环境中数据库连接FTP等配置会在部署过程中变更 所以预先定义成配置项 在配置文件中修改 这样测试和发布将会变得简单 下面以数据库为例说明这类配置的使用
  • 指标体系、原子指标和衍生指标

    指标 是一个可以量化目标事物多少的数值 有时候也称为度量 如 DNU 留存率等都是指标 原子指标和衍生指标 按照个人的理解 不加任何修饰词的指标就是原子指标 也叫度量 一般存在于olap表中 例如订单量 用户量的等等 而在原子指标上进行加减
  • AI修复人像

    一 前言 最近闲来无事 翻了翻以前的老照片 看着多年前的老照片 感慨万千 仿佛又回到了以前的青春岁月 只可惜青春易逝 无法重来 意气风发 头角峥嵘的画面只能永远地留存在相片之中了 只叹当时没有多拍几张照片留作纪念 可惜当时设备也不好 照片效
  • BI大数据名词术语

    大数据的出现带来了许多新的术语 但这些术语往往比较难以理解 因此 我们通过本文给出一个常用的大数据术语表 抛砖引玉 供大家深入了解 部分定义参考了相应的博客文章 A 聚合 Aggregation 搜索 合并 显示数据的过程 算法 Algor
  • Siebel是什么意思

    简介 Siebel是电子商务软件的突出供应商 其客户关系管理 CRM 企业资源管理 ERM 以及合作关系管理 PRM 应用设计用于实现企业这些方面的自动化以及允许企业在互联网和零售或电话中心网络等其它渠道来执行和调节相关任务 Sieble的
  • 斯坦福 机器学习-第二章 生成学习算法

    CS229 Lecture notes 原作者 Andrew Ng 吴恩达 翻译 CycleUser Part IV 生成学习算法 Generative Learning algorithms 目前为止 我们讲过的学习算法的模型都是p y
  • PRD 使用Pentaho Metadata Editor(PME)生成的metadata做数据源(5)

    使用Pentaho Metadata Editor PME 生成的metadata做数据源 Pentaho Report Designer PRD 可以支持多种数据源输入方式 Pentaho Metadata Editor作为自家平台中的一
  • Datart使用说明

    Datart使用说明 Datart安装记录 Refer 安装问题 前端源码编译 java 程序包datart data provider calcite parser impl不存在 启动基础步骤 Datart安装记录 Refer 最近在学
  • Power BI RANKX函数之计算列

    转载自 知乎 在实际做报表时 有时会遇到需要对某些指标 例如销售额等 进行排名 所以今天跟大家讨论一下可以实现排名的DAX函数 RANKX函数 首先看下RANKX函数的参数 RANKX table table
  • 帆软 finereport FCRA 考试 题库+答案,共收录561题,大部分有答案

    帆软 finereport FCRA 考试 题库 答案 共收录561题 大部分有答案 入门基础 11 多选题 以下方式中属于FineReport中预览模式的有 分页预览 填报预览 新填报预览 数据分析 移动端预览 16 判断题 FineRe
  • 什么是BI分析系统

    BI分析系统是一种用于帮助企业进行数据分析和决策的工具 它通过收集 整理 分析和可视化庞大的数据集 帮助企业了解自身的业务状况 并提供有关未来预测和战略决策的有价值信息 BI分析系统以其强大的功能和灵活性 在企业管理和决策中发挥着重要的作用
  • Power BI:切片器联动的一些问题

    问题1 联动切片器选中子项后父项未能显示全部 如下所示 切片器原始状态为 Province和City来源同一张表 当选中了City中的某一项时 变为 父项也发生了变化 但我们希望无论子项选择什么 父项应该始终显示全部 解决办法 City切片
  • 数据ETL面临的问题----数据缺失

    数据缺失的类型有 完全随机缺失 Missing Completely at Random MCAR 数据的缺失与不完全变量以及完全变量都是无关的 随机缺失 Missing at Random MAR 数据的缺失不是完全随机的 数据的缺失只依
  • 智能数据分析系统:揭秘最强AI助力企业腾飞的秘密武器

    现代企业离不开数据 而数据的分析与应用更是成为企业走向成功的关键之一 然而 随着数据量的不断增长 传统的数据分析方法已经无法满足企业的需求 这时 智能数据分析系统应运而生 成为企业决策的得力助手 那么 智能数据分析系统究竟是如何帮助企业实现

随机推荐

  • linux---配置bond方法

    配置bond方法 原始配置文件1 DEVICE eth0 BOOTPROTO dhcp HWADDR 00 0C 29 04 AE 65 IPV6INIT no NM CONTROLLED no ONBOOT yes TYPE Ethern
  • 不用插拔网线鼠标点击自动切换网线和WIFI

    因为之前在zf单位工作 政务内网需要插网线 而访问外网又需要连wifi 切换就需要拔掉网线插上网线很麻烦 旁边老哥教我了一手 bat程序自动切换方法 bat文件代码如下 以下代码的 bat文件执行后会切换到以太网 同时关闭掉wifi和以太网
  • 监听对象中属性变化(一个或多个属性、全部属性)

    一 数据监听器 什么是数据监听器 数据监听器用于监听和响应任何属性和数据自动的变化 从而执行特定的操作 它的作用类似于vue中的watch侦听器 在小程序中 基本语法格式如下 Component observers 字段A 字段B func
  • 积分规划:构建全面会员积分管理系统

    在当今竞争激烈的市场环境中 企业要想保持用户的忠诚度和活跃度 建立一个全面的会员积分管理系统是至关重要的 积分制度不仅可以激励用户参与 还可以增加用户的消费频次和购买金额 本文将深入探讨如何构建全面的会员积分管理系统 以实现更好的私域营销效
  • 消息队列(MQ)

    一 为什么要用消息队列 消息队列的应用场景 应用解耦 异步任务 流量削峰 问题背景 学生向老师请教问题 如果学生A正在向老师请教问题 那么后面的学生依次排队等候 直到轮到自己请教问题 这样的模式会使整个系统的效率较低 学生排队等待时间太久
  • pygame学习笔记

    pygame学习笔记 1 基础知识 参考 1 基础知识 1 设置死循环 持续显示窗口 import pygame import sys pygame init 初始化pygame size 320 240 设置窗口大小 w h screen
  • 数字逻辑触发器(一)

    触发器 一 定义 是一种具有记忆功能的逻辑部件 具有两个稳定的输出状态 用这两个稳定的状态来表示二值信号的0和1 在外界输入信号的激励下 触发器的输出状态会发生改变 二 触发器的种类举例 基本RS触发器 主从触发器 维持阻塞触发器 D触发器
  • 【appium报错】Original error:Could not proxy command to remote server. Original error:socket hang up

    博客链接1 系统自带的应用kill掉appium相关的进程 博客链接2 卸载并重装appium相关安装包 如果上面的方法仍不能解决问题 暴力解决 卸载设备上的appium setting 等appium安装的app 卸载自动化启动的app
  • UncaughtExceptionHandler 获取线程运行时异常

    我们知道线程执行体的方法接口定义为 public void run 因此线程在执行单元中是不允许抛出checked异常的 且线程之间是相对独立的 他们运行在自己的上下文当中 派生它的线程无法直接感知到它在运行时出现的异常信息 为了解决这个问
  • P2084 进制转换

    题目背景 无 题目描述 今天小明学会了进制转换 比如 10101 2 那么它的十进制表示的式子就是 1 2 4 0 2 3 1 2 2 0 2 1 1 2 0 那么请你编程实现 将一个M进制的数N转换成十进制表示的式子 注意 当系数为0时
  • vector 删除元素的几种方法

    vector 删除元素的几种方法 1 利用成员函数pop back 可以删除最后一个元素 2 利用成员函数erase 可以删除由一个iterator指出的元素 3 通过STL中的算法库函数remove 删除指定的元素 与list容器自带的成
  • 鱼眼相机标定

    分享一个最近在复习的一个鱼眼相机标定 这个大佬的链接 因为课题相关 先视觉2D检测再通过标定形成视锥然后再点云目标检测 所以先埋一个坑 刚好2D检测这块做的差不多 不过是Python版本哈 后续肯定要用C 先上一个大佬的鱼眼内参去畸变的链接
  • MavenFor this reason, future Maven versions might no longer support building such malformed projects

    使用IDEA MAVEN clean时提示如下错误 Maven For this reason future Maven versions might no longer support building such malformed pr
  • 查字典(c++)

    思路 判断insert和find insert放入string set find就用count 过程 1 判断insert和find 2 放入set中 3 判断结果 代码 include
  • 清除浮动之双伪元素清除浮动

  • 结构体指针

    结构体指针 当一个指针变量用来指向一个结构体变量时 1 结构体指针变量的值是所指向的结构体变量的起始地址 2 通过结构体指针可以访问结构体变量 定义形式 结构体名 结构体指针变量 也可在定义结构体时 同时定义这个结构体变量 注 1 结构体指
  • 实现从一个类中的实体对象获取所有属性值注入到另一个不同类的实体对象的对应属性中

    背景 由于dao层的可视化对象 bean 跟service层以及controller层的bean对象是分开的 也就是同一业务流水线中 在controller层是跟界面或者接口的交互bean 而到了操作数据库层则用的匹配数据库表的实体bean
  • python wechatsougou_使用Python的requests库模拟登陆微信搜狗,爬取100X10篇微信文章并保存到MySQL...

    自学的python和爬虫技术 使用到Redis MySQL数据库 request请求模块 re Xpath解析模块 dumps loads序列化和反序列化 还可以配合代理池使用 爬取的是https weixin sogou com 网站只能
  • RPM打包原理、示例、详解

    RPM Redhat Package Manager 是用于Redhat CentOS Fedora等Linux 分发版 distribution 的常见的软件包管理器 因为它允许分发已编译的软件 所以用户只用一个命令就可以安装软件 看到这
  • BI数据系统的设计流程

    BI大数据产品 数据管理平台可以通过报表或者BI模块来搭建 在专栏 帆软数据应用研究院 里有关于企业数据管理和BI报表平台建设的案例 站在项目实施的角度 可以从技术和业务两个层面来考虑 前期进行需求调研 罗列了一张建设思路图 技术上需要考虑