数据中台产品【数据服务中心】【含代码说明等】

2023-11-12




链接: https://pan.baidu.com/s/1_WNnt690-WWf8BX8uvNaKw 提取码: uscr

DataCenter

Todo:
 

  •     CDH, hbase,zk 部署和配置。代码发布。
  •     presto , redis集群,cachecloud 部署。
  •     Hive 开发的流程。 azkaban安装部署。
  •     Doubble 服务安装部署。
  •     MySQL的在模块里的配置。


Plan:
 

  •     3月底代码整体提交,做一次部署测试发现问题。 3月底验证可部署性。
  •     4月份提供可以使用的一个版本。 4月底验证可使用性。
  •     5,6月份主要是做一些二次开发,使得像一个真正的产品。 6月底验证产品完整性。


项目说明

项目整体架构
数据服务中心管理了所有业务服务的数据访问,业务层对外提供的是dubbo接口或Rest风格接口,路由网关负责对外接口的管理,是的web应用或其他三方应用的访问具有可控性

avatar
big-cbr(报表系统)

数据报表系统,报表元数据存储在数据库,可以通过前端进行动态配置报表的样式和数据查询功能
big-dbms(数据库管理系统)

可以理解它为’一个超级大的数据访问层’,在整个项目中承担了所有数据访问的工作,
big-dbms-server(数据查询服务系统)

提供数据的查询功能,可集成数据源有:mysql,hive,presto
big-gateway(服务网关)

所有对外服务接口api(dubbo,http)管理中心,可配置api的超时,权限,重试次数
big-msg(消息推送 提醒)

公司内部模块(考虑删除)
big-whtc(数仓配置服务)

提供数仓的基本任务配置功能,提供datax的配置
bigdata-interface(模块的对外服务接口)

所有模块间的调用接口信息
bigdata-parent(父工程)

包含了所有基础框架 详情

部署顺序
一、部署安装前置依赖服务
1、安装部署zookeeper

网上资料较多,不在赘述

2、安装部署nacos

1). 下载地址:https://github.com/alibaba/nacos/releases  
2). 解压 nacos-server-1.0.0-RC1.tar.gz
    目录结构:   
    |---nacos  
    |------|---bin  
    |------|---conf  
    |------|---data  
    |------|---plugins  
    |------|---target  
3). 创建数据库:nacos-config,在将nacos/conf/nacos-mysql.sql sql中的表数据刷入nacos-config中
4). 修改nacos/conf/application.properties
    在文件末尾添加以下类容
   
    db.num=1
    db.url.0=jdbc:mysql://188.188.22.165:3306/nacos_config?characterEncoding=utf8&connectTimeout=1000&socketTimeout=3000&autoReconnect=true
    db.user=root
    db.password=123

注意:将数据库连接改一下
5). 启动nacos
进入nacos/bin目录,执行startup.sh 或startup.cmd
6). 打开web页面
    地址: 127.0.0.1:8848/nacos   
    用户名:nacos  密码: nacos

3、安装部署sentinel
 

  •     主要是安装一个控制台,实时接受服务传来的运行参数,以及实时更改或配置一些限流策略


1)、下载
https://github.com/alibaba/Sentinel/releases  
选择sentinel-dashboard-1.5.0.jar 下载
2)、安装部署
执行以下命令即可  
java -jar sentinel-dashboard-1.5.0.jar
3)、访问web页面
默认端口是8080: 127.0.0.1:8080

4、安装部署cachecloud

此处有两种部署方式:
方式一、可以根据官方文档进行部署admin控制台
部署文档

方式二、以下是源码部署

1)、刷入sql
在script文件夹中有cachecloud.sql 文件,新建数据库(cache_cloud),将sql中的数据刷入该库中

2)、 修改配置
进入cachecloud/cachecloud-open-web/src/main/swap文件夹可以看到两个文件
local.properties(开发环境的配置文件)
online.properties(生产环境的配置文件)
*注:主要修改其中的数据库连接信息

2)、编译源码
进入cachecloud
mvn clean install
进入cachecloud/cachecloud-open-web 执行:
mvn clean package -Plocal # 开发环境
mvn clean package -Ponline # 生产环境

3)、部署
进入cachecloud/cachecloud-open-web/target下;找到cachecloud-open-web-1.0-SNAPSHOT.war
进入cachecloud/script下找到start.sh
mkdir -p /opt/cachecloud-web/logs
将cachecloud-open-web-1.0-SNAPSHOT.war和start.sh 一起复制到指定的发布目录/opt/cachecloud-web下
*注:目录权限要保证(推荐使用一个新用户,而不是root)

4)、启动
chmod +x start.sh
./start.sh  #直接启动

5)、验证
127.0.0.1:9999 (开发环境)
127.0.0.1:8585 (生产环境)
用户名:admin
默认密码:admin

二、部署bigdata-parent

因为此项目是其他项目的依赖,所以需要最先部署

cd path/to/bigdata-parent
mvn clean install

部署数据服务中心项目:https://github.com/sevenfang/DataCenter

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

数据中台产品【数据服务中心】【含代码说明等】 的相关文章

  • 分布式事务学习总结

    1 基础概念 1 1 什么是事务 事务可以看做是一次大的活动 它由不同的小活动组成 这些活动要么全部成功 要么全部失败 1 2 本地事务 在计算机系统中 更多的是通过关系型数据库来控制事务 这是利用数据库本身的事务特性来实现的 因此叫数据库
  • 数据仓库建设及数据治理总结

    在谈数仓之前 先来看下面几个问题 数仓为什么要分层 用空间换时间 通过大量的预处理来提升应用系统的用户体验 效率 因此数据仓库会存在大量冗余的数据 不分层的话 如果源业务系统的业务规则发生变化将会影响整个数据清洗过程 工作量巨大 通过数据分
  • 数据中台-让数据用起来-8

    文章目录 第八章 数据资产管理 8 1 数据资产的定义和3个特征 8 2 数字资产管理现状和调整 8 3 数据资产管理的4个目标 8 4 数据资产管理在数据中台架构中的位置 8 5 数据治理 8 5 1 数据治理的6个目标 8 5 2 数据
  • 数仓建设-架构&建模

    目录 一 架构篇 1 1 企业架构 1 2 数据平台架构 二 建模篇 2 1 FS LDM 2 2 数据模型概念 2 2 1 概念 2 2 2 数据模型三要素 2 2 3 数据模型分类 以旅客身份识别为例 2 3 维度建模工作过程 2 3
  • 数据中台元年,企业数字化转型面临的三大挑战

    随着企业信息化程度越来越高 企业掌握的数据量从原来的TB级发展到PB级 再到EB级甚至往ZB级别发展 数据形式也在从原来的结构化数据为主转变为以日志 视频 图片 语音等非结构化数据为主 然而 数据存储和计算 数据组织的运行都是有成本的 当数
  • 第三章、中台实践-业务中台建设

    第三章 业务中台建设 3 1 什么事业务中台 从业务运行机制和系统开发机制两个维度 展开产生建设业务中台的主要内容 3 1 1 业务中台定义 业务中台是以业务领域划分边界 形成高内聚 低耦合的面向业务领域的能力中心 打造持续演进的企业级业务
  • KVM-1、Linux 操作系统及虚拟化

    1 前言 一台计算机是由一堆硬件设备组合而成 在硬件之上是操作系统 操作系统与计算机硬件密不可分 操作系统用来管理所有的硬件资源提供服务 各个硬件设备是通过 总线 进行连接起来的 在操作系统之上 需要一个人机交互接口 我们才能使用计算机对其
  • Hadoop生态圈集群部署(完整版)

    软件 版本 Mysql 5 7 Java 1 8 0 241 Hadoop 3 3 0 Zookeeper 3 4 6 Hive 3 1 2 Flink 1 14 5 Hudi 0 11 1 Doris 1 1 0 Dinky 0 6 6
  • 数据中台盛行,DataOps兴起,数据架构才是未来

    导读 在数字化转型的浪潮下 数据架构获得了越来越多的关注 作为企业架构中的关键纽带 数据架构解决了业务与数据间的映射 规范了应用架构中的数据集成关系 指导了技术架构的技术选型 在企业中发挥着不可或缺的作用 伴随DataOps等场景的出现 数
  • 数据中台-让数据用起来-5

    文章目录 第五章 数据汇聚联通 打破企业数据孤岛 5 1 数据采集 汇聚的方法和工具 1 线上行为采集 2 线下行为采集 3 互联网数据采集 4 内部数据汇聚 5 2 数据交换产品 1 数据源管理 2 离线数据交换 3 实时数据交换 5 3
  • 大数据数据仓库建设流程概述

    数据仓库的逻辑分层架构 想看懂数据仓库的逻辑分层架构 必须先弄懂以下4大概念 数据源 数据来源 互联网公司的数据来源随着公司的规模扩张而呈递增趋势 同时自不同的业务源 比如埋点采集 客户上报 API等 ODS层 数据仓库源头系统的数据表通常
  • 收入最高的十大IT职位

    过去的一年对科技行业来说非常艰难 一些公司宣布裁员 面临着迫在眉睫的经济衰退威胁 尽管经历了坎坷的一年 但市场对科技人才的需求仍然强劲 截至1月 美国的科技人才失业率下降到1 5 对于拥有适当技能和专业知识的技术人员来说 市场对人才的需求仍
  • 【数据治理】数据中台:OneData之One ID中用户体系ID-Mapping

    在OneData 体系中 OneID 指统一数据萃取 是一套解决数据孤岛问题的思想和方法 数据孤岛是企业发展到一定阶段后普遍遇到的问题 各个部门 业务 产品 各自定义和存储其数据 使得这些数据间难以关联 变成孤岛一般的存在 OneID的做法
  • 数据整理——大数据治理的关键技术

    摘要 数据是政府 企业和机构的重要资源 数据治理关注数据资源有效利用的众多方面 如数据资产确权 数据管理 数据开放共享 数据隐私保护等 从数据管理的角度 探讨了数据治理中的一项关键技术 数据整理 介绍了以数据拥有者和直接使用者 行业用户 为
  • 数据仓库灵魂30问之如何建设数据中台?一幅图说清中台。

    什么是中台 什么是数据中台 数据仓库实现了企业数据模型的构建 大数据平台解决了海量 实时数据的计算和存储问题 数据中台要解决什么呢 数据如何安全的 快速的 最小权限的 且能够溯源的被探测和快速应用的问题 数据中台不应该被过度的承载平台的计算
  • 数据中台-让数据用起来-6

    文章目录 第六章 数据开发 数据价值提炼工厂 6 1 数据计算能力的4种类型 6 1 1 批计算 6 1 2 流计算 6 1 3 在线查询 6 1 4 即席分析 6 2 离线开发 1 作业调度 2 基线控制 3 异构存储 4 代码校验 5
  • 【华为数据之道学习笔记】5-5结构化数据入湖

    结构化数据是指由二维表结构来逻辑表达和实现的数据 严格遵循数据格式与长度规范 主要通过关系型数据库进行存储和管理 触发结构化数据入湖的场景有两种 第一 企业数据管理组织基于业务需求主动规划和统筹 第二 响应数据消费方的需求 结构化数据入湖过
  • 【华为数据之道学习笔记】5-6非结构化数据入湖

    1 非结构化数据管理的范围 非结构化数据包括无格式的文本 各类格式的文档 图像 音频 视频等多样异构的格式文件 相较于结构化数据 非结构化数据更难以标准化和理解 因而非结构化数据的管理不仅包括文件本身 而且包括对文件的描述属性 也就是非结构
  • 数字化转型数据中台解决方案:PPT全文50页,附下载

    关键词 数字化转型 数据中台解决方案 数字化转型对企业的意义 数字化转型的核心 数据中台技术架构 数据中台的作用和意义 一 数字化转型背景 1 互联网普及和信息技术突破 随着互联网的普及和信息技术的突破 企业迫切需要适应数字化时代的变革 数
  • 【华为数据之道学习笔记】5-10标签设计

    标签是根据业务场景的需求 通过对目标对象 含静态 动态特 性 运用抽象 归纳 推理等算法得到的高度精练的特征标识 用于差异化管理与决策 标签由标签和标签值组成 打在目标对象上 标签由互联网领域逐步推广到其他领域 打标签的对象也由用 户 产品

随机推荐