在linux中DATAX和DATAX-WEB安装指引

2023-10-30

DATAX介绍:​ DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。

DATAX-WEB介绍:DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的 操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据同步任务,支持RDBMS、Hive、HBase、ClickHouse、MongoDB等数据源,RDBMS数据源可批量创建数据同步任务,支持实时查看数据同步进度及日志并提供终止同步功能,集成并二次开发xxl-job可根据时间、自增主键增量同步数据。

安装清单

软件名称 软件版本
DATAX 3.0
DATAX-WEB datax-web-2.1.2
MYSQL 8
JDK 8

约束:

1、先安装DATAX再安装DATAX-WEB

2、DATAX和DATAX-WEB都依赖于JDK8+,所以需要先安装JDK8,且需要设置好JAVA_HOME、CLASS_PATH、PATH环境变量,因为启动DATA-WEB是需要用到jdk的jps指令

3、安装DATAX-WEB依赖mysql,安装mysql参考:docker安装mysql8实战_风云琪文的博客-CSDN博客

安装DATAX步骤:

1、下载DATAX3.0 某个目录,进入bin目录,即可运行同步作业:

2、下载后解压至本地某个目录

$ cd 你存放datax.tar.gz的路径
$ tar -zxvf datax.tar.gz

3、确保安装DATAX的服务器安装了JDK8

安装DATAX-WEB步骤:

参考官方指引:datax-web/datax-web-deploy.md at master · WeiYe-Jing/datax-web · GitHub
1、确保安装DATAX-WEB的服务器安装了JDK8,且需要设置好JAVA_HOME、CLASS_PATH、PATH环境变量,因为启动DATA-WEB是需要用到jdk的jps指令
2、安装mysql数据库,创建名称为data_web_db的数据库和datax_web用户
3、到官方提供的百度云地址下载百度网盘 请输入提取码,提取码为:cpsk

4、在选定的安装目录,解压安装包

tar -zxvf datax-web-{VERSION}.tar.gz

5、则执行以下命令安装

./bin/install.sh --force

6、找到/bin/db/datax-web.sql文件,复制文件的脚本内容,在mysql的data_web_db库中执行,主要是建一下基础表和初始化用户

7、在./modules/datax-admin/conf/bootstrap.properties设置data-web连接数据库的信息,连接mysql参考:

#Database
DB_HOST=192.168.xx.xx
DB_PORT=3306
DB_USERNAME=datax-web
DB_PASSWORD=xxx
DB_DATABASE=datax_web_db

8、在项目目录下/modules/datax-execute/bin/env.properties 指定PYTHON_PATH的路径

vi ./modules/{module_name}/bin/env.properties
### 执行datax的python脚本地址
PYTHON_PATH=/mysoft/datax/bin/datax.py

9、启动服务

- 一键启动所有服务

./bin/start-all.sh

- 一键取消所有服务

./bin/stop-all.sh

10、启动完成后就可以通过页面进行访问了,默认端口号是9527,形式如:http://192.168.xx.yy:9527/index.html,进入页面后进行登录默认用户:admin,默认密码:1231456

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在linux中DATAX和DATAX-WEB安装指引 的相关文章

  • 应用程序中两个不同版本的库

    考虑一个场景 其中有两个不同版本的共享库 考虑 A 1 so 链接到 B so A 2 so 链接到 C so 现在 B so 和 C so 都链接到 d exe 当 B so 想要调用 A 1 so 中的函数时 它最终会调用 A 2 so
  • 使用 shell 脚本发送 HTML 邮件

    如何使用 shell 脚本发送 HTML 电子邮件 首先 您需要撰写消息 最低限度由这两个标头组成 MIME Version 1 0 Content Type text html 以及适当的消息正文 p Hello world p 获得后
  • 在本地主机上使用相同的 IP 和端口创建套接字

    我在 Linux 上看到奇怪的行为 我看到远程端和本地端都显示相同的 IP 和端口组合 以下是 netstat 输出 netstat anp 网络统计grep 6102 tcp 0 0 139 185 44 123 61020 0 0 0
  • 如何在C(Linux utf8终端)中打印“盒子抽屉”Unicode字符?

    我正在尝试显示 方框图范围 2500 257F 中的 Unicode 字符 它应该是标准 utf8 Unicode 标准 版本 6 2 我根本做不到 我首先尝试使用旧的 ASCII 字符 但 Linux 终端以 utf8 显示 并且没有显示
  • 使用脚本检查 git 分支是否领先于另一个分支

    I have branch1 and branch2我想要某种 git branch1 isahead branch2 这将显示如果branch1已承诺branch2没有 也可能指定这些提交 我无法检查差异原因branch2 is在之前br
  • 在ubuntu中打开spyder

    我想在ubuntu中打开spyder Python IDE 通常我会在 shell 中编写 spyder 它会打开spyder IDE 现在 当我在shell中编写spyder时 它只是换行 什么也没有发生 类似于按 enter 我如何找回
  • Bash:将字符串添加到文件末尾而不换行

    如何将字符串添加到文件末尾而不换行 例如 如果我使用 gt gt 它将添加到文件末尾并换行 cat list txt yourText1 root host 37 echo yourText2 gt gt list txt root hos
  • 链接错误:命令行中缺少 DSO

    我对 Linux 使用 Ubuntu 14 04 LTS 64 位 相当陌生 来自 Windows 并且正在尝试移植我现有的 CUDA 项目 当通过链接时 usr local cuda bin nvcc arch compute 30 co
  • 如何在 Linux 和 C 中使用文件作为互斥体?

    我有不同的进程同时访问 Linux 中的命名管道 并且我想让此访问互斥 我知道可以使用放置在共享内存区域中的互斥体来实现这一点 但作为一种家庭作业 我有一些限制 于是 我想到的是对文件使用锁定原语来实现互斥 我做了一些尝试 但无法使其发挥作
  • “git add”返回“致命:外部存储库”错误

    我刚刚进入 git 的奇妙世界 我必须提交我对程序所做的一系列更改 位于名为的目录中 var www myapp 我创建了一个新目录 home mylogin gitclone 从这个目录中 我做了一个git clone针对公共回购 我能够
  • 如何并行执行4个shell脚本,我不能使用GNU并行?

    我有4个shell脚本dog sh bird sh cow sh和fox sh 每个文件使用 xargs 并行执行 4 个 wget 来派生一个单独的进程 现在我希望这些脚本本身能够并行执行 由于某些我不知道的可移植性原因 我无法使用 GN
  • 嵌入清单文件以要求具有 mingw32 的管理员执行级别

    我正在 ubuntu 下使用 i586 mingw32msvc 交叉编译应用程序 我很难理解如何嵌入清单文件以要求 mingw32 具有管理员执行级别 对于我的例子 我使用了这个hello c int main return 0 这个资源文
  • Linux无法删除文件

    当我找到文件时 我在删除它们时遇到问题 任务 必须找到带有空格的文件并将其删除 我的尝试 rm find L root grep i 但我有错误 rm cannot remove root test No such file or dire
  • 来自守护程序的错误响应:加入会话密钥环:创建会话密钥:超出磁盘配额

    我尝试在我的服务器上安装 docker 使用本教程 https docs docker com install linux docker ce ubuntu 我想远程运行 docker 镜像并使用 portainer Web 界面来管理一切
  • Linux 使用 boost asio 拒绝套接字绑定权限

    我在绑定套接字时遇到问题 并且以用户身份运行程序时权限被拒绝 这行代码会产生错误 acceptor new boost asio ip tcp acceptor io boost asio ip tcp endpoint boost asi
  • 在压缩存档内的文本文件上运行“head”,而不解压存档

    问候 我接手了之前的团队并编写了处理 csv 文件的 ETL 作业 我在 ubuntu 上结合使用 shell 脚本和 perl csv 文件很大 它们以压缩档案形式到达 解压后 很多都超过 30Gb 是的 那是 G 旧进程是在 cron
  • awk 在循环中使用时不打印任何内容[重复]

    这个问题在这里已经有答案了 我有一堆使用 file 1 a 1 txt 格式的文件 如下所示 A 1 B 2 C 3 D 4 并使用以下命令添加包含每个文件名称的新列 awk print FILENAME NF t 0 file 1 a 1
  • vmsplice() 和 TCP

    在原来的vmsplice 执行 有人建议 http lwn net Articles 181169 如果您的用户态缓冲区是管道中可容纳的最大页面数的 2 倍 则缓冲区后半部分成功的 vmsplice 将保证内核使用缓冲区的前半部分完成 但事
  • C#的数组列表可以用来填充SSIS对象变量吗?

    我已在 C 脚本中填充了一个列表 并将其值分配给 SSIS 对象变量 然后 我使用该对象变量通过循环遍历 For every do 枚举器来执行一些 SQL 查询 我尝试通过 Foreach ado 枚举器执行此操作 但出现错误 X 变量不
  • Google BQ:运行参数化查询,其中参数变量是 BQ 表目标

    我正在尝试从 Linux 命令行为 BQ 表目标运行 SQL 此 SQL 脚本将用于多个日期 客户端和 BQ 表目标 因此这需要在我的 BQ API 命令行调用中使用参数 标志 parameter 现在 我已经点击此链接来了解参数化查询 h

随机推荐

  • 火牛(STM32) 多路ADC采样数据经过RS485传输到另一块ARM板路虎(LPC1768)

    调试了好几天终于搞定ADC多路的数据采集 然后通过RS485传输到另一块ARM板上 上程序 火牛开发板基础实验 串口实验 在串口1中输出实验标题 并打印串口1输入的字符 串口中断接收 include stm32f10x h include
  • 嵌入式Linux webserver: Boa+CGI程序设计技术

    摘要 在详细介绍一种嵌入式Web服务器BOA的实现与配置方法的基础上 以一个Web在线远程监控GPIO 通用输入 输出 的程序为实例 介绍嵌入式Linux系统下CPU程序设计技术 关键词 嵌入式系统Linux BOA CGI GPIO 1
  • java中strictfp关键字,java strictfp关键字用法大全详解

    一 strictfp关键字简介 strictfp是Java中提供的一个保留关键字 该关键字是从这第java JDK2版本儿开始出现的一直沿用到现在 只不过很多情况下都不怎么使用 所以容易被大家遗忘 因此今天我们来介绍一下这个关键字的用法和使
  • 【深度学习环境-2】nvidia驱动、cuda安装配置

    一 ubuntu系统安装nvidia驱动 方法一 禁用nouveau驱动 1 打开文件 sudo vim etc modprobe d blacklist conf 2 在末尾添加 blacklist nouveau 3 更新设置 sudo
  • abap append 用法

    转自http blog chinaunix net uid 7982817 id 91999 html Append用法总结 2008 11 14 11 42 19 分类 Syntax APPEND wa INITIAL LINE LINE
  • molloc/free和new/delete的区别

    malloc free和new delete的区别 malloc free和new delete的共同点是 都是从堆上申请空间 并且需要用户手动释放 不同的地方是 malloc和free是函数 new和delete是操作符 malloc申请
  • CSP-S第二轮认证总结——提高组算法总结

    目录 0 前言 一 动态规划 必考必考必考 1 背包 1 01背包 2 完全背包 2 线性DP 3 多维DP 二 贪心 三 模拟 四 图论 很灵活 1 最短路 1 spfa 2 Dijkstra 堆优化 时间复杂度远快于spfa 2 最小生
  • 聚类算法dbscan

    k means k medians 初始化k个类的中心 计算样本点到k个类中心的距离 以此为根据 将这些样本点归类为k类中距离最近的那个类 重新计算k类的中心 直到k类的中心收敛 缺点 需提前知道类数量 优点 速度快 均值漂移 它的原理就是
  • openwrt 中调用json

    对于这种写法 json require json print json encode 1 2 fred first mars second venus third earth 还是这种写法 local json require json p
  • git 提交到某分支,如何将某些提交移动到git中的另一个分支?

    The situation master is at X quickfix1 is at X 2 commits Then I started working on quickfix2 but by accident took quickf
  • python调用搜狗OCR接口实现图片文字识别

    import requests multiple files pic 1111111 jpg open r QQ截图20180905172943 jpg rb image jpg resp requests post r http ocr
  • 自适应控制---自校正PID控制器

    PID算法 其中e 期望输出 实际输出 自校正PID控制器参数的确定 注 F q 1 中有 1 f1q 部分是为了提高分母的次数 便于实现 PID自校正控制算法 对于PI或者P控制 只要将对应的系数去掉即可
  • Android:开启一个服务循环ping服务器,记录ping 5次均失败触发某条件

    import android app Service import android content Intent import android os Handler import android os IBinder import andr
  • SpringMVC(07) -- RESTful

    SpringMVC学习笔记 源码地址 7 1 RESTful简介 REST Representational State Transfer 表现层资源状态转移 7 1 1 资源 资源是一种看待服务器的方式 即 将服务器看作是由很多离散的资源
  • 3、数组——二维数组中的查找(python版)

    剑指Offer 题目描述 在一个二维数组中 每个一维数组的长度相同 每一行都按照从左到右递增的顺序排序 每一列都按照从上到下递增的顺序排序 请完成一个函数 输入这样的一个二维数组和一个整数 判断数组中是否含有该整数 重要信息 二维数组 每行
  • Java合并两个有序的整数数组

    题目描述 给出两个有序的整数数组 A和B 请将数组B 合并到数组 A中 变成一个有序的数组 注意 可以假设A 数组有足够的空间存放 B数组的元素 A和 B中初始的元素数目分别为 m和Nn public class Solution publ
  • 泛微oa主表赋值明细表_Java学习第89天--OA系统

    学习主题 OA系统 学习目标 1 掌握web开发项目实战 熟练使用web开发基础技术 对应作业 1 报销管理 添加报销单 业务层 1 在报销主表和明细表中都有一个字段叫expid 这个字段在数据库中是利用序列获取的 但是在业务层中 我们要控
  • 将postgresql数据库内容导出至sqlite数据库

    上周为应对去外地投标演示网站demo时可能没网的问题 经理让我把远程服务器的postgresql数据库上的数据导出至access或sqlite数据库中 几经波折 终于完成 现将过程记录如下 demo所用S2SH框架 经查询了解hiberna
  • (python 毕业设计)基于“协同过滤”算法的订餐推荐小程序

    B站小程序演示视频 https www bilibili com video BV1Lg411D7mP spm id from 333 337 search card all click 总体架构 核心功能 美食推荐 根据学号查询该学生的消
  • 在linux中DATAX和DATAX-WEB安装指引

    DATAX介绍 DataX 是一个异构数据源离线同步工具 致力于实现包括关系型数据库 MySQL Oracle等 HDFS Hive ODPS HBase FTP等各种异构数据源之间稳定高效的数据同步功能 DATAX WEB介绍 DataX