基于docker构建spark运行环境

2023-05-16

基于docker构建spark运行环境

一、安装docker与docker-compose

参考之前的实验进行docker和docker-compose的安装。

二、系统构架图：

在这里插入图片描述

三、安装相关镜像

使用docker hub查找我们需要的镜像。

spark-master
spark-worker

四、docker compose部署文件准备

docker-compose.yml文件可以从本机编辑好再上传的虚拟机或服务器。
将docker-compose.yml文件拷贝到/usr/local/bin/内部并通过以下命令给予执行权限。
chmod 777
docker-compose.yml文件内容如下：
version: ‘3’

services:
spark-master:
image: bde2020/spark-master:3.1.1-hadoop3.2
container_name: spark-master
ports:
- “8080:8080”
- “7077:7077”
volumes:
- <共享目录绝对路径>:/data
environment:
- INIT_DAEMON_STEP=setup_spark
spark-worker-1:
image: bde2020/spark-worker:3.1.1-hadoop3.2
container_name: spark-worker-1
depends_on:
- spark-master
ports:
- “8081:8081”
volumes:
- <共享目录绝对路径>:/data
environment:
- “SPARK_MASTER=spark://spark-master:7077”
spark-worker-2:
image: bde2020/spark-worker:3.1.1-hadoop3.2
container_name: spark-worker-2
depends_on:
- spark-master
ports:
- “8082:8081”
volumes:
- <共享目录绝对路径>:/data
environment:
- “SPARK_MASTER=spark://spark-master:7077”

五、使用yml部署文件部署spark环境

在yml文件所在的目录下，执行命令：
sudo docker-compose up -d
检查docker在命令行的输出确认容器的部署顺利完成。
查看容器创建与运行状态
sudo docker ps
对输出进行格式化(可选)
sudo docker ps --format ‘{{.ID}} {{.Names}}’
使用浏览器查看master的web ui界面
进入spark-master容器
sudo docker exec -it <master容器的id，仅需输入一部分即刻> /bin/bash
查询spark环境，安装在/spark下面。
ls /spark/bin
进入spark-shell
/spark/bin/spark-shell --master spark://spark-master:7077 --total-executor-cores 4 --executor-memory 1280m
进入浏览器查看spark-shell的状态

六、完成创建RDD与filter处理的实验

创建一个RDD
val rdd=sc.parallelize(Array(1,2,3,4,5,6,7,8))
打印rdd内容
rdd.collect()
查询分区数
rdd.partitions.size
选出大于5的数值
val rddFilter=rdd.filter(_ > 5)
打印rddFilter内容
rddFilter.collect()
退出spark-shell
:quit

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Docker

spark

运行环境

基于docker构建spark运行环境的相关文章

如何在docker compose中运行mongodb副本集

我尝试在我的 Mac 中使用 mongodb community 在本地运行 mongodb 副本集MongoDB 文档 https docs mongodb com manual tutorial convert standalone t
未设置 Docker-compose 环境变量

项目树 backend env dev docker compose dev yml project 我有以下警告 docker compose f docker compose dev yml up build i am in the b
如何使用 Docker 镜像 jupyter/pyspark-notebook 在 jupyter-notebook 上禁用密码或令牌登录

我正在运行 dockerdocker run it p 8888 8888 jupyter pyspark notebook usr local bin start notebook sh running hooks in usr loca
Azure DevOps Pipeline - 构建 Docker 映像并将其推送到具有受限网络访问权限的 Azure 容器注册表

我在 Azure DevOps 中有一个管道应该构建 Docker 映像并将其推送到 Azure 容器注册表因此我有一个服务连接类型 docker 注册表以便授权管道推送如果我删除容器注册表中的网络限制一切都会正常一旦我想限
Docker镜像删除后占用空间

我提交了一个现有的 Docker 容器来创建新镜像但提交的镜像太大了原始镜像为 3 GB 并且在容器中安装了一些其他内容提交的镜像为 8 GB 我的空间不足所以我决定删除提交的映像但即使删除提交的映像后我的磁盘空间也没有增加然
无法将 sql 转储加载到容器 mariadb

我正在尝试制作一个 dockerized mariadb 数据库在这个数据库中我需要在构建时加载 sql 转储这是我的 Dockerfile FROM alpine 3 18 2 WORKDIR Database COPY Datab
将 Docker 与 AWS Elastic Beanstalk 结合使用有哪些优势？

我在AWS Elastic Beanstalk上部署了几个网站然后我听说了Docker 所以我想这次我可以尝试一下小型企业电子商务网站 Lumen Angularjs 网上查遍了由于没有使用Docker的经验还是很难深入了解在 AW
如何在minikube中创建多个集群

我需要在 minikube 中创建额外的集群我搜索了一段时间没有找到任何这方面的资源如何在 minikube 中创建集群创建第一个名为cluster 1 minikube start p cluster 1 创建第二个集群名称为cl
Docker pull：不允许操作

我在拉取一些 docker 映像但不是全部时收到此错误 failed to register layer Error processing tar file exit status 1 operation not permitted 例
如何对 Xcode 进行 docker 化

出于 CI 的目的我需要建立一个能够构建 iOS 应用程序的构建从属集群目前我依赖于一台 MacMini 目标是在将来部署更多台并且我想在其上虚拟化多个从属设备其中一些虚拟从站将构建 iOS 应用程序其他虚拟从站将是用于各种目的
预创建检查出错：“此计算机未启用 VT-X/AMD-v。必须在 BIOS 中启用它”，即使已启用

运行docker工具箱 v19 03 1 https github com docker toolbox releases tag v19 03 1 从 Windows 10 家庭版产生以下错误消息 Running pre create c
Windows 计算机上出现“来自守护程序的错误响应：无法创建填充程序：OCI 运行时创建失败”错误

我正在尝试构建一个简单的 Python 映像然后在 Windows 上以交互方式访问容器构建过程有效但运行容器失败这是 Dockerfile FROM python 3 10 4 WORKDIR app 生成文件 IMAGE scr
Docker - 如何在 postgres 容器中运行 psql 命令？

我想在 postgres 映像中使用 psql 以便对数据库运行一些查询但不幸的是当我附加到 postgres 容器时我收到错误 psql 命令未找到对我来说如何在容器中运行 postgresql 查询或命令是一个谜如何在pos
Google Cloud Kubernetes 访问私有 Docker Hub 托管映像

是否可以将私有镜像从 Docker Hub 拉取到 Google Cloud Kubernetes 集群是否建议这样做或者我是否需要将我的私有映像也推送到 Google Cloud 我阅读了文档但没有发现任何内容可以清楚地解释这一点
无法将 docker 映像推送到本地 OpenShift Origin 注册表

目标是能够在我的笔记本电脑上获取 Docker 映像并将其推送到 OpenShift Origin 映像注册表由oc cluster up 进行本地开发目前尚不清楚我是否做错了什么或者 Docker 或 OpenShift Origi
来自守护程序的错误响应：加入会话密钥环：创建会话密钥：超出磁盘配额

我尝试在我的服务器上安装 docker 使用本教程 https docs docker com install linux docker ce ubuntu 我想远程运行 docker 镜像并使用 portainer Web 界面来管理一切
无法使用 docker build 运行 gradle 包装器

我有这个小构建 FROM eclipse temurin 17 jdk as build java COPY java project root project WORKDIR root project RUN chmod x gradle
无法从我的电脑上使用 traefik 后面的 gitlab 进行 git 克隆

这是我的 gitlab 和 traefik 配置 version 3 7 services gitlab web image gitlab gitlab ce latest restart always hostname gitlab ro
我可以更改 Windows Docker 容器中的日期和时间吗？

我正在尝试测试一个在特定时间段内导出文件的软件我想到使用 docker 容器来提供所需的时间而不是使用系统时间问题是我缺乏更改容器时间的权限并出现以下错误消息 PS C usr src app gt Set Date Date Get
经常提交 docker 容器是一个好习惯吗？

我在里面使用WebSphere Liberty 由于 WebSphere Liberty 需要频繁的 xml 编辑这对于 Dockerfile 命令来说是不可能的我必须不时地对容器进行 docker commit 以便其他人可以使用我的

随机推荐

类的静态（static）成员

有时候类需要它的一些成员与类本身直接相关 xff0c 而不是与类的各个对象保持关联 xff08 这意味着无论创建多少个类的对象 xff0c 静态成员都只有一个副本 xff09 我们通过在成员的声明前加上关键字static使得其与类关联在一起
Keil uvision5 介绍

keil 5 Keil uvision5 安装过程Keil uvision5安装包1 Keil uvision5 介绍2 Keil uVision5 特点3 Keil uVision5 功能4 Keil uVision5 快捷键 Keil
px4仿真时，/mavros/state现实连接不上

仿真时 xff0c 使用px4 xff0c 启动 PX4 Firmware launch文件中的launch文件进入gazebo世界中 xff0c 通过 xff1a rostopic list 查看发布的话题 xff0c 并且打印 mav
插值方法(一维插值、三次样条插值、二维插值的matlab自带函数，python实现/作图)

数模比赛中 xff0c 常常需要根据已知的函数点进行数据模型的处理和分析 xff0c 而有时候现有的数据是极少的 xff0c 不足以支撑分析的进行 xff0c 这时就需要使用一些数学的方法 xff0c 模拟产生一些新的单又比较靠谱的值来
ROS中常用命令

1 xff09 工作空间初始化 xff1a catkin init workspace 2 xff09 创建功能包 xff1a catkin create pkg pkg name reply 3 xff09 编译工作空间中的功能包 xff
【DL】CNN的前向传播和反向传播（python手动实现）

卷积层的前向传播和反向传播说明本文中 xff0c 只实现一层卷积层的正反向传播 xff08 带激活函数Relu xff09 xff0c 实现的是多通道输入 xff0c 多通道输出的之前对深度学习的理解大多止于pytorch里面现成的A
Postman使用教程详解

目录 1 Postman安装与接口请求基本操作1 1Postman安装1 2发起一个接口请求的小测试 2 接口测试实战2 1百度IP查询接口从抓包到测试实战2 2需要设置头域的请求实战2 3文件上传与json请求实战 3 Newman命令行
GNU Radio3.8创建OOT的详细过程(基础/C++)

GNU Radio 学习使用 OOT 系列教程 xff1a GNU Radio3 8创建OOT的详细过程基础 C 43 43 GNU Radio3 8创建OOT的详细过程进阶 C 43 43 GNU Radio3 8创建OOT的详细过程
Johnson-Trotter(JT)算法生成排列

对于生成 xff5b 1 xff0c xff0c n xff5d 的所有n xff01 个排列的问题 xff0c 我们可以利用减治法 xff0c 该问题的规模减一就是要生成所有 xff08 n 1 xff09 xff01 个排列假设这个小
OSMWebWizard无法使用（Address family not supported by protocol）

根据报错信息依次打开osmWebWizard py SimpleWebSocketServer py 查看对应行号的内容 xff0c 发现Simple py中有一个socket net6 可能是网络协议的问题 xff0c 查了一下 xff0
粤嵌实训笔记二

目录 20230227 20230303 xff08 第二周 xff09 main clcd clcd hbmp cbmp hgame cgame h 20230227 20230303 xff08 第二周 xff09 1 在Linux下
Arduino学习笔记：FreeRTOS——ESP32多任务处理

Arduino学习笔记 xff1a FreeRTOS ESP32多任务处理 Demo span class token comment 创建任务一和任务二的句柄 xff0c 并初始化 span TaskHandle t TASK Handl
JAVA-信号量

信号量 xff1a 信号量一般都有以下几个变量 xff1a count xff1a 记录可以使用的资源数wait list xff1a 等待信号量的队列获取信号量需要判断count是否大于零 xff0c 即if count gt 0 若c
（程序猿专属）1024-我用代码写成浪漫情话表白你

今天1024 xff0c 程序员节 xff01 不祝你们节日快乐了 xff0c 祝你们穿着拖鞋和裤衩去相亲吧 xff01 祝你们和甜蜜的爱情撞个满怀 xff01 一我是你的什么啊 xff1f 你是我的bug啊因为 xff0c 我每时每刻
C++中构造函数后的冒号

C 43 43 中构造函数后的冒号在C 43 43 中离不开类的定义 xff0c 而构造函数则是类的定义中很重要的一环我们在构造函数中常常见到如下定义 xff1a span class token keyword class span
论C语言没有输出的可能问题

论C语言没有输出的可能问题 1 今天帮别人找bug xff0c 说是程序没有输出题目如下 xff1a 错误代码如下 xff1a span class token macro property span class token direct
【VS2019】报错：E0349没有与这些操作数匹配的运算符

报错 xff1a E0349没有与这些操作数匹配的运算符调试程序遇到该错误 xff0c 特此记录 span class token macro property span class token directive keyword inc
基于docker技术搭建hadoop与mapreduce分布式环境

基于docker技术搭建hadoop与mapreduce分布式环境一安装doker 1 宿主环境确认如果没有的话安装lsb relaease工具 apt install lsb release 检查版本 lsb release a
GNU Radio3.8创建OOT的详细过程(进阶/C++)

GNU Radio 学习使用 OOT 系列教程 xff1a GNU Radio3 8创建OOT的详细过程基础 C 43 43 GNU Radio3 8创建OOT的详细过程进阶 C 43 43 GNU Radio3 8创建OOT的详细过程
基于docker构建spark运行环境

基于docker构建spark运行环境一安装docker与docker compose 参考之前的实验进行docker和docker compose的安装二系统构架图 xff1a 三安装相关镜像使用docker hub查找我们需

热门标签