如何使用 scala 2.12 重建 apache Livy

2024-04-11

我正在使用 Spark 3.1.1，它使用 Scala 2.12，以及从下载的预构建 Livyhere https://livy.incubator.apache.org/download/使用 Scala 2.11（可以找到名为repl_2.11-jars/解压后）。

提到了comment https://stackoverflow.com/questions/60276527/livy-start-new-session由 Aliaksandr Sasnouskikh 制作，Livy 需要重建，否则会抛出错误{'msg': 'requirement failed: Cannot find Livy REPL jars.'}即使在后会话中。

In the 自述文件.md https://github.com/apache/incubator-livy，其中提到：

默认情况下，Livy 是针对 Apache Spark 2.4.5 构建的

如果我想重建 Livy，我该如何更改构建它的 Spark 版本？

提前致谢。

您可以在 Maven 中通过 Spark-3.0 配置文件重建 Livy，为 Spark 3 创建自定义构建，例如：

git clone https://github.com/apache/incubator-livy.git && \
cd incubator-livy && \
mvn clean package -B -V -e \
        -Pspark-3.0 \
        -Pthriftserver \
        -DskipTests \
        -DskipITs \
        -Dmaven.javadoc.skip=true

该配置文件在 pom.xml 中定义，默认安装 Spark 3.0.0。您可以更改它以使用不同的 Spark 版本。

<profile>
      <id>spark-3.0</id>
      <activation>
        <property>
          <name>spark-3.0</name>
        </property>
      </activation>
      <properties>
        <spark.scala-2.12.version>3.0.0</spark.scala-2.12.version>
        <spark.scala-2.11.version>2.4.5</spark.scala-2.11.version>
        <spark.version>${spark.scala-2.11.version}</spark.version>
        <netty.spark-2.12.version>4.1.47.Final</netty.spark-2.12.version>
        <netty.spark-2.11.version>4.1.47.Final</netty.spark-2.11.version>
        <netty.version>${netty.spark-2.11.version}</netty.version>
        <java.version>1.8</java.version>
        <py4j.version>0.10.9</py4j.version>
        <json4s.spark-2.11.version>3.5.3</json4s.spark-2.11.version>
        <json4s.spark-2.12.version>3.6.6</json4s.spark-2.12.version>
        <json4s.version>${json4s.spark-2.11.version}</json4s.version>
        <spark.bin.download.url>
          https://archive.apache.org/dist/spark/spark-3.0.0/spark-3.0.0-bin-hadoop2.7.tgz
        </spark.bin.download.url>
        <spark.bin.name>spark-3.0.0-bin-hadoop2.7</spark.bin.name>
      </properties>
    </profile>

据我所知，Livy支持spark 3.0.x。但值得使用 3.1.1 进行测试，并让我们知道:)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

livy

如何使用 scala 2.12 重建 apache Livy 的相关文章

如何在 pySpark 数据框中添加行 ID [重复]

这个问题在这里已经有答案了我有一个 csv 文件我在 pyspark 中将其转换为 DataFrame df 经过一番改造后我想在 df 中添加一列这应该是简单的行 ID 从 0 或 1 开始到 N 我将 df 转换为 rdd 并使
Spark JSON 文本字段到 RDD

我有一个 cassandra 表其中有一个名为 snapshot 的文本类型字段其中包含 JSON 对象 identifier timestamp snapshot 我了解到为了能够使用 Spark 对该字段进行转换我需要将该 RD
一起调用distinct和map会在spark库中抛出NPE

我不确定这是否是一个错误所以如果你这样做 d spark RDD String d distinct map x gt d filter equals x 您将获得 Java NPE 但是如果你做了一个collect之后立马distinc
使用 databricks 列出 Azure Blob 中的所有文件

我正在使用 pyspark python 脚本来列出 Azure blob 存储中的所有文件包括子目录我在 scala 中找到了一个用于此目的的脚本需要帮助将此脚本转换为 pyspark https learn microsoft c
根据条件组合 Spark 数据帧列中的多行

我正在尝试根据条件组合 Spark 数据框中的多行这是我的数据框 df username qid row no text a 1 1 this a 1 2 is d 2 1 the a 1 3 text d 2 2 ball 我希望它看起
如何在spark中将矩阵转换为RDD[Vector]

如何转换自org apache spark mllib linalg Matrix to RDD org apache spark mllib linalg Vector 在火花该矩阵是由 SVD 生成的我正在使用 SVD 的结果进行聚
为 Spark Thrift 服务器提供仓库目录的路径

我已经设置了 Spark 集群并且成功通过 Spark SQL 连接器连接 Tableau 我从 Spark shell 创建了表并使用 saveAsTable 如何访问从 Tableau 保存的表启动spark thrift服务器时
将 Scala Dataframe 写入 CSV 文件时应用 UTF8 编码

在 Spark2 Scala 中将数据帧写入 CSV 文件时如何正确应用 UTF8 编码我正在使用这个 df repartition 1 write mode SaveMode Overwrite format csv option he
Spark SQL 广播提示中间表

我在使用广播提示时遇到问题可能是缺乏 SQL 知识我有一个查询例如 SELECT broadcast a FROM a INNER JOIN b ON INNER JOIN c on 我想要做 SELECT broadcast a F
Spark-获取RDD中的文件名

我正在尝试处理每天都在增长的 4 个文本文件目录我需要做的是如果有人试图搜索发票号码我应该给他们包含该发票号码的文件列表我能够通过将文本文件加载为 RDD 来映射和减少文本文件中的值但是如何获取文件名和其他文件属性呢从 Spar
Spark/Yarn：HDFS 上不存在文件

我在 AWS 上设置了 Hadoop Yarn 集群有 1 个主服务器和 3 个从服务器我已经验证我有 3 个活动节点在端口 50070 和 8088 上运行我在客户端部署模式下测试了 Spark 作业一切正常当我尝试使用 Spa
Spark SQL如何读取压缩的csv文件？

我尝试过使用apispark read csv读取带有扩展名的压缩 csv 文件bz or gzip 有效但在源代码中我没有找到任何可以声明的选项参数codec type 即使在这个link https github com databr
有没有办法捕获 Spark 中使用通配符读取的多个 parquet 文件的输入文件名？

我使用 Spark 将多个 parquet 文件读取到单个 RDD 中并使用标准通配符路径约定换句话说我正在做这样的事情 val myRdd spark read parquet s3 my bucket my folder parq
对多列应用窗口函数

我想执行窗口函数具体为移动平均值但针对数据帧的所有列我可以这样做 from pyspark sql import SparkSession functions as func df df select func avg df col
任务和分区之间有什么关系？

我能说么 Spark任务的数量等于Spark分区的数量吗执行器运行一次执行器内部的批处理等于一个任务吗每个任务只产生一个分区 1 的重复并行度或可以同时运行的任务数量由以下公式设置 Executor实例的数量配置每个执行器的
使用 Spark DataFrame 获取组后所有组的 TopN

我有一个 Spark SQL DataFrame user1 item1 rating1 user1 item2 rating2 user1 item3 rating3 user2 item1 rating4 如何按用户分组然后返回TopN
为什么 Spark 比 Hadoop MapReduce 更快

有人可以使用字数统计示例解释一下为什么 Spark 比 MapReduce 更快吗 bafna的答案提供了故事的记忆方面但我想补充另外两个重要事实 DAG和生态系统 Spark 使用惰性求值来形成连续计算阶段的有向无环图 DAG 通过
使用spark phoenix从表中读取rdd分区号为1

当我运行我的火花代码时 val sqlContext spark sqlContext val noact table primaryDataProcessor getTableData sqlContext zookeeper table
Spark：Shuffle Write、Shuffle 溢出（内存）、Shuffle 溢出（磁盘）之间的区别？

我有以下 Spark 工作试图将所有内容保留在内存中 val myOutRDD myInRDD flatMap fp gt val tuple2List ListBuffer String myClass ListBuffer tuple
懒惰背景下的变革与行动

正如 Learning Spark 闪电般快速的大数据分析一书中提到的由于 Spark 计算 RDD 的方式不同转换和操作也有所不同在对惰性进行一些解释之后我发现转换和操作都是惰性地进行的那么问题来了这句话的意思是什么对比

随机推荐

Heroku 内置（Touch ID）不起作用，并且没有一次性密码生成器设置

我的 mac 坏了因此我无法再在 heroku 上使用 touchID 来验证自己因此唯一的其他选择是使用一次性密码生成器我什至没有设置它您需要登录并验证才能设置我该怎么办我如何才能访问我的 heroku 帐户 Hero
从 C# 获取 Powershell 错误

Problem 我正在从 c 调用 powershell 命令但是PowerShell命令对象似乎只有属性bool HasErrors这对我没有帮助what我收到的错误这就是我构建 powershell 命令的方式 Library pu
如何在网站上的多个登录字段上使用自动填充

当网页上有两个单独的登录字段时我的浏览器 Google Chrome 假设它们都需要相同的凭据这不是一个有效的假设我希望我的浏览器能够分别存储每个人的凭据
如何将 JavaFX TableView 与 java 记录一起使用？

Records是一个新功能Java 16 https en wikipedia org wiki Java version history Java 16 定义于JEP 395 记录 https openjdk org jeps 395 假
如何在反应中单击按钮将一个组件移动到另一个组件？

您能告诉我如何在反应中单击按钮时将一个组件移动到另一个组件吗我得到了react router js来自 cdn 我不知道如何使用这个 js 我想展示second component on button click of第一个组件这是我的
Delphi MREW 实现对读者有利吗？

是否有 MREW 多读独占写锁的 Delphi 实现它有利于读而不是写我觉得TMultiReadExclusiveWriteSynchronizer http edn embarcadero com article 28258已经受
Java中对象的类型切换

所以我想知道一种在Java中切换有效类型的简单方法如下所示我知道这不能编译但我想要这个功能 public void put Object obj if obj instanceof Integer else if obj instan
JButton 中的图标位置

是否有可能更改 JButton 中的图标图像位置现在看起来是这样的我想将图标移到更左边我尝试更改文本对齐方式但它无法按我想要的方式工作 myButton setHorizontalTextPosition SwingConstant
将有符号整数转换为无符号长整型的最佳方法？

对于 Java 中的某些哈希函数最好将值视为无符号整数例如用于与其他实现进行比较但 Java 仅支持有符号类型我们可以将有符号的int到未签名 long像这样 public static final int BITS PER B
Scrum 故事和幕后特色 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案据我了解 Scrum 待办事项由一系列代表最终用户的故事组成并进一步分解为功能如果是这样的话所有与故事没有真正联系但仍然有用的幕后功
PyQt4、QThread 和打开大文件而不冻结 GUI

我想问如何从磁盘读取大文件并保持 PyQt4 UI 响应不阻塞我已将文件的负载移至 QThread 子类但我的 GUI 线程被冻结有什么建议么我想这一定是GIL的问题但我不知道如何排序编辑我正在使用 GDCM 项目中的 vt
HBase如何实现对HDFS的随机访问？

鉴于HBase是一个数据库其文件存储在HDFS中那么它如何实现对HDFS中单个数据的随机访问呢这是通过什么方法实现的呢 From Apache HBase 参考指南 http hbase apache org book archite
事件+适配器模式

我在泛型类上有一个适配器模式它本质上在类型之间进行适应 class A
如何在我的 Swift 项目中使用 Objective-C 项目

注我知道如何从 Swift 调用 Objective C 代码 https stackoverflow com q 24002369 6521116 但我不知道下面我想用这个EsptouchForIOS的演示 https github
@AutoConfigureAfter 未按预期工作

我有 3 个 spring boot starter 项目其中一个自动配置类具有以下代码 Configuration ConditionalOnClass value Config class AutoConfigureAfter val
SQL查询结果需要返回WHERE子句中的所有记录，甚至重复

我是 Microsoft SQL Server 的新手需要一个查询来返回 WHERE 子句中列出的所有记录甚至是重复的记录我所拥有的只会返回 3 行我正在使用 C 读入并解析文本文件使用该文本文件我创建一个查询以从数据库获取结果
Xcode：多人共享相同的 Bundle ID

我正在和朋友一起开发 iOS 应用程序我们都以个人身份报名参加了 Apple 开发计划我们没有组织我们正在使用 git 并且希望能够从 Mac 构建应用程序但我无法编译因为 Bundle ID 已被我的朋友使用是否有可能在不成为
将数据库文件从文件资源管理器中的 /assets 复制到 /data/data 文件夹 - Android

我在文件资源管理器中将数据库文件从 assets 复制到 data data 文件夹时遇到问题我搜索了这个网站找到了很多答案但找不到适合我的情况的适当答案我已经使用 SQLite Manager 在外部创建了数据库并将其导入到资产文
在 R 中的 DT::datatable 中包含表容器

我是 HTML 和交互式表格的新手并且在构建表格容器来为我的数据集添加标题时遇到了麻烦有没有一种简单的方法可以为我的数据集插入表头我希望第 2 5 列不包括第 1 列中的日期和第 6 9 列分别具有标题部门和行业我在下面包
如何使用 scala 2.12 重建 apache Livy

我正在使用 Spark 3 1 1 它使用 Scala 2 12 以及从下载的预构建 Livyhere https livy incubator apache org download 使用 Scala 2 11 可以找到名为repl 2

如何使用 scala 2.12 重建 apache Livy

如何使用 scala 2.12 重建 apache Livy 的相关文章

随机推荐

热门标签