如何在 flink 独立安装上进行 kerberos 身份验证？

2023-12-31

我有一个独立的 Flink 安装，我想在其上运行一个将数据写入 HDFS 安装的流作业。 HDFS 安装是 Cloudera 部署的一部分，需要 Kerberos 身份验证才能读取和写入 HDFS。由于我没有找到有关如何使 Flink 与受 Kerberos 保护的 HDFS 连接的文档，因此我不得不对该过程做出一些有根据的猜测。这是我到目前为止所做的：

我为我的用户创建了一个密钥表文件。

在我的 Flink 工作中，我添加了以下代码：

UserGroupInformation.loginUserFromKeytab("myusername", "/path/to/keytab");

最后我用的是TextOutputFormat将数据写入HDFS。

当我运行该作业时，出现以下错误：

org.apache.hadoop.security.AccessControlException: SIMPLE authentication is not enabled.  Available:[TOKEN, KERBE
ROS]
        at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
        at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
        at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
        at java.lang.reflect.Constructor.newInstance(Constructor.java:422)
        at org.apache.hadoop.ipc.RemoteException.instantiateException(RemoteException.java:106)
        at org.apache.hadoop.ipc.RemoteException.unwrapRemoteException(RemoteException.java:73)
        at org.apache.hadoop.hdfs.DFSOutputStream.newStreamForCreate(DFSOutputStream.java:1730)
        at org.apache.hadoop.hdfs.DFSClient.create(DFSClient.java:1668)
        at org.apache.hadoop.hdfs.DFSClient.create(DFSClient.java:1593)
        at org.apache.hadoop.hdfs.DistributedFileSystem$6.doCall(DistributedFileSystem.java:397)
        at org.apache.hadoop.hdfs.DistributedFileSystem$6.doCall(DistributedFileSystem.java:393)
        at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
        at org.apache.hadoop.hdfs.DistributedFileSystem.create(DistributedFileSystem.java:393)
        at org.apache.hadoop.hdfs.DistributedFileSystem.create(DistributedFileSystem.java:337)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:908)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:889)
        at org.apache.hadoop.fs.FileSystem.create(FileSystem.java:786)
        at org.apache.flink.runtime.fs.hdfs.HadoopFileSystem.create(HadoopFileSystem.java:405)

由于某些奇怪的原因，Flink 似乎尝试了简单的身份验证，即使我打电话给loginUserFromKeytab。我在 Stackoverflow 上发现了另一个类似的问题（在 YARN 集群 (Cloudera) 上执行 Flink 示例代码时出现 Kerberos 身份验证错误 https://stackoverflow.com/questions/32085990/error-with-kerberos-authentication-when-executing-flink-example-code-on-yarn-clu）其中有一个答案解释说：

如果用户在所有工作节点上进行了身份验证，独立 Flink 目前仅支持访问 Kerberos 安全的 HDFS。

这可能意味着我必须在操作系统级别进行一些身份验证，例如和kinit。由于我对 Kerberos 的了解非常有限，我不知道该怎么做。我也想了解程序如何运行kinit当没有任何相关配置时，实际上知道从本地缓存中选择哪个 Kerberos 票证。

我不是 Flink 用户，但根据我在 Spark 和朋友身上看到的情况，我的猜测是“在所有工作节点上进行身份验证”意思是each工作进程有

a core-site.xml配置可在本地文件系统上使用hadoop.security.authentication set to kerberos（除其他外事物）
本地目录包含core-site.xml添加到 CLASSPATH 以便 Hadoop 自动找到它Configuration object [否则它将默默地恢复为默认的硬编码值，呃]
隐式身份验证通过kinit和默认缓存[为 Linux 帐户全局设置 TGT，影响所有进程，呃]## 或 ## 隐式身份验证通过kinit以及通过 KRB5CCNAME 环境变量设置的“私有”缓存（Hadoop 仅支持“FILE:”类型）## 或 ## 通过显式身份验证UserGroupInformation.loginUserFromKeytab()以及本地文件系统上可用的密钥表

UGI“登录”方法非常冗长，因此如果在 Flink 尝试从 HDFS 客户端启动之前确实调用了该方法，Configuration，你会注意到。另一方面，如果您没有看到详细的内容，那么您创建私有 Kerberos TGT 的尝试会被 Flink 绕过，您必须找到一种方法来绕过 Flink:-/

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 flink 独立安装上进行 kerberos 身份验证？的相关文章

Spark/Yarn：HDFS 上不存在文件

我在 AWS 上设置了 Hadoop Yarn 集群有 1 个主服务器和 3 个从服务器我已经验证我有 3 个活动节点在端口 50070 和 8088 上运行我在客户端部署模式下测试了 Spark 作业一切正常当我尝试使用 Spa
SharePoint Online 身份验证失败

我有一个 C 应用程序它通过使用 Web 请求对 SharePoint Online 进行身份验证它对我来说非常有用但其他人收到以下错误
C# SMTP 身份验证失败，但凭据正确

这是我的问题我编写了以下程序来测试是否可以发送电子邮件 class Program static void Main string args try Console WriteLine Mail To MailAddress to new
Firebase GAS webapp Google 弹出窗口消失

我正在尝试升级我的 firebase GAS web 应用程序之前我有一个弹出窗口可以让用户使用 Google 登录我不确定我做错了什么但我已经升级到新的 firebase 现在正在尝试使用新的代码格式进行相同的登录发生的情况是
在 React Native 应用程序中哪里可以获取 EXPO DEBUG 值？

当我尝试登录 expo 时出现此错误 exp Set EXPO DEBUG true in your env to view the stack trace 你知道我到底要在哪里设置值吗EXPO DEBUG EXPO DEBUG是一个环境变
使用 Django REST 框架进行 SAML SSO 身份验证

我目前正在开发 AngularJS 前端和 Django REST 后端我一直在使用Django rest auth https github com Tivix django rest auth过去需要对两者之间的连接进行身份验证但现
Twitter 登录说明

我想在 Android 中创建一个 Twitter 应用程序为此我想创建一个登录页面并登录到 Twitter 为此我们需要消费者密钥和消费者密钥这是什么意思要创建此登录页面除了 Twitter 帐户之外我们还需要其他任何东西吗
Kerberos 双跳

我们遇到了臭名昭著的 Kerberos 双跳问题这是一个全新的域是从以前使用模拟和委派的另一个提供商迁移而来的我们已将操作系统升级到最新的 SQL 服务器 2017 WPF 应用程序使用域凭据 gt Web 服务 IIS 10 上的
免费 PHP 登录库 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
CakePHP 身份验证插件身份关联

我正在使用 CakePHP 3 8 并迁移到身份验证插件 https book cakephp org authentication 1 1 en index html https book cakephp org authenticati
我可以使用passport-google回调来验证android/ios用户吗？

我有一个使用 google passport oauth2 进行身份验证的 node js 服务器我的服务器端代码看起来像这样文档 https www npmjs com package passport google oauth2 au
使用 AFNetworking 重置基本身份验证凭据

我正在编写一个 REST 客户端使用 AFNetworking 并且需要能够在应用程序的单个实例中触发新会话的创建换句话说我想 1 通过服务器进行身份验证2 进行一些 REST 调用3 模拟注销 4 重新与服务器进行身份验证5 进行
Spring Security从数据库获取用户ID

我正在使用 spring security 进行身份验证并成功获得User目的 org springframework security core userdetails User 任何我需要的地方但我想要UserId还有春天里没有的U
有没有办法在 Blazor 中进行外部身份验证而不使用数据库？

所以本质上我有一个 Blazor 服务器端应用程序我正在尝试使用 Azure AD SAML 添加外部身份验证我在用Sustainsys Saml2 AspNetCore2用于外部身份验证的包我不太熟悉 ASP NET 或 Blazo
Spark-submit，客户端无法通过以下方式进行身份验证：[TOKEN，KERBEROS]；

我使用 kerberos 设置了 hadoop 集群但是当我运行 Spark Submit 时它抛出异常 17 10 19 08 46 53 WARN scheduler TaskSetManager Lost task 0 0 in
使用 SSL 证书验证 Web 浏览器

是否可以使用 ssl 证书对 Web 浏览器进行身份验证假设我在应用程序中存储私钥有什么方法可以从浏览器读取密钥并尝试基于该私钥进行身份验证您可以使用 SSL TLS 客户端证书身份验证来对浏览器用户进行身份验证服务器必须请求客户
HIVE - 使用WITH CLAUSE插入覆盖

我有一个生成的查询以WITH子句开头当我在控制台中运行它时当我尝试使用INSERT OVERWRITE运行查询以将输出加载到单独的配置单元表中时该查询工作正常 INSERT OVERWRITE TABLE proc db master
关于 Hadoop 和压缩输入文件的非常基本的问题

我已经开始研究 Hadoop 如果我的理解是正确的我可以处理一个非常大的文件它会被分割到不同的节点上但是如果文件被压缩那么文件就无法分割并且需要由单个节点处理有效地破坏了运行一个mapreduce 一个并行机器集群我的问题是
像袋子一样压平元组

我的数据集如下所示 A 1 2 B 2 9 我想展平 Pig 中的元组基本上为内部元组中找到的每个值重复每个记录这样预期的输出是 A 1 A 2 B 2 B 9 我知道当元组 1 2 和 2 9 是袋时这是可能的你的洞察力很好可以
S3并行读写性能？

考虑 Spark 或任何其他 Hadoop 框架从 S3 读取大型例如 1 TB 文件的场景多个spark执行器如何从S3并行读取非常大的文件在 HDFS 中这个非常大的文件将分布在多个节点上每个节点都有一个数据块在对象存储中

随机推荐

如何在 shell 脚本中的 curl 命令中传递变量

我有一个curl命令 curl u USER ID PASSWORD X GET http blah gso woo com 8080 rest job execution job details job id 变量job id其中有一个值
Backbone.Collection 上的 toJSON#在哪里？

我不知道为什么但我无法让它工作 var friends new Backbone Collection name Athos job Musketeer name Porthos job Musketeer name Aramis job
创建 COM 互操作类的实例

我正在尝试使用 C 从我的程序中打开 CorelDRAW 到目前为止我已经能够通过引用适当的 com 库并调用来做到这一点 CorelDRAW Application draw new CorelDRAW Application draw
Python - ElementTree - 不能在元素上使用绝对路径

当我尝试运行以下代码时我在 ElementTree 中收到此错误 SyntaxError cannot use absolute path on element 我的 XML 文档如下所示
JSON 迭代器的类型安全警告

我的问题来自于从 JSONObject 获取迭代器最简单形式的代码生成错误 String json client retrieveList JSONObject jsonList new JSONObject json Iterator
Java - 不可变数组线程安全

我有一个关于 Java 内存模型的问题这是一个呈现问题的简单类 public class ImmutableIntArray private final int array public ImmutableIntArray array n
如何有效地从 std::set 中选择随机元素

如何有效地从一个随机元素中选择一个std set A std set iterator is 不是随机访问迭代器所以我不能像为一个随机选择的元素那样直接索引std deque or std vector I could获取从返回的迭代器s
表达式 lambda 和语句 lambda 之间的区别

表达式 lambda 和语句 lambda 之间有区别吗如果是这样有什么区别在下面的链接中找到了这个问题但无法理解答案什么是 Lambda 表达式 C 面试题 http csharpinterviewfaq blogspot in
MFMailComposeViewController 未从视图中消失

我有以下代码当调用操作表上的按钮时会调用该代码但是当我按取消然后删除草稿时它只是收费并且不会关闭我在应用程序的其他地方使用相同的代码并从选择的表格视图单元格中调用它并且它可以在那里找到有什么想法为什么它在这里不起作用吗当
当变量超出范围时是否意味着它不存在？

我不确定我是否理解作用域超出作用域的变量我正在使用 Ruby 是否存在于内存中的某处或者它是否停止存在我知道你无法访问它说超出范围的变量不再存在是不准确的吗也许这是一个哲学问题如果您使用托管语言那么您不会分配和取消分配内存
Google Oauth2 userinfo API 不返回用户名数据

在过去的几个月里我一直在使用 OAuth 登录后使用此 url 来检索用户的名称和信息 https www googleapis com oauth2 v1 userinfo alt json 这给了我以下格式的 JSON id 1234
openGL以伪3D视角绘制扭曲的精灵（图像）

好吧这将是一个很难解释的事情我正在使用 AndEngine 我认为是 openGL 为 Android 制作一个非常基本的伪 3d 赛车游戏我不相信使用 AndEngine 真的与这个问题有任何关系因为我直接访问 openGL 函
UILocalizedIndexedCollation 仅返回英文排序规则

我正在尝试使用以下方法获取像联系人这样的本地化索引UILocalizedIndexedCollation 在通讯录中当我更改语言时索引会更改以匹配语言然而sectionIndexTitles始终返回英文索引我已经用我创建的演示应
ValueError：“10.0.0.0/24”似乎不是 IPv4 或 IPv6 网络

我想在 Python 中使用 IP 子网 IP 地址我使用以下命令创建了 Python 代码ipaddress模块当我在 pycharm IDE 中运行代码时它工作正常但是当我在命令提示符下键入时运行python test py 它
如何使用 BEM 正确设置元素的范围？

给定以下 BEM 树结构其中存在五个嵌套级别 collection main features top story byline author 根据 BEM 的命名约定其中一个元素是块的一部分并且在它所属的块之外没有任何意义命名该元
什么是“别名”流缓冲区？

什么是别名流缓冲区我在评论中遇到了这个词answer https stackoverflow com questions 3318714 check if ostream object is cout or ofstream c 331
在后台接收 UIPasteboard (generalPasteboard) 通知

有办法做到这一点吗我注册我的对象UIPasteboardChangedNotification在启动时但是当将其发送到后台并打开例如 Safari 并复制一些文本时我的处理程序永远不会被调用我现在只使用模拟器我都用过 NSNot
自定义开关按钮动画

我用的是定制的开关按钮 in the 自定义开关按钮 https stackoverflow com questions 30593193 creating sliding on off switch button in javafx an
Flexbox 项目之间的间距

这就是我要的但这是我最接近的 body margin 0 padding 0 border 1px solid red flex display ms flexbox display webkit box display webkit f
如何在 flink 独立安装上进行 kerberos 身份验证？

我有一个独立的 Flink 安装我想在其上运行一个将数据写入 HDFS 安装的流作业 HDFS 安装是 Cloudera 部署的一部分需要 Kerberos 身份验证才能读取和写入 HDFS 由于我没有找到有关如何使 Flink 与受

如何在 flink 独立安装上进行 kerberos 身份验证？

如何在 flink 独立安装上进行 kerberos 身份验证？ 的相关文章

随机推荐

热门标签

如何在 flink 独立安装上进行 kerberos 身份验证？的相关文章