如何在 NoteBook 之外的 pyspark 作业中使用 dbutils 命令

2024-01-14

我想使用 dbutils 命令来访问通过 Databricks 上的作业内的 Spark-Submit 提交的 pyspark 作业中的机密。使用 dbutils 命令时,出现错误 dbutils not Defined。

除了笔记本之外,还有在 pyspark 作业中使用 dbutils 的方法吗?

尝试了以下解决方案:

1)导入DBUtils,根据这个solution https://stackoverflow.com/a/52947713/11824257。但这不是 Databricks dbutils。

2)导入 pyspark.dbutils import DBUtils ,根据这个solution https://learn.microsoft.com/en-gb/azure/databricks/dev-tools/databricks-connect#access-dbutils。但这也行不通。

pyspark作业如下图所示:image https://i.stack.imgur.com/V3FEm.png


我对你的问题的理解 - 如何从 Databricks 笔记本中的密钥库访问秘密值?
因此,要访问密钥,您必须将 Databricks 笔记本链接到密钥库。 此链接必须通过使用范围来完成。
在下面的网址中,您必须提供详细信息:

https://westeurope.azuredatabricks.net/#secrets/createScope https://westeurope.azuredatabricks.net/#secrets/createScope

If you open the link then you will land to a secret scope creation page: Scope creation Page Link may be vary depends on the area/region of subscription. In my case it is "westeurope".

您必须在页面上提供 3 个值:
1)范围名称
2)DNS 名称
3)资源ID

Scope name have to be define manually and rest of the two values has to copy from the key-vault.
Now go to your Azure key-vault and click on properties section.
KeyVaultScreenShot

复制DNS Name and 资源ID值并将其粘贴到范围创建页面的所需单元格中。

就是这样。现在您的笔记本将指向您的密钥保管库。

我给了az-kv-范围测试命名到我的范围。

让我们假设我的密钥库有一个带有名称的秘密数据库密码我想在我的笔记本中访问它。

因此,要从 Databricks 笔记本内的密钥保管库访问秘密值,我必须使用以下命令。

    // variable declaration and initialization.    
    val my_kv_scope = "az-kv-scope-test"    
    val password = dbutils.secrets.get(scope = my_kv_scope, key = "db_password")

以下链接将引导您获取有关秘密范围的更多信息。
https://docs.databricks.com/security/secrets/index.html https://docs.databricks.com/security/secrets/index.html

我希望这能让您清楚地了解笔记本中的 Key-Vault 值的可访问性。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 NoteBook 之外的 pyspark 作业中使用 dbutils 命令 的相关文章

随机推荐

  • PowerShell - 匹配运算符和多个组

    我正在 PowerShell 中处理以下日志条目 我正在尝试使用以下命令提取所有活动名称和持续时间 match操作员 但我只拿回一组比赛 当我使用 C 做同样的事情时 我没有得到我看到的所有匹配项Regex目的 有人可以解释我做错了什么吗
  • 在 lucene 索引中存储和检索 Json 对象

    我已经将一组 json 对象存储到 lucene 索引中 并且还想从索引中检索它 我使用的是lucene 3 4 那么有没有任何库或简单的机制可以在 lucene 中实现这一点 例如 Json 对象 BOOKNAME1 id 1 name
  • Python Pandas 警告:尝试在 DataFrame 切片的副本上设置值

    我有一个 Pandas DataFrame 我想用以下代码更改列的所有值 df Population round df Population 1000000 1 我收到以下警告 A value is trying to be set on
  • ruby 中的字节与代码点

    ruby 字符串函数之间有什么区别 代码点和字节 abcd bytes gt 97 98 99 100 abcd codepoints gt 97 98 99 100 bytes无论字符大小如何 都返回单个字节 而codepoints返回
  • Powershell 版本 5 Copy-Item -FromSession 找不到

    我正在尝试通过以下方式从远程会话复制一些日志文件 FromSession的参数Copy Itemcmdlet 在呼叫计算机上我安装了 PS 版本 5 运行脚本时我收到以下错误 Copy Item A parameter cannot be
  • Lodash 地图并返回唯一值

    我有一个 lodash 变量 var usernames map data usernames 产生以下结果 joebloggs joebloggs simongarfunkel chrispine billgates billgates
  • URIencode 和冒号

    冒号是一个可以根据许多站点编码为 3A 的字符 当我尝试使用编码时URIencode它不工作 例如 如果我尝试编码URIencode 然后什么也没有发生 返回冒号 为什么是这样 有人可以帮我吗 提前致谢 The encodeURI 对特殊字
  • 如何运行 Alamofire 库

    I downloaded the alamofire library and opened the iOS Example xcodeproj but it won t run In import Alamofire when i comm
  • 到 Task.Run 或不到 Task.Run

    假设我有一个包含异步方法的接口 并且该接口有两个不同的实现 这两种实现之一自然是异步的 而另一个则不是 实现非异步方法的 最正确 方法是什么 public interface ISomething Task
  • 无法在 xcode 崩溃报告中找到发生崩溃的代码

    我在 x code 中收到了几个崩溃报告 由用户报告 但无法找出它的用途 我在项目中打开它 但它没有显示发生崩溃的代码行 显然我尝试单击堆栈跟踪的每一行 如果您想在已发布的版本中触发崩溃 那么您应该将崩溃报告程序集成到您的项目中 并且Cra
  • 如何检查两个异步任务是否成功完成

    在函数中实现此流程图的最佳和最简单的方法是什么 现在我正在使用两个调度组 但我需要检查它们是否都已完成 而不仅仅是它们何时完成 如果他们完成了 那么 Friends 数组将包含元素 昵称数组将包含元素 注 FB是Facebook FIR是F
  • Python-读取具有不同分隔符的数据文本文件

    我有一个文件 其中字段由 分隔 子字段由 分隔 子字段中的项目由 分隔 我想读Python 一段时间后 我可能可以逐行阅读它 然后分割所有内容 但我相信这种事情已经存在了 文件的一行 0 16 250 1 0 053 RIG DIS 1 4
  • Prism - EventAggregator.GetEvent<>.Subscribe() - 使用泛型和约束

    我在使用作为棱镜框架一部分的事件聚合器订阅事件时遇到问题 如果我使用诸如 eventAggregator GetEvent
  • 无法从控制台将 .csv 导入 Cloud SQL

    我尝试了多种方法将 csv 文件导入 Cloud SQL PostgreSQL 但没有成功 psql f import sql 不起作用 它说我必须是超级用户才能导入 但 copy 有效 所以我尝试了 copy 但失败了 我得到 postg
  • 在 OpenLayers 3.20+ 中使用 view.fit() 使用 view.animate()

    我有以下为 OpenLayers 3 20 之前版本编写的代码 fitViewToFeature function viewer feature var pan ol animation pan source viewer olView g
  • .NET Core 是否有任何等效的 GAC?

    据我目前在完整 NET Framework 中的了解 当我们将框架安装到计算机上时 它将整个 BCL 部署到计算机的 GAC 中 这样 当我们使用 NET 开发软件并将其部署到该计算机时 它将使用 BCL 程序集 这些程序集在安装 NET
  • 嵌入式 dylibs/frameworks 仅支持 iOS 8.0 及更高版本的架构 armv7

    我刚刚从 Xcode 6 4 升级到 Xcode 7GM 现在在运行旧项目时收到以下警告 embedded dylibs frameworks are only supported on iOS 8 0 and later rpath xx
  • 是否可以迭代多个枚举类?

    我有三个枚举类 我想以某种方式将它们放入一个数组中 循环遍历该数组并在每个枚举类中调用相同的方法 这在Java中可能吗 在我看来 你不能将枚举类型放置在数组结构中 除非我错过了如何放置 谢谢 让每个枚举类型实现一个通用接口具有常用方法您想要
  • 两个视图控制器之间viewDidAppear和viewDidDisappear的回调顺序

    据我所知 至少有两种方法可以在另一个 UIViewController 上呈现 UIViewController 第一种是在 UIViewController 上使用 presentModalViewController animated
  • 如何在 NoteBook 之外的 pyspark 作业中使用 dbutils 命令

    我想使用 dbutils 命令来访问通过 Databricks 上的作业内的 Spark Submit 提交的 pyspark 作业中的机密 使用 dbutils 命令时 出现错误 dbutils not Defined 除了笔记本之外 还