在 Google BigQuery 中创建 UUID 列

2023-11-23

谷歌大查询不支持UUID作为数据类型。那么,哪个选项更好地存储它:

  • STRING:格式为 8-4-4-4-12 的字符串
  • BYTES:16字节(128位)的数组

编辑:BigQuery 现在支持函数称为GENERATE_UUID。这会返回一个STRING32 个十六进制数字分为五组,用连字符分隔,格式为 8-4-4-4-12。

原文内容:

关于权衡的一些讨论:

Using STRING

  • UUID 与其他系统中的表示兼容,例如,如果您导出到 CSV,然后想要与其他地方的导出合并。
  • UUID 与 BigQuery 兼容可能是 UUID 实现。您将能够使用函数生成相同形式的 UUID(当实现该功能时)。
  • 如果您决定将 UUID 表示为BYTES稍后,您可以使用 UDF 进行转换。
  • 缺点:比较速度可能不如BYTES取决于运算符,因为字符串比较必须考虑 UTF-8 编码。 (听起来这对你来说不是问题)。
  • 缺点:存储成本较高。 (听起来这对你来说不是问题)。

Using BYTES

  • UUID存储更加紧凑;存储更便宜,比较速度更快。
  • 如果您决定将 UUID 表示为STRING稍后,您可以使用 UDF 转换它们。
  • 缺点:UUID 导出后与其他系统不兼容,并且也可能与 BigQuery 的实现不兼容。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在 Google BigQuery 中创建 UUID 列 的相关文章

随机推荐

  • 防止直接从 amazon s3 下载音频文件

    我在 Amazon S3 中存储了音频文件 可以从基于 Web 的音乐播放器应用程序以及移动应用程序访问这些音频文件 即使未登录的用户也应该能够访问音乐 但是我不希望人们使用该链接来下载内容 这可以在 s3 中完成吗 谢谢 您可以根据 HT
  • 如何用Java代码配置Logback来设置日志级别?

    我想使用默认的 SLF4J Logback 配置 除了设置org springframework data document mongodb日志记录级别为DEBUG 我怎样才能用Java代码做到这一点 我没有使用 XML 并且这个决定是在运
  • MATLAB 中的高效低秩逼近

    我想计算一个矩阵的低秩近似 该矩阵在弗罗贝尼乌斯范数下是最佳的 实现此目的的简单方法是计算矩阵的 SVD 分解 将最小奇异值设置为零 并通过乘以因子来计算低秩矩阵 在 MATLAB 中是否有一种简单且更有效的方法来做到这一点 如果您的矩阵稀
  • Laravel 带有正则表达式的可选前缀路由

    有没有办法创建带有前缀的路由 这样我就可以拥有这样的路由 articles html gt goes to listing Controller in default language en articles html gt goes to
  • 气流 外部传感器卡在戳戳处

    我希望一个 dag 在另一 dag 完成后开始 一种解决方案是使用外部传感器功能 您可以在下面找到我的解决方案 我遇到的问题是依赖的 dag 卡在 poking 上 我检查了这个answer并确保两个 dags 按相同的时间表运行 我的简化
  • 将“元组列表”转换为平面列表或矩阵

    使用 Sqlite select from命令返回结果output 打印 gt gt print output 12 2817 12 2817 0 0 8 52 8 52 它似乎是一个元组列表 我想转换output一个简单的列表 12 28
  • Firebase 真正的离线功能

    我正在尝试了解 Android 上的 Firebase 离线功能实际上能达到什么程度 据我了解 应该可以使数据库 持久化 FirebaseDatabase getInstance setPersistenceEnabled true 文档内
  • 我应该将 go depvendor/ 添加到 .gitignore 吗? [复制]

    这个问题在这里已经有答案了 我应该添加go dep vendor 文件夹到 gitignore 我现在有vendor in gitignore 所以每次部署都会调用dep ensure github gitignore Go gitigno
  • 滤波器阵列 - 奇偶

    如何过滤掉具有奇数或偶数索引号的数组条目 Array 0 gt string1 1 gt string2 2 gt string3 3 gt string4 就像 我希望它从数组中删除 0 和 2 条目 或者说我有 0 1 2 3 4 5
  • 良好的线程 C++ 库

    我更喜欢仅基于 pthreads 的库 对于线程来说 什么是好的 C 库 怎么样增强线程 Boost Thread 允许使用 多线程执行 可移植 C 代码中的共享数据 它 提供类和函数 管理线程本身 与其他人同步数据 线程之间或提供 特定于
  • Windows API 保留参数

    我想知道为什么有些函数有一些参数由于 保留参数 而必须设置为 NULL 例如 LONG WINAPI RegQueryValueEx in HKEY hKey in opt LPCTSTR lpValueName reserved LPDW
  • CSS 子选择器 (>) 不适用于 IE

    下面的 CSS 在 Firefox 下运行良好 但在 IE 浏览器下不起作用 为什么 另外 如何才能只让父元素正下方的元素受 CSS 影响 CSS box font 24px box gt div font 18px box gt div
  • 使用 cabal 安装库时无法解决依赖关系

    我尝试在 Window 10 上使用 cabal 安装库的每一次努力都导致了同样的错误 cabal install gtk cabal exe Could not resolve dependencies 0 trying parconc
  • 如何使用react-native更改Textinput中的电话号码格式

    i want the phone number work Phone format to be as shown in the below image using react native can any one help how to w
  • iOS 上的 Google Analytics:未跟踪事件

    我按照 Google 指南中提供的说明将 Google Analytics SDK 添加到我的项目中 但是 当我尝试跟踪某些事件时 这是调试输出 BOOL application UIApplication application didF
  • 从文本中获取 url [重复]

    这个问题在这里已经有答案了 可能的重复 包含查询字符串的 URL 正则表达式 我有一条短信或消息 嘿 尝试这个http www test com test aspx id 53 我们的要求是从文本中获取链接 我们正在使用以下代码 List
  • Meteor :等待所有模板渲染完毕

    我有以下模板代码
  • 为什么 IEnumerable.Select() 在两种情况之一中起作用?无法从使用情况推断

    我明白了错误信息 The type arguments for method System Linq Enumerable Select
  • 在ggplot箱线图中显示填充组内的单独平均值

    我有一个使用 3 个类别的数据的分组箱线图 一个类别设置为箱线图的 x 轴 另一个类别设置为填充 最后一个类别设置为分面类别 我想显示每个填充组的平均值 但使用stat summary只给出 x 轴类别的平均值 而不分离填充的平均值 这是当
  • 在 Google BigQuery 中创建 UUID 列

    谷歌大查询不支持UUID作为数据类型 那么 哪个选项更好地存储它 STRING 格式为 8 4 4 4 12 的字符串 BYTES 16字节 128位 的数组 编辑 BigQuery 现在支持函数称为GENERATE UUID 这会返回一个