如何将事件流式传输到 BigQuery?

2024-03-09

我想将事件添加到 BigQuery 中,以便使用以下服务通过图表查看它们模式分析 https://modeanalytics.com.

我不确定是否掌握了 BigQuery 的完整概念,也许我对它做出了错误的假设,但我想使用它的目的是拥有一个(某种)表“事件”,并根据关于事件名称。

这可能类似于“新帐户”、“用户搜索”等。

但我能找到的所有文档都是关于从其他表、csv、json 文件等加载大量数据的。

我无法找到有关仅执行诸如 POST 请求之类的操作并将数据添加到“事件”表的文档。

我能怎么做 ?


我建议多读一点 BigQuery。您似乎还没有完全掌握它实际上是什么的概念。尝试here https://cloud.google.com/bigquery/对于初学者。想想“利用 Google 基础设施的力量,使用 SQL 进行大规模可扩展的数据分析”。之后,再看看它的流媒体 API 功能 https://cloud.google.com/bigquery/streaming-data-into-bigquery。这允许您通过其 RESTful API 使用 http POST 请求插入“事件”。

一旦你明白了这一点,那么就有一些解决方案可以流式传输数据。你可以直接访问 BigQuery,但这不是一个好主意 - 原因很明显。正如 varun 的回答中提到的,您确实可以连接 Pub/Sub 和数据流,但我觉得这可能超出了您的需求。

因此,一个常见的模式/解决方案是使用队列,并让某些东西异步消耗该队列中的事件,并将它们批量推送到 BigQuery。我们的许多项目都是这样做的,而且效果非常好。

您不必使用 GAE 来实现此目的。您可以使用任何类型的队列,或者简单地构建您自己的自定义队列。例如,我们使用 SQS 在 AWS 上运行一些队列(我们的事件源自 EC2 上运行的 Apache 节点),然后有一个应用程序异步消耗 SQS 上的事件。

我们也使用Redis来达到同样的效果。它在生产中运行,具有可扩展性,每分钟为我们处理大约 50K 个事件到 BigQuery。我们的一位工程师写了一篇关于它的博客文章here https://blog.shinetech.com/2014/12/19/license-to-queue/.

因此,正如您所看到的,有很多方法可以构建解决方案。然而,基本前提是拥有某种队列来异步处理您的“事件”,并将它们批量推送到 BigQuery,然后您可以在其中进行分析并插入 BI 工具来制作漂亮的图表。此外,您选择什么解决方案取决于您的具体用例,例如您的事件源自哪里?你的技能是什么样的? ETC。

希望这可以帮助。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何将事件流式传输到 BigQuery? 的相关文章

随机推荐

  • 如何使用 opencv python 将黑色更改为红色

    你怎么能用Python做到这一点 我在这条线上遇到了问题 img rgb Set mask cv2 Scalar 0 0 255 这是代码 import numpy as np import imutils import cv2 img r
  • 在 C 中将匿名结构作为参数传递

    我有以下 c 行 为了可读性而添加回车符 它们不在代码中 define i2c write slave addr reg addr len data ptr twi master write MPU TWI addr reg addr ad
  • 如何移动文件?

    我正在针对 SourceForge SVN 存储库使用 TortoiseSVN 我想将文件从一个文件夹移动到另一个文件夹以维护其修订历史记录 这可能吗 如果是这样 你会怎么做 我当前的策略是将文件复制到新文件夹中并将其签入 然后从当前文件夹
  • 优化 S3 下载大量小文件

    我目前使用转账管理器 https docs aws amazon com AWSJavaSDK latest javadoc com amazonaws services s3 transfer TransferManager html从
  • AJAX 将不带表单的 ValidateAntiForgeryToken 发布到 MVC 操作方法

    我一直在寻找如何在 SO 上执行此操作的示例 据我所知 我已经尝试了所有我能找到的示例 但到目前为止没有成功 我尝试根据我的场景更改一些实现 但到目前为止也失败了 我的页面上有这个 layout cshtml 所以我总是有一个可用的令牌
  • Android 设计支持库可扩展浮动操作按钮 (FAB) 菜单

    现在Android设计支持库已经出来了 有谁知道如何用它实现扩展的Fab菜单 就像Inbox App上的fab一样 应该看起来像这样 获得了一种更好的方法来实现动画 FAB 菜单 而无需使用任何库或为动画编写大量 xml 代码 希望这对将来
  • insertUI 中的 R 闪亮动态 UI

    我有一个闪亮的应用程序 我想使用操作按钮添加 UI 元素 然后让插入的 ui 成为动态的 这是我当前的 ui 文件 library shiny shinyUI fluidPage div id placeholder actionButto
  • MySQL 与 JSON - 为什么? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • 使用 vbscript 从本地驱动器获取文件夹列表

    我想从计算机中删除所有文档 doc 文件 因为我知道如何从文件夹中获取子文件夹列表 但不知道如何从根目录中获取文件夹列表 Ex C subfoldersInFolder folder subFolder 给出文件夹的所有子文件夹 但据说我想
  • 熊猫显示所有行的组总和[重复]

    这个问题在这里已经有答案了 给定以下数据框 col a col b tosum b 5 b 5 b 1 c 6 c 3 a 2 a 2 我想显示所有行上每个 col 组的总和 如下所示 col a col b tosum group sum
  • 图像(Blob)在浏览器中仅显示一次

    我正在使用 Symfony2 和 Twig 在实体类中 ORM Column name photo type blob nullable true private photo public function displayPhoto ret
  • 绑定元函数:接受类型和模板模板参数(接受任何内容)

    我正在尝试写一个Bind将模板参数绑定到某些内容的元编程模板帮助器元函数 我有一个简单模板元函数的工作实现 template
  • 如何让 SSL 在 pip3 中工作?

    Python 3 6 5 从源代码构建并与 Python 2 7 5 一起安装 python3但是打开 python 终端pip3无法安装任何带有 SSL 错误的软件包 root servername openssl OpenSSL 1 1
  • 如何在 Python 中向旧的 CSV 文件追加新行?

    我正在尝试向旧的 CSV 文件添加新行 基本上 每次运行 Python 脚本时它都会更新 现在 我将旧的 CSV 行值存储在列表中 然后删除 CSV 文件并使用新的列表值再次创建它 我想知道是否有更好的方法可以做到这一点 with open
  • 如何列出 FTP 连接的目录内容

    我找不到这方面的教程 在 VB NET 中我想要执行如下命令 Dim array1 as string ListFilesInFolder www example com images 我知道这可能不会那么简单 但是有人可以给我指点教程或其
  • MongoDB C# 驱动程序覆盖字符串的默认值从 null 到 string.empty

    使用 10gen mondgo db c 驱动程序 我有以下课程 BsonId public ObjectId Id get set public int AttemptId get set public int UserId get se
  • Json 下拉列表

    当我点击部门安装主题时 当我点击主题时要安装的服务 但当我点击服务时却没有看到问题 我认为对json的描述不准确 你能帮我解决这个问题吗 谢谢 我的 Jquery 代码
  • ASP.NET MVC 在哪里放置自定义验证属性

    我一直在摆弄一些 ASP NET MVC3 解决方案结构 并且已经确定了由以下项目组成的设计 MyApp Web MVC3 Web Layer MyApp Data Repositories and infrastructure for m
  • 使用php将XML数据插入mysql

    代表问题的 xml 文件部分 该 xml 文件有数百条客户记录
  • 如何将事件流式传输到 BigQuery?

    我想将事件添加到 BigQuery 中 以便使用以下服务通过图表查看它们模式分析 https modeanalytics com 我不确定是否掌握了 BigQuery 的完整概念 也许我对它做出了错误的假设 但我想使用它的目的是拥有一个 某