如何根据 BigQuery 中的另一个现有行为每个用户添加记录？

2024-02-13

在这里发帖，以防知识渊博的人能够帮助我找到一些方向。

我有一个这样的表：

| Row |   date   |user id | score |
-----------------------------------
|  1  | 20201120 |  1     |   26  |
-----------------------------------
|  2  | 20201121 |  1     |   14  |
-----------------------------------
|  3  | 20201125 |  1     |   0   |
-----------------------------------
|  4  | 20201114 |  2     |   32  |
-----------------------------------
|  5  | 20201116 |  2     |   0   |
-----------------------------------
|  6  | 20201120 |  2     |   23  |
-----------------------------------

但是，由此，我需要为每个用户每天记录一个记录，如果用户缺少一天，则应保留最后记录的分数，然后我会得到如下所示的结果：

| Row |   date   |user id | score |
-----------------------------------
|  1  | 20201120 |  1     |   26  |
-----------------------------------
|  2  | 20201121 |  1     |   14  |
-----------------------------------
|  3  | 20201122 |  1     |   14  |
-----------------------------------
|  4  | 20201123 |  1     |   14  |
-----------------------------------
|  5  | 20201124 |  1     |   14  |
-----------------------------------
|  6  | 20201125 |  1     |   0   |
-----------------------------------
|  7  | 20201114 |  2     |   32  |
-----------------------------------
|  8  | 20201115 |  2     |   32  |
-----------------------------------
|  9  | 20201116 |  2     |   0   |
-----------------------------------
|  10 | 20201117 |  2     |   0   |
-----------------------------------
|  11 | 20201118 |  2     |   0   |
-----------------------------------
|  12 | 20201119 |  2     |   0   |
-----------------------------------
|  13 | 20201120 |  2     |   23  |
-----------------------------------

我正在尝试使用 StandardSQL 在 BigQuery 中实现此目的。我知道如何在以下空日期中保持相同的分数，但我真的不知道如何为每个用户的缺失日期添加新行。另外，请记住，这个示例只有 2 个用户，但在我的数据中，我有超过 1500 个用户。

我的最终目标是显示每天的平均得分之类的东西。对于背景，由于我们的逻辑，如果分数没有在特定日期记录，这意味着用户仍在最后记录的分数中，这就是为什么我每天需要每个用户的分数。

我真的很感激我能得到的任何帮助！我一直在尝试不同的选择但没有成功

以下是 BigQuery 标准 SQL

#standardSQL
select date, user_id, 
  last_value(score ignore nulls) over(partition by user_id order by date) as score
from (
  select user_id, format_date('%Y%m%d', day) date,  
  from (
    select user_id, min(parse_date('%Y%m%d', date)) min_date, max(parse_date('%Y%m%d', date)) max_date
    from `project.dataset.table` 
    group by user_id
  ) a, unnest(generate_date_array(min_date, max_date)) day
)
left join `project.dataset.table` b
using(date, user_id)
-- order by user_id, date

如果应用于您问题中的样本数据 - 输出是

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

Arrays

datetime

googlebigquery

leftjoin

如何根据 BigQuery 中的另一个现有行为每个用户添加记录？的相关文章

数组与列表的性能

假设您需要一个需要频繁迭代的整数列表数组我的意思是非常频繁原因可能有所不同但可以说它位于大容量处理的最内层循环的核心一般来说人们会选择使用列表 List 因为它们的大小具有灵活性最重要的是 msdn 文档声称列表在内部使用数组
根据日期顺序排名

我的数据如下 Heading Date A 2009 02 01 B 2009 02 03 c 2009 02 05 d 2009 02 06 e 2009 02 08 我需要如下排名 Heading Date Rank A 2009 02
什么时候应该使用 C++ 而不是 SQL？

我是一名 C 程序员偶尔使用 MySQL 来处理数据库但我的 SQL 知识相当有限但我肯定愿意改变这一点目前我正在尝试仅使用 SQL 查询对数据库中的数据进行分析但我准备放弃了转而将数据导入到C 中用C 代码进行分析我和同
st_intersects 与 st_overlaps

这两个查询有什么区别 select a gid sum length b the geom from polygons as a roads as b where st intersects a the geom b the geom gr
在 SQL Server 上执行分页的最佳方式是什么？

我有一个数据库超过200万记录我需要执行分页以在我的 Web 应用程序上显示该应用程序每页必须有 10 条记录DataGrid 我已经尝试使用ROW NUMBER 但是这种方式会选择所有 200 万条记录然后只得到 10 条记录我也
H2 用户定义的聚合函数 ListAgg 不能在第一个参数上使用 DISTINCT 或 TRIM()

所以我有一个 DB2 生产数据库我需要在其中使用可用的函数 ListAgg 我希望使用 H2 的单元测试能够正确测试此功能不幸的是H2不直接支持ListAgg 但是我可以创建一个用户定义的聚合函数 import java sql Co
在 C 中将字符追加到字符数组

我想将一个字符附加到代表字符串的字符数组中我正在使用结构来表示字符串 struct String char c int length int maxLength String realloc弄乱了我的数组当我打印字符串时它会从内存中打
使用子查询 select 创建新表

我试图从子查询选择创建一个新表但出现以下错误附近的语法不正确 SELECT INTO foo FROM SELECT DATEPART MONTH a InvoiceDate as CalMonth DATEPART YEAR a In
如何从 SQL Server 2008 查询结果中删除“NULL”

我有一个包含 59 列和超过 17K 行的表很多行都有NULL在某些列中我想删除NULL以便查询返回空白而不是NULL 我可以运行一些更新功能来替换所有NULL with 使用 SQL Server 2008R2 Management
如何在 DB2 中创建返回序列值的函数？

如何在 DB2 中创建一个从序列中获取值并返回该值的函数应该可以在 select 或 insert 语句中使用该函数例如 select my func from xxx insert into xxx values my func 基本
删除数据库中的行后如何重新排序ID

我正在使用 C 来制作具有 sql 数据库的程序在数据库中我有一个名为Workers 它有一个自动增量和主键ID column 当我删除一条记录时 ID 之间会出现间隙删除记录后如何重新排序 ID UPDATE 我要做的就是找到记录后将
SELECT max(x) 返回 null；我怎样才能让它返回0？

运行以下命令时如何返回 0 而不是 null SELECT MAX X AS MaxX FROM tbl WHERE XID 1 假设没有XID 1的行 or SELECT coalesce MAX X 0 AS MaxX FROM tbl
SQL查询查找表的主键？

我怎样才能找到哪一列首要的关键使用查询来创建表这是重复的question https stackoverflow com questions 893874 mysql determine tables primary key dynami
mysql自动存储记录创建时间戳

mysql 有什么方法可以在创建记录时自动将时间戳存储在记录行中我试图使用时间戳数据类型和 current timestamp 作为默认值但后来意识到每次更新记录时都会更新我只需要一些可以存储创建时间戳的东西 Thanks Set
解析时区并转换为夏令时

我有一个 pandas 数据框Datetime column Datetime 0 2019 01 01 17 02 00 1 2019 01 01 17 03 00 2 2019 01 01 17 04 00 3 2019 01 01 1
谷歌的Dremel是什么？它与 MapReduce 有什么不同？

谷歌的 Dremel 是此处描述 http research google com pubs pub36632 html Dremel 和 Mapreduce 有什么区别 Dremel http research google com pu
如何使用 BigQuery 有效地选择另一个表中匹配子字符串的记录？

我有一个包含数百万个字符串的表我想将其与包含大约两万个字符串的表进行匹配如下所示 standardSQL SELECT record FROM record JOIN fragment ON record name LIKE CONCA
如何实现n个元素的查找和插入操作的动态二分查找

这个想法是使用多个数组每个长度为 2 k 根据 n 的二进制表示来存储 n 个元素每个数组都是排序的不同的数组没有以任何方式排序在上述数据结构中 SEARCH是通过对每个数组进行一系列二分查找来进行的 INSERT 是通过一系列相同
如何在 SQL Server 中连接

我的数据库没有特定的列因此我通过开关在查询中创建了一个列我需要的是将此列与数据库中的另一列连接起来 select certificateDuration DurationType case when certificateDuratio
如何部署“SQL Server Express + EF”应用程序

这是我第一次部署使用 SQL Server Express 数据库的应用程序我首先使用实体框架模型来联系数据库我使用 Install Shield 创建了一个安装向导来安装应用程序这些是我在目标计算机中安装应用程序所执行的步骤安装

随机推荐

如何使用 Python ntplib 将 ntp 服务器时间降低到毫秒精度？

我正在创建一个 python 模块它将从选定的 NTP 池服务器中输出精确到毫秒的时间作为显示服务器时间戳如何变化的练习到目前为止我已经能够以秒精度打印出源服务器时间戳但是如何获得毫秒精度 ntp pool 0 pool ntp
xmltask 对 dtd 感到困惑

我正在尝试使用 xmltask 让 ant 修改子目录中的文件 project path to file xml 该文件引用如下 DTD 我没有灵活性来更改这些文件该 DTD 存储在同一个子目录中一直运行良好 project path
每 5 秒仅响应一次事件

我正在尝试使用运行一个函数setInterval 并单击我想运行该功能somefunction 当我点击时每五秒只有一次这是我的代码 function somefunction do something setInterval fun
如何使用 swt.TabItem 添加关闭按钮？

TabFolder tabFolder new TabFolder composite SWT CLOSE TabItem tab1 new TabItem tabFolder SWT CLOSE tab1 setText Tab 1 Ta
OpenCL 内核是异步执行的吗？

对于 CUDA 我知道它们是在向默认流空流发出启动命令后异步执行的那么在 OpenCL 中又如何呢示例代码如下 cl context context cl device id device id cl int err cl kern
CSS 句子大小写[重复]

这个问题在这里已经有答案了有什么办法可以格式化句子大小写吗例如这是句子 1 这是句子 2 这是句子 3 更改为 gt 这是句子 1 这是句子 2 这是句子 3 您可以使用id class first letter财产来实现这一目标
Protractor 在构建服务器上失败 - ElementNotVisibleError

我使用量角器和黄瓜进行的所有角度 e2e 测试都在我的机器上顺利运行但是当我在构建服务器上运行测试时我收到一个错误 ElementNotVisibleError 元素不可见会话信息 chrome 51 0 2704 84 驱动程序信息
将 React 导入 next.js 页面（以及 React 和 CRA 应用程序）

我有一个 Next js 应用程序其中有几个页面所有页面看起来都很相似 import React Component from react import from components Wrapper export default cl
Swift 中的 ArraySlice 索引超出范围

我有以下格式的数据数据1 1 数据1 2 数据1 3 数据1 4 数据2 1 数据2 2 数据2 3 数据2 4 DATA3 1 DATA3 2 DATA3 3 DATA3 4 我需要在数组的每个组件中执行特定操作组件之间用分隔换句
jq 使用嵌套数组元素的值进行排序

我需要一些帮助使用jq对每个元素包含嵌套的元素数组进行排序tags元素数组我的输入 JSON 如下所示 result name ct 1 tags key service name value BaseCT key sequence va
存储库模式 - POCO 还是 IQueryable？

我是存储库模式的新手在网上阅读了大量内容后我对正在发生的事情有了粗略的了解但似乎存在思想冲突一是 IRepository 应返回的内容我只想处理 Pocos 所以我将为每个聚合根都有一个存储库实现如下所示 public clas
Java 服务器的单个或多个线程池？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我正在编写一个相当复杂的 Java 服务器应用程序除了通常的请求响应处理之外它还具有重要的后台处理部分一些后台处理是使用 Quartz 框
如何授予 Linux 用户 sudo 访问权限？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在尝试向我的一位用户授予 sudo 访问权限我应该在终端中输入什么你需要跑步visudo然后在打开的编辑器中写入 igor ALL ALL A
如何在 PowerShell 字符串文字中对 32 位 Unicode 字符进行编码？

这个堆栈溢出问题 https stackoverflow com questions 1056692 how to encode unicode character codes in a powershell string literal处
如何将“Red”等字符串转换为 System.Windows.Media.Color？

我知道我可以走很长的路添加对 System Drawing 的引用从字符串创建 System Drawing Color 从 System Drawing Color 的 ARGB 值创建 System Windows Media Co
调度程序初始化失败。 java.lang.ClassNotFoundException: org.apache.struts2.views.gxp.inject.InjectedObjectContainer

我正在使用 Struts 2 3 14 2 jar 但是当我创建简单的应用程序时我收到以下错误异常我几乎把每件事都做得很完美我在类路径中添加了几乎所有罐子但仍然遇到这个异常我错过了什么吗 SEVERE Dispatcher in
为什么我们需要分开编译和链接？

是否可以在编译时进行链接并删除单独的链接步骤您一次编译一个或多个翻译单元但就语言而言编译时会单独考虑每个 TU 您可以将一个或多个翻译单元链接在一起因此如果程序中的所有 TU 同时编译您可以在那时链接它们好吧通常链接会在编
为什么我的 iOS 应用程序无法在 iPod touch 上运行？

我编写了一个通用的 iOS 应用程序它可以在我的 iPhone 和 iPad 上运行良好但不能在我的旧 iPod touch 上运行 X 代码甚至不传输二进制文件它只是说完成在设备名上运行程序名部署目标是4 2 iPod touc
为什么内联 JS 块不安全？

我正在阅读 Chrome 扩展文档内容安全策略 CSP http developer chrome com extensions contentSecurityPolicy html 它说内联 JavaScript 以及危险的字符串到
如何根据 BigQuery 中的另一个现有行为每个用户添加记录？

在这里发帖以防知识渊博的人能够帮助我找到一些方向我有一个这样的表 Row date user id score 1 20201120 1 26 2 20201121 1 14 3 20201125 1 0 4 20201114 2 32

如何根据 BigQuery 中的另一个现有行为每个用户添加记录？

如何根据 BigQuery 中的另一个现有行为每个用户添加记录？ 的相关文章

随机推荐

热门标签

如何根据 BigQuery 中的另一个现有行为每个用户添加记录？的相关文章