SQL实战5——统计活跃间隔对用户分级结果

2023-11-15

现有用户行为日志表tb_user_log

问题：统计活跃间隔对用户分级后，各活跃等级用户占比，结果保留两位小数，且按占比降序排序。

注：

用户等级标准简化为：忠实用户(近7天活跃过且非新晋用户)、新晋用户(近7天新增)、沉睡用户(近7天未活跃但更早前活跃过)、流失用户(近30天未活跃但更早前活跃过)。
假设今天就是数据中所有日期的最大值。
近7天表示包含当天T的近7天，即闭区间[T-6, T]。

问题分解：

计算每个用户最早最晚活跃日期（作为子表t_uid_first_last）：
- 按用户ID分组：GROUP BY uid
- 统计最早活跃：MIN(DATE(in_time)) as first_dt
- 统计最晚活跃：MAX(DATE(out_time)) as last_dt
计算当前日期和总用户数（作为子表t_overall_info）：
- 获取当前日期：MAX(DATE(out_time)) as cur_dt
- 统计总用户数：COUNT(DISTINCT uid) as user_cnt
左连接两表，即将全表统计信息追加到每一行上：t_uid_first_last LEFT JOIN t_overall_info ON 1
计算最早最晚活跃离当前天数差（作为子表t_user_info）：
- 最早活跃距今天数：TIMESTAMPDIFF(DAY,first_dt,cur_dt) as first_dt_diff
- 最晚（最近）活跃距今天数：TIMESTAMPDIFF(DAY,last_dt,cur_dt) as last_dt_diff

计算每个用户的活跃等级：

CASE

WHEN last_dt_diff >= 30 THEN "流失用户"

WHEN last_dt_diff >= 7 THEN "沉睡用户"

WHEN first_dt_diff < 7 THEN "新晋用户"

ELSE "忠实用户"

END as user_grade

统计每个等级的占比：
- 按用户等级分组：GROUP BY user_grade
- 计算占比，总人数从子表得到，非聚合列避免语法错误加了MAX：COUNT(uid) / MAX(user_cnt) as ratio
- 保留2位小数：ROUND(x, 2)

完整代码：

SELECT user_grade, ROUND(COUNT(uid) / MAX(user_cnt), 2) as ratio
FROM (
    SELECT uid, user_cnt,
        CASE
            WHEN last_dt_diff >= 30 THEN "流失用户"
            WHEN last_dt_diff >= 7 THEN "沉睡用户"
            WHEN first_dt_diff < 7 THEN "新晋用户"
            ELSE "忠实用户"
        END as user_grade
    FROM (
        SELECT uid, user_cnt,
            TIMESTAMPDIFF(DAY,first_dt,cur_dt) as first_dt_diff, 
            TIMESTAMPDIFF(DAY,last_dt,cur_dt) as last_dt_diff
        FROM (
            SELECT uid, MIN(DATE(in_time)) as first_dt,
                MAX(DATE(out_time)) as last_dt
            FROM tb_user_log
            GROUP BY uid
        ) as t_uid_first_last
        LEFT JOIN (
            SELECT MAX(DATE(out_time)) as cur_dt,
                COUNT(DISTINCT uid) as user_cnt
            FROM tb_user_log
        ) as t_overall_info ON 1=1
    ) as t_user_info
) as t_user_grade
GROUP BY user_grade
ORDER BY ratio DESC;

最后附上原数据表方便大家练习：

DROP TABLE IF EXISTS tb_user_log;
CREATE TABLE tb_user_log (
    id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
    uid INT NOT NULL COMMENT '用户ID',
    artical_id INT NOT NULL COMMENT '视频ID',
    in_time datetime COMMENT '进入时间',
    out_time datetime COMMENT '离开时间',
    sign_in TINYINT DEFAULT 0 COMMENT '是否签到'
) CHARACTER SET utf8 COLLATE utf8_bin;

INSERT INTO tb_user_log(uid, artical_id, in_time, out_time, sign_in) VALUES
  (109, 9001, '2021-08-31 10:00:00', '2021-08-31 10:00:09', 0),
  (109, 9002, '2021-11-04 11:00:55', '2021-11-04 11:00:59', 0),
  (108, 9001, '2021-09-01 10:00:01', '2021-09-01 10:01:50', 0),
  (108, 9001, '2021-11-03 10:00:01', '2021-11-03 10:01:50', 0),
  (104, 9001, '2021-11-02 10:00:28', '2021-11-02 10:00:50', 0),
  (104, 9003, '2021-09-03 11:00:45', '2021-09-03 11:00:55', 0),
  (105, 9003, '2021-11-03 11:00:53', '2021-11-03 11:00:59', 0),
  (102, 9001, '2021-10-30 10:00:00', '2021-10-30 10:00:09', 0),
  (103, 9001, '2021-10-21 10:00:00', '2021-10-21 10:00:09', 0),
  (101, 0, '2021-10-01 10:00:00', '2021-10-01 10:00:42', 1);

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

SQL实战

sql

SQL实战5——统计活跃间隔对用户分级结果的相关文章

MYSQL中收盘价的简单移动平均线计算和更新表

我可以使用一些帮助最好是虚拟指南来更新下表 CREATE TABLE SYMBOL day date NOT NULL open decimal 8 3 DEFAULT NULL high decimal 8 3 DEFAULT NUL
MYSQL 查询返回“资源 id#12”而不是它应返回的数值

不知道为什么但这返回了错误的值我正在取回此资源 ID 12 而不是我正在寻找的数值 1 执行此操作的代码是 type SELECT account type from user attribs WHERE username userna
使用 to_char 格式化间隔

以下 SQL 命令 select TO CHAR NVL arg1 arg2 TO DSINTERVAL 0 00 00 00 from table1 生成格式为 000000000 00 03 01 954000 的结果是否可以在 to
SQL Server 2008 R2 的 Try_Convert

我正在使用 SQL Server 2008 R2 并且有一个VARCHAR我想要转换为的列DECIMAL 28 10 using CONVERT 但其中许多行的格式错误因此无法将它们解析为数字在这种情况下我只想通过将结果设置为 0 或
SQL SERVER 中的排序依据和大小写

我需要在存储过程中按功能排序一个值被发布到网络服务并且基于该值我必须以某种方式对结果进行排序即当 ColName 按 ColName 发布订单时当 ColName2 由 ColName2 发布订单时我正在研究使用 Case 但出
如何在sqlite中创建物化视图？

我对物化视图和 SQLite 进行了无数次搜索据我所知 2004 年和 2006 年似乎有人提到 SQLite 没有物化视图紧随其后的是 SQLite 的变更日志2008年3月 http www sqlite org releaselo
将 UPDATE 转换为 INSERT INTO ON DUPLICATE KEY UPDATE 语句

我有这个 UPDATE MySQL 语句效果很好 UPDATE table1 Inner Join table2 ON table2 id table1 gw id SET table1 field1 1 table1 field2 2
创建表作为 select 删除 postgresql 中的非空约束

在 postgres sql 中创建表时 select 删除了表上的非空约束例如对此没有单一命令的解决方案要基于现有表包括所有约束创建表请使用 create table B like a including constrain
如何在 sqlalchemy 中创建基于文字的查询？

我创建了一个函数来创建表达式 def test operator1 operation operator2 return literal column operator1 op operation operator2 现在当我用 test
如何有效地从 DB2 表中删除所有行

我有一个大约有 50 万行的表我想删除所有行如果我做简单的delete from tbl 事务日志已满我不关心这种情况下的事务无论如何我都不想回滚我可以删除许多事务中的行但是有更好的方法吗如何有效地从 DB2 中的表中删除所有
使用 MS Access 获取行的第一个实例

EDITED 我有这个查询我想SELECT表中记录的第一个实例petTable SELECT id pet ID FIRST petName First Description FROM petTable GROUP BY pet ID
如何使用 MySQL 的 LOAD DATA LOCAL INFILE 在导入 CSV 时将字符串日期更改为 MySQL 日期格式

我正在使用 MySQL 的 LOAD DATA LOCAL INFILE SQL 语句将数据从 CSV 文件加载到现有数据库表中下面是一个 SQL 语句示例 LOAD DATA LOCAL INFILE file csv INTO TAB
复选框上的数据绑定

我目前正在将数据从 SQL 数据库之一提取到我的应用程序中我可以让它适用于我的文本框和其他项目但是我似乎无法让它适用于复选框这是我正在使用的代码 DataTable dt new DataTable dt using SqlConn
如何使用PostGIS将多边形数据转换为线段

我在 PostgreSQL PostGIS 中有一个多边形数据表现在我需要将此多边形数据转换为其相应的线段谁能告诉我如何使用 PostGIS 查询进行转换提前致谢一般来说将多边形转换为线可能并不简单因为没有一对一的映射 http
如何在 SQL Server 中使用 nvarchar 变量为 unicode 用户添加前缀“N”？

如何在 SQL Server 中使用 nvarchar 变量为 unicode 用户添加前缀 N 例如给定这个变量 declare Query1 nvarchar max 我可以这样分配它 set Query1 N 但是如果我想使用怎么办
Mysql 检索所有有限制的行

我想检索特定用户的所有行限制为 0 x 所以我只是想问是否有任何方法可以检索 mysql 中的所有行而不调用返回 x 的 count id 的方法而不重载现有函数该函数在查询中根本没有限制与我们的 string Relace 功能
如何在 Visual Studio 中更改 Azure 数据库表的列顺序

我整个下午都在寻找在 MS Visual Studio 2022 中重新排序 Azure 数据库表列的方法没有运气在其他应用程序中可以通过拖动或剪切和粘贴轻松重新排列列这里无能为力此时我什至不确定可以在 VS 中移动列我只对
在一个数据访问层中处理多个连接字符串

我有一个有趣的困境我目前有一个数据访问层它必须与多个域一起使用并且每个域都有多个数据库存储库具体取决于所调用的存储过程目前我只需使用 SWITCH 语句来确定应用程序正在运行的计算机并从 Web config 返回适当的连接字
sql server 按组排名

问题看似简单但我却无法理解这是针对 sql 服务器的 what I have in a table What I need as a output cksum id cksum id 2162514679 204 2162514679
如何在 PostgreSQL 中使用具有多个值的 SQL LIKE 条件？

有没有更短的方法来查找多个匹配项 SELECT from table WHERE column LIKE AAA OR column LIKE BBB OR column LIKE CCC 这个问题适用于 PostgreSQL 9 1 但如

随机推荐

浅谈 one-stage 与 two-stage 目标检测方法

由于目前实习及找工作的原因博客更新的频率下降而在面试过程中也发现虽然论文是看过了包括也有输出一些论文笔记但是很多时候无法形成自己对该领域的一个概括性的认知无法粗中有细细中有粗主要还是基本功不扎实反应了自己在日常学习中的学习
快速排序（qsort）

快速排序排序方法有很多种选择排序冒泡排序归并排序快速排序等看名字都知道快速排序是目前公认的一种比较好的排序算法快速排序的核心思想是二分法在此我以升序为例首先我们需要选取一个基准数temp 再通过循环比较将比基准数小的
mysql安装版的下载与安装（windows）

https blog csdn net heting717 article details 73497005 这是安装版挺方便的
soft fork and hard fork

https bitcoin stackexchange com questions 30817 what is a soft fork https blog csdn net chabuduoxiansheng1 article detai
【OpenAI】《Zotero GPT

Zotero GPT 如何调教你的GPT 此教程讲述了tag的代码构成 ZoteroGPT中tag的效果就有点像浏览器中的插件 Time Content 0 51 一个tag的基本组成 5 32 tag的工作原理 6 33 删除和新建tag
KVM-7、KVM 虚拟机创建的几种方式

通过对 qemu kvm libvirt 的学习总结三种创建虚拟机的方式 1 通过 qemu kvm 创建 2 通过 virt install 创建 3 通过 virt manager 创建在使用这三种创建虚拟机前提是宿主机必须支持
数据可视化——seaborn（一）

数据可视化 seaborn 二简介 seaborn这个库是基于matplotlib并且数据结构与pandas统一的python制图库 seaborn提供了一个高级界面它是在matplotlib上进行了更高级的API封装因此使得制图更加
Python学习笔记之os.walk()函数

我们使用os listdir 函数来列出目录下的所有文件和目录放入一个列表进行返回但是listdir 函数不可对目录的子目录进行扫描 print os listdir 输出 boot dev home proc run sys etc r
前端和后台数据交互总结

web服务器应用程序 apache tomcat nodeJs Nginx IIS 后台语言 php java net nodeJS 数据库 Mysql SqlServer Oracle 后台mvc ssh ssm 前台mvc js jsp
TensorFlow索引与切片语句

学习课程 1 Basic indexing a tf ones 1 5 5 3 创建tensor a 0 0 结果是5 3的tensor a 0 0 0 结果是1 3的tensor a 0 0 0 1 结果是一个数1 2 Numpy sty
python汇总zip文件，压缩包的每个文件格式一样

汇总zip文件压缩包的每个文件格式一模一样 from zipfile import ZipFile import pandas as pd import os 打开文件 path r C Users Administrator Deskt
gcc/g++ 编译器使用简介

gcc g 编译器使用简介原地址 http blogold chinaunix net u3 109487 showart 2153853 html GNU CC 简称gcc 是GNU项目中符合ANSI C标准的编译系统能够编译用C C
WireShark简介和抓包原理及过程

WireShark 简介 WireShark是一个网络封包分析软件其功能是记录网络封包并尽可能显示出最为详细的网络封包信息 WireShark使用WinPCAP作为接口直接与网卡进行数据报文交换通俗理解一个记录网络封包软件你可以
python怎么调用另一个py文件的变量_Python中py文件引用另一个py文件变量的方法

最近自己初学Python 在编程是遇到一个问题就是怎样在一个py文件中使用另一个py文件中变量问题如下 demo1代码 import requests r requests get http www baidu com r encodi
【Linux】常用指令汇总

目录 1 文件和目录操作 2 进程管理和查询 3 压缩和解压操作 4 系统信息和管理 5 远程和下载操作 6 用户和权限管理 7 时间和日期操作 8 运行和停止程序 9 其他操作如果这篇文章对你有所帮助渴望获得你的一个点赞以下示例涵盖
3S基础知识：VC6.0+MapX编程总结

一 MapX的帮助 MapX的官方帮助文档是 MapX在线帮助个人认为这套文档过于简单系统性偏差与ArcEngine的帮助文档不可比很多MapX的开发技巧在 MapX在线帮助中查找不到只能在互联网上搜索本文试图从一个程序员的
1V转5V芯片，三个元件即可组成完整的稳压方案

1V低电压要转成5V的电压需要1V转5V的芯片由于1V输入所以不需要指望能输出多大的电流压差和1V的供电电压意味着供电电流也是无法做大的了一般1V转5V的输出电流在0MA 100mA 一般60MA应用多 1V转5V电路的BOM物料
[LeetCode]202. Happy Number(判断正整数是不是Happy Number)

202 Happy Number 原题链接 Write an algorithm to determine if a number is happy A happy number is a number defined by the fol
java.lang.Integer线程安全吗？

java lang Integer线程安全因为 private final int value 不可变
SQL实战5——统计活跃间隔对用户分级结果

现有用户行为日志表tb user log 问题统计活跃间隔对用户分级后各活跃等级用户占比结果保留两位小数且按占比降序排序注用户等级标准简化为忠实用户近7天活跃过且非新晋用户新晋用户近7天新增沉睡用户近7天未活跃但更早

SQL实战5——统计活跃间隔对用户分级结果

问题分解：

SQL实战5——统计活跃间隔对用户分级结果 的相关文章

随机推荐

热门标签

SQL实战5——统计活跃间隔对用户分级结果的相关文章