我的数据看起来像
姓名|来自 |前往城市 |请求日期
安迪|巴黎 |伦敦| 2014年8月21日 12:00
莉娜 |科隆 |柏林 | 2014年8月22日 18:00
安迪|巴黎 |伦敦 | 2014年8月22日 06:00
丽莎|罗马 |尼尔佩尔 | 2014年8月25日 18:00
莉娜 |罗马 |伦敦 | 2014年8月21日 20:00
丽莎|罗马 |尼尔佩尔 | 2014年8月24日 18:00
安迪|巴黎 |伦敦| 2014年8月25日 12:00
我想知道一个人在 +/- 一天内有多少个相同的驱动器请求。我很乐意收到一张桌子,上面写着:
姓名|来自 |前往城市 |平均请求日期| # 要求
安迪|巴黎 |伦敦| 2014/08/21 21:00 | 2
莉娜 |科隆 |柏林 | 2014/08/22 18:00 | 1
丽莎|罗马 |尼尔佩尔 | 2014/08/25 06:00 | 2
莉娜 |罗马 |伦敦 | 2014/08/21 20:00 | 1
安迪|巴黎 |伦敦| 2014/08/25 12:00 | 1
这将是一个结果group by条款。但是,编写这样一个条件来检查初始请求后 24 小时内是否有相同的请求以及有多少个相同的请求,通常是否可行?
现在我在Excel中下载数据并在那里执行,但是数据很多,因此效率不高......
样本数据:
让我们首先构建一个示例数据集:
select * from (select 'Andy' as name,'Paris' as f,'London' as to, '2014-08-21 12:00' as date),
(select 'Lena' as name,'Koln' as f,'Berlin' as to, '2014-08-22 18:00' as date),
(select 'Andy' as name,'Paris' as f,'London' as to, '2014-08-22 06:00' as date),
(select 'Lisa' as name,'Rome' as f,'Neapel' as to, '2014-08-25 18:00' as date),
(select 'Lena' as name,'Rome' as f,'London' as to, '2014-08-21 20:00' as date),
(select 'Lisa' as name,'Rome' as f,'Neapel' as to, '2014-08-24 18:00' as date),
(select 'Andy' as name,'Paris' as f,'London' as to, '2014-08-25 12:00' as date)