原始问题
我陷入了以下问题。我试图找出车辆在工厂存放的具体时间和时间。我有一个 Excel 工作表,其中存储了所有事件,这些事件要么是交付路线,要么是维护事件。最终目标是获得一个数据帧,其中给出了车辆登记号以及相应的到达工厂和在那里花费的时间(包括维护操作)。对于感兴趣的人来说,这是因为我最终希望能够安排对车辆的非关键维护操作。
我的数据框的一个例子是:
Registration RoutID Date Dep Loc Arr Loc Dep Time Arr Time Days
0 XC66 A58 20/May/17 Home Loc A 10:54 21:56 0
1 XC66 A59 21/May/17 Loc A Home 00:12 10:36 0
2 XC66 A345 21/May/17 Home Loc B 12:41 19:16 0
3 XC66 A346 21/May/17 Loc B Loc C 20:50 03:49 1
4 XC66 A347 22/May/17 Loc C Home 06:10 07:40 0
5 XC66 #M1 22/May/17 Home Home 10:51 13:00 0
我创建了一个脚本,其中的日期和时间均经过处理,以便为到达和出发日期时间创建正确的日期时间列。对于维护期间:“Dep Loc”= Home 且“Arr Loc”= Home,以下代码用于选出相关行:
df_home = df[df["Dep Loc"].isin(["Home"])]
df_home = df_home[df_home["Arr Loc"].isin(["Home"])]
从这里我可以轻松减去日期来创建持续时间列。
到目前为止,一切都很好。然而,我在其他时间坚持使用计算。这是因为可能存在中间停止,因此 .shift() 函数不起作用,因为要移动的行数不是恒定的。
我试图搜索这个问题,但我只能找到班次解决方案,或者基于内部事件时间的答案,而不是基于事件之间的时间。
任何正确方向的指导将不胜感激!
Regards
解决方案的尝试
我已经被这个问题困扰了一段时间,但在发布这个问题后不久我尝试了这个解决方案:
for idx, loc in enumerate(df["Arr Loc"]):
if loc == "Home":
a = ((idx2, obj) for idx2, obj in enumerate(df["Dep Loc"]) if (obj == "Home" and idx2 > idx))
idx_next = next(a)
idx_next = idx_next[0]
Arrival_times = df["Arr Time"]
Departure_times = df["Dep Time"]
Duration = Arrival_times[idx] - Departure_times[idx_next]
在这里,我使用 next 函数来查找下一次出现的 Home 作为起始位置(即车辆离开基地的时间)。随后,我将两个日期相减以找到正确的时差。
它适用于小数据集,但仍不适用于整个数据集。