我有一个数据框,需要列的子集包含具有多个值的条目。下面是一个带有“运行时”列的数据框,其中包含程序在各种条件下的运行时:
df = [{"condition": "a", "runtimes": [1,1.5,2]}, {"condition": "b", "runtimes": [0.5,0.75,1]}]
df = pandas.DataFrame(df)
这会生成一个数据框:
condition runtimes
0 a [1, 1.5, 2]
1 b [0.5, 0.75, 1]
我如何使用这个数据框并让 pandas 将其值视为数字列表?例如计算行中“运行时”列的平均值?
df["runtimes"].mean()
给出错误:"Could not convert [1, 1.5, 2, 0.5, 0.75, 1] to numeric"
使用此数据框并将它们序列化为 csv 文件会很有用,其中列表如下:[1, 1.5, 2]
被转换成"1,1.5,2"
这样它仍然是 csv 文件中的单个条目。