我想创建带有连续数字的列pyspark从指定编号开始的数据帧。例如,我想添加列A到我的数据框df这将从5到我的数据帧的长度,增加一,所以5, 6, 7, ..., length(df).
一些简单的解决方案使用pyspark方法?
您可以使用以下方法执行此操作range
df_len = 100
freq =1
ref = spark.range(
5, df_len, freq
).toDF("id")
ref.show(10)
+---+
| id|
+---+
| 5|
| 6|
| 7|
| 8|
| 9|
| 10|
| 11|
| 12|
| 13|
| 14|
+---+
仅显示前 10 行
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)