我有一个名为“源”的列,其中包含数百行文本。
问题是,其中一些可以组合在一起,而我正在努力在 Pandas 数据框中做到这一点。这是我的代码:
df.source.replace({
df.source.str.startswith('share', na=False): 'sharePet',
df.source.str.startswith('2012-01-08', na=False): 'shareDate'
})
另外,这适用于以日期开头的第二行吗?如果没有,我可以将其保留在第一行和其他文本分组中。
希望得到一些建议。
您可以使用字典并迭代:
d = {'share': 'sharePet', '2012-01-08': 'shareDate'}
for k, v in d.items():
df.loc[df['source'].str.startswith(k, na=False), 'source'] = v
Pandas str.startswith
仅适用于字符串。您可以通过以下方式轻松检查系列中存在哪些类型set(map(type, df['source']))
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)