我正在尝试对以下内容执行一些文本分析pandas
dataframe
,但我在流程上遇到了一些问题。或者,也许我只是不明白...... PS - 我是一个Python初学者。
数据框示例:
df = pd.DataFrame({'Document' : ['a','1','a', '6','7','N'], 'Type' : ['7', 'E', 'Y', '6', 'C', '9']})
Document Type
0 a 7
1 1 E
2 a Y
3 6 6
4 7 C
5 N 9
我正在尝试构建一个流程,如果“文档”或“类型”是数字或不是数字,则执行某些操作。
这是一个简单的函数,用于返回“文档”是否为数字(经过编辑以显示我如何在该字段上尝试一些 if/then 流程):
def fn(dfname):
if dfname['Document'].apply(str.isdigit):
dfname['Check'] = 'Y'
else:
dfname['Check'] = 'N'
Now, I apply
它到数据框:
df.apply(fn(df), axis=0)
我得到这个错误:
TypeError: ("'NoneType' object is not callable", u'occurred at index Document')
从错误消息看来,我没有正确处理索引。谁能看到我哪里出错了?
最后 - 这可能与问题相关,也可能无关,但我真的很苦恼如何indexes
工作于pandas
。我认为我遇到的索引问题比任何其他问题都多。