我需要将大型数据帧转换为 numpy 数组。
仅保留数值和类型。
我知道有很多有据可查的方法可以做到这一点。
那么,更喜欢哪一个呢?
df.values
df._as_matrix()
pd.to_numeric(df)
... others ...
决定因素:
您提到的功能有不同的用途。
pd.to_numeric https://pandas.pydata.org/pandas-docs/stable/generated/pandas.to_numeric.html:如果您的数据当前未以数字形式存储,请使用它来转换数据框中的类型or如果你希望
通过以下方式投射为最佳类型downcast='float'
or
downcast='integer'
.
pd.DataFrame.to_numpy() http://pandas.pydata.org/pandas-docs/version/0.24.0rc1/api/generated/pandas.DataFrame.to_numpy.html(v0.24+) 或pd.DataFrame.values https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.values.html:用这个来检索numpy
数据框的数组表示。
pd.DataFrame.as_matrix https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.as_matrix.html: 不要使用这个。包含它只是为了向后兼容。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)