缺失值的类型必须转化为np.nan类型

replace('?',np.nan)#用pandas的replace    用np.nan替换

sklearn中处理缺失值

from sklearn.preprocessing import Imputer

例如

这里有个含有缺失值的二维数组

[1,3,6],[np.nan,2,4],[2,8,5]

利用sklearn处理

 imp=Imputer()
    data=imp.fit_transform([[1,3,6],[np.nan,2,4],[2,8,5]])
    print(data)

结果如下

在这里插入图片描述

Logo

技术共进,成长同行——讯飞AI开发者社区

更多推荐