几种空值填充

发布时间:2018-11-03 16:04:52 作者:spyboyyu 阅读量:2525

import pandas as pd

import numpy as np 

import matplotlib.pyplot as plt

%matplotlib inline

import seaborn as sns

train=pd.read_csv('../data.csv')

空值填充

train.isnull().sum()


train.info()

sns.boxplot(train1['LotFrontage'])


### 分布


sns.distplot(train['LotFrontage'].dropna())


### 均值填充


sns.distplot(train['LotFrontage'].fillna(train['LotFrontage'].mean()))


### 中值填充


sns.distplot(train['LotFrontage'].fillna(train['LotFrontage'].median()))


### 高频值填充


sns.distplot(train['LotFrontage'].fillna(train['LotFrontage'].mode()[0]))


### 随机填充


sns.distplot(train['LotFrontage'].fillna(np.random.normal(train['LotFrontage'].mean(),train['LotFrontage'].std())))


    分享到:



我要评论 登录后才能发布评论

Copyright © 2017 - 2031 昱树临风
京ICP备 17072245号
Catfish(鲶鱼) CMS V 5.9.6