Pandasで欠損値のある行、列を削除する方法を紹介します。
使用するデータフレーム
data変数に以下のデータフレームが入っていると仮定します。
Name Age Gender Address 0 田中 太郎 17 male NaN 1 NaN NaN NaN NaN 2 渋井丸 巧 20 male NaN 3 社畜 丸 22 male 会社 4 宗竜 レイ 28 female 日本
書き方
data.dropna(axis = , how = "any")
- axisを省略するかaxis = 0とすることで欠損値のある行が削除されます。
- axis = 1とすることで欠損値のある列が削除されます。
- how = "any"とするか省略をすることで、欠損値のある行もしくは列が削除されます。
欠損値を削除
欠損値のある行を削除します。
data.dropna(axis = 0 , how = "any")
Name Age Gender Address 3 社畜 丸 22 male 会社 4 宗竜 レイ 28 female 日本
無事欠損値のある行が削除されましたね。
以下のように書いても同じ結果が得られます。
data.dropna()
全て欠損値の行、列を削除する方法
how = "all"とします。
data.dropna(axis = 0 , how = "all")
Name Age Gender Address 0 田中 太郎 17 male NaN 2 渋井丸 巧 20 male NaN 3 社畜 丸 22 male 会社 4 宗竜 レイ 28 female 日本
axis = 1とすることで全て欠損値の列を削除します。