Pandas Python

Pandasで欠損値のある行、列を削除する方法

更新日:

Pandas欠損値のある行、列を削除する方法を紹介します。

使用するデータフレーム

data変数に以下のデータフレームが入っていると仮定します。

	Name	 Age	Gender	Address
0	田中 太郎	 17	   male	NaN
1	   NaN	 NaN	 NaN	NaN
2	渋井丸 巧	 20	   male	NaN
3	社畜  丸	 22	   male	会社
4	宗竜 レイ	 28	   female	日本

書き方

data.dropna(axis =  , how = "any")
  • axisを省略するかaxis = 0とすることで欠損値のある行が削除されます。
  • axis = 1とすることで欠損値のある列が削除されます。
  • how = "any"とするか省略をすることで、欠損値のある行もしくは列が削除されます。

欠損値を削除

欠損値のある行を削除します。

data.dropna(axis = 0 , how = "any")
	Name	 Age	Gender	Address
3	社畜  丸	 22	   male	会社
4	宗竜 レイ	 28	   female	日本

無事欠損値のある行が削除されましたね。
以下のように書いても同じ結果が得られます。

data.dropna()

全て欠損値の行、列を削除する方法

how = "all"とします。

data.dropna(axis = 0 , how = "all")
	Name	 Age	Gender	Address
0	田中 太郎	 17	   male	NaN
2	渋井丸 巧	 20	   male	NaN
3	社畜  丸	 22	   male	会社
4	宗竜 レイ	 28	   female	日本

axis = 1とすることで全て欠損値の列を削除します。





-Pandas, Python
-,

Copyright© 初めてのデータサイエンス , 2024 All Rights Reserved Powered by STINGER.