Pandasで任意の文字で文字列を分割してカラムを作成する方法を紹介します。
使用するデータフレーム
data変数に以下のデータフレームが入っていると仮定します。
Name Age Gender Address 0 田中:太郎 17 male 東京 1 鈴木:一郎 43 male 大阪 2 渋井丸:巧 20 male 渋谷 3 社畜:丸 22 male 会社 4 宗竜:レイ 28 female 日本
書き方
data["一時保存カラム名"] = data["分割したいカラム"].str.split("分割文字") #分割した文字列を一時保存 data["カラム名"] = data["一時保存カラム名"].str.get(0) data["カラム名"] = data["一時保存カラム名"].str.get(1)
使用例
dataのNameを:で区切りfirst_nameとlast_nameで分けます。
data["Split"] = data["Name"].str.split(":") data["First_name"] = data["Split"].str.get(0) data["Lase_name"] = data["Split"].str.get(1)
Name Age Gender Address Split First_name Lase_name 0 田中:太郎 17 male 東京 [田中, 太郎] 田中 太郎 1 鈴木:一郎 43 male 大阪 [鈴木, 一郎] 鈴木 一郎 2 渋井丸:巧 20 male 渋谷 [渋井丸, 巧] 渋井丸 巧 3 社畜:丸 22 male 会社 [社畜, 丸] 社畜 丸 4 宗竜:レイ 28 female 日本 [宗竜, レイ] 宗竜 レイ