【pandas】100日チャレンジ : 4日目 DataFrameの簡単な操作

※この記事は2020年11月8日に更新されました。

ポイント

プログラミング学習が義務教育でも取り入れられるようになり、ほぼすべての人が避けては通れない時代に突入してしまいました。

基本的にはローコードやノーコードテクノロジーが発達し、個人で隅々まで覚える必要はないとも言えますが、やはり自在に操れればまさに100人力とも言えます。

Pythonやpandasの技術があなたがやりたい何かに合致した場合、是非100日でサクッと覚えてしまいましょう。

100日でざっくりと基礎を身に着けられるように構成しています。

Pythonコース【.pro】 Python 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイルを学ぶオンライン講座

4日目 DataFrameの簡単な操作

本日は簡単な操作ということで、まずはリスト型にてcolumnsとindexの名前をそれぞれ指定せずにデータフレームを作成してみます。

df = pd.DataFrame([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
df

このようになりました。

名前を指定せずに作成すると、自動的にゼロからスタートしナンバリングされていきます。

それぞれ名称を指定

では、columnsとindexの名前をそれぞれ指定してみましょう。

df.columns=["co01", "co02", "co03"]
df.index=["id01", "id02", "id03"]

[9]でDataFrameを実行しています。

名称を変更

次に名称を変更してみましょう。

まずは、columnsから。

全体を変更する場合は上書きでOKです。

先ほどのコードの続きから・・・

df.columns=["co04", "co05", "co06"]

を入力し、DataFrameを実行。

df

ばっちりcolumns名が変更されています。

一部分のみ変更する場合 = rename

では、試しに[co05]を[kotaro]に変更してみましょう。

df = df.rename(columns={"co05": "kotaro"})
df

変更できました。

renameを指示したあと、変更前の名称を指定し、[:]で入れ替えます。

それでは本日登場した3つのcolumnsすべてを指定して変更してみます。

それぞれTaroとMasakoに変更してみましょう。

df = df.rename(columns={"co04": "Taro","co06": "Masako"})
df

ばっちりですね!

続けてindexもやっちゃいましょう。

ルールは同じです。

先ほどのcolumnsの変更をindexでもするだけです。

それぞれ月曜日、火曜日、水曜日と変更してみます。

df = df.rename(index={"id01": "月曜日", "id02": "火曜日", "id03": "水曜日"})
df

まとめ

部分的にrenaemする場合は辞書型の{}を使いますので注意しましょう。

これでどの列・行でも自由自在にrenameできるようになりました。