閉じる

【pandas】23日目 DataFrame とは?

※この記事は2020年11月3日に更新されました。

ポイント

プログラミング学習が義務教育でも取り入れられるようになり、ほぼすべての人が避けては通れない時代に突入してしまいました。
基本的にはローコードやノーコードテクノロジーが発達し、個人で隅々まで覚える必要はないとも言えますが、やはり自在に操れればまさに100人力とも言えます。
プログラミングがあなたのやりたい何かに合致した場合、是非100日でサクッと覚えてしまいましょう。
100日でざっくりと基礎を身に着けられるように構成しています。

データフレームを把握する

1-11-21-3
2-12-22-3
3-13-23-3

データフレームとはラベル付き二次元配列のことを言います。

エクセルなどでもお馴染みですよね。

上の表で見た時の[1-1]~[1-3]までの列を一次元配列と呼びます。

ここに1-1, 2-1, 3-1 が加わり、二次元配列となります。

インデックスとカラム

[1-2]~[1-3]までの部分を[colums(列)]と言います。

[2-1]~[2-3]までの部分を[index(行)]と言います。

[2-2, 2-3, 3-2, 3-3]部分がデータ部分です。

pandasではこれらのcolumsとindexでデータを表現します。

DataFrame 例

前日比前日比(%)1ヶ月利回り変化幅年間利回り変化幅
INDU:INDNYダウ 工業株30種26,925.05+423.45+1.60%-2.74%-1.54%
SPX:INDS&P 500種3,310.24+40.28+1.23%-1.14%+7.93%
CCMP:INDナスダック 総合指数10,957.61+46.02+0.42%-1.06%+30.66%
NYA:INDNYSE 総合指数12,662.17+232.89+1.87%-0.69%-4.80%
SPTSX:INDS&Pトロント総合指数15,696.87+116.23+0.75%-3.10%-5.41%
引用:Bloomberg 

毎日参考にチェックしているアメリカ関連のDataFrameになります。

INDU:INDNYダウ 工業株30種 ~ SPTSX:INDS&Pトロント総合指数までをindexと言います。

値 ~ 年間利回り変化幅までをcolumsと言います。

ナンバリングのルール

Pythonのリストはナンバリングが0から始まりますので(ルールなので覚える)indexとcolumsもそれぞれナンバリングは0からスタートします。

この例で見ると、colums 3 のindex 1のDataは-1.14%となります。

pandasではこのようにDataFrameから特定のデータを抽出したり、表にしたりしてデータの取り扱いが可能になります。

例えば膨大な過去の株価データフレームの中から「過去大統領選挙前日のダウの前日比」のみを抽出と言ったことも一瞬で抽出してくれます。

3日目はpandasを定義してDataFrameを作成してみたいと思います。

この記事を書いた人

こうたろう

当サイトの管理人
元ピアニスト
ドイツで2枚目のアルバムを制作し帰国後、ワンポイント録音の魅力に出会いすぐに裏方へ転身。
金田明彦氏直伝金田式DC録音専門の「タイムマシンレコード」代表の五島昭彦氏に弟子入り。
タイムマシンレコードでアシスタントとして音響を学び金田式DC録音の洗礼を受ける。
その後独立し音楽作品制作チーム「芸術工房Pinocoa(現在は活動休止)」を立ち上げ。
ジャンルを超えた様々なアーティストをプロデュース。
その後サウンドデザイナーとして秋山庄太郎氏後継の写真スタジオ「村上アーカイブス」で映像制作チームに加入し、サウンドデザインの仕事をしながら写真と映像を学ぶ。
現在はPythonを使ったデータ分析や、トレンドフォロー投機を研究しつつ、フォトグラファー&音響エンジニアとしてゆるりゆらりと活動中。

趣味は毎朝楽しむコーヒーと竜笛(和楽器の練習)
好きな動物は猫。
好きな食べ物はカリフラワー

© 2021 Kotaro Marks | WordPress テーマ: CrestaProject の Annina Free