■ Python 3
Pythonの基本構文もおいおいやっていくとして、今回は、データ分析で有用なパッケージである「pandasパッケージ」を使用してみます。
■ pandasパッケージのインポート
早速、Jupyter Notebookを開き、pandasパッケージのインポートと、Series型を使ったデータを作成して、表示されてみようとすると…
「ModuleNotFoundError」でエラー。
pandasというモジュールが見つからないと言われました。
確かに、今回の環境にはまだ Python本体を入れただけで、サードパーティパッケージは一つも入れていなかったので、そりゃそうですね。
ということで、pandasをインストール。
Jupyter Notebook上からでもインストールコマンドは実行できます。
インストールコマンドライン(pandasの場合)
!pip install pandas
これで、pandasパッケージをインストールできました。
依存パッケージであるためか、一緒に、numpyパッケージもインストールもされたようです。
この状態でさっきと同じコードを書いてみると
無事に実行できました。
pandasにはいろいろなデータ型がありますが、その中でもよく使うのが、「Series」と「DataFrame」でしょうか。
- Seriesデータ型(pd.Series):1次元配列(ベクトル)
- DataFrameデータ型(pd.DataFrame):2次元配列(2次元行列)
…ということで、DataFrame型で (3✕4)行列のデータを定義してみると…
整形された表形式で表示されるので、見やすいのもいいですね。