■ Python 3

今回も matplotlibパッケージ について学習です。numpyも使ってます。


◆ 散布図とヒストグラム
今回は、散布図を作成してみます。
まずは、乱数ジェネレータから小数値のデータを50個生成。
これで表示すると、

50点のランダムデータの散布図を生成できました。
試しに、平均や分散、中央値を見てみると…

平均は大体真ん中の「5」に近い値ですが、中央値は結構端っこに寄ってますね。
まあ、この辺りは実行するたびに変わりますし、50個程度の値だとどうしても偏りは出ますね。
では、分布を見やすくするために、ヒストグラムで表示してみると…
![]()

あれっ!?
ヒストグラムの表示が全然想定通りではありません。
何を間違えたのか…ちょっと振り返ってみると…
原因は、最初の乱数生成方法。
この時に、uniform関数を使うために、1行50列の2次元データを作成していました。
ただ、ヒストグラムなどに入力するデータは1次元データでないとダメなところを、2次元データを入力としてしまったためにこうなってしまったようです。
◆ 1次元データの作り直しからやり直し
ということで、作ったデータを1次元データに変換して再実行。
変換には、ravel( )関数を使用すればOK。


これで再び、散布図を作成。
このデータをもとにヒストグラムを作成すると…

今度はきれいにできました。
ただ、重なっていて見づらいです。
そのため、透明化することで少しでも見やすくしてみます。
alpha属性を設定することで、棒グラフの透明度を上げることができますので設定。
あとは、凡例もつけるために、ラベルを設定。

これでそこそこ見やすいヒストグラムが完成しました。