機械学習記3日目 ~ NumPyの統計関数

▶NumPyの統計関数

配列の要素の平均は、mean関数を使うと簡単に計算できます。

f:id:hackU0001:20190222204900p:plain

f:id:hackU0001:20190222205855p:plain

例えば、0~9までのランダムな整数の配列を生成して、その平均を計算してみましょう。ランダムな値の配列は、random.randint関数を使って作ります。第1引数は下限、第2引数は上限(この数は含まない)、第3引数は要素数です。

f:id:hackU0001:20190222210808p:plain

この配列のすべての要素の平均は、次のようになります。

f:id:hackU0001:20190222211215p:plain

 

 標準偏差とは、std関数で求めることができます。

f:id:hackU0001:20190222213717p:plain

f:id:hackU0001:20190222212852p:plain

先ほどの配列rの標準偏差は、次のようになります。

f:id:hackU0001:20190222214052p:plain

集計する関数として、sum関数があります。このsum関数にはaxis(軸)を表す引数があり、2次元配列に関してどの向きに集計を取るのか指定できます。

f:id:hackU0001:20190222214755p:plain

f:id:hackU0001:20190222215115p:plain

 

 2点間の距離(ベクトルの長さ)、いわゆる「ユークリッド距離」を求める場合は、linalg.norm関数を使います。座標(x,y)として、a地点(2,5)からb地点(7,8)へのユークリッド距離を求めるには、次のように記述します。

f:id:hackU0001:20190222215424p:plain

 

 だんだんと難しくなってきたので、ここからさらにギアを上げていこうと思います!