numpyで平均を求める

はじめに

機械学習を勉強しているとPythonが避けて通れない。
中でもnumpyはとても重要だったりする。

基本的な使い方から調べた。

使い方

何はともあれinstall

pipで一発。

pip3 install numpy 

import

import numpy as np

以降、npとして利用する

変数に入れる

x = np.array([1,2,3])

1,2,3を配列として入れる

結果は

[1 2 3]

変数の中の平均を取る

この配列の中の平均を計算する
一つ一つ足して、カラム数で割る・・・というような処理は不要で、

.mean()メソッドを利用することで自動で計算することが可能。

xaverage =x.mean()
print (xaverage)

結果は以下のとおり

2.0

中心化を行う

単回帰分析の場合、求めるのは

  • 傾き
  • 切片

の2つ。
この中心化を行うことで切片を計算する事が不要になる。

やることは、全てのカラムから、平均分を引くだけ。

xc = x - x.mean()
print (xc)

詳細はこちら  http://www.bokupy.com/detail/93#single-regression3

結果は以下のとおり

[-1.  0.  1.]
[1 2 3]から全てのカラムが平均2が引かれている事がわかる。