はじめに
機械学習を勉強しているとPythonが避けて通れない。
中でもnumpyはとても重要だったりする。
基本的な使い方から調べた。
使い方
何はともあれinstall
pipで一発。
pip3 install numpy
import
import numpy as np
以降、npとして利用する
変数に入れる
x = np.array([1,2,3])
1,2,3を配列として入れる
結果は
[1 2 3]
変数の中の平均を取る
この配列の中の平均を計算する
一つ一つ足して、カラム数で割る・・・というような処理は不要で、
.mean()メソッドを利用することで自動で計算することが可能。
xaverage =x.mean() print (xaverage)
結果は以下のとおり
2.0
中心化を行う
単回帰分析の場合、求めるのは
- 傾き
- 切片
の2つ。
この中心化を行うことで切片を計算する事が不要になる。
やることは、全てのカラムから、平均分を引くだけ。
xc = x - x.mean() print (xc)
詳細はこちら http://www.bokupy.com/detail/93#single-regression3
結果は以下のとおり
[-1. 0. 1.]
[1 2 3]から全てのカラムが平均2が引かれている事がわかる。