機械学習などで使われる p50, p90, p95 (パーセンタイル)とは

パーセンタイル

パーセントと、パーセンタイルを比べるとわかりやすい。

一般的な パーセントの場合は、率をあらわす。
50パーセントは全体に対し、半分がという意味になる。

一方でパーセンタイルは似たようでちょっと違う。
全体を 100個に区切り、
小さい方順にソートして 何番目にあるかを表現されている。

p50 (50パーセンタイ)ルの場合は、
下から 50/100に位置しているデータ。

p90 (90パーセンタイル)の場合は、
下から 90/100に位置しているデータ。

p95 (95パーセンタイル)の場合は、
下から 95/100に位置しているデータ。

となる。

機械学習ではなく xray でもこのパーセンタイルを採用しているが、おそらく理由は、

それより遅い異常値を弾くことで精度の高い統計情報にするためだと考える。