datadog,Google Stackdriver,New Relicを比較した

はじめに

マルチクラウド時代、監視はVPCごとに作らなければならなくなりがち。そのため、マルチクラウドに対応した監視を導入すべく、datadogが候補に上がった。

Google Stackdriver,New Relicとも比較した。

特徴

integrationを自社開発している。

eventの取得頻度は10分/1回、RDSはもっと頻繁、かたや課金は4時間ごとにみている。agentを入れると15sごとになる。

agentいれても、cloudwatchでも。2018年末時点では1台でxxxx円という料金形態。

リソースの保存は15ヶ月。
ログは料金に応じて。S3に出力して、athenaなどで解析も可能

監視対象サーバの追加について

OS毎にテンプレートを作って、それを自動で割り当てることはできない。

複数同じ設定をする際は、terraformでimport & exportが必要

https://www.terraform.io/docs/providers/datadog/index.html

GCPについて

GCPの場合、プロジェクト毎にdatadog用のService account keyを作らなければならない。

特定ユーザのみ公開

「ある画面をAさんには見せ、Bさんには見せない。」というような制御はできない。

IP制限によるアクセス制御

サポートに連絡することで可能

証明書監視について

SSL期限の監視などはできない。

ニューレリックとの比較

ニューレリックのメリット

APMの設定が楽、agentいれてトレーサー知れるだけでよい。

ニューレリックのデメリット

ニューレリックはコミュニティーベースのサポートになる
agentがオープンソースではないので、トラブルシュートが難しい。
logやAPMを統合させようとするとニューレリックインサイトというのを買わないといけない。
監視の設定がやや複雑。

stackdriverとの比較

stackdriverのメリット

BigQueryとの連携が強い(Googleなので)

stackdriverのデメリット

cloudwatch同様の使い方
2018年9月くらいから料金が高くなった