はじめに
マルチクラウド時代、監視はVPCごとに作らなければならなくなりがち。そのため、マルチクラウドに対応した監視を導入すべく、datadogが候補に上がった。
Google Stackdriver,New Relicとも比較した。
特徴
integrationを自社開発している。
eventの取得頻度は10分/1回、RDSはもっと頻繁、かたや課金は4時間ごとにみている。agentを入れると15sごとになる。
agentいれても、cloudwatchでも。2018年末時点では1台でxxxx円という料金形態。
リソースの保存は15ヶ月。
ログは料金に応じて。S3に出力して、athenaなどで解析も可能
監視対象サーバの追加について
OS毎にテンプレートを作って、それを自動で割り当てることはできない。
複数同じ設定をする際は、terraformでimport & exportが必要
https://www.terraform.io/docs/providers/datadog/index.html
GCPについて
GCPの場合、プロジェクト毎にdatadog用のService account keyを作らなければならない。
特定ユーザのみ公開
「ある画面をAさんには見せ、Bさんには見せない。」というような制御はできない。
IP制限によるアクセス制御
サポートに連絡することで可能
証明書監視について
SSL期限の監視などはできない。
ニューレリックとの比較
ニューレリックのメリット
APMの設定が楽、agentいれてトレーサー知れるだけでよい。
ニューレリックのデメリット
ニューレリックはコミュニティーベースのサポートになる
agentがオープンソースではないので、トラブルシュートが難しい。
logやAPMを統合させようとするとニューレリックインサイトというのを買わないといけない。
監視の設定がやや複雑。
stackdriverとの比較
stackdriverのメリット
BigQueryとの連携が強い(Googleなので)
stackdriverのデメリット
cloudwatch同様の使い方
2018年9月くらいから料金が高くなった