Datadog의 Google Chat 앱이 대시보드 위젯 공유와 Workspace 도메인 연결 기반 알림 핸들을 지원하도록 개선됐다. 장애 대응 대화를 Chat 안에서 이어 가는 데 유용하지만, 실제 도입 전에는 Datadog 라이선스, Chat 앱 허용 목록, 서비스 계정 위임, 알림 범위와 감사 가능성을 함께 확인해야 한다.

핵심 요약

  • Datadog 대시보드 위젯을 복사해 Google Chat에 붙여 넣으면 차트를 Chat 안에서 볼 수 있다.
  • Workspace 도메인을 Datadog과 연결하면 Datadog 안에서 Google Chat 알림 핸들을 더 쉽게 만들 수 있다.
  • Datadog Google Chat 앱을 쓰려면 Datadog 라이선스가 필요하다.
  • 관리자는 조직에서 Datadog Google Chat 앱을 allowlist하고, Chat 조직과 Datadog 조직 연결 및 서비스 계정 사용자 위임 절차를 따라야 한다.
  • Rapid Release와 Scheduled Release 도메인 모두 공지 시점 기준 사용 가능하며, Workspace 고객과 Workspace Individual, 개인 Google 계정 사용자도 대상이지만 Datadog 라이선스 조건은 별도로 적용된다.

무엇이 바뀌었나

이번 업데이트는 Google Chat을 단순 알림 수신 채널이 아니라 Datadog 관측 데이터와 인시던트 대화를 이어 가는 작업 공간으로 만드는 데 초점이 있다. 팀원이 Datadog 대시보드에서 특정 위젯을 복사해 Chat에 붙여 넣으면, 대화방 안에서 관련 차트를 바로 확인할 수 있다. 링크만 던지고 각자가 브라우저를 열어 같은 그래프를 찾아야 하는 마찰을 줄이는 변화다.

또 하나의 변화는 Workspace 도메인과 Datadog 조직을 연결해 Chat 알림 핸들을 Datadog 안에서 만들 수 있다는 점이다. 운영팀은 서비스별 알림을 Chat 스페이스로 라우팅하고, 인시던트 선언이나 대응 흐름을 Chat 중심으로 정리하기 쉬워진다.

왜 중요한가

장애 대응에서 가장 비싼 비용은 도구 전환과 맥락 손실이다. 지표는 Datadog에 있고, 대화는 Chat에 있고, 액션 아이템은 별도 문서에 흩어져 있으면 담당자가 같은 정보를 반복해서 설명해야 한다. 위젯 미리보기와 Chat 알림 핸들은 이 간극을 줄여 줄 수 있다.

하지만 관측 데이터에는 내부 서비스명, 고객 트래픽 패턴, 장애 영향 범위, 배포 시간 같은 민감한 운영 정보가 포함될 수 있다. Chat 스페이스 멤버십이 넓거나 외부 사용자가 포함되어 있다면 Datadog 데이터를 그대로 노출하는 것이 적절한지 검토해야 한다.

관리자 체크포인트

  • 앱 허용 목록: 조직의 Chat 앱 정책에서 Datadog Google Chat 앱이 허용되어 있는지 확인한다.
  • 조직 연결: Datadog 조직과 Google Chat 조직 연결 절차를 문서화하고, 운영 권한을 가진 관리자만 수행하게 한다.
  • 서비스 계정 위임: 서비스 계정 사용자를 위임할 때 필요한 권한 범위를 최소화하고, 키·토큰 보관 위치를 확인한다.
  • 라이선스: Google 계정 대상 범위와 별개로 Datadog 라이선스가 필요하므로 비용과 사용자 수를 먼저 산정한다.
  • 정보 노출: 어떤 대시보드 위젯을 Chat에 붙여 넣을 수 있는지, 외부 협업 스페이스에는 어떤 데이터가 금지되는지 가이드를 둔다.
  • 감사와 롤백: 알림 핸들 생성·변경 기록, 앱 제거, 스페이스 권한 회수 절차를 운영 런북에 포함한다.

작게 테스트하는 방법

  1. 운영팀 내부 Chat 스페이스 하나와 비민감 Datadog 대시보드 하나를 파일럿 대상으로 정한다.
  2. 관리자가 Datadog Google Chat 앱을 허용 목록에 추가하고 조직 연결을 수행한다.
  3. 서비스 계정 위임 범위를 최소 권한으로 설정한 뒤, 위젯 복사·붙여넣기와 알림 핸들 생성을 테스트한다.
  4. 외부 사용자 포함 스페이스, 비공개 스페이스, 아카이브 정책이 다른 스페이스에서 표시 방식이 어떻게 달라지는지 확인한다.
  5. 테스트 종료 후 Datadog과 Google Workspace 양쪽에서 남는 로그와 회수 절차를 점검한다.

ActualStack 관점

Datadog과 Google Chat 연결은 SRE와 플랫폼 팀의 대응 속도를 높일 수 있다. 특히 그래프를 대화 맥락 안에 바로 붙이는 기능은 “어느 지표를 보고 있는가”를 빠르게 맞추는 데 도움이 된다. 다만 모든 알림을 Chat으로 밀어 넣는 식의 도입은 오히려 피로도를 높인다. 서비스 중요도, 온콜 정책, 에스컬레이션 기준을 먼저 정하고 Chat 알림은 그 기준을 보조하는 경로로 설계하는 것이 좋다.

결론

Datadog Google Chat 앱 개선은 관측과 협업을 더 가깝게 붙이는 업데이트다. 실제 가치는 대시보드 위젯 공유와 알림 핸들을 운영 런북에 맞게 설계했을 때 나온다. 도입 전에는 라이선스와 권한, 정보 노출 범위, 감사 로그, 롤백 절차를 확인하고 작은 내부 스페이스에서 먼저 검증하자.

자동화 측면에서는 Chat 알림을 만드는 권한과 Datadog 대시보드를 보는 권한이 항상 같지 않다는 점을 주의해야 한다. 알림은 보이지만 원본 대시보드는 접근할 수 없는 사용자, 반대로 대시보드는 볼 수 있지만 Chat 스페이스에는 없는 사용자가 생길 수 있다. 파일럿 단계에서 이 경계 조건을 확인하면 실제 장애 때 권한 문제로 대응이 늦어지는 상황을 줄일 수 있다.

출처와 검증