IT 정보/리눅스

🐧 우분투 서버 고급 모니터링: Prometheus + Node Exporter 실전

DONOT 2025. 5. 9. 14:43

우분투 서버 Prometheus + Node Exporter 고급 모니터링

대규모 서버 운영에서 Prometheus와 Node Exporter를 활용한 실시간 모니터링, 커스텀 메트릭, 알람 자동화 실전 노하우를 소개합니다.

1. Prometheus + Node Exporter 기본 구조

  • Node Exporter: CPU/메모리/디스크/네트워크 등 OS 메트릭 수집
  • Prometheus: 메트릭 Pull 방식 수집, 시계열 DB 저장
  • Grafana 등 시각화 도구와 연동, 실시간 대시보드 구현

2. 실전 설정 및 커스텀 메트릭

  • Node Exporter 설치 후 9100/tcp 포트 오픈
  • Prometheus prometheus.yml에 타겟 서버 등록
  • 커스텀 스크립트로 사용자 정의 메트릭 추가 가능

3. 알람 및 장애 대응 자동화

  • Prometheus Alertmanager로 CPU/메모리/디스크 임계치 알람 설정
  • Slack, 이메일 등 실시간 알림 연동
  • 실무 팁: 임계치 조정, 알람 노이즈 최소화, 장애 발생 시 메트릭 이력 분석

# Node Exporter 실행
./node_exporter &

prometheus.yml 예시

scrape_configs:

  • job_name: 'node'
    static_configs:
    • targets: ['localhost:9100']

Alertmanager 알람 규칙 예시

groups:

  • name: node_alerts
    rules:
    • alert: HighCPUUsage
      expr: 100 - avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance) * 100 > 90
      for: 5m
      labels:
      severity: warning
      annotations:
      summary: "High CPU usage detected"

“Prometheus + Node Exporter는 리눅스 서버 실시간 모니터링의 표준입니다. 실무자는 커스텀 메트릭, 알람 자동화로 장애 대응력을 높이세요.”

반응형