우분투 서버 Prometheus + Node Exporter 고급 모니터링
대규모 서버 운영에서 Prometheus와 Node Exporter를 활용한 실시간 모니터링, 커스텀 메트릭, 알람 자동화 실전 노하우를 소개합니다.
1. Prometheus + Node Exporter 기본 구조
- Node Exporter: CPU/메모리/디스크/네트워크 등 OS 메트릭 수집
- Prometheus: 메트릭 Pull 방식 수집, 시계열 DB 저장
- Grafana 등 시각화 도구와 연동, 실시간 대시보드 구현
2. 실전 설정 및 커스텀 메트릭
- Node Exporter 설치 후
9100/tcp
포트 오픈 - Prometheus
prometheus.yml
에 타겟 서버 등록 - 커스텀 스크립트로 사용자 정의 메트릭 추가 가능
3. 알람 및 장애 대응 자동화
- Prometheus Alertmanager로 CPU/메모리/디스크 임계치 알람 설정
- Slack, 이메일 등 실시간 알림 연동
- 실무 팁: 임계치 조정, 알람 노이즈 최소화, 장애 발생 시 메트릭 이력 분석
# Node Exporter 실행 ./node_exporter &prometheus.yml 예시
scrape_configs:
- job_name: 'node'
static_configs:- targets: ['localhost:9100']
Alertmanager 알람 규칙 예시
groups:
- name: node_alerts
rules:- alert: HighCPUUsage
expr: 100 - avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance) * 100 > 90
for: 5m
labels:
severity: warning
annotations:
summary: "High CPU usage detected"“Prometheus + Node Exporter는 리눅스 서버 실시간 모니터링의 표준입니다. 실무자는 커스텀 메트릭, 알람 자동화로 장애 대응력을 높이세요.”
- alert: HighCPUUsage
반응형
'IT 정보 > 리눅스' 카테고리의 다른 글
🔧 우분투 24.04 LTS 커널 레벨 성능 튜닝: BPF 컴파일러 실전 (0) | 2025.05.10 |
---|---|
🐧 우분투 서버 고급 자동화: Ansible + Systemd Timer 실전 운영 (0) | 2025.05.09 |
🐧 우분투 서버 고급 보안: AppArmor 프로파일 튜닝 & 실전 운영 (0) | 2025.05.08 |
🐧 우분투 고급 네트워크: Netplan + Networkd 고가용성(HA) 구성 (0) | 2025.05.08 |
🐧 우분투 서버 고급 스토리지: LVM 스냅샷 & 라이브 백업 실전 (0) | 2025.05.07 |