0. IT

Microsoft Azure Dashboard의 모니터링 기준

정보공유방 2024. 6. 20. 16:28
반응형

 

  Azure Dashboard에서 일반적으로 많이 사용하는 Metric과 그 상세 내용 및 Aggregation 방법에 대해 알아보겠습니다.

각 메트릭은 시스템 성능과 상태를 모니터링하는 데 중요하며, 적절한 Aggregation 방법을 사용하여 의미 있는 데이터를 얻을 수 있습니다.

 

1. CPU Usage

상세 내용:

- CPU Usage는 가상 머신, 앱 서비스 등에서 CPU가 얼마나 사용되고 있는지를 나타냅니다.

- Aggregation: 평균(Avg), 최대(Max), 최소(Min) 등의 방식으로 집계하여 전체적인 CPU 사용 경향과 피크 타임을 분석합니다.

- 예시: 특정 기간 동안 CPU 사용률의 평균이 65%이고 최대 사용률이 90%라면, 시스템이 꾸준히 높은 부하를 받고 있으며 일시적으로 매우 높은 부하를 받는다는 것을 알 수 있습니다.

 

2. Memory Usage

상세 내용:

- Memory Usage는 사용 중인 메모리 양을 나타냅니다.

 Aggregation: 평균(Avg), 최대(Max), 최소(Min) 등의 방식으로 집계하여 메모리 사용 패턴을 파악합니다.

- 예시: 특정 기간 동안 메모리 사용률의 평균이 75%이고 최대 사용률이 95%라면, 시스템이 메모리 리소스를 많이 사용하고 있다는 것을 의미합니다.

 

3. Disk I/O (Read/Write Operations)

상세 내용:

- Disk Read Operations/sec와 Disk Write Operations/sec는 초당 읽기 및 쓰기 작업 수를 나타냅니다.

- Aggregation: 합계(Sum), 평균(Avg) 등의 방식으로 집계하여 디스크 활동의 빈도와 강도를 분석합니다.

- 예시: 디스크 읽기 작업이 초당 평균 200회이고 최대 500회라면, 디스크 입출력이 빈번하게 발생하고 있다는 것을 알 수 있습니다.

 

4. Network In/Out

상세 내용:

- Network In은 수신된 네트워크 바이트 수, Network Out은 전송된 네트워크 바이트 수를 나타냅니다.

- Aggregation: 합계(Sum), 평균(Avg) 등의 방식으로 집계하여 네트워크 트래픽 패턴을 분석합니다.

- 예시: 특정 기간 동안 네트워크 수신량의 평균이 500MB이고 최대 수신량이 1GB라면, 네트워크 트래픽이 일정하지만 피크 타임에 트래픽이 크게 증가한다는 것을 의미합니다.

 

5. Disk Space Usage

상세 내용:

- Disk Space Used는 사용 중인 디스크 공간의 양을 나타냅니다.

- Aggregation: 최대(Max), 평균(Avg) 등의 방식으로 집계하여 디스크 공간 사용 패턴을 파악합니다.

- 예시: 디스크 사용량의 평균이 70%이고 최대 사용량이 85%라면, 디스크 공간이 꾸준히 사용되고 있으며 여유 공간이 점점 줄어들고 있다는 것을 알 수 있습니다.

 

6. Request Count

상세 내용:

- Request Count는 웹 애플리케이션이나 API 호출의 총 요청 수를 나타냅니다.

- Aggregation: 합계(Sum), 평균(Avg) 등의 방식으로 집계하여 요청 빈도를 분석합니다.

- 예시: 특정 기간 동안 총 요청 수가 10,000회이고 초당 평균 요청 수가 5회라면, 애플리케이션에 대한 요청이 일정하게 발생하고 있다는 것을 알 수 있습니다.

 

7. Response Time

상세 내용:

- Response Time은 요청에 대한 응답 시간을 나타냅니다.

-Aggregation: 평균(Avg), 최대(Max) 등의 방식으로 집계하여 응답 시간의 변동성을 분석합니다.

- 예시: 평균 응답 시간이 200ms이고 최대 응답 시간이 1초라면, 대체로 빠르게 응답하지만 간헐적으로 응답 지연이 발생한다는 것을 알 수 있습니다.

 

8. Error Rate

상세 내용:

- Error Rate는 실패한 요청의 비율을 나타냅니다.

- Aggregation: 합계(Sum), 비율(Rate) 등의 방식으로 집계하여 오류 발생 빈도를 분석합니다.

- 예시: 특정 기간 동안 실패한 요청이 50회이고 총 요청이 1,000회라면, 오류율이 5%라는 것을 알 수 있습니다.

 

9. Queue Length

상세 내용:

- Queue Length는 대기 중인 작업의 수를 나타냅니다.

- Aggregation: 평균(Avg), 최대(Max) 등의 방식으로 집계하여 작업 대기 상태를 분석합니다.

- 예시: 평균 대기 작업 수가 10개이고 최대 대기 작업 수가 25개라면, 시스템이 지속적으로 처리해야 할 작업이 있다는 것을 알 수 있습니다.

 

10. Database DTU Utilization

상세 내용:

- DTU (Database Transaction Unit) Utilization는 Azure SQL Database의 리소스 사용량을 나타냅니다.

- Aggregation: 평균(Avg), 최대(Max) 등의 방식으로 집계하여 데이터베이스 리소스 사용 패턴을 분석합니다.

- 예시: DTU 사용률의 평균이 60%이고 최대 사용률이 90%라면, 데이터베이스가 상당한 리소스를 사용하고 있다는 것을 알 수 있습니다.

 

 

  이처럼 각 메트릭은 다양한 Aggregation 방법을 통해 의미 있는 데이터를 도출하므로 그 중요성을 표현합니다.  예를 들어, 평균(Avg)은 일반적인 사용 경향을 파악하는 데 유용하며, 최대(Max)는 피크 부하 상태를 이해하는 데 도움이 됩니다. 합계(Sum)는 총 사용량이나 총 요청 수를 파악하는 데 유용합니다.

반응형