지원 기능 메트릭을 사용한 CA APM 성능 모니터링
APM 성능 모니터링 도구를 사용하여 APM 배포 환경의 성능을 모니터링하십시오. 프로덕션 환경을 효율적으로 모니터링하려면 Enterprise Manager가 건전한 상태여야 합니다.
apmdevops104kr
APM 성능 모니터링 도구를 사용하여 APM 배포 환경의 성능을 모니터링하십시오. 프로덕션 환경을 효율적으로 모니터링하려면 Enterprise Manager가 건전한 상태여야 합니다.
2
CA Technologies에서는 문제를 감지하고 예기치 않은 변경으로 인해 모니터링 환경이 손상되지 않도록 하는 데 사용할 수 있는 다음과 같은 도구를 제공합니다.
- APM 상태 콘솔
- 지원 기능 메트릭
- 알림
APM 상태 콘솔을 사용하여 성능 모니터링
Workstation에는 APM 상태 콘솔 구성 요소가 포함되어 있습니다. APM 상태 콘솔에서는 Enterprise Manager 클러스터 토폴로지의 그래픽 뷰를 제공하고, 다음과 같은 주요 성능 측정값에 대한 정보를 제공합니다.
- 활성 클램프클러스터와 개별 수집기 수준에서 범위를 초과한 클램프 임계값입니다.
- 중요한 이벤트
- 긴 하베스트 기간
- 높은 CPU 사용량
- 긴 SmartStor 기간
- APM 데이터베이스 연결 문제
- 거부된 에이전트클러스터에 연결을 시도했지만loadbalancing.xml파일의 에이전트 연결 구성에 따라 제외된 에이전트입니다.
참고:
APM 상태 콘솔에 대한 자세한 내용은 APM Workstation을 참조하십시오.Enterprise Manager 지원 기능 메트릭을 사용하여 성능 모니터링
Enterprise Manager는 15초마다 자체 Enterprise Manager에 대한 건전성 메트릭을 수집하고 기록합니다. 다음 원본을 검사하여 이러한 메트릭을 보고 Enterprise Manager 성능 문제를 해결할 수 있습니다.
- Investigator 메트릭 브라우저 트리
- 로그 파일
- Enterprise Manager 개요 탭
메트릭 브라우저 트리의 지원 기능 메트릭 보기
독립 실행형 Enterprise Manager나 MOM의 경우 지원 기능 메트릭은 메트릭 브라우저 트리의 최상위 *SuperDomain* 아래에 표시됩니다.
Custom Metric Host (Virtual) Custom Metric Process (Virtual) Custom Metric Agent (Virtual)(SuperDomain) Enterprise Manager
클러스터 환경의 수집기 지원 기능 메트릭도 유사한 메트릭 경로를 갖지만 "Custom Metric Agent"(사용자 지정 메트릭 에이전트) 수준에 수집기의 컴퓨터 이름 및 포트가 포함된다는 차이점이 있습니다.
MOM과 하나의 수집기가 있는 Investigator 트리는 다음 예와 같이 나타납니다.
Custom Metric Host (Virtual) Custom Metric Process (Virtual) Custom Metric Agent (Virtual)(SuperDomain) Enterprise Manager Custom Metric Agent (Virtual)(Collector1@5001)(SuperDomain) Enterprise Manager
로그 파일의 지원 기능 메트릭 보기
기본적으로 Enterprise Manager는
perflog.txt
라는 로그 파일에 많은 양의 지원 기능 메트릭을 기록합니다. 지원 기능 메트릭은 15초 간격으로 생성됩니다. 이 파일의 기본 위치는 <EM_Home
>/logs 디렉터리입니다.기본적으로
perflog.txt
는 압축 모드로 생성됩니다. 값은 열 머리글을 포함하여 쉼표로 구분되어 있습니다. 이 형식의 perflog.txt
는 분석을 위해 스프레드시트로 손쉽게 가져올 수 있습니다.압축 모드를 해제하면 Enterprise Manager는
perflog.txt
를 보다 읽기 쉬운 세부 정보 표시 형식으로 기록합니다.다음 단계를 따르십시오.
- IntroscopeEnterpriseManager.properties파일을 엽니다.
- 다음과 같이 구성 값을 설정합니다.
- introscope.enterprisemanager.performance.compressed=false
- log4j.logger.Manager.Performance=DEBUG, performance, logfile
- IntroscopeEnterpriseManager.properties파일을 저장하고 닫습니다.
Enterprise Manager "개요" 탭의 지원 기능 메트릭 보기
메트릭 브라우저 트리의 "Enterprise Manager" 폴더를 클릭하면 Enterprise Manager의 지원 기능 메트릭에 대한 요약 정보를 볼 수 있습니다. 이 정보에는 가장 중요한 여러 지원 기능 메트릭을 단일 뷰로 보여 주는 그래프가 표시되는 "개요" 탭이 포함됩니다. Enterprise Manager "개요" 탭은 Enterprise Manager의 부하와 리소스 사용률을 빠르게 분석할 수 있는 유용한 도구입니다.
중요한 Enterprise Manager 지원 기능 메트릭
다음 지원 기능 메트릭은 추세를 예측하고, 문제를 감지하고, Enterprise Manager 수용 능력 문제의 근본적인 원인을 파악하는 데 유용합니다. 각 메트릭은 사용 방법에 대한 정보와 함께 설명되어 있습니다.
"하베스트 기간" 메트릭
Harvest Duration
(하베스트 지속 시간) 메트릭은 15초 시간 조각 동안 데이터 하베스트에 소요된 시간을 밀리초 단위로 표시합니다. 이 메트릭은 일반적으로 Enterprise Manager가 현재 작업 부하를 처리할 수 있는지 여부를 결정하기에 적합한 지표입니다.계산기 실행 시간은 하베스트 지속 시간의 주요 구성 요소이므로
Harvest Duration
(하베스트 지속 시간) 메트릭은 대략적인 CPU 사용량을 추정하는 데 유용합니다. 최적의 Harvest Duration
(하베스트 지속 시간) 메트릭 값은 3500밀리초(3.5초) 미만입니다. 7500 밀리초(7.5초)보다 큰 값은 Enterprise Manager에 메트릭 및 계산기 부하를 처리할 CPU 수용 능력이 부족함을 나타냅니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Tasks아래
- Performance.Harvest.HarvestDuration아래의perflog.txt
"SmartStor 기간" 메트릭
SmartStor Duration
(SmartStor 지속 시간) 메트릭은 하나의 시간 조각 동안 수신 및 생성된 메트릭을 SmartStor 데이터베이스에 쓰는 데 소요된 시간을 표시합니다.SmartStor Duration
(SmartStor 지속 시간) 메트릭은 SmartStor 디스크 I/O 쓰기 성능의 지표입니다. 일관되지 않은 값은 디스크 관련 리소스의 경합을 나타냅니다. 일관되게 높은 값은 디스크 쓰기 대역폭이 메트릭 부하를 처리하는 데 적절하지 않음을 나타냅니다.표준 Enterprise Manager 조건에서 평균
SmartStor Duration
(SmartStor 지속 시간) 값은 3500밀리초(3.5초)보다 작아야 합니다. SmartStor Duration
(SmartStor 지속 시간) 값은 반드시
15,000밀리초(15초)보다 작아야 합니다. 15초보다 큰 메트릭 값은 중대하게 오버로드된 Enterprise Manager를 나타냅니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Tasks아래
- Performance.SmartStor.Duration아래의perflog.txt
Number of Collector Metrics(수집기 메트릭 수)
Number of Collector Metrics
(수집기 메트릭 수) 메트릭은 클러스터에서 현재 추적 중인 총 메트릭 수를 표시합니다. 이 메트릭은 클러스터에 있는 모든 수집기의 Enterprise Manager | Connections | Number of Metrics
지원 기능 메트릭 값을 합산한 것입니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | MOM | Number of Collector Metrics아래
- Performance.MOM.NumberOfCollectorMetrics아래의perflog.txt
Collector Metrics Received Per Interval(간격당 수신된 수집기 메트릭)
Collector Metrics Received Per Interval
(간격당 수신된 수집기 메트릭) 메트릭은 각 15초 기간에 MOM이 수신한 수집기 메트릭 데이터 포인트를 합산한 것입니다. 데이터 포인트는 다음 원본에서 가져옵니다.- 관리 모듈을 대신하는 메트릭 구독. 예: 대시보드, 계산기, 경고
- 클라이언트가 생성하는 쿼리. 예: Workstation 및 CLW 쿼리
- 기본 제공 경고 및 계산기가 생성하는 메트릭에 대한 쿼리. 예: 응용 프로그램 심사 맵을 지원하는 경고 및 계산기
Collector Metrics Received Per Interval
(간격당 수신된 수집기 메트릭) 메트릭은 수집기와 MOM 간의 통신에 사용되는 네트워크 대역폭 소비량과 클러스터 쿼리 부하를 나타내는 지표입니다. 이 메트릭에는 약간의 변동이 있을 수 있습니다. 큰 폭의 급등은 자연 발생적인 쿼리 동작이 많음을 나타냅니다. Collector Metrics Received Per Interval
(간격당 수신된 수집기 메트릭) 값은 계산기가 처리하는 메트릭 수를 대략적으로 나타냅니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | MOM | Collector Metrics Received Per Interval아래
- Performance.MOM.CollectorMetricsReceivedPerInterval아래의perflog.txt
Alerts:Total Number of Evaluated Metrics(알림:총 평가 메트릭 수)
경고는 다른 계산기의 출력에 대해 작동하므로
종속 계산기
입니다. 종속 계산기는 해당 입력을 제공하는 계산기와 병렬로 실행할 수 없습니다. 따라서 경고의 경우 비종속 계산기보다 하베스트 기간이 길어질 수 있습니다. "Alerts:Total Number of Evaluated Metrics"(알림:총 평가 메트릭 수) 지원 기능 메트릭은 각 시간 조각 동안 알림이 처리한 메트릭 수를 표시합니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
메트릭 브라우저 트리의
Enterprise Manager | Internal | Alerts
아래하베스트 기간의 증가가 경고에서 평가되는 메트릭의 증가와 상호 관련된 경우 경고를 최적화하여 Enterprise Manager 수용 능력을 늘릴 수 있습니다. 가장 많은 리소스를 소비하는 알림을 식별하려면 다음 정규식과 일치하는 이름을 갖는 모든 메트릭을 검색하고 값을 기준으로 정렬하십시오.
(.*)Enterprise Manager|Internal|(.*)Alerts(.*)Number of Evaluated Metrics
Introscope에 많은 수의 메트릭(특히 여러 수집기의 메트릭)을 평가하는 경고가 있는 경우 다음 작업을 고려하십시오.
- 값을 거의 제공하지 않는 경고는 사용되지 않도록 설정합니다.
- 경고 조건을 나타내는 데 필요한 최소한의 메트릭만 포함하도록 경고 상태의 메트릭 그룹에서 정규식을 조정합니다.
- 여러 수집기의 메트릭을 평가하는 알림을 단일 수집기의 메트릭만 평가하는 여러 개의 알림으로 분할합니다. 이 작업은 MOM이 처리하는 메트릭 수를 반드시 줄여 주지는 않지만 클러스터의 쿼리 성능을 향상시킵니다.
Overall Capacity (%)(전체 수용 능력(%))
Enterprise Manager의
Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 소비되는 Enterprise Manager의 수용 능력을 백분율로 추정합니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager |아래
Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 영향을 주는 다음 메트릭을 사용하여 대략적으로 계산되며, 메트릭 브라우저 트리의 Enterprise Manager | Health
아래에서 볼 수 있습니다.- CPU Capacity (%)(CPU 수용 능력(%))
- GC Capacity (%)(GC 수용 능력(%))
- Harvest Capacity (%)(하베스트 수용 능력(%))
- Heap Capacity (%)(힙 수용 능력(%))
- Incoming Data Capacity (%)(들어오는 데이터 수용 능력(%))
- SmartStor Capacity (%)(SmartStor 수용 능력(%))
Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 특정 15초 시간 조각보다는 장기간에 더 유용한 메트릭입니다. Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 실시간 메트릭을 기반으로 하므로 Overall Capacity (%)
(전체 수용 능력(%)) 값이 100%보다 상당히 높게 급등할 수 있습니다. 예를 들어 하드웨어 I/O 하위 시스템이 잠깐 동안 오버로드된 때문에 급등이 발생할 수 있습니다. 그러나 Enterprise Manager는 이러한 급등 상황이 오래 지속되지 않으면 급등 상태에서 자동으로 복구하는 경향이 있습니다. 일반적으로 200% 정도의 급등은 일시적인 경우에는 문제가 되지 않습니다. 그러나 장기간의 경우 이상적인 평균 Overall Capacity (%)
(전체 수용 능력(%))는 75% 미만입니다.Overall Capacity (%)
(전체 수용 능력(%)) 메트릭이 높은 값으로 급등하는 기간 동안에는 영향을 주는 다른 메트릭 중 하나 이상도 급등할 수 있습니다. 2차 급등의 원인을 조사하고 이해하면 리소스 문제의 근본적인 원인을 정확히 찾아낼 수 있습니다. 예를 들어 Overall Capacity (%)
(전체 수용 능력(%)) 메트릭의 입력으로 사용되는 Heap Capacity (%)(힙 수용 능력(%)) 메트릭을 확인하여 문제를 찾을 수 있습니다.기록 모드에서
Overall Capacity (%)
(전체 수용 능력(%)) 메트릭을 보는 방법은 Enterprise Manager 수용 능력 상태에 대한 일반적인 비교 뷰를 보는 데 유용합니다. 그러나 Enterprise Manager 작업 부하는 복잡하며 작업 부하의 다양한 요소가 서로 다른 비선형적 방식으로 Overall Capacity (%)
(전체 수용 능력(%)) 메트릭에 영향을 줍니다. 예를 들어 SmartStor 유지 관리 작업(스풀-데이터 변환 및 기간 재지정)의 기간은 Enterprise Manager 수용 능력의 중요한 지표일 수 있습니다. 그러나 이러한 유지 관리 작업은 Overall Capacity (%)
(전체 수용 능력(%)) 계산에 직접적으로 관여하지 않습니다. SmartStor 유지 관리 작업은 CPU 및 힙 사용률을 증가시킵니다. 사용률이 증가하면 수용 능력 비율도 증가하지만 증가 크기에는 SmartStor 유지 관리 문제의 전반적인 영향이 반영되지 않습니다.Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 주로 Enterprise Manager가 에이전트 메트릭 작업 부하를 처리하는 방법에 초점을 둡니다. 이 메트릭은 응용 프로그램 심사 맵이나 CA CEM 데이터와 관련하여 수용 능력을 직접 평가하지는 않습니다. 예를 들어 Overall Capacity (%)
(전체 수용 능력(%)) 메트릭은 오버로드된 Enterprise Manager 서비스 또는 APM 데이터베이스 I/O 문제를 반영하지 않습니다.Heap Capacity (%)(힙 수용 능력(%))
Heap Capacity (%)
(힙 수용 능력(%)) 메트릭은 현재 사용 중인 할당된 힙 메모리의 양을 보여 줍니다. 이 메트릭은 안전 버퍼를 제공하고 충돌을 방지하도록 할당된 힙 메모리의 75%로 정규화되어 있습니다. 즉, 메트릭 값 100은 할당된 힙 메모리가 75% 사용됨을 나타냅니다.Heap Capacity (%)
(힙 수용 능력(%)) 메트릭을 사용하면 Enterprise Manager에 할당된 힙이 Enterprise Manager에서 처리하는 부하에 충분한지 여부를 평가할 수 있습니다. 또한 이 메트릭을 사용하여 힙 사용량에 영향을 주는 추세를 감지할 수 있습니다. 일부 경우 힙 사용률이 높으면 CPU 사용률 또는 하베스트 기간이 높아지거나 둘 모두가 높아질 수 있습니다.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Health아래
Number of Historical Metrics(기록 메트릭 수)
Number of Historical Metrics
(기록 메트릭 수) 메트릭은 Enterprise Manager가 SmartStor에서 관찰하고 저장한 총 메트릭 수입니다. 이 수치는 에이전트가 새 메트릭을 보고할 때 증가하고 메트릭이 SmartStor에서 만료 처리될 때 감소합니다. 일시적으로 에이전트 연결이 끊기고 기존 메트릭에 대한 보고 데이터가 늘어나도 이 수치는 변경되지 않습니다.기록 메트릭 수는 기록 쿼리 성능과 매일 밤 수행되는 SmartStor 기간 재지정의 오버헤드에 영향을 줍니다. 이 값이 늘어나는 것은 다음과 같은 문제를 나타낼 수 있습니다.
- 메트릭 누수제어되지 않는 에이전트 연결이 있는 불안정한 모니터링 환경으로 인해 메트릭의 수가 점차적으로 늘어나는 문제입니다.
- 메트릭 급증새 에이전트의 급증 또는 잘못 지정된 SQL 에이전트 메트릭으로 인해 메트릭의 수가 급속하게 늘어나는 문제입니다.
이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Connections아래
Partial Metrics without Data(데이터 없는 부분 메트릭)
Partial Metrics without Data
(데이터 없는 부분 메트릭) 메트릭은 더 이상 라이브로 보고되지 않는 에이전트 메트릭의 수를 알려 줍니다. 이러한 메트릭은 힙 메모리를 소비하며, "Historical Metrics"(기록 메트릭 수)의 메트릭 수에 포함되므로 쿼리 성능에 부정적인 영향을 줍니다.Partial Metrics without Data
(데이터 없는 부분 메트릭) 메트릭의 값이 증가하지 않는 경우에는 이러한 성능 저하가 그다지 크지 않습니다.기록 쿼리 응답성에 문제가 발생하거나 SmartStor 기간 재지정 시간이 길어지는 경우에는
Partial Metrics without Data
(데이터 없는 부분 메트릭) 메트릭의 값을 Partial Metrics with Data
(데이터 있는 부분 메트릭) 메트릭의 값과 비교하십시오. Partial Metrics with Data
(데이터 있는 부분 메트릭) 메트릭은 메트릭 브라우저 트리의 Enterprise Manager | Data Store | SmartStor | MetaData
아래에서 볼 수 있습니다. Partial Metrics without Data
(데이터 없는 부분 메트릭) 메트릭의 값이 Partial Metrics with Data
(데이터 있는 부분 메트릭) 메트릭의 값과 비슷한 경우에는 SmartStor 도구를 사용하여 불필요한 메트릭 메타데이터를 제거하십시오.이 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Data Store | SmartStor | MetaData아래
참고:
SmartStor 도구 사용에 대한 자세한 내용은 SmartStor 데이터 구성 및 관리를 참조하십시오.Number of Traces in Insert Queue(삽입 큐의 추적 수)
Enterprise Manager는 들어오는 모든 이벤트를 트랜잭션 추적 삽입 큐에 삽입하려고 시도합니다.
Number of Traces in Insert Queue
(삽입 큐의 추적 수) 지원 기능 메트릭은 이전 시간 조각 동안 큐에 포함된 평균 이벤트 수를 표시합니다.Number of Traces in Insert Queue
(삽입 큐의 추적 수) 메트릭은 Enterprise Manager가 트랜잭션 추적을 처리할 수 있는지 여부를 나타냅니다. 새 이벤트가 들어올 때 트랜잭션 추적 삽입 큐가 가득 찬 경우에는 해당 이벤트가 드롭됩니다. Transactions:Number of Dropped Per Interval
(트랜잭션:간격당 드롭 수) 메트릭을 보고 간격 중에 Enterprise Manager가 처리하지 못해 드롭된 트랜잭션 추적 수를 확인할 수 있습니다.Transactions:Number of Dropped Per Interval
(트랜잭션:간격당 드롭 수) 메트릭은 다음 위치에서 볼 수 있습니다.- 메트릭 브라우저 트리의Enterprise Manager | Data Store | Transactions아래
- Performance.Transactions.Num.Dropped.Per.Interval아래의perflog.txt
"Number of Traces in Insert Queue"(삽입 큐의 추적 수) 메트릭은 다음 위치에서 볼 수 있습니다.
- 메트릭 브라우저 트리의Enterprise Manager | Data Store | Transactions아래
- Performance.Transactions.TT.Queue.Size아래의perflog.txt
SmartStor Queries Per Interval Metric(간격당 Smartstor 쿼리)
SmartStor Queries per Interval
(간격당 SmartStor 쿼리) 메트릭은 이전 시간 조각 동안 받은 메트릭 데이터에 대한 쿼리 수를 보여 줍니다.메트릭 쓰기와 메트릭 쿼리의 균형에 따라 SmartStor 디스크 구성 요구 사항이 결정됩니다.
메트릭 쿼리 부하의 성능을 평가하려면 다음 메트릭을 확인하십시오.
- SmartStor Queries per Interval(간격당 SmartStor 쿼리) 메트릭
- SmartStor Queries Duration (ms)(SmartStor 쿼리 지속 시간(ms)) 메트릭이 메트릭은 이전 시간 조각 동안의 평균 쿼리 기간을 보여 줍니다.
SmartStor Queries Duration (ms)
(Smartstor 쿼리 지속 시간(ms)) 메트릭 및 SmartStor Queries per Interval
(간격당 Smartstor 쿼리) 메트릭은 다음 위치에서 볼 수 있습니다.- 메트릭 브라우저 트리의Enterprise Manager | Internal | Query아래
- perflog.txt
추가 Enterprise Manager 지원 기능 메트릭
다음 목록에는 그 밖의 유용한 지원 기능 메트릭 중 일부와 그에 대한 간략한 설명이 나와 있습니다.
- EM CPU Used (%)(EM CPU 사용(%))측정 기간 동안 EM(Enterprise Manager) 스레드의 프로세서 사용률입니다. 15초 시간 조각 동안의<EM이 사용한 프로세서 시간(ms)>/ (15000 *<프로세서 수>)로 계산됩니다.이 메트릭은 Investigator 트리의Enterprise Manager|CPU아래에 있습니다.참고:이 값은 시간 조각 동안의 총 프로세서 사용률을 반영하지 않습니다. 전체 프로세서 사용률에서 Enterprise Manager가 차지하는 부분만 측정합니다.
- Number of Agents(에이전트 수)현재 연결된 에이전트의 수입니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Connections아래에서 볼 수 있습니다.
- Harvest Capacity (%)(하베스트 수용 능력(%))15000 밀리초(15초)의 시간 조각 동안 데이터 하베스트가 차지하는 시간의 백분율입니다. 100%는 15초 전체입니다. 예를 들어 하베스트 기간이 15000 밀리초인 경우 이 메트릭 값은 100입니다.참고:건전한 모니터링 환경에서 하베스트 수용 능력은 25% 미만으로 유지됩니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Health아래에서 볼 수 있습니다.
- Number of Metrics(메트릭 수)Enterprise Manager의 메트릭 부하입니다. 에이전트의 연결이 끊어진 경우 이 값은 드롭됩니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Connections아래에 있습니다.
- SmartStor Capacity (%)(SmartStor 수용 능력(%))15000 밀리초(15초)의 시간 조각 동안 SmartStor 쓰기 프로세스가 차지하는 시간의 백분율입니다. 100%는 15초 전체입니다. 예를 들어 SmartStor 쓰기 기간이 15000 밀리초인 경우 이 메트릭 값은 100입니다.참고:건전한 모니터링 환경에서 SmartStor 수용 능력은 25% 미만으로 유지됩니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Health아래에 있습니다.
- Active Incoming Threads(활성 들어오는 스레드)클라이언트의 메시지를 활발하게 처리하고 있는 스레드의 수입니다."Active Incoming Threads"(활성 들어오는 스레드) 메트릭은 동시 쿼리 실행에 대한 정보를 제공합니다. 여러 개의 동시 메트릭 쿼리는 다른 SmartStor 동작을 방해할 수 있으며 SmartStor 기간을 늘릴 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Messaging아래에 있습니다.
- Active Outgoing Threads(활성 나가는 스레드)클라이언트에 데이터를 활발하게 전달하고 있는 스레드의 수입니다.이 메트릭은 쿼리 동시성을 나타내는 또 다른 지표가 될 뿐 아니라, 데이터 전달 작업 중인 스레드의 수가 증가할 경우에는 네트워크에 문제가 있음을 나타낼 수도 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Messaging아래에 있습니다.참고:나가는 스레드 및 성능 문제에 대한 자세한 내용은 추가 클라이언트 연결을 지원하도록 클러스터 구성을 참조하십시오.
- Number of Dependent Calculator Input Metrics(종속 계산기 입력 메트릭 수)종속 계산기의 입력인 총 메트릭 수입니다.종속 계산기는 다른 계산기가 생성한 메트릭 값을 기반으로 작동합니다. 에이전트에서 보고한 메트릭 값도 종속 계산기의 입력에 포함될 수 있습니다. 이 수치는 다른 계산기에서 생성한 메트릭뿐 아니라 종속 계산기에 제공된 모든 메트릭을 나타냅니다. 종속 계산기는 응용 프로그램 심사 맵 값에 대한 가장 일반적인 경고 요소입니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal아래에 있습니다.
- Number of Non Dependent Calculator Input Metrics(비종속 계산기 입력 메트릭 수)비종속 계산기의 입력인 총 메트릭 수입니다.비종속 계산기는 에이전트가 보고한 메트릭을 기반으로 작동하며 다른 계산기가 출력한 메트릭을 기반으로 하지 않습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal아래에 있습니다.
- Total Number of Evaluated Metrics(총 평가 메트릭 수)(계산기)모든 계산기에 대해 평가된 총 메트릭 수입니다. Number of Dependent Calculator Input Metrics(종속 계산기 입력 메트릭의 수)와 Number of Non-dependent Calculator Input Metrics(비종속 계산기 입력 메트릭의 수)의 합입니다.이 수가 급증하는 경우 Enterprise Manager는 많은 실시간 계산을 수행하며, 이로 인해 CPU 리소스가 오버로드될 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|InternalCalculators아래에 있습니다.
- <calculator name> | Total Number of Evaluated Metrics(총 평가 메트릭 수)개별 계산기에 대해 평가된 총 메트릭 수입니다.이 메트릭의 값은 관련 계산기가 하베스트 기간에 영향을 주는 정도를 나타냅니다. Enterprise Manager 수용 능력을 최적화하기 위해 많은 수의 메트릭을 평가하는 계산기에 중점을 둡니다.참고:이 메트릭은 계산기가 정의된 경우에만 Investigator에 나타납니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal아래에 있습니다.
- Alert Action Processing Time (ms)(경고 작업 처리 시간(ms))Enterprise Manager가 모든 경고 작업을 처리하는 데 걸리는 시간입니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Calculator Queries Wait Time (ms)(계산기 쿼리 대기 시간(ms))비계산기 쿼리 루프가 완료될 때까지의 대기 시간을 포함하여 계산기 쿼리 스레드가 현재 작업을 완료할 때까지 경과된 시간입니다.새 계산기 쿼리 처리는 모든 이전 시간 조각 비계산기가 클라이언트에게 전달을 완료한 후에 시작됩니다. 이 수가 급증하는 경우 Enterprise Manager는 많은 실시간 계산을 수행하며, 이로 인해 CPU 리소스가 오버로드될 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Non Calculator Queries Delivery Time (ms)(비계산기 쿼리 전달 시간(ms))Enterprise Manager가 특정 시간 조각 동안 비계산기 쿼리를 실행하고 모든 요청 클라이언트에 제공하는 데 걸린 시간입니다.모든 계산기 쿼리가 실행된 후 Enterprise Manager는 비계산기 쿼리를 실행하고 그 결과를 요청한 모든 클라이언트에게 보냅니다. 이 수치가 급증하면 Enterprise Manager가 많은 비계산기 쿼리 결과를 클라이언트에 보내고 있음을 의미하며 이로 인해 네트워크가 오버로드될 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Non Calculator Queries Excess Time (ms)(비계산기 쿼리 초과 시간(ms))비계산기 쿼리가 특정 시간 조각 이후 완료될 때까지 대기하는 초과 시간입니다.클라이언트는 비계산기 쿼리 요청을 Enterprise Manager에게 보내고 Enterprise Manager는 결과를 반환합니다. 이 프로세스가 시간 조각 내에 완료되지 않으면 완료될 때까지 이월됩니다. 이 메트릭은 비계산기 쿼리가 특정 시간 조각 이후 연장된 시간을 보여 줍니다.이 메트릭을 기반으로 비계산기 쿼리로 인해 Enterprise Manager가 오버로드되는지 여부를 결정할 수 있습니다. Introscope의 로드가 적을 경우 이 메트릭 값은 대개 0입니다. 0보다 크면 Enterprise Manager가 오버로드되어 특정 시간 조각 내에 메트릭 쿼리를 처리할 수 없음을 의미합니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Metrics From All Agents(모든 에이전트의 메트릭)마지막 시간 조각 동안 데이터를 보낸 모든 연결된 에이전트에서 생성된 총 고유 메트릭 수입니다. 이 수는 기록 메트릭을 포함하지 않습니다. 클램프 설정은 이 수에 영향을 주지 않습니다.introscope.enterprisemanager.agent.metrics.limit 클램프가 트리거될 경우 이 메트릭의 값은 제한이 초과된 정도를 알려 줍니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Spooling Data File Write Time (ms)(스풀링 데이터 파일 쓰기 시간(ms))Enterprise Manager가 특정 시간 조각 동안 하베스트된 데이터를 스풀링 파일(.spool)에 쓰는 데 걸린 시간입니다.이 메트릭을 기반으로 하베스트 주기를 모니터링할 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Spooling Preparation Time (ms)(스풀링 준비 시간(ms))Enterprise Manager가 특정 시간 조각 동안 하베스트된 데이터를 스풀링 파일(.spool)에 쓰기 위해 준비하는 데 걸린 시간입니다.이 메트릭을 기반으로 하베스트 주기를 모니터링할 수 있습니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|Internal|Harvest아래에 있습니다.
- Total Number of Evaluated Metrics(총 평가 메트릭 수)(관리 모듈 계산기)관리 모듈 계산기의 입력인 메트릭의 수입니다.이 수치가 급증하면 쿼리 또는 쿼리가 있는 계산기가 너무 많은 메트릭과 일치하고 있음을 나타냅니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|InternalManagement Module Calculators아래에 있습니다.
- Metric Matches Per Interval(간격당 메트릭 일치 수)마지막 시간 조각 동안 모든 쿼리에서 평가된 총 메트릭 수입니다.이 메트릭은 다음과 같은 작업이 발생할 때 값을 표시합니다.
- 새 에이전트가 Enterprise Manager에 연결할 때
- 관리 모듈 메트릭 그룹화를 포함한 사용자 생성 쿼리와 내부 쿼리에서 정규식이 사용될 때
- 사용자가 메트릭 브라우저 트리에서 메트릭을 선택할 때
- 사용자가 그래프가 포함된 대시보드를 열 때
이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|InternalMetric Group아래에 있습니다. - Queued Queries Per Interval(간격당 큐에 저장된 쿼리 수)하베스트 주기 간격에서 현재 처리 대기 중인 쿼리의 수입니다. 이 값은 시작한 후 일반적으로 0입니다.이 메트릭은 메트릭 브라우저 트리의Enterprise Manager|InternalMetric Group아래에 있습니다.
지원 기능 메트릭을 사용하여 CA CEM 성능 모니터링
CA APM은 TIM이 보고하는 데이터의 처리를 모니터링하는 여러 CA CEM 지원 기능 메트릭을 제공합니다. 표시되는 CA CEM 지원 기능 메트릭은 Enterprise Manager 서비스가 할당된 위치에 따라 달라집니다.
CA CEM 지원 기능 메트릭을 보고 CA CEM 건전성 및 성능 문제를 해결할 수 있습니다. CA CEM 데이터의 다음 원본을 검사하여 메트릭을 확인하십시오.
- 메트릭 브라우저 트리의 CA CEM 건전성 메트릭
- tessperflog.txt파일
CA CEM 지원 기능 메트릭은 메트릭 브라우저 트리의 다음 위치에 표시됩니다.
*SuperDomain* | Custom Metric Host (Virtual) | Custom Metric Process (Virtual) | Custom Metric Agent (Virtual) | Enterprise Manager | CEM
다양한 범주의 CA CEM 건전성 메트릭에는 다음 메트릭 유형이 포함됩니다.
CA CEM 캐시 메트릭
CA CEM 데이터는 데이터베이스 쿼리의 오버헤드를 방지하기 위해 TIM 수집 서비스를 실행하는 수집기에 캐시됩니다. 캐싱은 성능을 위해 메모리의 균형을 맞추는 것입니다.
LRU(Least Recently Used: 오래 전에 사용한 항목) 캐시 메트릭은 세 가지 유형의 CA CEM 데이터(인시던트, 로그인 이름 및 모니터링되는 사용자)에 대한 캐시 성능 정보를 제공합니다. "메트릭 브라우저" 탭의 Investigator 트리에 있는 다음 위치에서 관련 LRU 캐시 메트릭을 확인할 수 있습니다.
- 사고CEM | 캐시 | Incident LRU Cache(인시던트 LRU 캐시)
- 로그인 이름CEM | 캐시 | Login Name LRU Cache(로그인 이름 LRU 캐시)
- 모니터링되는 사용자CEM | 캐시 | User LRU Cache(사용자 LRU 캐시)
각 캐시에 대해 다음과 같은 네 개의 기본 LRU 캐시 메트릭이 보고됩니다.
- 현재 크기현재 사용 중인 캐시 메모리의 양입니다.
- Hit Count(적중 수)요청된 데이터를 캐시에서 찾은 횟수입니다.
- Miss Count(누락 수)요청된 데이터를 캐시에서 찾지못한횟수입니다.
- Total Capacity(총 수용 능력)캐시에 할당된 총 메모리 크기입니다.
캐시 적중률(<적중 수> / <누락 수>)이 1보다 크면 캐시에서 작업이 효율적으로 수행되며 대부분 APM 데이터베이스 쿼리 오버헤드가 방지됩니다. 캐시 적중률이 1보다 작으면 다음 중 하나 이상의 조건에 해당되는 것입니다.
- 정의된 데이터 값의 수가 캐시 크기에 비해 너무 큽니다(예: 인시던트, 로그인 이름, 사용자).
- 값의 도착 패턴이 균일하게 분산되어 있습니다. 캐시는 참조의 위치에 의존합니다. 예를 들어 특정 기간에 모니터링되는 사용자의 하위 집합이 트랜잭션에 관련되는 것으로 예상됩니다.
- 캐시 크기가 사용 환경에 비해 너무 작습니다.
캐시 적중률이 일시적으로 낮아지는 것은 응용 프로그램 사용에 변화가 있음을 나타낼 수 있습니다. 예를 들어 이전에 온라인 상태였던 CA CEM 사용자 대신 다른 시간대의 CA CEM 사용자로 바뀔 수 있습니다. 이러한 경우는 문제가 되지 않습니다. 그러나 캐시 적중률이 일관되게 낮은 경우에는 캐시 크기를 늘리는 것이 좋습니다. 캐시 크기는 <
EM 홈
>/config/tess-default.properties
파일에서 지정합니다. tess-customer.properties
파일을 생성하여 값을 구성할 수도 있습니다.캐시 크기를 늘리기 전에 현재 JVM 힙 사용률이 증가된 메모리 할당량에 충분한 가용 공간을 허용하는지 확인하십시오.
캐시 사용률은 다음 수식을 사용하여 계산됩니다.
(<현재 크기> / <전체 수용 능력>) * 100
캐시 사용률이 일관되게 50% 미만인 경우 구성된 캐시 크기를 줄여 힙 메모리를 절약할 수 있습니다. 그러나 캐시 크기는 개체 수로 지정됩니다. 현재 JVM 환경에서 500개의 사용자, 로그인 또는 인시던트 개체는 많은 양의 힙 메모리를 나타내지 않습니다. 캐시 크기 속성을 적절히 조금씩 조정하면 수용 능력에 거의 영향을 주지 않습니다.
참고:
캐시 지원 기능 메트릭은 클러스터의 모든 수집기와 MOM에 대해 표시됩니다. 그러나 컴퓨터에서 TIM 수집 서비스가 실행되고 있지 않을 때는 캐시가 사용되지 않습니다.CA CEM 프로세서 메트릭
프로세서와 서비스는 TIM 수집 서비스의 기능적 하위 구성 요소입니다. 프로세서에 대한 지원 기능 메트릭은 다음 정보를 제공합니다.
- 다양한 유형의 CA CEM 데이터에 대한 TIM 수집 서비스별 도착 및 처리 비율
- CA CEM 데이터 오류 빈도
다음은 크기 조정 및 수용 능력 계획 시 유용한 메트릭입니다.
CEM|Processors(프로세서)|…|처리 시간
CEM|Processors(프로세서)|…|Processing Delay(처리 지연)
독립 실행형 Enterprise Manager의 경우 메트릭 브라우저 트리의 다음 위치에서 이러한 메트릭을 확인할 수 있습니다.
*SuperDomain*|Custom Metric Host (Virtual)|Custom Metric Process (Virtual)| Custom Metric Agent (Virtual)|Enterprise Manager
클러스터 환경에서 TIM 수집 서비스를 실행하는 수집기의 경우 메트릭 브라우저 트리의 다음 위치에서 이러한 메트릭을 확인할 수 있습니다.
*SuperDomain*|Custom Metric Host (Virtual)|Custom Metric Process (Virtual)| Custom Metric Agent (Virtual)(Collector1@5001)|Enterprise Manager
프로세서 메트릭이나 서비스 메트릭의 처리 시간이 꾸준히 늘어나면 TIM 수집 서비스가 오버로드되었음을 나타냅니다. 꾸준히 증가하는 추세를 확인하려면 기록 모드를 사용하여 이러한 메트릭을 조사합니다.
"Processing Delay"(처리 지연) 메트릭 시간이 길거나 증가하는 경우 하나 이상의 TIM과 TIM 수집 서비스 간에 파일 전송 문제가 있음을 나타냅니다. 이는 오버로드된 TIM 또는 네트워크 지연으로 인한 것일 수 있습니다.
"남은 큐 공간" 메트릭 값은 주기적으로 "전체 큐 공간" 메트릭의 값과 같아져야 합니다. 두 값이 서로 같아질 때가 없으면 해당 유형의 CA CEM 데이터에 대해 TIM 수집 서비스의 수용 능력이 초과된 것입니다.
APM 데이터베이스 연결 풀 지원 기능 메트릭
Enterprise Manager 서비스는 Enterprise Manager 서비스와 APM 데이터베이스 간의 데이터 교환을 가능하게 하는 APM 데이터베이스 연결 풀의 할당 및 사용량을 설명하는 메트릭을 제공합니다. APM 데이터베이스 연결 풀 지원 기능 메트릭은 Workstation Investigator에서 다음 항목 아래에 표시됩니다.
Custom Metric Agent|Enterprise Manager|Internal|Database|Connection Pools
이러한 메트릭은
tessperflog.txt
로그 파일에서도 사용할 수 있으며 Internal.Database.Connection Pools라는 접두사를 갖습니다.두 개의 내부 데이터 원본에 대해 메트릭이 제공됩니다. 데이터 원본은 응용 프로그램 심사 맵과 TIM 수집 서비스가 각각 APM 데이터베이스와 상호 작용하는 데 사용되는 다음과 같은 연결 개체입니다.
- APM 데이터 원본
- CEM 데이터 원본
"apmDataSource"라는 이름은 APM 데이터 원본을 식별합니다. CA CEM 데이터 원본의 이름은 암호화됩니다.
다음 목록에서는 APM 데이터베이스 연결 풀 지원 기능 메트릭에 대해 설명합니다.
- numBusyConnections현재 사용 중인 스레드의 수입니다.
- numConnections열려 있는 연결의 수입니다.
- numIdleConnections열려 있으나 사용 중이 아닌 연결의 수입니다.
- numUnclosedOrphanedConnections시간 만료 임계값을 초과한 후 사용되지 않는 상태로 남아 있는 열려 있는 연결의 수입니다.
- threadPoolNumTasksPending큐에 저장되고 연결 대기 중인 작업의 수입니다.
tessperflog.txt
tessperflog.txt
파일에는 메트릭 브라우저 트리에 표시되는 CA CEM 지원 기능 메트릭과 데이터베이스 연결 풀 메트릭이 포함되어 있습니다. 메트릭 이름은 메트릭 브라우저 트리에 나타나는 메트릭 이름과 동일하되, 메트릭 경로 구분 기호 "|"(파이프)와 메트릭 이름 구분 기호 ":"(콜론)만 "."(점)으로 바뀝니다. 기록된 지원 기능 정보는 외부 분석용으로 유용하며 CA Support에서 사용하는 도구로도 유용합니다.tessperflog.txt
파일의 기본 위치는 <EM 홈
>/logs 디렉터리입니다.IntroscopeEnterpriseManager.properties
파일에서 tessperflog.txt
파일에 대해 다음과 같은 속성을 구성할 수 있습니다.- log4j.appender.tessperformance.File경로 및 파일 이름을 지정합니다.
- introscope.tess.performance.compressedtessperflog.txt 파일의 압축되거나 압축되지 않은 형식 사이에서 선택하려면 이 속성을 추가합니다. 다음 설정을 사용할 수 있습니다.
- True - 파일을 CSV(쉼표로 구분된 값) 형식으로 압축합니다.기본 형식은 압축된 형식입니다. 이 형식은 데이터 분석용 스프레드시트로 가져오는 데 유용합니다.
- False - 파일을 압축되지 않은 세부 정보 표시 형식으로 제공합니다.압축되지 않은 형식에서는 이 파일의 각 줄마다 <field>: <value> 쌍이 포함됩니다. 이 형식은 보다 읽기 쉬운 형식입니다.
지원 기능 메트릭을 사용하여 Workstation 연결 모니터링
Connections:Number of Workstations
지원 기능 메트릭은 Workstation 연결의 현재 개수를 보여 줍니다. 클러스터 환경에 있는 수집기의 경우 이 메트릭의 값은 0입니다.Connections:Number of Workstations
메트릭은 메트릭 브라우저 트리의 다음 위치에서 볼 수 있습니다.*SuperDomain*|Custom Metric Host (Virtual)|Custom Metric Process (Virtual)| Custom Metric Agent (Virtual)(*SuperDomain*)|Enterprise Manager| Connections:Number of Workstations
참고:
메트릭은 명령줄 Workstation 또는 WebView 연결을 반영하지 않습니다.Connections:Number of Workstations