수용 능력 계획 및 서버 배포 옵션
하드웨어 요구 사항을 계산할 때는 모니터링되는 환경의 작업량을 고려하십시오.
apmdevops104kr
하드웨어 요구 사항을 계산할 때는 모니터링되는 환경의 작업량을 고려하십시오.
2
2
독립 실행형 Enterprise Manager 기본 요구 사항
설치 섹션에서는 독립 실행형 Enterprise Manager 설치를 위한 최소 하드웨어 요구 사항에 대해 자세히 설명합니다. 프로덕션 환경에서 리소스 요구 사항은 모니터링 대상에 따라 크게 달라집니다. 다음 권장 사항은 일반적인 지침일 뿐입니다. 사용 중인 Enterprise Manager에 모니터링되는 환경에 적당한 리소스가 있는지 확인하려면 시스템을 모니터링하십시오.
독립 실행형 Enterprise Manager 부하 | CA Technologies 리소스 권장 사항 |
에이전트 100개에 응용 프로그램 프런트엔드 20개(에이전트 메트릭 약 500,000개), CA CEM 데이터 부하 없음 | 클록 속도가 약 2 GHz인 최소 4개의 CPU 코어 및 RAM 2 GB |
에이전트 100개에 응용 프로그램 프런트엔드 20개(에이전트 메트릭 약 500,000개), Enterprise Manager에서 CA CEM 데이터 부하 처리 | CPU 코어 8개, RAM 32 GB |
CA CEM 데이터 부하만 있고 에이전트 메트릭 없음 | CPU 코어 8개, RAM 20 GB |
Enterprise Manager CPU 사용량
Enterprise Manager는 15초마다 메트릭을 처리합니다. 이 프로세스를
하베스트 주기
라고 하며, 매 15초의 기간은 시간 조각
이라고 합니다. 각 시간 조각의 끝에는 Enterprise Manager가 해당 시간 조각 동안의 데이터를 처리하느라 CPU 사용량이 급등합니다. "Harvest Duration"(하베스트 지속 시간)(ms) 지원 기능 메트릭은 각 시간 조각 동안 메트릭을 처리하는 데 소요된 시간을 보고합니다."SmartStor Duration"(SmartStor 지속 시간)(ms) 지원 가능성 메트릭은 Enterprise Manager가 스풀 데이터를 준비하여 SmartStor 데이터베이스에 쓰는 데 소요된 시간을 보고합니다. 최종 스풀링만 제외하고 하베스트 주기에는 CPU가 많이 사용됩니다.
건전한 상태의 Enterprise Manager에서 하베스트 기간은 대부분 3500밀리초 미만입니다. 메트릭이나 실행되는 계산기의 수가 변경되지 않은 상태에서 "하베스트 기간" 지원 가능성 메트릭의 값이 증가하는 경우는 CPU 리소스에 대한 경합이 발생했음을 나타낼 수 있습니다. 따라서 "하베스트 기간" 지원 가능성 메트릭을 부적절한 CPU 프로비저닝의 표시기로 사용할 수 있습니다.
Enterprise Manager는 정상 상태의 메트릭 처리 외에도 연결 처리, 트랜잭션 추적, 응용 프로그램 심사 맵 유지 관리, 외부 제품 통합 서비스, TIM 결함 및 통계 처리를 비롯한 다양한 다른 기능을 처리합니다. 또한 기간 재지정 및 CA CEM 통계 집계와 같은 정기적 유지 관리 작업에는 CPU 가용 공간이 필요합니다. 이 때문에 하베스트 주기 중의 CPU 급등은 3~4초 이상 지속되지 않아야 합니다. 이 사용 패턴과 필요 시에만 CPU 리소스가 사용되는 상황은 평균 또는 샘플링된 CPU 사용량이 낮게 나타날 수 있음을 의미합니다. 따라서 CPU 사용량이 낮다고 해서 Enterprise Manager의 사용률이 낮은 것으로 해석해서는
안 됩니다
. CA CEM 데이터 부하 없이 에이전트 메트릭 부하가 포화 수준일 때 정상 상태의 평균 CPU 사용률은 45% 이하여야 합니다.Enterprise Manager 파일 시스템 요구 사항
Enterprise Manager 내부 데이터베이스(SmartStor, variance.db 및 traces.db)의 성능은 디스크 I/O 성능에 따라 달라집니다. 이러한 데이터베이스는 로컬 디스크 또는 고속 SAN에 배치하십시오. NFS(네트워크 파일 시스템) 저장소는 권장되지 않습니다.
Enterprise Manager 기능은 SmartStor 디스크 구성에 매우 민감합니다. 대부분의 환경에서 SmartStor 디스크 저장소를 순차적 쓰기에 맞게 최적화하십시오.
다음과 같은 Enterprise Manager는 SmartStor 디스크 구성이 순차적 쓰기에 맞게 최적화된 경우 최대의 확장성을 얻습니다.
- 높은 메트릭 부하를 처리하며 메트릭 쿼리 부하가 비교적 낮은 Enterprise Manager
- 많은 메트릭 구독을 처리하며 메트릭 쿼리 부하가 비교적 낮은 MOM
Enterprise Manager가 처리하는 메트릭 부하는 비교적 낮지만 클라이언트로부터의 메트릭 쿼리 부하가 높은 경우에는 임의 읽기에 맞게 SmartStor 디스크 구성을 최적화하십시오.
Enterprise Manager 메모리 요구 사항
작업 부하에 대한 힙 요구 사항과 Enterprise Manager 서비스 예를 보여 줍니다. 컴퓨터 메모리는 Java 힙 요구 사항에 OS에서 파일 캐싱 등에 사용할 용도로 2 GB를 더한 만큼 제공하는 것이 좋습니다.
수집기 요구 사항
클러스터에 참여하여 에이전트나 TIM 중 하나 또는 둘 모두에서 데이터를 수집하는 Enterprise Manager를
수집기
라고 합니다. 수집기는 클라이언트 연결이나 다른 CA Technologies 제품과의 서비스 기반 통합을 처리하지 않습니다. 수집기는 MOM이 전달하는 메트릭 쿼리를 실행합니다.수집기의 리소스 요구 사항은 독립 실행형 Enterprise Manager의 요구 사항과 크게 다르지 않습니다. 그러나 수집기의 메모리 수용 능력은 동일한 구성으로 동일한 하드웨어에서 실행되는 독립 실행형 Enterprise Manager보다 높습니다.
높은 모니터링 부하를 처리하려면 힙 크기가 6 GB인 64비트 JVM에서 수집기를 실행하는 것이 좋습니다. 힙 크기가 이 정도가 되려면 컴퓨터의 실제 RAM이 8 GB 이상이어야 합니다.
MOM 요구 사항
클러스터에서 MOM(Manager Of Managers)은 클라이언트 연결을 처리하고, 대시보드를 표시하고, 쿼리 및 계산기를 실행하고, 다른 CA Technologies 제품과 데이터를 교환합니다. MOM은 에이전트 또는 TIM의 데이터를 처리하지 않습니다. 에이전트는 초기에 MOM에 연결할 수 있습니다. 그러면 MOM는 에이전트를 수집기 연결로 리디렉션합니다. 클러스터에서는 이 방법으로 부하 분산을 구현합니다.
MOM은 관리 모듈에 정의된 계산기를 대신하여, 또는 응용 프로그램 심사 맵의 일부로, 메트릭 쿼리를 통해 가져온 메트릭을 구독합니다. MOM의 SmartStor에는 이러한 계산기에서 생성하는 메트릭만 저장됩니다. 대부분의 클러스터된 환경에서는 필요한 MOM SmartStor 수용 능력이 수집기 SmartStor 수용 능력보다 낮습니다. 계산기 실행 및 서비스 지향 데이터 교환은 CPU 소모가 많은 동작입니다. MOM에 필요한 CPU 리소스는 수집기보다 많은 반면 디스크 I/O 성능 및 수용 능력은 수집기보다 낮습니다.
높은 모니터링 부하를 처리하려면 힙 크기가 12 GB인 64비트 JVM에서 MOM을 실행하는 것이 좋습니다. 컴퓨터의 실제 RAM은 14 GB 이상이어야 합니다.
업그레이드 후 증가한 MOM 메트릭 부하 처리
응용 프로그램 심사 맵에는 응용 프로그램 프런트엔드 및 백엔드를 기반으로 메트릭 데이터를 요약하고 표시하는 추가 계산기가 도입되었습니다.
따라서 9.0 이전 버전의 Introscope에서 업그레이드하는 경우 MOM CPU 사용량이 증가할 수 있습니다. 증가량은 크지 않으므로 업그레이드 전에 MOM이 수용 능력에 거의 도달했던 환경에서만 리소스 증가가 필요합니다.
MOM 계산기 수용 능력을 평가하려면 "하베스트 기간" 지원 가능성 메트릭을 사용하십시오. 하베스트 기간이 3500밀리초를 초과하는 경우가 많으면 MOM에 추가 CPU 리소스를 제공하는 것이 좋습니다. 실질적으로 MOM에 추가 CPU 리소스를 제공할 수 없는 상황일 때는 다음과 같은 방법으로 MOM의 부하를 줄일 수 있습니다.
- 대시보드, 그래프 및 경고 같은 불필요한 관리 모듈 요소를 제거합니다.
- 보다 적은 수의 메트릭에 맞게 메트릭 그룹화를 조정합니다.
- 보다 적은 수의 메트릭을 보고하도록 에이전트를 조정합니다.
- 클러스터에 연결된 에이전트의 수를 줄입니다.
CA APM 클러스터 요구 사항
클러스터 수용 능력 계획에 영향을 주는 요인으로는 여러 가지가 있습니다.
MOM 및 수집기의 로컬 네트워크 요구 사항
가능하면 항상 MOM과 해당 수집기를 동일한 데이터 센터에, 가급적이면 동일한 서브넷에 배치하십시오. 수집기와 MOM 간의 연결이 방화벽이나 라우터 종류를 통과할 경우에는 Workstation 응답성에 부정적인 영향이 있습니다. 지연 시간이 너무 길면 MOM과 수집기의 연결이 끊어집니다. MOM과 수집기가 라우터나 더 나쁘게는 패킷 검사 방화벽 보호 라우터를 통과할 경우 응답 시간이 심하게 느려질 수 있습니다. 수집기가 다음과 같은 상태일 때 MOM과 수집기의 연결이 끊어집니다.
- 네트워크를 통해 60초 이상 응답이 없는 것으로 나타나는 경우(아래의 ping 시간 임계값에 관한 정보 참조)
- 수집기 시스템 클록과 MOM 클록의 차이가 3초를 초과하는 것으로 나타나는 경우
MOM은 매 시간 조각마다 각 수집기에 대한 ping 메트릭을 보고합니다. 최적의 Workstation 응답성을 위해서는 ping 메트릭이 500 ms 미만이어야 합니다.
참고:
Introscope ping 메트릭은 MOM에서 각 수집기에 연결할 때의 왕복 응답 시간 하한만 모니터링합니다. 이 ping 시간은 ICMP 에코 요청을 보내고 에코 응답을 받는 네트워크 ping 시간과는 다릅니다.ping 메트릭을 보려면 "검색" 탭을 사용하여 Investigator 트리의 지원 기능 메트릭 섹션에 있는 "ping"이라는 메트릭을 확인하십시오. Introscope는 각 수집기에 대한 ping 메트릭을 보고합니다.
ping 시간이 임계값인 10초를 초과하면 Enterprise Manager|MOM|Collectors(수집기)|<host@port>:Connected(연결됨) 메트릭의 값이 2로 표시됩니다. IntroscopeEnterpriseManager.properties 파일에서 introscope.enterprisemanager.clustering.manager.slowcollectorthreshold 속성을 변경하여 사용 중인 환경의 이 임계값을 조정할 수 있습니다.
ping 시간이 60초를 초과하면 MOM은 ping 시간이 느린 수집기와의 연결을 자동으로 끊습니다. MOM 연결 끊기는 전체 클러스터가 중단되는 것을 방지합니다.
연결이 끊어진 수집기가 있으면 Enterprise Manager|MOM|Collectors(수집기)|<host@port>:Connected(연결됨) 메트릭의 값이 3으로 표시됩니다. IntroscopeEnterpriseManager.properties 파일에서 introscope.enterprisemanager.clustering.manager.slowcollectordisconnectthreshold 속성을 변경하여 사용 중인 환경의 이 임계값을 조정할 수 있습니다.
팁:
Enterprise Manager|MOM|Collectors(수집기)|<host@port>:Connected(연결됨) 메트릭 값에 대한 경고를 설정할 수 있습니다.참고:
이러한 속성과 알림 생성 및 구성에 대한 자세한 내용은 IntroscopeEnterpriseManager.properties를 참조하십시오.MOM과 수집기의 연결에 대한 제한
메트릭을 제공하는 에이전트의 수에 맞춰 최소 개수의 수집기를 사용하는 것이 좋습니다. 클러스터의 수집기 수를 최소화하면 다음과 같은 잠재적인 문제를 방지할 수 있습니다.
중요!
시간 서버 소프트웨어를 실행하여 클러스터에 포함된 모든 컴퓨터의 클록을 정기적으로 동기화하십시오.- 오래 걸리는 클러스터 시작 시간
- 리소스가 제한된 단일 수집기로 인한 쿼리 성능 저하
참고:
안정성 문제를 방지하고 클러스터 전체 메트릭 쿼리의 크기를 제어하려면 단일 MOM을 10개 이상의 수집기에 연결하지 마십시오. 다음 지원 가능성 메트릭을 사용하여 MOM이 연결된 수집기 목록을 확인하십시오.SuperDomain*|Custom Metric Host (Virtual)|Custom Metric Process (Virtual)| Custom Metric Agent (Virtual)|Enterprise Manager|MOM|Collectors
클라이언트 메시지 큐 조정
각 Enterprise Manager(독립 실행형, 수집기 MOM 및 CDV)에는 나가는 메시지 큐가 각 클라이언트에 대한 소켓 연결마다 하나씩 있습니다. Enterprise Manager에서는 나가는 메시지 큐를 사용하여 클라이언트로 나가는 데이터를 버퍼링합니다. 클라이언트에는 Workstation, CLW(명령줄 Workstation) 인스턴스, WebView, 그리고 MOM이나 CDV(Enterprise Manager가 수집기인 경우)가 포함됩니다.
드물지만 이러한 메시지 큐를 조정하면 클라이언트 연결 확장성이 향상되는 경우가 있습니다. 메시지 큐를 조정하여 클라이언트 연결 확장성을 향상시키기 전에 CA Support에 문의하는 것이 좋습니다.
IntroscopeEnterpriseManager.properties 파일의 transport.outgoingMessageQueueSize 속성은 아웃바운드 메시지 큐의 크기를 제한합니다. 이 속성 값은 메시지 내용의 크기가 아니라 메시지 수를 나타냅니다. transport.outgoingMessageQueueSize 값을 늘리면 Enterprise Manager에 필요한 힙 메모리도 늘어납니다.
고정된 수의 나가는 배달 스레드에서 모든 나가는 메시지 큐를 처리합니다. IntroscopeEnterpriseManager.properties 파일의 transport.override.isengard.high.concurrency.pool.max.size 속성은 사용 가능한 나가는 배달 스레드의 수를 결정합니다.
배달 스레드 수가 활성 클라이언트 연결 수보다 적으면 나가는 메시지가 나가는 메시지 큐에서 대기해야 하므로 큐가 최대 수용 능력에 도달할 수 있습니다. 나가는 메시지 큐에 사용 가능한 공간이 없으면 Enterprise Manager가 요청된 데이터를 클라이언트로 다시 보낼 수 없습니다. 이 경우 클라이언트가 중단된 것으로 나타날 수 있습니다. 큐 크기와 스레드 풀 크기를 늘리면 수용 능력을 높이고 이 문제를 해결할 수 있습니다.
다수의 클라이언트가 각각 대량의 데이터를 요청하는 환경에서 이 문제가 발생할 수 있습니다. 이 같은 상황이 자주 발생하는 환경에서만 메시지 큐를 늘리십시오.
다음과 같은 증상은 나가는 메시지 큐의 문제를 나타냅니다.
- MOM 수집기 로그의 다음 예와 유사한 오류 메시지:[ERROR] [Manager] Outgoing message queue limit of 3000 reached. Connection is responding slowly: Node=Workstation_0, Address=test/x.x.x.x:2298, Type=socket Raw Data Stash
- 다음 위치의 "Active Outgoing Threads"(활성 나가는 스레드) 지원 가능성 메트릭 값이 높음:*SuperDomain*|Custom Metric Host (Virtual)|Custom Metric Process (Virtual)|Custom Metric Agent (Virtual)(*SuperDomain*)|Enterprise Manager|Internal |Messaging: Active Outgoing Threads
나가는 메시지 큐 증상이 자주 발생하는 클러스터의 모든 수집기와 MOM에 대해 나가는 메시지 큐 속성을 조정하십시오.
다음 단계를 따르십시오.
- 각 수집기와 MOM에서 IntroscopeEnterpriseManager.properties 파일을 구성합니다.
- <EM_Home>/config 디렉터리로 이동하고 IntroscopeEnterpriseManager.properties 파일을 엽니다.
- 메시지 큐 속성을 추가하고 값을 6000으로 설정합니다.transport.outgoingMessageQueueSize=6000
- MOM과 모든 수집기에서 transport.override.isengard.high.concurrency.pool.max.size 속성의 주석 처리를 제거하고 값을 10으로 설정합니다.transport.override.isengard.high.concurrency.pool.max.size=10
- 파일을 저장하고 닫습니다.
- 모든 수집기와 MOM을 다시 시작합니다.
- 필요한 경우 JVM 힙 크기를 사용 환경에 적절하게 늘립니다.
대규모 환경을 지원하도록 클러스터 수용 능력 최대화
사용 가능한 컴퓨터 리소스에 따라 Enterprise Manager 수용 능력이 제한됩니다. 따라서 Enterprise Manager에서 모니터링할 수 있는 최대 응용 프로그램 수는 알려져 있지 않습니다. 이 지침은 대규모 리소스 프로비저닝을 효율적으로 사용하는 데 유용합니다.
클러스터 용량을 최대화하면 가능한 가장 많은 수의 응용 프로그램을 모니터링할 수 있습니다. 클러스터 수용 능력을 최대화하려면 다음 지침을 따르십시오.
- 모든 수집기와 MOM에 고속 전용 SmartStor 디스크(SSD가 적합)를 제공하십시오.
- 최대 힙 크기 12 GB 이상의 힙이 있는 64 비트 JVM에서 MOM과 10개의 수집기를 실행하십시오. 컴퓨터의 실제 RAM 크기는 최대 힙 크기보다 2 GB 이상 커야 합니다.
- 각 수집기와 MOM에 클록 속도가 2 GHz보다 빠른 CPU 코어를 8개 이상 제공하십시오.
- 경고와 상위 N 그래프는 필요한 경우에만 구성하십시오.
- 필요한 경우에만 트랜잭션 추적 및 Java 스레드 덤프를 생성하십시오.
CA CEM 트랜잭션 모니터링 수용 능력을 최대화하려면 다음 지침을 따르십시오.
- Enterprise Manager 서비스를 실행할 전용 수집기를 지정하십시오.이 수집기에 TIM 수집 서비스와 통계 집계 서비스를 모두 할당하십시오.참고: CA APM 9.0에는 이 배포를 사용하지 않는 것이 좋습니다.
- Enterprise Manager 서비스를 실행하는 수집기에서 모든 에이전트 연결을 제외하도록 loadbalancing.xml을 구성하십시오.
- Enterprise Manager 서비스를 실행하는 수집기를 호스팅하는 컴퓨터에 32 GB RAM 및 8개의 CPU 코어를 제공합니다.이 컴퓨터에는 전용 SmartStor 디스크가 필요하지 않습니다.
에이전트 부하 분산 구성
작업 부하가 주로 에이전트에 의해 보고되는 메트릭인 클러스터에서는 MOM 에이전트 부하 분산을 구성하여 전체 클러스터 수용 능력을 최적화할 수 있습니다.
참고:
MOM 에이전트 부하 분산에 대한 자세한 내용은 MOM 에이전트 부하 분산 구성을 참조하십시오.오버로드된 Enterprise Manager를 나타내는 결합된 시간 조각
하베스트 주기 중에 Enterprise Manager는 15초 단위의 지난 시각 조각 동안 에이전트에서 받은 모든 메트릭 데이터를 처리합니다. 다음 하베스트 주기가 시작되기 전에 하베스트 주기를 완료할 수 없는 경우에는 두 시간 조각 동안 Enterprise Manager에서 받은 모니터링 데이터가 결합됩니다. 시간 조각 데이터가 결합되면 Enterprise Manager 로그에 주의 수준의 메시지가 나타납니다. 또한 세부 정보 표시 모드의 Enterprise Manager 로그에는 결합된 시간 조각의 다운샘플링된 기간에 대해 설명하는 또 다른 오류 메시지가 있습니다. Workstation에서는 결합된 시간 조각으로 인해 메트릭 그래프에 차이가 나타날 수 있습니다.
결합된 시간 조각은 Enterprise Manager가 오버로드되었음을 나타냅니다. 모니터링 환경이 계속 올바르게 작동하도록 하려면 다음 중 하나 이상의 작업을 수행하십시오.
- Enterprise Manager에 더 많은 리소스를 제공합니다.
- 응용 프로그램 계측 수준을 낮춰 Enterprise Manager의 부하를 줄입니다.
- Workstation 등의 클라이언트에서 발생하는 쿼리 부하를 줄입니다.
- Enterprise Manager와 동일한 컴퓨터에서 실행되는 다른 프로세스가 있는 경우 리소스 경합을 줄입니다.
- 모니터링 부하를 더 많은 Enterprise Manager에 분산합니다.
- 독립 실행형 Enterprise Manager에서 클러스터로 배포를 향상시킵니다.
- 기존 클러스터에 수집기를 추가합니다.
- 모니터링 부하를 여러 클러스터에 분할합니다.
트랜잭션 추적
CA APM 환경에서 다음 이벤트는 트랜잭션 추적을 생성합니다.
- 중단
- 경고(트랜잭션 추적을 생성하도록 구성된 경우)
- 오류(ErrorDetector가 실행되는 경우)
- 변경 이벤트(Change Detector가 실행되는 경우)
- Investigator에서 수동으로 실행되는 트랜잭션 추적
- CA CEM 인시던트
참고:
이 컨텍스트에서 사용되는 이벤트
라는 용어를 APM 상태 콘솔에서 보고되는 이벤트나 CA CEM 이벤트와 혼동하지 마십시오.메트릭 브라우저 트리에서는 트랜잭션 추적 비율을 볼 수 있습니다. Introscope는 Data Store(데이터 저장소) | 트랜잭션:간격당 삽입 수 메트릭을 사용하여 이벤트 비율을 보고합니다.
apm-events-thresholds-config.xml 파일에서 introscope.enterprisemanager.agent.trace.limit 클램프를 설정하여 트랜잭션 추적 생성을 제한할 수 있습니다. 이 클램프는 Enterprise Manager에서 각 간격마다 처리되는 에이전트당 트랜잭션 이벤트 수를 제한합니다.
참고:
이 클램프의 구성에 대한 자세한 내용은 apm-events-thresholds-config.xml을 참조하십시오.한 컴퓨터에서 여러 수집기 및 MOM 실행
단일 컴퓨터에 여러 수집기를 함께 배치하여 실행할 경우에는 예기치 않은 리소스 경합 충돌이 발생할 위험이 있으므로 주의해야 합니다. 사용 중인 환경에서 여러 수집기를 함께 배치해야 할 경우 다음 권장 사항을 따르십시오.
- 64비트 운영 체제를 사용해야 합니다. 이 구성을 사용하면 APM이 대용량 파일 캐시를 활용할 수 있습니다.SmartStor 스풀링 및 기간 재지정을 수행할 경우 OS 파일 캐시는 수집기에 중요한 요소입니다.
- 사용 가능한 RAM 크기는 수집기 최대 힙 크기 합계에 수집기당 1 GB씩을 더한 크기여야 합니다.
- 사용 가능한 CPU 코어를 수집기 간에 배분하려면 IntroscopeEnterpriseManager.properties 파일의 introscope.enterprisemanager.availableprocessors 속성을 사용하십시오.
- 가능하면 각 Enterprise Manager 프로세스에 프로세서 리소스를 고정하십시오.참고:Enterprise Manager에서는 하이퍼스레딩을 효율적으로 사용할 수 없으므로 프로세서를 할당할 때는 프로세서 스레드 수가 아닌 물리적 코어 수를 기준으로 하십시오.
- 최대 네 개의 수집기에서 생성된 variance.db 및 traces.db 파일이 별도의 단일 디스크에 저장될 수 있습니다. 최대 네 개의 수집기가 이 물리적 디스크를 공유하여 모든 variance.db 및 traces.db 파일을 저장할 수 있습니다.
- 샘플 CA APM 크기 조정 권장 사항의 힙 크기 지침을 따르십시오.
- SmartStor 디스크 경합을 최소화하려면 Enterprise Manager 서비스를 에이전트 메트릭 부하를 처리하는 수집기와는 별개의 수집기에 할당하십시오.
- 에이전트 메트릭을 처리하는 각 수집기에 전용 SmartStor 디스크 I/O 경로를 제공하십시오.
수집기 지침을 따라 MOM을 하나 이상의 수집기와 함께 배치할 수 있습니다.
한 컴퓨터에 여러 MOM을 배치할 수도 있습니다. 적정 수준의 RAM, 전용 SmartStor 디스크 I/O 경로 및 MOM 인스턴스당 4개의 CPU를 제공해야 합니다.
Introscope 단독 환경에서는 전용 SmartStor 디스크 I/O 경로에 대한 지침을 따르기만 하면 APM 데이터베이스를 함께 배치하더라도 리소스 경합 위험이 크지 않습니다.
CA EEM 서버를 함께 배치할 경우에도 리소스 경합 위험이 크지 않습니다.
함께 배치하기 위한 Enterprise Manager 스레드 풀 구성
Enterprise Manager에는 15초마다 메트릭 하베스트 작업을 수행하는 스레드 풀이 있습니다. 스레드 풀의 크기는 컴퓨터의 CPU 코어 수에 따라 크게 달라집니다.
다중 프로세스 컴퓨터에서 여러 Enterprise Manager(클러스터)를 실행할 경우 각 Enterprise Manager가 사용 가능한 CPU 코어 중 일부만 사용하도록 구성하면 리소스 공유를 최적화할 수 있습니다.
예를 들어 쿼드 코어 CPU 8개가 있는 컴퓨터에서 Enterprise Manager를 다섯 개 실행할 경우 각 Enterprise Manager의 스레드 풀 크기는 32개의 사용 가능한 CPU 코어를 기준으로 결정됩니다. 이 구성을 사용하면 다섯 개 Enterprise Manager 모두의 스레드에서 32개의 사용 가능한 CPU 코어를 두고 경합할 때 컨텍스트 전환으로 인한 처리량을 줄일 수 있습니다.
IntroscopeEnterpriseManager.properties 파일에는 다음과 같이 사용 가능한 예상 프로세서 수를 Enterprise Manager에 알려 주는 사용 가능한 프로세서 속성이 포함되어 있습니다.
introscope.enterprisemanager.availableprocessors=
CPU 코어가 32개인 호스트 컴퓨터에 다섯 개의 Enterprise Manager가 있는 위 예의 경우에는 각 Enterprise Manager마다 CPU 코어를 6개씩 할당합니다. 그런 다음 다음과 같이 사용 가능한 프로세서 속성을 6으로 설정합니다.
introscope.enterprisemanager.availableprocessors=6
참고:
이 속성의 설정에 대한 자세한 내용은 IntroscopeEnterpriseManager.properties를 참조하십시오.CDV 요구 사항
CDV는 여러 클러스터의 여러 수집기에서 에이전트 및 고객 경험 메트릭 데이터를 수집하는 특수 Enterprise Manager입니다. 리소스 요구 사항 측면에서 CDV는 MOM과 거의 동일합니다.
CDV 연결 제한
CDV는 10개 이하의 수집기에 연결하는 것이 좋습니다.
CDV에서 수집기에 연결할 때는 높은 쿼리 부하가 생성될 수 있습니다. 이 때문에 수집기 하나에서 지원되는 CDV 연결은 최대 5개입니다.
CA APM 요구 사항
독립 실행형 Enterprise Manager와 수집기는 TIM이 수집하는 CA CEM 데이터를 받아 처리하고 통합합니다. Enterprise Manager 서비스라는 내부 소프트웨어 구성 요소는 CA CEM 데이터를 처리합니다. 클러스터에서는 이러한 Enterprise Manager 서비스 세 가지를 사용자가 선택한 수집기에 할당하여 Enterprise Manager 서비스 리소스 요구 사항을 하드웨어 리소스 가용성과 일치시킬 수 있습니다.
이러한 구성 요소에 대한 구체적인 리소스 권장 사항은 샘플 CA CEM 크기 조정 권장 사항에 포함되어 있습니다.
Enterprise Manager 서비스
CA APM에서는 클러스터에 포함된 세 가지 Enterprise Manager 서비스인, TIM 수집 서비스, 통계 집계 서비스 및 데이터베이스 정리 서비스의 서버 위치를 지정할 수 있습니다. 이러한 Enterprise Manager 서비스에는 각각 고유한 리소스 소비 특징이 있습니다.
Enterprise Manager 서비스의 배치는 중요합니다. TIM 수집 서비스와 통계 집계 서비스는 사용 가능한 리소스 수용 능력이 있는 수집기에 배치하십시오.
참고:
Enterprise Manager 서비스 배포에 대한 자세한 내용은 Distribute Enterprise Manager Service를 참조하십시오.TIM 수집 서비스
TIM 수집 서비스는 TIM이 수집한 CA CEM 데이터를 처리하는 서비스 그룹입니다. TIM 수집 서비스에는 로그인, 결함, 기록, CA CEM 이벤트, 시간별 통계, 고객 경험 메트릭 및 트랜잭션 검색을 처리하기 위한 서비스가 포함되어 있습니다.
TIM 수집 서비스의 리소스 소비량은 다음과 같은 요인에 따라 달라집니다.
- CA CEM이 결함(CA CEM 임계값을 넘었다는 알림)을 보고하는 비율
- CA CEM이 로그인을 보고하는 비율
- 생성된 통계 레코드 수. 이 수는 활성 상태인 정의된 비즈니스 트랜잭션의 수와 사용자 또는 사용자 그룹의 수에 따라 달라집니다.
TIM은 1시간 간격으로 통계를 보고합니다. 다른 모든 데이터는 5초 간격으로 보고됩니다. 따라서 TIM 수집 서비스에서는 리소스를 지속적으로 사용합니다. TIM 수집 서비스는 두 개의 CPU 코어를 주로 사용하며, CPU를 많이 사용합니다. 에이전트 부하 외에 TIM 수집 서비스를 처리하는 수집기에 대해 4 GB의 힙 메모리를 추가로 제공하는 것이 좋습니다. 따라서 에이전트 메트릭 부하와 함께 TIM 수집 서비스를 실행하려면 64비트 JVM이 필요합니다.
참고:
TIM 수집 서비스 및 통계에 대한 자세한 내용은 Distribute Enterprise Manager Service를 참조하십시오.통계 집계 서비스
통계 집계 서비스는 시간별 및 일별로 통계를 집계합니다. 일별 통계 집계는 기본적으로 오전 12:00의 시간별 집계 후에 수행됩니다. 일별 집계는 기본적으로 자정에 수행되는 SmartStor 기간 재지정과 유사합니다. 기본적으로 일별 통계 집계 서비스는 통계를 집계하기 위한 별도의 프로세스를 생성합니다.
8개 이상(최대 25개)의 TIM을 지원하는 환경의 경우 통계 집계 서비스에 12 GB 이상의 힙 메모리를 할당하십시오. 이 권장 사항을 따르려면 Windows 및 Linux에 64 비트 JVM이 있어야 합니다.
데이터베이스 정리 서비스
데이터베이스 정리 서비스는 보존 기간이 경과된 데이터를 삭제하며, 보존 기간은 구성 가능합니다. PostgreSQL 데이터베이스에서 삭제란 소프트 삭제를 의미합니다. 데이터베이스 유지 관리 작업을 통해 데이터가 회수되기 전까지는 APM 데이터베이스에 데이터가 유지됩니다. 데이터베이스 정리 서비스에는 약간의 수집기 리소스가 필요합니다. 그러나 데이터베이스 정리 및 비우기는 APM 데이터베이스의 수용 능력을 저해할 수 있는 데이터베이스 팽창을 방지하는 데 필수적인 작업입니다.
APM 데이터베이스
CA APM은 APM 데이터베이스를 설치합니다. 이 데이터베이스는 새 PostgreSQL 데이터베이스 인스턴스로 설치되거나 이전에 설치된 Oracle 데이터베이스 인스턴스에 새 스키마로 추가될 수 있습니다. 이 데이터베이스에는 CA CEM 모니터링 및 응용 프로그램 심사 맵과 관련된 정보가 저장됩니다.
다음 요인은 APM 데이터베이스의 데이터 양에 영향을 줍니다.
- 통계 및 결함 보존 기간
- 정의된 결함의 수 및 임계값
- 모니터링되는 트래픽의 양
- 트랜잭션 정의
- 사용자 및 사용자 그룹 정의
참고:
보존 기간 조정에 대한 자세한 내용은 Enterprise Manager 구성을 참조하십시오.VMWare 요구 사항 및 권장 사항
크기 조정 및 성능 관련 배경 정보, 요구 사항, 설정 및 제한 사항은 가상 컴퓨터(특히 VMWare ESX Server)에 CA APM을 배포하는 데 유용합니다.
CA APM 가상화를 위한 물리적 컴퓨터 권장 사항
CA APM을 실행하는 가상 환경을 호스팅하는 물리적 컴퓨터에는 다음과 같은 권장 사항이 적용됩니다.
- 물리적 컴퓨터에서 가상화에 도움이 되는 BIOS 설정을 사용하도록 설정하십시오. 이러한 설정은 가상화 계층에서 CPU 기능을 사용하여 가상 컴퓨터의 성능을 향상시키는 데 유용합니다. 최신 AMD 및 Intel 프로세서는 하드웨어 지원 가상화를 지원하지만 대개 이러한 설정은 기본적으로 사용하지 않도록 설정되어 있습니다. 하드웨어 지원 가상화를 위한 BIOS 설정을 사용하도록 설정하는 방법은 플랫폼 공급업체의 설명서를 참조하십시오.
- 플랫폼에서 지원하는 경우 하이퍼스레딩을 사용하도록 설정하십시오.
- 플랫폼에서 지원하는 경우 OS에서 대용량 페이지 지원을 사용하도록 설정하십시오.참고:대용량 페이지 지원이 사용되도록 설정하는 방법에 대한 자세한 내용은 대용량 메모리에 대한 Java 설명서를 참조하십시오.일부 JVM은 기본 OS에서 지원되는 경우에도 대용량 페이지를 지원하지 않습니다.
CA APM에 대한 가상 컴퓨터 구성 및 권장 사항
다음 구성 및 권장 사항은 CA APM을 호스팅하는 가상 컴퓨터에 적용됩니다.
CPU
- 소규모에서 보통 규모의 Introscope 단독 작업 부하에는 두 개 이상의 vCPU(2000 MHz)를 할당하십시오. 대규모 Introscope 단독 작업 부하에는 네 개의 vCPU(4000 MHz)를 할당하십시오.
메모리
- 가상 컴퓨터의 메모리 크기를 확인하여 Java 힙, Java Virtual Machine 스택 코드의 메모리 필요량, 그리고 메모리를 필요로 하는 게스트 운영 체제의 다른 동시 실행 프로세스 등을 위해 충분한 공간을 확보하십시오.
- VMware Infrastructure Client의 메모리 예약 값을 가상 컴퓨터의 필요한 메모리 크기로 설정하십시오. 모든 유형의 메모리 스와핑(물리적 또는 가상)은 JVM 힙의 성능, 특히 가비지 수집을 저하시키는 요인입니다.
- ESX 호스트가 오버 커밋되는 경우, 메모리가 최적으로 관리되도록 가상 컴퓨터 내에서 메모리 벌룬 드라이버가 실행되고 있는지 확인하십시오.
- JAVA 프로세스 메모리의 보호 기능이 없으므로 다음 계산을 사용하는 것이 좋습니다.
- VM 메모리 = 게스트 OS 메모리 + JVM 메모리
- JVM 메모리 = JVM 최대 힙[-Xmx 값] + JVM 메타스페이스[-xx:MaxMetaspaceSize] + 동시 스레드 수 * 스레드 당 메모리[-Xss]
저장소
- 각 CA APM 인스턴스에 SmartStor 전용 저장소가 있는지 확인하십시오.
- SmartStor에 대해 로컬 전용 디스크 또는 전용 SAN LUN(논리 단위 번호)을 사용 중인 경우 introscope.enterprisemanager.smartstor.dedicatedcontroller 속성을 true로 설정하십시오. 이 속성은 IntroscopeEnterpriseManager.properties 파일에서 설정합니다.
- 가상 컴퓨터가 SAN 환경에서 실행 중인 경우 각 SmartStor가 SAN의 디스크에 대한 전용 경로를 갖는지 확인하십시오. 예를 들어 대개 호스트 하드웨어에 존재하는 HBA와 SAN에 대해 NPIV, 조닝(Zoning), QoS 및 트래픽 분리를 구성하는 등의 방법으로 이를 수행할 수 있습니다.
- 동일한 RAID 또는 스토리지 어레이를 공유할 수 있는 다른 응용 프로그램에서의 디스크 I/O 경합을 방지하려면 CA 도구에 대한 전용 디스크/스핀들을 사용하여 특정 RAID 볼륨 또는 LUN을 만들어야 합니다. RAID 볼륨에 할당된 디스크/스핀들의 볼륨이 크면 I/O가 더 효과적으로 분산되고 CA 도구 프로세스의 읽기/쓰기 시간이 최대화됩니다.
일반
- 가상 컴퓨터 시간 동기화가 올바르게 작동하는지 확인하고 가상 컴퓨터 공급업체의 권장 사항을 따르십시오. 그러나 CA APM을 실행하는 경우 -XX:ForceTimeHighResolution JVM 플래그를 사용하면 SmartStor 지속 시간이 늘어나므로 이 플래그는 사용하지 않는 것이 좋습니다.
- 동일한 서버에서 실행 중인 다른 VM의 상태에 관계없이 필요한 리소스를 항상 사용할 수 있도록 예약하려면 CA 도구 가상 컴퓨터에 예약된 전용 리소스 그룹을 할당해야 합니다. 특정 리소스 그룹 할당은 CA Technologies에서 제공하는 크기 조정 정보에 기반해야 합니다.
VMWare ESX Server의 CA APM에 대한 리소스 예제
다음 예제는 Introscope만 설정하거나 CA APM 환경을 설정할 때 VMWare ESX Server에서의 배포를 계획하는 데 유용할 수 있습니다. CA Technologies 성능 테스트는 랩 테스트 환경에서 특정 리소스를 사용하여 수행되며, 이러한 환경을
참조 환경
이라고 합니다. CA Technologies는 참조 작업 부하를 사용하여 테스트를 실행했습니다. 이 참조 환경에서 얻은 리소스 정보를 기초로 프로덕션 및 테스트 작업 부하의 요구 사항을 쉽게 추정할 수 있습니다.중요!
이 성능 데이터는 이 하드웨어 구성을 실행하는 경우를 기준으로 합니다. VMWare ESX 작업 부하에 대해 선택한 프로세서 및 플랫폼에 따라 성능이 달라질 수 있습니다.- Intel Xeon 5649 6코어 프로세서(2.53 GHz) 두 개가 장착된 DELL Poweredge R610
- 하이퍼스레딩 및 가상화 지원 설정
- 32 GB RAM
Introscope 단독
다음 예는 Introscope 단독 참조 작업 부하를 사용하여 테스트된 Introscope 단독 독립 실행형 Enterprise Manager 참조 환경입니다.
가상 컴퓨터
- Windows 2008 SP2 Server
- 메모리 구성: 6 GB
- vCPU 구성: 4
- CPU 예약: 4000 MHz
Enterprise Manager 구성
- 64 비트 JVM
- 4 GB 힙 크기
작업 부하
- 550,000개의 메트릭
- 110개의 프런트엔드 응용 프로그램
CA CEM
다음 예는 CA CEM 단독 참조 작업 부하를 사용하여 테스트된 CA CEM 단독 환경입니다.
가상 컴퓨터
- Windows 2008 SP2 Server
- 메모리 구성: 6 GB
- vCPU 구성: 4
- CPU 예약: 4000 MHz
Enterprise Manager 구성
- 64 비트 JVM
- 4 GB로 구성된 힙 크기
Introscope 및 CA CEM 결합 작업 부하
결합된 Introscope 메트릭 부하와 CA CEM을 실행할 경우 최상의 성능을 얻으려면 다음과 같은 CA Technologies 권장 사항을 따르십시오.
- 클러스터 환경에서 실행하십시오.
- 에이전트 부하와 CA CEM TIM 부하를 처리할 수집기를 별도의 가상 컴퓨터에 설치하십시오.
네이티브와 가상 컴퓨터의 성능 비교
다음 표에서는 동일한 참조 작업 부하 상태에서 서로 유사한 네이티브 환경과 가상 환경의 Enterprise Manager 성능을 비교합니다.
수용 능력 요인 | 평균 값 및 % 차이 |
평균 CPU 사용률(%) | 네이티브 = 37.5 가상 컴퓨터 = 40.3 백분율 차이 = VM이 7.5% 더 높음 |
하베스트 기간(ms) | 네이티브 = 1639 가상 컴퓨터 = 1957 백분율 차이 = VM이 19.4% 더 높음 |
Smartstor 기간(ms) | 네이티브 = 1291 가상 컴퓨터 = 1427 백분율 차이 = VM이 10.5% 더 높음 |
평균 JVM 힙 사용률(MB) | 네이티브 = 970 가상 컴퓨터 = 1090 백분율 차이 = VM이 16% 더 높음 |
JVM GC 시간(%) | 네이티브 = 6.7 가상 컴퓨터 = 7.8 백분율 차이 = VM이 16% 더 높음 |
단일 ESX Server에서 여러 CA APM 인스턴스 실행
모든 Enterprise Manager는 하베스트 주기, TIM 데이터 수집, SmartStor 스풀-데이터 변환, SmartStor 기간 재지정 및 CA CEM 일별 통계 집계를 기본적으로 동일한 일정으로 실행합니다. 하베스트 주기 및 TIM 데이터 수집 일정은 변경할 수 없습니다. 따라서 리소스 사용률이 동시에 급등하고 공유 리소스가 한계에 도달할 수 있습니다. 가상 환경에서 실행되는 각 Enterprise Manager 인스턴스에는 전용 리소스(특히, CPU, 네트워크 및 SmartStor 디스크 액세스)가 있어야 합니다.
예약된 실행 시간이 가능한 한 적게 겹치도록 설정하면 SmartStor 스풀-데이터 변환, SmartStor 기간 재지정 및 일별 통계 집계 중 리소스 사용률이 동시에 급등하는 문제를 줄일 수 있습니다.
SmartStor 기간 재지정의 일정을 설정하려면 IntroscopeEnterpriseManager.properties 파일에서 introscope.enterprisemanager.smartstor.reperiodizationOffsetHour 속성을 구성하십시오.
SmartStor 스풀-데이터 변환의 일정을 설정하려면 IntroscopeEnterpriseManager.properties 파일에서 introscope.enterprisemanager.smartstor.conversionOffsetMinute 속성을 구성하십시오.
여러 개의 CA CEM 통계 집계 서비스가 동일한 가상 환경(동일한 기본 하드웨어)에서 실행 중인 경우 CA CEM 일별 통계 집계가 서로 겹치지 않도록 예약할 수 있습니다. tess-default.properties 파일에서 stats.processAt_MinsAfterHour 속성을 설정하여 각 CA CEM 통계 집계 서비스에 대해 서로 다른 시작 시간을 구성하십시오. CA CEM 일별 통계 집계 프로세스는 해당 일의 마지막 시간별 집계가 완료된 후 실행됩니다. 따라서 stats.processAt_MinsAfterHour 속성 설정에 따라 일별 통계 집계 일정도 결정됩니다.
참고:
여러 클러스터에서 동일한 APM 데이터베이스 서버를 사용하는 경우에도 CA CEM 일별 통계 집계 일정을 조정하는 것이 좋습니다.단일 ESX Server에서 소규모 Introscope 클러스터 실행
다음은 VMWare ESX Server에 CA APM을 배포할 경우에 해당하는 소규모 클러스터 참조 환경의 예입니다.
모든 가상 컴퓨터는 Windows 2008 Enterprise Server SP2입니다.
클러스터는 다음 Enterprise Manager로 구성되었습니다.
- 3개의 수집기
- 1개의 MOM
다음은 수집기의 가상 컴퓨터 구성입니다.
- 메모리 구성: 6 GB
- vCPU 구성: 4
다음은 수집기의 리소스 구성입니다.
- 64 비트 JVM 1.6
- 4 GB 힙 크기
다음은 MOM의 가상 컴퓨터 구성입니다.
- 메모리 구성: 8 GB
- vCPU 구성: 4
다음은 MOM의 리소스 구성입니다.
- 64 비트 JVM 1.6
- 6 GB 힙 크기
다음은 PostgreSQL APM 데이터베이스의 리소스 구성입니다.
- 메모리 구성: 4 GB
- vCPU 구성: 2
다음은 작업 부하입니다.
- 수집기당 550,000개의 메트릭
- 110개의 프런트엔드 위치
- MOM에 있는 1,650,000개의 메트릭 구독