クラスタ モニタリング メトリック
apmsaas
2
UMA (Universal Monitoring Agent)は、クラスタ、ノード、および展開に関するパフォーマンス データを収集します。関連付けられているメトリックは、メトリック ツリーで確認できます。
クラスタ パフォーマンス メトリック
UMA は、UMA の
ClusterDeployment
の下にクラスタ メトリックをレポートします。 Kubernetes ベースのクラスタのメトリック ビューのパスを以下に示します。
<Cluster_Name> | Cluster Deployment | Infrastructure Agent | Kubernetes
OpenShift ベースのクラスタのメトリック ビューのパスを以下に示します。
<Cluster_Name> | Cluster Deployment | Infrastructure Agent | Openshift
- API Server connection StatusKubernetes API サーバ ステータス。数値で表されます。
- 0 - 実行されていない
- 1 - 実行中
- CPU Limit (mcore)クラスタ レベルで割り当て可能な CPU ミリコア。このメトリックは、すべてのクラスタ ノードでの CPU Limit メトリックの集計値を示します。UMA はこのメトリックを計算する際に No Schedule テイントを持つノードを無視します。
- CPU Request (mcore)クラスタ レベルで要求された CPU ミリコア。このメトリックは、すべてのクラスタ ノードでの CPU Request メトリックの集計値を示します。UMA はこのメトリックを計算する際に No Schedule テイントを持つノードを無視します。
- CPU Request Deviation要求された CPU 内で空いている利用可能な CPU の割合。CPU Request Deviation メトリック値は、空き CPU の割合です。たとえば、値が 90 の場合は、CPU の 90% が空いており、要求された CPU のリソース使用率が 10% であることを示します。値が 5 の場合は、CPU の 5% が空いており、要求された CPU のリソース使用率が 95% であることを示します。
- CPU Utilization (mcore)クラスタ レベルでポッドまたはコンテナによって使用されている CPU。このメトリックは、すべてのクラスタ ノードでの CPU Utilization メトリックの集計値を示します。UMA はこのメトリックを計算する際に No Schedule テイントを持つノードを無視します。
- Disk Pressureディスク容量が圧迫されているクラスタ ノードの合計数。ディスクの圧迫とは、ノードが使用しているディスク容量が大きすぎるか、ノードによるディスク容量の使用速度が速すぎることを示す状態です。
- Memory Limit (Bytes)クラスタで現在割り当て可能なメモリ制限容量(バイト単位)。このメトリックは、すべてのクラスタ ノードでの Memory Limit メトリックの集計値を示します。UMA はこのメトリックを計算する際に No Schedule テイントを持つノードを無視します。
- Memory Pressureメモリが圧迫されているクラスタ ノードの数。メモリの圧迫とは、ノードがメモリを使い果たしていることを示す状態です。
- Memory Request (Bytes)クラスタ レベルですべてのポッドによって要求されたメモリ(バイト単位)。このメトリックは、すべてのクラスタ ノードでの Memory Request メトリックの累積値を示します。UMA はこのメトリックを計算する際に No Schedule テイントを持つノードを無視します。
- Memory Request Deviation要求されたメモリ内で空いている利用可能なメモリの割合。Memory Request Deviation メトリック値は、空きメモリの割合です。たとえば、値が 90 の場合は、メモリの 90% が空いており、要求されたメモリのリソース使用率が 10% であることを示します。値が 5 の場合は、メモリの 5% が空いており、要求されたメモリのリソース使用率が 95% であることを示します。
- Memory Usage (Bytes)ポッド内のコンテナによる現在のメモリ使用量。
- NetworkUnavailable使用できないネットワークがあるクラスタ ノードの合計数。
- NoScheduleNoSchedule が設定されているクラスタ ノードの合計数。
- PIDPressureクラスタ内で PID の圧迫が発生しているノードの合計数。PID の圧迫は、ポッドまたはコンテナで生成されるプロセスが多すぎるときに発生するまれな状態です。この状態になると、ノードで使用可能なプロセス ID が枯渇します。
- Node Ready Statusクラスタ内のノード全体の準備完了ステータス。1 つ以上のクラスタ ノードが Not Ready 状態の場合、この値は 1 です。すべてのノードが Ready 状態の場合、この値は 0 です。
- ReadyReady 状態のクラスタ ノードの合計数。
- 合計コンテナ数クラスタ内のコンテナの合計数。
- Total Namespacesクラスタ内のネームスペースの合計数。
- Total Nodesクラスタ ノードの合計数。
- Total NonRunning ContainersRunning 状態でないクラスタ内のコンテナの合計数。
- Total Podsクラスタ内のポッドの合計数。
- Total Restartsクラスタ内でコンテナが再起動した累積回数。
- Total Running Containersクラスタ内の Running 状態にあるコンテナの合計数。
ノード パフォーマンス メトリック
UMA は、UMA の
ClusterDeployment
の下にノード メトリックをレポートします。Kubernetes ベースのクラスタのメトリック ビューのパスを以下に示します。
<User-defined Cluster Name> | Cluster Deployment | Infrastructure Agent | Kubernetes | Nodes | <node name>
OpenShift ベースのクラスタのメトリック ビューのパスを以下に示します。
<User-defined Cluster Name> | Cluster Deployment | Infrastructure Agent | Openshift | Nodes | <node name>
- CPU Limit (mcore)ノード レベルで割り当て可能な CPU ミリコア。
- CPU Request (mcore)ノードで実行中のすべてのポッドで要求されている CPU ミリコア。
- CPU Request Deviation and Memory Request Deviation使用可能な CPU メモリの割合と、推測による使用中の CPU メモリの割合。CPU Request Deviation メトリック値は、空き CPU メモリの割合です。たとえば、値が 90 の場合は、CPU メモリの 90% が空いており、要求された CPU メモリのリソース使用率が 10% であることを示します。値が 5 の場合は、CPU メモリの 5% が空いており、要求された CPU メモリのリソース使用率が 95% であることを示します。
- CPU Utilization (mcore)ノードで実行中のポッド/コンテナによって使用される CPU。
- Disk Pressureノードでディスクの圧迫が発生しているかどうかを示します。ディスクの圧迫とは、ノードが使用しているディスク容量が大きすぎるか、ノードによるディスク容量の使用速度が速すぎることを示す状態です。
- Memory Limit (Bytes)ノードで現在割り当て可能なメモリ制限容量(バイト単位)。
- Memory Pressureノードでメモリの圧迫が発生しているかどうかを示します。メモリの圧迫とは、ノードがメモリを使い果たしていることを示す状態です。
- Memory Request (Bytes)ノードで実行中のすべてのポッドによって要求されたメモリ(バイト単位)。
- Memory Usage (Bytes)ノードで実行中のすべてのポッドによる現在のメモリ使用量。
- NetworkUnavailableノードに使用不可のネットワークがあるかどうかを示します。
- NoScheduleこのノードに NoSchedule が設定されているかどうかを示します。
- PIDPressureノードで PID の圧迫が発生しているかどうかを示します。PID の圧迫は、ポッドまたはコンテナで生成されるプロセスが多すぎるときに発生するまれな状態です。この状態になると、ノードで使用可能なプロセス ID が枯渇します。
- Readyノードが Ready 状態にあるかどうかを示します。
- 合計コンテナ数ノード内のコンテナの合計数。
- Total NonRunning ContainersRunning 状態でないノード内のコンテナの合計数。
- Total Podsノード内のポッドの合計数。
- Total Restartsノードでコンテナが再起動した合計の累積回数。
- Total Running Containersノード内の Running 状態にあるコンテナの合計数。
ネームスペースおよびプロジェクト展開のパフォーマンス メトリック
UMA は、UMA の
ClusterDeployment
の下に展開メトリックをレポートします。Kubernetes ベースのクラスタのメトリック ビューのパスを以下に示します。
<User-defined_Cluster_Name>| Cluster Deployment | Infrastructure Agent | Kubernetes | Namespaces | <namespace name>
OpenShift ベースのクラスタのメトリック ビューのパスを以下に示します。
<User-defined_Cluster_Name>| Cluster Deployment | Infrastructure Agent | Openshift | Projects | <project name>
- CPU Limit (mcore)ネームスペース/プロジェクト内のすべてのポッドによって使用される CPU 制限。
- CPU Request (mcore)ネームスペース/プロジェクト内のすべてのポッドによって要求された CPU ミリコア。
- CPU Utilization (mcore)ネームスペース/プロジェクト内のポッド/コンテナによって使用される CPU。
- CPU Request Deviation and Memory Request Deviation使用可能な CPU メモリの割合と、推測による使用中の CPU メモリの割合。CPU Request Deviation メトリック値は、空き CPU メモリの割合です。たとえば、値が 90 の場合は、CPU メモリの 90% が空いており、要求された CPU メモリのリソース使用率が 10% であることを示します。値が 5 の場合は、CPU メモリの 5% が空いており、要求された CPU メモリのリソース使用率が 95% であることを示します。
- Memory Limit (Bytes)ネームスペース/プロジェクト レベルですべてのポッドによって設定されたメモリ制限(バイト単位)。
- Memory Request (Bytes)ネームスペース/プロジェクト内のすべてのポッドによって要求されたメモリ(バイト単位)。
- Memory Usage (Bytes)ネームスペース/プロジェクト内のすべてのポッドによる現在のメモリ使用量。
- 合計コンテナ数ネームスペース/プロジェクト内のコンテナの合計数。
- Total Daemonsetsネームスペース/プロジェクト内の DaemonSet の合計数。
- Total NonRunning ContainersRunning 状態でないノード内のコンテナの合計数。
- Total Not Running PodsRunning 状態でないノード内のポッドの合計数。
- Total Podsネームスペース/プロジェクト内のポッドの合計数。
- Total ReplicaSetsネームスペース/プロジェクト内の ReplicaSet の合計数。
- Total Restartsノードでコンテナが再起動した合計の累積回数。
- Total Running Containersネームスペース/プロジェクト内の Running 状態にあるコンテナの合計数。
- Total Running Podsネームスペース/プロジェクト内の Running 状態にあるポッドの合計数。
- Total Servicesネームスペース/プロジェクト内のサービスの合計数。
DaemonSet のパフォーマンス メトリック
- Availableネームスペース/プロジェクト内で DaemonSet ポッドが実行されており使用可能なノードの数。
- CollisionCountDaemonSet のハッシュ競合の数。DaemonSet コントローラでは、最新の ControllerRevision の名前を作成する必要がある場合、このフィールドを衝突回避メカニズムとして使用します。
- 現在ネームスペース/プロジェクト内で DaemonSet ポッドの実行がスケジュールされているノードの数。
- Desiredネームスペース/プロジェクト内で DaemonSet ポッドを実行している必要があるノードの合計数。
- ヘルスDaemonSet の稼働状況。0 は良好ではない状態を示し、1 は良好な状態を示します。
- MisScheduledネームスペース/プロジェクト内で DaemonSet ポッドを実行しているが DaemonSet ポッドを実行することになっていないノードの数。
- ReadyDaemonSet ポッドが実行中で準備ができているノードの数。
- 利用不可DaemonSet ポッドが実行されていないノードの数。
- Up-To-Dateネームスペース/プロジェクト内で更新された DaemonSet ポッドを実行しているノードの合計数。
展開のパフォーマンス メトリック
- Availableネームスペース/プロジェクト内で実行中で利用可能な展開ポッドの数。
- Desiredこの展開で実行する必要があるポッドの合計数。
- ヘルス展開の稼働状況。
- 0 は良好でない状態を示します。
- 1 は良好な状態を示します。
- Ready展開で実行中で準備ができているポッドの数。Total 実行がスケジュールされているポッドの数。
- 利用不可展開で実行されていないポッドの数。
- Updatedこの展開によって実行されており、必要なテンプレート仕様を持つ、終了していないポッドの合計数。
ReplicaSet のパフォーマンス メトリック
- 現在実行がスケジュールされているポッドの数。
- Desiredこのレプリカ セットによって実行する必要があるポッドの合計数。
- Readyレプリカ セット内で実行中で準備ができているポッドの数。
クラスタ属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_cluster_namespacesクラスタ内のネームスペース/プロジェクトの合計数。
- k8s_cluster_nodesクラスタ内の合計ノード数。
- k8s_cluster_projectsクラスタ内のネームスペース/プロジェクトの名前。
ネームスペースおよびプロジェクト属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_namespace_phaseネームスペース/プロジェクトのフェーズ。
- k8s_namespace_uuidネームスペース/プロジェクトの UUID。
- k8s_projectネームスペース/プロジェクトの名前。
- 名前ネームスペース/プロジェクトの名前を示します。
DaemonSet 属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_projectネームスペースの名前。
- k8s_daemonset_annotations_<annotation name>DaemonSet に設定されている注釈とその値を示します。
- k8s_daemonset_labels_<label name>DaemonSet に設定されているラベルとその値を示します。
- 名前Daemonset の名前を示します。
展開属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_projectネームスペースの名前。
- k8s_deployment_annotations_<annotation name>展開に設定された注釈とその値を示します。
- k8s_deployment_labels_<label name>展開に設定されたラベルとその値を示します。
- 名前展開の名前を示します。
ReplicaSet 属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_projectネームスペースの名前。
- k8s_replicaset_annotations_<annotation name>ReplicaSet に適用されている注釈とその値を示します。
- k8s_replicaset_labels_<label name>ReplicaSet に設定されているラベルとその値を示します。
- k8s_replicaset_deploymentReplicaSet が含まれている展開名を示します。
- 名前ReplicaSet の名前を示します。
サービス レベル属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_projectネームスペースの名前。
- k8s_service_selector_appサービスに定義されているセレクタ。
- k8s_service_annotations_<annotation name>サービスに適用されている注釈とその値を示します。
- k8s_service_labels_<label name>サービスに適用されているラベルとその値を示します。
- k8s_service_service_typeサービスのタイプ。
- k8s_service_clusteripサービス IP アドレス。
- k8s_service_serviceportポッドに関連付けられているサービスのサービス ポート番号。
- k8s_service_targetportポッドに関連付けられているサービスのターゲット ポート番号。
- 名前サービスの名前。
ホストおよびノード属性
- k8s_cluster_nameUMA のインストール時にユーザによって定義されたクラスタ名。
- k8s_node_allocatable_cpuノードに割り当て可能な CPU セット。
- k8s_node_allocatable_ephemeral-storageノードに割り当て可能な一時ストレージ セット。
- k8s_node_allocatable_hugepages-1Giノードに事前割り当て済みの 1Gi Huge Page セットを示します。
- k8s_node_allocatable_hugepages-2Miノードに事前割り当て済みの 2Mi Huge Page セットを示します。
- k8s_node_allocatable_memoryノードに割り当て可能なメモリ セット。
- k8s_node_allocatable_podsノードに割り当て可能なポッド カウント セット。
- k8s_node_architectureノードのアーキテクチャ。
- k8s_node_bootIDノードのブート ID。
- k8s_node_capacity_cpuノードの CPU 容量。
- k8s_node_capacity_ephemeral-storageノードのストレージ容量。
- k8s_node_capacity_hugepages-1Giノード上に設定された 1Gi Huge Page 容量。
- k8s_node_capacity_hugepages-2Miノード上に設定された 2Mi Huge Page 容量。
- k8s_node_capacity_memoryノードの合計メモリ容量。
- k8s_node_capacity_podsノードの合計ポッド容量。
- k8s_node_annotations_<annotation name>ノード上に設定された注釈とその値を示します。
- k8s_node_containerRuntimeVersionコンテナ ランタイムを示します。たとえば、Docker または crio バージョンです。
- k8s_node_DiskPressure_statusノード上でディスクの圧迫が発生しているかどうかを表すブール値。
- k8s_node_DiskPressure_reasonkubelet によって報告された、ノード上でディスクの圧迫が発生している場合の理由。
- k8s_node_DiskPressure_messagekubelet によって報告された、ディスクの圧迫が発生した理由の詳細なメッセージ。
- k8s_node_MemoryPressure_statusノード上でメモリの圧迫が発生しているかどうかを表すブール値。
- k8s_node_MemoryPressure_reasonkubelet によって報告された、ノード上でメモリの圧迫が発生している場合の理由。
- k8s_node_MemoryPressure_messagekubelet によって報告された、メモリの圧迫が発生した理由の詳細なメッセージ。
- k8s_node_PIDPressure_statusノード上で PID の圧迫が発生しているかどうかを表すブール値。
- k8s_node_PIDPressure_reasonkubelet によって報告された、ノード上で PID の圧迫が発生している理由。
- k8s_node_PIDPressure_messagekubelet によって報告された、PID の圧迫が発生した理由に関する詳細なメッセージ。
- k8s_node_NetworkUnavailable_statusノードにネットワークの問題があるかどうかを表すブール値。
- k8s_node_NetworkUnavailable_reasonノード上にネットワーク利用不可のテイントが設定されている理由。
- k8s_node_NetworkUnavailable_message関係があるポッドによって報告された、ネットワークの停止が発生した理由に関する詳細なメッセージ。
- k8s_node_Ready_statusノードが準備完了で使用可能かどうかを表すブール値。
- k8s_node_Ready_reasonkubelet によって報告された、ノードが NotReady 状態である場合の理由。
- k8s_node_Ready_messagekubelet によって報告された、ノードが NotReady 状態である理由に関する詳細なメッセージ。
- k8s_node_Hostnameノードのホスト名。
- k8s_node_kernelVersionノードの OS カーネル バージョン。
- k8s_node_kubeletEndpointkubelet エンドポイントのポート番号。
- k8s_node_labels_<label name>ノード上に設定されたラベルとその値を示します。
- k8s_node_operatingSystemノードの OS タイプ。
- k8s_node_osimageノードの完全な OS 名およびバージョン。
- k8s_node_systemUUID Systemノードの UUID。
- k8s_node_namespacesノード内に作成されたすべてのネームスペースのリスト。
- k8s_node_rolesノードに割り当てられたロールの名前。Kubernetes クラスタ USER/ADMIN でノードのロールが定義されていない場合、ノード ロール属性の値は NotDefined になります。
永続ボリューム メトリック
メトリック ビューのパスを以下に示します。
<ClusterName>|ClusterDeployment|Infrastructure Agent|Kubernetes|PersistentVolumes|<PersistentvolumeName>
永続ボリューム メトリックを以下に示します。
- accessModesPV アクセス モードは、特定のボリュームによってサポートされる特定のモードに設定されます。アクセス モードは、ReadWriteOnce、ReadOnlyMany、および ReadWriteMany です。
- Capacity特定の PV のストレージ容量。
- PersistentVolumeClaimPV が関連付けられている PVC の名前。
- PersistentVolumeReclaimPolicy再利用ポリシーは、Retain、Recycle、および Delete です。
- StatusPV のステータス値を以下に示します。
- Available自由に使用できます。バインディングはまだ発生していません。
- BoundPV が PersistentVolumeClaim と一致し、バインディングが発生しました。
- Releasedユーザは PVC を削除しましたが、クラスタはまだ PV を再利用していません。
- Failedクラスタは PV を自動的に再利用できませんでした。
- StorageClassPV のストレージ クラス名。特定のクラスの PV は、そのクラスを要求している PVC にのみバインディングできます。