しきい値イベント処理自己監視メトリック

処理するイベントの数が多すぎるかどうかを判断するには、Data Aggregator で重要業績評価指標を監視します。 Data Aggregator でのイベント処理は、バッチ形式で実行されます。たとえば、大きなアイテム グループに対して、イベントは同時に評価および生成されます。 いくつかのメトリックは、Data Aggregator システムの健全性を評価するために、自己監視機能を提供します。
capm370
処理するイベントの数が多すぎるかどうかを判断するには、Data Aggregator で重要業績評価指標を監視します。 Data Aggregator でのイベント処理は、バッチ形式で実行されます。たとえば、大きなアイテム グループに対して、イベントは同時に評価および生成されます。 いくつかのメトリックは、Data Aggregator システムの健全性を評価するために、自己監視機能を提供します。
これらのメトリックを表示するには、カスタムの[IM デバイス マルチトレンド]ビューをダッシュボードに追加します。
[Data Aggregator イベント計算時間]
メトリック ファミリから以下のメトリックを使用して、ダッシュボードを編集します。
  • イベント プロセス キュー サイズ
    - イベント処理キューのサイズを表示します。 以降のリカバリなくキュー サイズが増えていく(減少傾向)のは、イベントがバックアップされていることを示します。
  • クリア イベント数
    - レポート間隔ウィンドウでクリアされたイベントの数。
  • 作成イベント数
    - レポート間隔ウィンドウで発生したイベントの数。
    多数のイベントが連続して発生またはクリアされると、イベント マネージャ データベースに影響を及ぼす可能性があります。 これらのメトリックは、ご使用のシステムが推奨されるイベント生成レートを超過したことを示します。 イベントの生成/クリアのバーストは許容範囲です。
  • 処理済みイベント ルール評価数
    - イベント ルールの合計数にそれらのルールが適用されるアイテムの数を掛けた数値。 評価数が高いほど、システムの処理量は増加します。 一部の評価は、他の評価より高負荷です。 たとえば、条件および標準偏差条件が多い、または期間またはウィンドウが長い評価は、より高負荷です。 評価の合計許容数は、イベント ルールによって異なります。
  • イベント計算の合計時間
    - このメトリック ファミリのイベント処理にかかった合計時間。 このメトリックの値がレポート間隔ウィンドウでの秒数を超えると、その時点でイベントの遅延またはバックログが発生します。
一般的に、これらの自己監視メトリックの値が安定しているのは、システムが健全であることを示します。 一部の集中的なデータベース ジョブによって、これらの自己監視メトリックが変動します。 通常、これらのジョブは UTC で午前 2 時から午前 4 時の間に実行されます。 ルールを変更する際は、あらかじめイベント処理を少しずつ有効にして、システムの健全性を判断してください。 それ以降、変更があるたびに 24 時間以上、システムの健全性を監視します。
Data Aggregator システムでの Karaf ログのエラーは、システムの負荷が高いことを示す場合もあります。