しきい値超過時間イベント ルール

目次
uimpga-ga
目次
前提条件
しきい値超過時間を使用するには、以下のプローブ バージョンが、しきい値超過時間の機能を活用するハブ レベルごとにインストールされている必要があります。
  • alarm_enrichment 4.40 以降
  • baseline_engine 2.34 以降
  • nas 4.40 以降
  • Probe Provisioning Manager (PPM) 2.38 以降
  • prediction_engine 1.01 以降
しきい値超過時間およびセカンダリ ハブ
しきい値超過時間の前提条件は、しきい値超過時間機能をアクティブにする任意のセカンダリ ハブに適用されます。 必要なプローブを展開して、セカンダリ ハブでしきい値超過時間を設定したら、nas 転送およびレプリケーションを使用して、プライマリ ハブにアラームを転送できます。
TOT レプリケーション フロー
TOT replication flow
(CA UIM 9.0.2) MCS でのしきい値超過時間設定の前提条件
MCS でのしきい値超過時間設定の前提条件の詳細については、「MCS でのアラームしきい値の設定」を参照してください。
概要
しきい値超過時間(TOT)は、しきい値違反イベントが発生すると生成されるアラーム数を減らすことができるイベント処理ルールです。 しきい値超過時間を使用して、データ スパイクを除外し、指定した期間にわたり問題のあるメトリクスをモニタできます。 しきい値違反が発生した直後にアラームを送信する代わりに実行します。 しきい値超過時間
  • ユーザ定義のスライディング タイム ウィンドウ内で発生するイベントをモニタします。
  • 各アラーム重大度でのメトリクスの時間の長さをトラッキングします。
  • スライディング ウィンドウ内でメトリクス違反の累積時間が、設定されたしきい値超過時間に達すると、アラームが送信されます。
例: 連続するブロック内のしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    30 分
  • しきい値超過時間:
    10 分
  • 自動クリア:
    設定しない
  • アラーム重大度:
    [クリア]、[情報]、[警告]、[マイナー]、[メジャー]、および[クリティカル]の各アラームしきい値はプローブ GUI で設定される
2320254.png
しきい値超過時間をスライディング タイム ウィンドウ内で連続して発生させる必要はありません。 スライディング ウィンドウ内の時間はすべて、しきい値超過時間で考慮されます。
例: 連続しないブロック内のしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    30 分
  • しきい値超過時間:
    10 分
  • 自動クリア:
    設定しない
  • アラーム重大度セット:
    [クリア]、[情報]、[警告]、[マイナー]、および[メジャー]の各アラームしきい値はプローブ GUI で設定される
2320634.png
しきい値超過時間ワークフロー
tot_プローブ_フロー
tot_probe_flow
  1. baseline_engine プローブは、プローブからの QoS メトリクスを静的および動的なしきい値定義に対して評価します。
  2. しきい値を超えた場合、baseline_engine プローブはしきい値違反メッセージを生成します。
  3. nas プローブは、データ スパイクを除外するしきい値超過時間イベント処理ルールを実装します。 このイベント処理では、しきい値違反動作がより正確に反映されます。
(CA UIM 9.0.2) MCS でのしきい値超過時間の設定
MCS でしきい値超過時間を設定する方法の詳細については、「MCS でのアラームしきい値の設定」を参照してください。
しきい値超過時間中のアラーム サプレッション
メトリクスがしきい値超過時間状態に到達した後、アラームは追加の各しきい値違反に対して生成されます。 デフォルトでは、これらの重複アラームはアラームのサプレッション数を増加させますが、それ以外では表示されません。 サプレッションをオフにすると重複したアラームは新しいアラームとして扱われ、USM または nas GUI に表示されます。
UMP またはインフラストラクチャ マネージャでアラームが削除(確認)されても、タイム ウィンドウはリセットされません。 アラームのサプレッションが再開されるには、十分な期間(スライディング ウィンドウ時間内のしきい値超過時間未満)にプローブの違反アラームがクリアされる必要があります。
しきい値超過時間を使用したアラームのクリア条件
自動クリアは、新しいしきい値違反イベントが定義された期間中に発生しない場合、しきい値超過時間アラームをクリアするオプションの設定です。 自動クリアをオンにすると、クリア イベントの受信後にタイマが開始されます。 クリア イベントの受信後に、自動クリア ウィンドウ内に後続のしきい値違反イベントが発生しない場合、アラームは自動的にクリアされます(レベル 0 にセットされます)。 しきい値違反イベントが発生すると、クリア ルールがリセットされます。これにより、次のクリア イベントが発生してからタイマが再開されます。
自動的にクリアされたしきい値超過時間アラームは、nas プローブ GUI の
アラーム オプションである自動「確認」のアクセプト
を使用して自動的に確認できます(および閉じることができます)。このオプションはデフォルトで有効になります。 このオプションが無効にされている場合、アラームはクリア重大度(緑)でアラーム履歴に残り、手動で確認する必要があります。
alarm_enrichment プローブがアクティブでない場合、自動クリア時間が保持されます。 alarm_enrichment プローブが停止し、次に再アクティブ化されると、実行中の自動クリア タイマは次のいずれかで再起動されます。
  • 元の自動クリア時間が将来の時間の場合は元の自動クリア時間。
  • 元の自動クリア時間が過去の時間の場合は 1 分。
例: 自動クリアを使用したしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    30 分
  • しきい値超過時間:
    10 分
  • 自動クリア:
    5 分
  • アラーム重大度:
    [クリア]、[情報]、[警告]、[マイナー]、および[メジャー]の各アラームしきい値はプローブ GUI で設定される
2320865.png
しきい値超過時間中のアラーム重大度の変更
しきい値超過時間は各ユーザ定義のイベント重大度で評価されます。 つまり、重大度を変更する前に、定義されたしきい値超過時間に対してメトリクスが高度なアラーム重大度である必要があることを意味します。 新しいアラーム重大度レベルは、しきい値超過時間ウィンドウ内で累積イベント重大度に一致するよう設定されます。
しきい値違反イベントが発生するたびに、しきい値超過時間アラーム重大度は以下のように決定されます。
  1. スライディング ウィンドウ内の重大度がクリティカルなしきい値違反イベントの累積時間が計算されます。 この時間が定義されたしきい値超過時間を超えると、アラーム重大度は[クリティカル]に設定され、ルール処理が完了します。
  2. スライディング ウィンドウ内の重大度がメジャー以上のしきい値違反イベントの累積時間が計算されます。 この時間が定義されたしきい値超過時間を超えると、アラーム重大度は[メジャー]に設定され、ルール処理が完了します。
  3. スライディング ウィンドウ内の重大度がマイナー以上のしきい値違反イベントの累積時間が計算されます。 この時間が定義されたしきい値超過時間を超えると、アラーム重大度は[マイナー]に設定され、ルール処理が完了します。 これ以外の場合、残りの重大度レベルに対してもこのパターンでアルゴリズムが続行します。
例: 増加する重大度を持つしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    20 分
  • しきい値超過時間:
    10 分
  • 自動クリア:
    設定しない
  • アラーム重大度:
    [クリア]、[情報]、[警告]、[マイナー]、および[メジャー]の各アラームしきい値はプローブ GUI で設定される
  • アラーム サプレッション:
    オン
2320864.png
この例では、以下の設定を使用します。
  1. Time 20
    - しきい値超過時間のイベント時間が10 分間蓄積されると、しきい値超過時間アラームが送信されます。 最初に一致したしきい値超過時間ルール条件が「イベント重大度が 1 以上」であるため、アラーム重大度は「1」に設定されます。
  2. Time 25
    - しきい値超過時間ルール条件「イベント重大度が 2 以上」が True になったため、重大度が「2」に増加されます。
  3. Time 30
    - しきい値超過時間ルール条件「イベント重大度が 3 以上」が True になったため、重大度が「3」に増加されます。
しきい値超過時間は、プローブ設定 GUI で設定されるアラーム重大度レベルのみを評価します。
例: 2 つの重大度が設定されたしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    30 分
  • しきい値超過時間:
    10 分
  • 自動クリア:
    設定しない
  • アラーム重大度:
    [マイナー]および[メジャー]の各アラームしきい値はプローブ GUI で設定される
2321566.png
この例では、以下の設定を使用します。
  1. Time 30
    - しきい値超過時間のイベント時間が 10 分間蓄積されると、しきい値超過時間アラームが送信されます。 最初に一致したしきい値超過時間ルール条件が「イベント重大度が 3 以上」であるため、しきい値超過時間アラーム重大度は「3」に設定されます。
例: 複数の重大度を持つしきい値超過時間
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    8 分
  • しきい値超過時間:
    4 分
  • 自動クリア:
    4 分
  • アラーム重大度:
    [クリア]、[情報]、[警告]、[マイナー]、および[メジャー]の各アラームしきい値はプローブ GUI で設定される
  • アラーム サプレッション:
    オン
2321247.png
この例では、以下の設定を使用します。
  1. Time 8
    - しきい値超過時間のイベント時間が 4 分間蓄積されると、しきい値超過時間アラームが送信されます。 最初に一致したしきい値超過時間ルール条件が「イベント重大度が 1 以上」であるため、アラーム重大度は「1」に設定されます。
  2. Time 10
    - TOT ルール条件「イベント重大度が 2 以上」が True になったため、重大度が「2」に増加されます。
  3. Time 16
    - TOT ルール条件「イベント重大度が 3 以上」が True になったため、重大度が「3」に増加されます。
  4. Time 21
    - 8 分間のスライディング ウィンドウ内に 4 分以上で 3 以上の重大度はないが、4 分以上で 2 以上の重大度はあるため、アラーム重大度が「2」に減少されます。
  5. Time 25
    - 8 分間のスライディング ウィンドウ内に 4 分以上で 2 以上の重大度はないが、4 分以上で 1 以上の重大度はあるため、アラーム重大度が「1」に減少されます。
  6. Time 30
    - 新しい違反が 4 分間発生せず、自動クリア条件が満たされるため、アラームはクリアされます。
サポートされているしきい値タイプ
静的および動的なしきい値制限タイプは、現在しきい値超過時間でサポートされています。 詳細については、「アラームしきい値の設定」または「MCS でのアラームしきい値の設定」を参照してください。
利用可能なしきい値のタイプは、プローブおよび UI ごとに異なります。 すべてのしきい値タイプがすべてのプローブとすべての UI でサポートされているわけではありません。 プローブ設定 UI または MCS テンプレートでしきい値タイプを設定できない場合は、そのプローブまたは MCS ではそのしきい値タイプはサポートされていません。
しきい値超過時間の追加シナリオ
以下の例では、特定のプローブ メトリクスを使用したしきい値超過時間の追加シナリオを示します。
例: URL_response プローブ メトリクス[最初のバイトまでの時間]
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    5 分
  • しきい値超過時間:
    3 分
  • 自動クリア:
    設定しない
  • アラーム重大度:
    • アラーム重大度 2 は 100 ミリ秒に設定されます。
    • アラーム重大度 3 は 300 ミリ秒に設定されます。
    • アラーム重大度 4 は 700 ミリ秒に設定されます。
    • アラーム重大度 5 は 1,000 ミリ秒に設定されます。
  • アラーム サプレッション:
    オン
2321586.png
この例では、以下の設定を使用します。
  1. Time 8:
    最初のバイトまでの 3 分間(100 ミリ秒)以上がスライディング ウィンドウ内で観察されると、重大度 2 のアラームが送信されます。
  2. Time 14
    - 最初のバイトまでの 3 分間(300 ミリ秒)以上が観察されます。 アラームは重大度 3 に増加されます。
  3. Time 20
    - 最初のバイトまでの 3 分間(700 ミリ秒)以上が観察されます。 アラームは重大度 4 に増加されます。
  4. Time 25
    - 最初のバイトまでの 3 分間(1000 ミリ秒)以上が観察されます。 アラームは重大度 5 に増加されます。
例: CDM プローブ メトリクス[ディスク使用量]
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    45 分
  • しきい値超過時間:
    5 分
  • 自動クリア:
    設定しない
  • アラーム重大度:
    クリティカル アラームしきい値はプローブ GUI で 80% に設定される
2321585.png
この例では、以下の設定を使用します。
  1. しきい値超過時間は 4 分間に対してのみ発生し、アラームは送信されません。
例: CDM プローブ メトリクス[ディスク使用量](しきい値超過時間アラーム送信に変更されました)
この例では、以下の設定を使用します。
  • スライディング ウィンドウ:
    15 分
  • しきい値超過時間:
    5 分
  • 自動クリア:
    5 分
  • アラーム重大度:
    クリティカル アラームしきい値はプローブ GUI で 80% に設定される
2321837.png
  1. Time 15
    : 80% 以上のディスク使用量が 5 分間のスライディング ウィンドウ内で観察されると、重大度 5 のアラームが送信されます。
  2. Time 21
    : 指定した重大度レベル未満の状態が 5 分経過した後にアラームはクリアされます。
しきい値超過時間のベスト プラクティス
しきい値超過時間を使用する場合は、以下のベスト プラクティスに従ってください。
  • しきい値超過時間の間隔は QoS メトリクスのサンプル期間よりも長く設定します。 しきい値超過時間を小さく設定すると、しきい値超過時間ルールが無効になるため、同じ結果が生じます。
  • モニタしているシステムを評価し、スライディング ウィンドウとしきい値超過時間の両方に適した値を判断します。 システムに設定した値が大きすぎると、通知される必要のあるアラームのサプレッションが適用される可能性があります。
自動クリア ウィンドウを小さく設定すると、アラームが過剰に発生したり、
その他の予期せぬアラームが発生したりする可能性があります
クリア遅延時間(TC)の値は、自動的にアラームをクリアするためのしきい値超過時間(TOT)の値よりも小さく
することはできません
しきい値超過時間の設定
セカンダリ NAS から生成されたすべてのアラームは、レプリケーションを使用して、プライマリ NAS に渡す必要があります。
しきい値超過時間を設定するには、アドミン コンソールで各プローブ UI を使用するか、MCS で関連テンプレートを使用します。
利用可能なしきい値のタイプは、プローブおよび UI ごとに異なります。 すべてのしきい値タイプがすべてのプローブとすべての UI でサポートされているわけではありません。 プローブ設定 UI または MCS テンプレートでしきい値タイプを設定できない場合は、そのプローブまたは MCS ではそのしきい値タイプはサポートされていません。
以下の例では、cdm プローブのディスク使用量メトリクスのしきい値超過時間設定を示します。
screen.png
以下の手順に従います。
  1. プローブ GUI で、関連するモニタおよび QoS メトリクスを表示するには、ツリーのノードを選択します。
  2. 使用可能なリストから変更するモニタを選択します。
  3. [データをパブリッシュ]
    [アラームをパブリッシュ]
    [ベースラインの計算]
    チェック ボックスをクリックします。
  4. cdm プローブでは、動的しきい値超過時間の計算のみがサポートされます。 [
    動的アラーム
    ]チェック ボックスをオンにします。
  5. 動的アラーム設定を設定します。 詳細については、「アラームしきい値の設定」の記事の該当するセクションを参照してください。
  6. 動的なしきい値超過時間の有効化
    ]チェック ボックスをオンにします。
  7. 次のフィールドに値を入力します。
    • しきい値超過時間 <TOT>
      - アラームが送信されるまでにメトリクスがしきい値を超過している必要がある時間。
    • スライディング タイム ウィンドウ <TW>
      - メトリクスのしきい値違反がモニタされるスライディング ウィンドウの時間。
    • <TOT> および <TW> の時間単位
      - [
      しきい値超過時間
      ]および[
      期間
      ]パラメータで使用する測定単位。 分、時間、または日に制限されます。
    • 自動的にアラームをクリア
      - 自動クリア機能を有効にします。
    • クリア遅延時間
      - 自動クリア タイマで使用される時間。 指定した期間内にアラームが送信されない場合、アラームは自動的にクリアされます。
      クリア遅延時間が設定されていない場合、アラームはクリアされません。
    • <TC> の時間単位
      - 自動クリアで使用する測定単位。 分、時間、または日に制限されます。
  8. 変更を保存します。
ポスト ルール設定の更新
しきい値超過時間の設定直後には、以下の変更内容が反映されます。
  • 新しいしきい値超過時間ルール。
  • クリア遅延時間パラメータへの変更。
  • しきい値超過時間アクティブ状態への変更。
設定を保存したら、設定しているプローブの最もローカルな ppm プローブが件名 TOT_RULE_CONFIG のバス メッセージを作成します。 TOT_RULE CONFIG メッセージ件名をサブスクライブした
tot_rule_config
というハブの関連キューがあります。 alarm_enrichment プローブは、これらのメッセージを処理して、
rule_config.xml
というローカル ファイルに書き込みます。 rule_config.xml ファイルはファイル ディレクトリ
<UIM_install>\probes\service\nas\alarm_enrichment
に保存されています。 2 つのルールを含む rule_config.xml ファイルの例を以下に示します。
image2017-9-22 16:2:49.png
alarm_enrichment プローブは起動すると Rule_config.xml をメモリに読み込みます。 Rule_config.xml ファイル内に一致が検出された Met_id のアラームが alarm_enrichment プローブで処理されると、そのアラームは alarm2 件名にポストされません。 このアクションはしきい値超過時間の期間中にそのアラームが無視されることを意味します。
以下の変更は、次にアラームを受信すると有効になります。
  • しきい値超過時間パラメータへの変更。
  • スライディング タイム ウィンドウ パラメータへの変更。
しきい値超過時間のトラブルシューティング
alarm_enrichment に関するエラーが表示される
現象:
  • alarm_enrichment プローブ バージョンが正しくないか、または alarm_enrichment プローブをアクティブにする必要があるという重大アラームを受信しました。
  • アドミン コンソールのプローブ設定 GUI に以下のエラー メッセージが表示されます。
    しきい値超過時間がありません。 alarm_enrichment プローブから設定を読み取るか書き込むことができない。
解決策:
  • alarm_enrichment プローブ バージョン 4.40 以降がインストールされ、ハブ レベルでアクティブ化されていることを確認します。
しきい値超過時間の設定パラメータが使用できない
現象:
  • プローブのアドミン コンソール GUI に、しきい値超過時間の設定パラメータが表示されません。
  • 動的しきい値の設定パラメータは表示されます。
  • その他のエラー メッセージまたはアラームは受信していません。
解決策:
  • nas、ppm、prediction_engine の正しいバージョンがインストールされ、ハブ レベルでアクティブ化されていることを確認します。