問題切り分けマップ内のソケット グループの操作方法

問題切り分けマップを使用すると、ソケット グループを表示および使用できます。
apmdevops104jp
問題切り分けマップを使用すると、ソケット グループを表示および使用できます。
問題切り分けマップ内のソケット グループの操作方法
問題切り分けマップに、フロントエンド アプリケーション コンポーネントと共に多数のバックエンド ソケット コンポーネントが表示されると、問題の診断および切り分けが難しくなる場合があります。適切な権限を持つユーザは、これらの共通のバックエンド ソケットを 1 つのグループにグループ化するルールを定義して、コンポーネントの数を減らすことができます。
以下の例では、ルールは Reporting Service フロントエンド アプリケーション用の共通の MS Exchange バックエンド ソケットをグループ化するために定義されています。ツリーでフロントエンド アプリケーション ノードが選択されると、右側のビューア ペインにアクティブなソケット グループが表示されます。
2176673.PNG
 
問題切り分け担当者として、ソケット グループを使用して、以下のタスクを実行できます。
  • アプリケーションのデータを報告するアクティブなソケットの場所およびエージェントをすべて、場所テーブルに表示します。
  • [問題切り分けマップ グループ]管理モジュール内にグループ定義を表示します。
  • メトリック ブラウザで、問題を修正するためにエージェントから収集されるメトリックへドリルダウンします。対応するメトリックは、同じエージェントからのメトリックの場合と異なるエージェントからのメトリックの場合があります。
  • ソケット グループの稼働状況メトリックおよびアラートを監視します。
以下の図は、問題切り分け担当者として、ソケット グループを操作する方法を示しています。
9.6 Interact with Socket Groups in the Triage Map
以下の手順に従います。
  1. 問題切り分けマップで、ソケット グループを使用します。
  2. 場所の詳細およびメトリックを表示します。
  3. ソケット グループの稼働状況メトリックおよびアラートを監視します。
  4. 監視するアラートを編集します。
  5. (オプション)データを表示および解釈します。
注:
管理モジュール エレメントの作成および編集を行うためのユーザ権限の詳細については、「WebView の構成」を参照してください。
問題切り分けマップでのソケット グループの表示
ソケット グループを使用して、ソケットの送信先および対応するメトリックを監視します。
以下の手順に従います。
  1. WebView で、[Investigator]-[問題切り分けマップ]をクリックします。
  2. 問題切り分けマップ ツリーで、[By Frontend]ノードを展開します。このノードは、アプリケーションのアプリケーション中心階層を表示します。
  3. メトリックを表示するアプリケーションをクリックします。
    自動検出されたアプリケーション コンポーネントおよびそれらの依存関係が、右側のペインのアプリケーション問題切り分けマップに表示されます。選択したアプリケーションには 2 つのサブノードがあります。
    • [Health]メトリック -- 選択したアプリケーションが展開されている物理的な場所、およびアプリケーションのメトリックを報告するようにエージェントが設定されている物理的な場所全体の集約メトリック。
    • Backend calls メトリック -- 選択したアプリケーションをサポートするほかのエレメントへの呼び出しのメトリック。これらの呼び出しが行われるコンポーネントには別のフロントエンド、データベースなどのバックエンド システム、アプリケーションによって呼び出された Web サービス、および不明なエレメントが含まれる可能性があります。
    バックエンド呼び出しのメトリックは、これらのコンポーネントへのソケット接続の測定値から得られます。
  4. アプリケーション問題切り分けマップ内の
    <socket_group>
    コンポーネントを右クリックします。
    以下のいずれかのオプションを選択します。
    • 名前
      の場所を表示
      テーブルで、ソケット グループの場所の詳細およびステータスを表示するペインを開きます。
    注:
    問題切り分け担当者は、既存のソケット ノードがソケット グループによって置き換えられる状況に遭遇する場合があります。この場合、関連する場所テーブルでは、単一の特定の送信先を表示する代わりに、複数の送信先が表示されます。つまり、ソケット グループに含まれ、そのフロントエンドによって呼び出されるソケットごとに 1 つ表示されます。この場合、WebView は、元々表示されていたソケットを削除し、ソケット グループおよびそれに関連するデータで置き換えることに注意してください。
場所の詳細およびメトリックの表示
アプリケーションのデータを報告するエージェントの場所を表示できます。場所には、エージェントが選択されたソケット グループのメトリックを報告する物理的な場所に対応するノードが含まれます。個別のホストでアラートを監視する場所リストを参照できます。
以下の手順に従います。
  1. Webview で、[Investigator]-[問題切り分けマップ]をクリックします。
  2. 問題切り分けマップ ツリーで、情報を表示するアプリケーションをクリックします。
    アプリケーション問題切り分けマップが表示されます。
  3. <socket group> コンポーネントまたはライブ接続の矢印を右クリックし、コンテキスト メニューから[
    名前
    の場所を表示]を選択します。
    場所テーブルが下部ペインに表示されます。
  4. 以下のいずれかのアクションを実行します。
    • 警告状態または危険状態の場所を探します -- 色付きのセル(黄、赤)は、メトリックがしきい値を超えている場所を表しています。
      注:
      場所テーブル内のアラートは、最後の間隔の時点でのステータスを表します。精度設定の監視は行いません。
    • テーブルの列見出しをクリックして、リストを並べ替えます。
  5. メトリック ブラウザ ツリーで青い矢印アイコンをクリックして、データをレポートするエージェントの場所にジャンプします。
    表示がメトリック ブラウザ ツリーに切り替わり、選択したエージェントのパフォーマンス メトリックが表示されます。
  6. 右ペインの[概要] タブでアラートのメトリックを探します。
    色付きのアラートは、メトリックまたはエレメントのステータスを表示します。警告または危険のアラートは問題を示します。グラフは関連する標準的なメトリックを表示します。
ソケット グループの稼働状況メトリックおよびアラートの監視
[概要]タブで高レベルのソケット グループ稼働状況を監視して、問題の根本原因を識別できます。
以下の手順に従います。
  1. WebView で、[Investigator]-[問題切り分けマップ]をクリックします。
  2. 監視するフロントエンドを展開し、ソケット グループ フォルダを選択します。
    右ペインにテーブルが表示されます。
  3. 各ソケット グループの稼働状況サマリ メトリックを表示します。
  4. メトリック ブラウザ ツリーで青い矢印アイコンをクリックして、データをレポートするエージェントの場所にジャンプします。
    表示がメトリック ブラウザ ツリーに変わります。右ペインにある[概要]タブには、デフォルトのメトリック グラフ([平均応答時間]、[間隔ごとの応答数]など)が表示されます。
    以下のオプションがあります。
    • Average Response Time の傾向をほかのメトリックの変化と組み合せて、問題を識別し、診断します。
    • 監視するアラートを編集できます。
    • 選択したアプリケーションのデータをレポートしているソケットの場所にジャンプするには、[バックエンド呼び出しの場所]テーブルで青い矢印をクリックします。
    • [時間ウィンドウ]ドロップダウン リストから、履歴ビュー用の時間範囲([24 時間]など)を選択します。選択した(たとえば 24 時間)期間を使用して、その範囲のデータがチャートおよびグラフに表示されます。
監視するアラートの編集
アラートを編集して、以下の属性を指定することができます。
  • しきい値
  • アラートが監視するメトリックのセットを指定するメトリック グループ
  • アラートが属する管理モジュール
以下の手順に従います。
  1. Webview で、[Investigator]-[問題切り分けマップ]をクリックします。
  2. 問題切り分けマップ ツリーで
    <socket_group>
    ノードを右クリックします。
    このオプションを選択します。
    • 名前
      のアラートの編集
      名前
      のアラートの編集]ダイアログ ボックスを開きます。
  3. 左側のペインで、アラート ステータスに影響するメトリックを選択します。
  4. [問題]ドロップダウン リストからアラートをトリガする問題のタイプを選択します。
    • 高すぎる値
      メトリック値がしきい値を超えたときにアラートをトリガします。
    • 低すぎる値
      メトリック値がしきい値を下回ったときにアラートをトリガします。
    • 特定の不正な値
      メトリック値がしきい値と等しいときにアラートをトリガします。その後、そのしきい値はしきい値ではなく不正な値として扱われます。
    • 予期しない値
      メトリック値がしきい値と等しくないときにアラートをトリガします。その後、その値はしきい値ではなく予期しない値として扱われます。
  5. (オプション)[無効]チェック ボックスをオンにして、アラートを無効にします。このオプションは、すべての個々の原因アラートとオブジェクト アラートを無効にします。
  6. [サマリ メトリック]タブをクリックします。危険アラートおよび警告アラートのしきい値と感度レベルを設定して、[適用]をクリックします。
    • 危険
      メトリック値がしきい値を超えたときにアラートをトリガします。アラートは赤色で表示されます。
    • 警告
      メトリック値がしきい値に近づいたときにアラートをトリガします。アラートは黄色で表示されます。
    注:
    ソケット グループの場所メトリックはサポートされていません。
  7. (オプション)[プロパティ]タブをクリックし、アラートのプロパティを指定します。
    1. アラートの説明を入力します。
    2. 間隔を設定します。
    3. [適用]をクリックします。
  8. (オプション)[アクション]タブを選択し、以下のフィールドに入力します。[利用可能なアクション]からアクションを選択して、[選択したアクションおよびトリガの状態]リストに移動し、[危険]、[警告]、または両方の状態を選択します。
    • アラートをトリガ
      アラートの動作を指定します。
      • 全般的な重大度の増加時
        -- (デフォルト)このオプションは、簡易アラートの状態が以下のように悪化している期間に対する問題メッセージを生成します。
      • 正常から警告
      • 正常から危険
      • 警告から危険
      • 全般的な重大度の変更時は常に
        -- このオプションは、状態が変化したときに解決メッセージと問題メッセージを生成します。たとえば、簡易アラートが危険から警告に変化した場合、Introscope は解決メッセージと問題メッセージを生成します。この種類の解決アラートを利用するように設定した場合、解決メッセージが生成されるのは、警告または危険から状態が変化したときです。
      • 問題が発生している各間隔時
        -- このオプションは、簡易アラートが警告状態または危険状態になった期間ごとに、問題メッセージを生成します。
    • トリガ後遅延時間
      遅延時間の設定を指定します。
      注:
      [全般的な重大度の変更時は常に]が選択されている場合、このオプションは無効になります。
    [利用可能なアクション]リストには、問題切り分けマップ構成管理モジュールですでに作成されているアクションが表示されます。利用可能なアクションを追加するには、管理モジュールを編集して、その管理モジュール内にアクションを作成します。ただし、管理モジュール エディタを使用してアクションを編集することはできません。この手順で説明されているコントロールを使用してアクションを編集します。
    注:
    警告アクションと危険アクションの両方が存在し、アラートのステータスが正常から危険に変化したときは、システムは危険アクションのみをトリガします。
  9. [OK]をクリックします。
メトリックの表示と解釈
ソケット グループ データとメトリックは、さまざまな方法で表示および解釈できます。
  • 標準メトリックの表示。
  • Average Response Time の傾向の使用。
標準メトリック
WebView は、エージェントがメトリックとしてリモートおよびローカル システムから収集するアプリケーション パフォーマンス データを表示します。監視対象のフロントエンドおよびバックエンドのアプリケーション コンポーネント、およびその他の多くのアプリケーション コンポーネントについては、以下の標準メトリックが表示されます。
  • Average Response Time (ms) (平均応答時間(ミリ秒))
    : 基準となるアプリケーション応答速度。
  • Concurrent Invocations (同時進行中の呼び出し)
    -- 一定の時間に処理される要求の数。このメトリックは、バックエンド呼び出しに対して計算されません。
  • Errors Per Interval (間隔ごとのエラー数)
    -- 指定した時間スライス中に発生するエラーの数。
  • Responses Per Interval (間隔ごとの応答数)
    -- 指定した時間スライス中に完了した要求の数。
  • Stall Count (ストール数)
    -- ストールの数。ストールは、指定した時間しきい値内に完了しなかった要求です。
Average Response Time の傾向
Average Response Time をほかのメトリックの変化と組み合せて、傾向を分析することで、問題を識別し、診断できます。詳細については以下の表を参照してください。
Average Response Time の傾向
定義
継続的な問題
Available Thread Count の値が低く、Average Response Time の値が一貫して高い場合は、以下の問題を示している可能性があります。
非効率なコード
外部システムの過剰使用
バックエンドが遅い
レイヤが多すぎる
一貫した問題が常に存在し、改善することも悪化することもありません。
定期的な問題
Average Response Time が定期的に高くなり、定期的に急増した後、通常に戻るというようなグラフで示されます。
Available Thread Count の値が低く、Average Response Time の値が定期的に高くなる場合は、以下の問題を示している可能性があります。
GC リークが頻繁に発生
負荷に関連するバックエンドのボトルネック
CPU Utilization の値が低く、Average Response Time の値が定期的に高くなる場合は、以下の問題を示している可能性があります。
内部問題
定期的な問題が発生し、一定の間隔で収まります。
進行的な問題
Average Response Time が長期にわたって着実に増加しており、Responses Per Interval の値が低い場合は、以下の問題を示している可能性があります。
メモリ リーク
段階的な問題は時間と共に減少します。