Gerenciar alarmes com diretivas centralizadas de alarme

uim203
HID_Alarm_Policy
Uma diretiva de alarme define um conjunto de condições de alarme e métricas em um local centralizado para que os administradores de monitoramento possam exibir e gerenciar relatórios de alarmes com facilidade.Os administradores também podem criar diretivas de alarme em resposta a novas condições e necessidades. Eles podem gerenciar todos os aspectos do comportamento do alarme em uma diretiva de alarme; por exemplo, gerenciar os limites do alarme, o tempo e mensagens configuradas para alarmes. O recurso Diretivas de alarme permite executar as seguintes ações:
  • Exibir uma lista de diretivas de alarme.
  • Adicionar diretivas de alarme.
  • Adicionar e excluir as condições que disparam um alarme. 
  • Adicionar condições de alarme para monitorar dispositivos individuais, um grupo de dispositivos ou uma tecnologia de monitoramento específica (como o Docker).
  • Configurar o alarme Tempo acima do limite de modo a reduzir o ruído do alarme para um nível acionável.
  • Personalizar mensagens de alarme para que elas forneçam as informações das quais você precisa.
Índice
2
2
Pré-requisitos
Veja a seguir os pré-requisitos para criar uma diretiva de alarme:
  • Certifique-se de que a versão do robô seja a 7.96 ou posterior.
    • Se a versão do robô for 9.31 ou 9.31S, certifique-se de que a versão do MCS também seja 9.31. Se essa compatibilidade não for mantida, as diretivas de alarme e os perfis do MCS não funcionarão.
  • Certifique-se de que o perfil seja um perfil de monitoramento aprimorado e de que esteja coletando métricas.
  • Certifique-se de que o MCS (Monitoring Configuration Service - Serviço de configuração de monitoramento) já esteja configurado.
Criar uma diretiva de alarme
O processo completo para criar uma diretiva de alarme exige que você trabalhe no Console do operador. Crie um perfil aprimorado no OC (com a coleta de métricas ativada).Somente quando a coleta de métricas for iniciada, você poderá criar uma diretiva de alarme no Console do operador.
Siga estas etapas:
  1. Efetue logon no OC.
  2. Crie um perfil de monitoramento aprimorado com a coleta de métricas ativada. A seguinte captura de tela mostra um perfil de monitoramento aprimorado no OC
  3. No Console do operador, clique em
    Configurações
    no painel esquerdo.
  4. Clique no cartão
    Diretivas de alarme
    .
    A página
    Diretivas de alarme
    é aberta.
  5. Clique no ícone de mais Plus Icon, na parte inferior da página.
  6. Insira um nome de diretiva no campo
    Nome da diretiva de alarme
    .
    Digite um nome para a diretiva que o ajude a distinguir uma diretiva das outras. Se estiver criando uma diretiva de alarme para um dispositivo ou grupo, você poderá incluir o nome ou endereço IP do dispositivo ou o nome do grupo. Inclua palavras-chave no nome para facilitar a pesquisa de uma diretiva específica.
  7. Clique em
    Adicionar condição
    (Add Condition Icon).
    A caixa de diálogo
    Definir condição
    é aberta. Essa caixa de diálogo permite definir as condições de alarme.
    Uma condição de alarme define o que é monitorado. Você pode definir as condições de alarme para um grupo (dispositivo e recipiente), um dispositivo específico ou uma tecnologia de monitoramento.
  8. Selecione o tipo de condição de alarme na caixa de diálogo
    Definir condição
    :
    • Dispositivo
      Monitora as métricas de desempenho ou estado de um componente do dispositivo.
      Para configurar uma condição de alarme para um dispositivo, selecione o nome de um dispositivo, a métrica e o componente que deseja monitorar.A seguinte captura de tela de exemplo mostra as configurações para o Tipo de dispositivo:
      filter_device.png
      Quando há vários hosts que coletam a mesma métrica, a lista de hosts de monitoramento também é exibida na página
      Definir condição
      . Você pode selecionar somente um host por vez para criar a condição de alarme. Crie outra condição para coletar métrica em outro host. A seguinte captura de tela de exemplo mostra a seção
      Select a Monitoring Host
      que aparece quando há vários hosts que coletam a mesma métrica:
      select_monitoring_host.png
    • Tecnologia de monitoramento
      Monitora as métricas associadas a uma tecnologia de monitoramento específica.
      Para configurar uma condição de alarme para uma tecnologia de monitoramento, selecione uma tecnologia de monitoramento, um perfil de configuração e uma métrica. A seguinte captura de tela de exemplo mostra as configurações para o tipo Tecnologia de monitoramento:
      Monitoring_Technology_Set_Condition.png
    • Grupo
      Monitora as métricas de desempenho ou estado de um grupo (recipiente ou dispositivo).Adicione condições de alarme que se apliquem a todos os dispositivos de um grupo.Os grupos são exibidos como uma árvore de navegação. Os grupos de recipientes são seguidos pelos subgrupos. Expanda um grupo de recipientes para selecionar um subgrupo. Quando você cria a condição no grupo de recipientes, todos os subgrupos (grupos de recipientes filho e grupos de dispositivos) nesse grupo de recipientes a herdam. O suporte para o grupo de recipientes é útil em cenários onde você deseja um limite único para cada métrica em um dispositivo. Essa diretiva de limite pode ser baixada do grupo de recipientes para o grupo de dispositivos e para o dispositivo.
      Para ativar a funcionalidade de diretiva de alarme para grupos de recipientes, use a configuração de dados brutos do MCS para definir o valor do parâmetro
      enable_container_support_for_alarm_policy
      na seção
      timed
      como
      true
      . Por padrão, o valor é
      false
      .
      Para configurar uma condição de alarme para um grupo, selecione o nome do grupo e a métrica que deseja monitorar em todos os dispositivos em um grupo. Também é possível especificar se deseja gerar alarmes em todos os componentes ou para alguns componentes específicos. Por padrão, os alarmes são gerados em todos os componentes. Para gerar alarmes em componentes específicos, use uma expressão regular para filtrar os componentes. Selecione uma das seguintes opções, dependendo de seus requisitos:
      • Todos os componentes
        Permite gerar alarmes em todos os componentes de todos os dispositivos em um grupo.
      • RegEx
        Permite filtrar os componentes com base em uma expressão regular, o que permite gerar alarmes apenas em componentes filtrados. Use metacaracteres como
        *
        e
        ?
        para criar uma expressão regular e uma correspondência de padrão.A opção RegEx oferece suporte a expressões regulares escritas em PERL. Por exemplo, se desejar gerar alarmes sobre uso das CPUs – CPU-11, CPU-12 e CPU-13 – de todos os dispositivos em um grupo, você poderá definir a expressão regular como:
        CPU-1[1-3]
        .Também é possível usar texto simples com os operadores curinga para correspondência com a sequência de caracteres de destino. Por exemplo, a expressão
        CPU*
        corresponde a todas as CPUs do sistema (CPU-0, CPU-1 e assim por diante até a CPU-15). Existem determinadas limitações sobre como é possível definir expressões regulares específicas.
      A seguinte captura de tela mostra configurações para o tipo Grupo:
      Group_Set_Condition.png
  9. Clique em
    OK
    para salvar as informações da condição.
  10. Especifique uma prioridade apropriada no campo
    Prioridade
    para avaliar a condição da métrica para a diretiva de alarme no nível do grupo. A condição que tem a prioridade mais alta é usada para gerar alarmes no dispositivo.O intervalo do valor de prioridade é de 0 a 10000.É possível especificar o valor da prioridade para a diretiva de alarme somente no nível do grupo, não no nível do dispositivo ou no nível da tecnologia de monitoramento. No nível do dispositivo, a prioridade da condição está definida para o valor mais alto e tem precedência sobre outras prioridades de condição para a mesma métrica nesse dispositivo. No nível da tecnologia de monitoramento, embora a UI não mostre a prioridade da condição, o CA UIM define internamente o valor para 100, que não pode ser alterado.O valor da prioridade padrão é 100 no nível do grupo e da tecnologia de monitoramento.
    Para obter mais informações sobre casos de uso específicos, consulte a seção relacionada.
    A captura de tela a seguir mostra a prioridade de uma condição para uma diretiva de alarme no nível do dispositivo. Observe que a prioridade é definida como mais alta e o valor não pode ser alterado:
    Device-level-priority.jpg
    A captura de tela a seguir mostra a prioridade de uma condição para uma diretiva de alarme no nível do grupo. Observe que o campo Prioridade mostra a prioridade padrão de 100; é possível alterar o valor nesse caso:
    group-priority.jpg
  11. Defina o limite de alarme inserindo a gravidade do alarme, o tipo de limite (estático ou dinâmico), o operador, o valor do limite e o tempo de execução (Imediato ou Tempo acima do limite), conforme a necessidade.
    Se você selecionar
    Tempo acima do limite
    , digite o número de minutos, horas ou dias que a métrica precisa para violar o valor do limite. Por exemplo, quando o
    Tempo acima do limite
    for 3 horas em 4 horas, o Infrastructure Management irá gerar um alarme quando houver uma violação consecutiva do limite por três horas dentro de um período de quatro horas.
    A seguinte captura de tela mostra a condição do alarme com uma prioridade de condição de 100 (valor padrão), gravidade Crítica, o tipo de limite como estático, o operador como maior que, o valor do limite como 80 e o tempo de execução da criação do alarme como Imediato:
    Group_Alarm_Policy_With_Condition.PNG
  12. Clique na seta ao lado da seção
    Mensagens de alarme
    para analisar as mensagens de alarme padrão. Também é possível personalizar as mensagens de alarme para conter informações adicionais.
  13. Clique em
    Salvar
    (no canto inferior direito) para criar uma diretiva de alarme com uma ou mais condições de alarme.
    Essa diretiva de alarme irá gerar alarmes com mensagens padrão quando os limites configurados forem violados.
A seguinte captura de tela de exemplo mostra uma diretiva de alarme criada:
Created_Alarm_Policy.PNG
Quando você cria um perfil aprimorado no OC e o modelo do probe inclui valores de limite padrão, uma diretiva de alarme padrão é criada no Console do operador para esse perfil aprimorado. O criador da diretiva de alarme padrão é exibido como
Diretiva padrão da CA
no console do operador. Além disso, quando você converte o perfil não aprimorado em um perfil aprimorado, uma diretiva de alarme correspondente é criada no console do operador para o perfil convertido. A criação dessa diretiva de alarme adiciona valores de limite que estão presentes no perfil não aprimorado à seção da métrica de spooler (plugin_metric). O criador dessa diretiva de alarme é exibido como a
migração do perfil da CA
no console do operador.
Exportar/importar diretivas de alarme
Com o UIM 20.3.0, a API de gerenciamento de diretivas foi aprimorada para oferecer suporte à exportação e à importação de diretivas de alarme de um domínio para outro. Para executar essas operações, você deve ter a permissão de ACL Gerenciamento de diretivas.
É possível exportar as diretivas de alarme com base nos seguintes itens:
  • Identificadores de diretiva de alarme
  • Identificador do grupo
  • Identificador de dispositivo
  • Tecnologia – nome do probe
Os formatos de exportação suportados são XML e JSON.
Para importar diretivas de alarme, mapeie os grupos, dispositivos e perfis para os tipos de destino GROUP, DEVICE e TECHNOLOGY, respectivamente.
O formato do arquivo de exemplo é como se segue:
[ { "sourcePolicyTargetId": 0, "sourcePolicyTargetType": "DEVICE", "targetPolicyTargetId": 0 } ]
APIs adicionadas recentemente
POST /v0/policy/export
Parâmetros de entrada:
  • policyIds
    - Lista de identificadores das diretivas de alarme a serem exportadas.
  • groupId
    - Identificador do grupo para recuperar diretivas de alarme.
  • deviceId
    - Identificador do dispositivo para recuperar diretivas de alarme.
  • Probe
    - Tecnologia para recuperar diretivas de alarme.
  • policyFileType
    - JSON(padrão), XML
Retorna o arquivo de diretivas de alarme XML/JSON a ser importado.
As diretivas de alarme exportadas podem ser baixadas no Swagger clicando no link no corpo da resposta.
ExportedPolicy.PNG
POST  /v0/policy/import
  • targetMappingFile
    - O mapa de destino da diretiva no formato JSON usado para mapear o dispositivo, o grupo ou a tecnologia no arquivo de origem e os atributos correspondentes no ambiente de destino durante a importação de diretivas de alarme.
    Exemplo:
    [ { "sourcePolicyTargetId": 0, "sourcePolicyTargetType": "DEVICE", "targetPolicyTargetId": 0 } ]
  • policiesFile
    - Arquivo usado para importar a diretiva de alarme.
Retorna a lista de diretivas de alarme importadas.
Gerenciamento de diretivas no modo de alta disponibilidade
Quando o probe policy_management_ws é implantado em vários nós do wasp, é necessário garantir que todos os probes não iniciem o processamento das diretivas. Ou seja, sempre deve haver apenas um nó de processamento. Você pode fazer isso configurando manualmente ou executando o probe policy_management_ws no modo HA (High Availability - Alta Disponibilidade). Execute a seguinte configuração no adminconsoleapp que está em execução no hub principal (na marca <adminconsole>).
Siga as etapas abaixo para executar o probe policy_management_ws no modo HA (High Availability - Alta Disponibilidade):
  1. Em wasp.cfg, vá até a pasta: webapps/adminconsoleapp/custom/uncrypted
  2. Atualize o atributo ha_mode.
    Os valores permitidos são: HA ou MANUAL (padrão).
    • Quando definido como HA, todos os nós de gerenciamento de diretivas trabalham em coordenação com o adminconsoleapp em execução no hub principal. O componente do controlador executado como parte do adminconsoleapp controla o nó a ser processado e garante que apenas um nó seja processado por vez.
    • Quando não for definido ou for definido para MANUAL, todos os nós lerão o sinalizador policy_processing no arquivo wasp.cfg do respectivo nó e processarão as diretivas se o valor for definido como verdadeiro.
  3. Atualize os atributos adicionais heartbeat_interval_min e no_failed_attempts.
    • heartbeat_interval_min: define o intervalo de tempo que especifica a frequência com que os nós policy_management_ws enviam o sinal de monitoramento para o controlador em execução como parte do adminconsoleapp. O valor padrão é 5 minutos.
    • no_failed_attempts: define o número de tentativas com falha do envio do sinal de monitoramento antes de interromper o processamento da diretiva. O valor padrão é 3. Com a configuração padrão, o processamento da diretiva em um nó é interrompido em 15 minutos, em caso de problemas de comunicação entre o controlador e o nó. Após 20 minutos, um novo nó se tornará o nó de processamento da diretiva.
  4. Clique em Salvar.
Configuração manual
Se ha_mode estiver configurado como MANUAL, o gerenciamento de diretivas funcionará no modo manual. No entanto, os administradores podem escolher manualmente o nó de tolerância a falhas em caso de falha no nó principal.
Para ativar essa opção:
  1. Implante o probe policy_management_ws em todos os servidores do OC e defina "policy_processing" como true em um dos nós (nó principal), conforme mostrado na captura de tela a seguir:
    policy_processing = true não está presente por padrão. É necessário adicioná-lo ao arquivo wasp.cfg no servidor do OC para o qual você deseja processar as diretivas de alarme.
Gerenciamento centralizado de limite para tecnologias monitoradas remotamente
(A partir do UIM 20.3.1) A funcionalidade da diretiva de alarme fornece um gerenciamento de limite centralizado para tecnologias que são monitoradas remotamente. Para probes remotos, as diretivas de alarme não são vinculadas ao robô, o que significa que as mesmas diretivas não são aplicadas a todos os dispositivos gerenciados por um probe remoto. Essa capacidade permite definir limites separados para diferentes dispositivos ou grupos que são monitorados por meio do mesmo probe remoto.
Portanto, para dispositivos ou grupos que um probe remoto gerencia, as diretivas de alarme são aplicadas somente a esses dispositivos para os quais elas são criadas. Isso garante que os alarmes sejam gerados somente para os dispositivos relevantes, permitindo que você gerencie as diretivas e os alarmes de maneira mais eficaz.
Essa funcionalidade aplica-se somente às diretivas remotas que são criadas após a atualização para o UIM 20.3.1. Observe que o UIM 20.3.1 é uma release de patch. O patch UIM 20.3.1 não inclui qualquer programa de instalação de atualização para o UIM Server. O patch inclui os artefatos autônomos separados que podem ser usados para atualizar os respectivos componentes. Para obter mais informações sobre os artefatos que estão disponíveis como parte da release do patch UIM 20.3.1, consulte o artigo UIM 20.3.1.
Examine o exemplo a seguir para entender como a funcionalidade aprimorada funciona.
Exemplo
O exemplo de configuração contém dois grupos: Grupo A e Grupo B. O primeiro grupo inclui dois dispositivos: vm1 e vm2. O segundo grupo também inclui dois dispositivos: vm3 e vm4. O computador 12vm4 está agindo como um host de monitoramento e está gerenciando os dois grupos. O perfil do MCS Conectividade da rede (probe net_connect) é criado nesse host de monitoramento.
A captura de tela a seguir mostra os dispositivos de destino no Grupo A e Grupo B, o host de monitoramento (12vm4) e o perfil do MCS:
GroupA_Profile é o perfil implantado no Grupo A (VM1 e VM2). Esse perfil usa o 12vm4 como seu host de monitoramento na configuração do perfil. Além disso, o tempo de resposta de ping é a métrica que esse perfil supostamente deve coletar. De modo semelhante, o Grupo B tem a mesma configuração, em que GroupB_Profile é o perfil com snw12vm4 como seu host de monitoramento e o tempo de resposta de ping como as métricas.
A captura de tela a seguir mostra a configuração do Grupo A:
A diretiva de alarme GroupA_AP é criada no Grupo A e a diretiva de alarme GroupB_AP é criada no Grupo B. A captura de tela a seguir mostra as duas diretivas de alarme:
Agora, se verificar os alarmes, você descobrirá que as respectivas diretivas estão criando alarmes somente nos dispositivos em que eles foram criados. A captura de tela a seguir mostra que a diretiva GroupA_AP está criando alarmes no Grupo A (vm1 e vm2). Da mesma forma, GroupB_AP está criando alarmes no grupo B (vm3 e vm4):
Neste cenário de exemplo, antes da versão 20.3.1, o comportamento era de que, se uma diretiva fosse criada no Grupo A, ela também seria aplicada aos dispositivos do Grupo B. Agora, com essa funcionalidade aprimorada, as diretivas de alarme não são aplicadas aos dispositivos de ambos os grupos. Elas são aplicadas somente aos dispositivos de seu grupo associado.
Perguntas frequentes
Esta seção fornece mais informações sobre algumas áreas específicas relacionadas à diretiva de alarme.
Como criar uma diretiva de alarme no estado desativado?
Quando você cria uma diretiva de alarme no estado desativado, ela é criada com êxito, mas não é aplicada por padrão. Essa habilidade fornece a opção de avaliar a diretiva de alarme antes que seja ativada para receber alarmes.
Siga estas etapas:
  1. Clique em
    Configurações
    (Settings Icon).
  2. Selecione o cartão
    Diretivas de alarme
    .
    Uma lista de diretivas de alarme existentes é exibida.
  3. Clique no ícone de mais Plus Icon, na parte inferior da página.
    A nova tela de diretivas é exibida.
  4. Insira um nome no campo
    Nome da diretiva de alarme
    .
  5. Clique em
    Adicionar condição
    (Add Condition Icon).
  6. Selecione o tipo de condição de alarme na caixa de diálogo
    Definir condição
    .
  7. Selecione as opções que se aplicam ao tipo de condição de alarme.
  8. Clique em
    OK
    para salvar as informações da condição.
  9. Defina o limite do alarme. Modifique a gravidade do alarme, o tipo de limite (estático ou dinâmico) e o tempo de execução do alarme, conforme necessário.
  10. Clique no botão
    Salvar e desativar
    .
    A diretiva de alarme é criada no estado desativado, e o marcador de status para a diretiva de alarme recém-criada é exibido como
    Desativado
    na página Diretivas de alarme.
Como desativar (ou ativar) uma diretiva de alarme existente?
Se desejar desativar (ou ativar) uma diretiva de alarme existente, será possível fazê-lo.Ao desativar a diretiva de alarme existente, você não receberá mais nenhum alarme para essa diretiva. Isso permite desativar temporariamente a diretiva de alarme sem a necessidade de excluí-la. E, se desejar receber alarmes da mesma diretiva de alarme desativada, você pode simplesmente ativá-la. Não é necessário criar outra diretiva de alarme.
Siga estas etapas:
  1. Clique em
    Configurações
    (Settings Icon).
  2. Selecione o cartão
    Diretivas de alarme
    .
    Uma lista de diretivas de alarme existentes é exibida.
  3. Clique na diretiva de alarme necessária.
  4. Alterne a opção no canto inferior esquerdo para
    Desativado (
    ou
    Ativado)
    .
    A diretiva de alarme será desativada (ou ativada) e uma mensagem de confirmação relevante será exibida. Por exemplo, ao verificar a lista de diretivas na página Diretivas de alarme, o status da diretiva exibe o marcador Disabled tag.pngpara a diretiva de alarme desativada.
    A seguinte captura de tela mostra um exemplo em que uma diretiva de alarme existente está desativada:
    Alarm_Policy_Disabled.PNG
Clique no botão
Excluir
(no canto inferior esquerdo) para excluir uma diretiva de alarme existente.
Como desativar uma condição de alarme?
Você pode desativar uma condição de alarme específica em uma diretiva de alarme. Caso haja várias condições em uma diretiva de alarme, desativar uma condição não afetará as outras. Isso irá interromper a geração de alarmes para condições de alarme desativadas de uma diretiva, ao passo que os outros alarmes das condições que ainda estiverem ativas continuarão sendo gerados. Por exemplo, digamos que você tenha criado uma diretiva de alarme para um dispositivo que o probe dirscan (Verificação de arquivos e diretórios) monitora. Para a mesma métrica, você criou duas condições separadas com valores de limite diferentes. Agora você deseja desativar uma das condições.
Siga estas etapas:
  1. Clique em
    Configurações
    (Settings Icon).
  2. Selecione o cartão
    Diretivas de alarme
    .
    Uma lista de diretivas de alarme existentes é exibida.
  3. Clique na diretiva de alarme necessária.
  4. Role para a condição de alarme que deseja desativar.
  5. Selecione o
    menu embutido
    (Inline_menu icon.png) e selecione
    Desativar condição
    .
  6. Selecione
    Salvar
    .
    A condição será desativada e os alarmes não serão mais gerados para ela. O status da condição (Disabled tag.png) será exibido ao lado dela. A seguinte captura de tela mostra um exemplo:
    Disable_Condition.PNG
    Enable_Condition.PNG
Para ativar a condição, selecione
Ativar
condição
e clique em
Salvar
. O status da condição será alterado e o marcador Desativado não será mais exibido.
Quais são as limitações para uso de expressões regulares?
As seguintes expressões regulares não filtram componentes de um grupo:
  • Expressão regular incorreta:
    CPU-(0|1)
    Solução alternativa:
    Use a expressão regular:
    CPU-[0-1]
    Corresponde aos componentes:
    CPU-0 e CPU-1
  • Expressão regular incorreta:
    CPU.11
    Solução alternativa:
    Use a expressão regular:
    /CPU.11/
    Corresponde ao componente:
    CPU-11
  • Expressão regular incorreta:
    total/i
    Solução alternativa:
    Use a expressão regular:
    /[tT][oO][tT][aA][lL]/
    Corresponde a todas as ocorrências da sequência de caracteres
    total
    , independentemente do caso. Isto é, a expressão corresponde a
    total
    ,
    Total
    ,
    tOtal
    ,
    toTal
    ,
    TotAl
    ,
    TOTAL
    e assim por diante.
A expressão regular a seguir tem limitações sobre como procura os componentes:
  • tmp1|tmp2
    : corresponde a todos os diretórios que começam com
    tmp1 (
    como
    tmp1
    ,
    tmp11
    ,
    tmp14
    ,
    tmp156
    ,
    tmp1.x
    ) e somente
    tmp 2
    .
Qual arquivo de configuração inclui informações relacionadas à diretiva de alarme?
Quando uma diretiva de alarme é criada, todas as informações relacionadas à diretiva são gravadas no arquivo de configuração plugin_metric (
...\Nimsoft\plugins\plugin_metric\plugin_metric.cfg
). O MCS implanta a diretiva de alarme no Spooler. O spooler lê a configuração e gera alarmes com base na condição. plugin_metric.cfg é o local central para todas as diretivas de alarme relacionadas a todos os probes de um robô. O seguinte snippet de plugin_metric.cfg mostra as informações sobre uma diretiva de alarme para o probe dirscan:
policy_metric.pngOs logs da diretiva de alarme são disponibilizados em
...\Nimsoft\probes\service\wasp
. O nome do arquivo de log é
policy_management.log
.
Como posso corrigir o arquivo plugin_metric?
Quando você cria uma diretiva de alarme ou um perfil aprimorado, suas informações de configuração são gravadas no arquivo plugin_metric. Nas versões do robô anteriores às versões seguras, às vezes, essas informações não eram gravadas corretamente no arquivo plugin_metric. Por exemplo, uma diretiva de alarme era criada, mas a configuração dessa diretiva de alarme não era implantada corretamente. Nesse caso, as informações correspondentes não eram atualizadas corretamente no arquivo plugin_metric e isso gerava problemas. Da mesma forma, quando um perfil filho era excluído da UI do OC, as mesmas informações permaneciam no arquivo plugin_metric. Esse problema foi corrigido na versão do robô lançada após as releases do CA UIM 9.2.0. Para resolver esses problemas em seu ambiente, você pode usar o retorno de chamada
plugin_metric_correction
que está disponível para o probe mon_config_service. Esse retorno de chamada implanta novamente os perfis aprimorados e as diretivas de alarme com base nas informações que você fornece.
Siga estas etapas:
  1. Certifique-se de não criar perfis do MCS ou diretivas de alarme ao executar esta operação.
  2. (Opcional) Abra a configuração de dados brutos do probe mon_config_service e aumente a contagem de segmentos para 10 na seção
    timed
    de cada parâmetro:
    • device_processing_threads
    • config_deployment_threads
    É recomendável aumentar a contagem de segmentos para que o processo seja concluído rapidamente. Depois de concluir o processo, altere as configurações de volta aos valores originais.
  3. Acesse o utilitário do probe (pu) do probe mon_config_service.
  4. Localize e selecione o retorno de chamada
    plugin_metric_correction
    na lista suspensa.
  5. Digite as informações apropriadas para os parâmetros a seguir, conforme necessário:
    • process_all_devices_flag
      Informe o valor como true se desejar reimplantar os perfis aprimorados ou as diretivas de alarme em todos os dispositivos. Se você selecionar esse parâmetro, todos os demais parâmetros deixarão de ser obrigatórios.
    • robot_names
      Digite o nome do robô específico no qual você deseja reimplantar os perfis aprimorados ou as diretivas de alarme. Se desejar usar mais de uma entrada, digite uma lista separada por vírgulas.
    • computer_system_ids
      Digite a ID de sistema do computador específico (cs_id) no qual você deseja implantar novamente os perfis aprimorados ou as diretivas de alarme. Se desejar usar mais de uma entrada, digite uma lista separada por vírgulas.
    • cm_group_ids
      Digite a ID do grupo específico no qual você deseja reimplantar os perfis aprimorados ou as diretivas de alarme. Todos os dispositivos que fizerem parte desse grupo serão considerados para a reimplantação. Se desejar usar mais de uma entrada, digite uma lista separada por vírgulas.
    Observação:
    é possível usar qualquer combinação de
    robot_names
    ,
    computer_system_ids
    e
    cm_group_ids
    .
  6. Execute o retorno de chamada.
    Uma mensagem será exibida no painel direito, indicando que o processo foi iniciado para os dispositivos. No entanto, observe que nenhuma mensagem de conclusão será exibida. O processo conclui todas as tarefas relacionadas em segundo plano. Se desejar verificar o status, será necessário verificar o banco de dados.
  7. Verifique o status executando as seguintes consultas:
    • select * from ssrv2policytargetstatus where cs_id in (<ID>);
    • select * from ssrv2profile where cs_id in (<ID>);
    O status OK significa que a reimplantação ocorreu sem nenhum problema.
  8. Da mesma forma, para saber se ocorreu algum erro, execute a seguinte consulta:
    • select * from ssrv2audittrail where
      userid
      like 'plugin_correction%';
    Do resultado dessa consulta, anote as IDs de objeto (IDs de sistema do computador que apresentou falha), verifique as mensagens de erro, resolva os problemas e execute novamente o retorno de chamada para esses dispositivos com falha.
Você reparou com êxito o arquivo plugin_metric.
Quais são os cenários relacionados à
prioridade da condição
para as diretivas de alarme?
Considere a seguinte hierarquia de exemplo para compreender os vários cenários:
Condição de prioridade para diretiva de alarme
Priority Condition for Alarm Policy
  • Essa hierarquia de exemplo inclui um grupo de recipientes raiz (C1).
  • O grupo de recipientes raiz inclui grupos de recipientes filho (C2, C3, C4, C5 e C6).
  • Dois grupos de recipientes filho (C3 e C6) contêm grupos de dispositivos (G1 em C3 e G2 em C6).
  • Esses grupos de dispositivos incluem determinados dispositivos (D1 em G1 e D1, D2 em G2). O dispositivo D1 faz parte dos dois grupos de dispositivos, G1 e G2.
  • Uma condição de diretiva do alarme (PC1, PC2, PC3, PG1, PC4, PC5, PC6 e PG2) é criada para cada grupo. As condições da diretiva de alarme PG1 e PG2 são para grupos de dispositivos; todas as outras condições de diretiva de alarme são para grupos de recipientes.
Para aplicar diretivas de alarme ao dispositivo D1 no contexto da hierarquia acima, os seguintes casos de uso se aplicam:
Caso de uso 1: diretiva de alarme apresenta a condição com a mesma métrica e a mesma prioridade
Se um dispositivo fizer parte de vários grupos em que as condições têm a mesma métrica e a mesma prioridade, todas as condições serão aplicadas ao dispositivo. Por exemplo, se as métricas e as prioridades forem as seguintes, todas as condições da política de alarme PC1, PC2, PC3, PG1, PC4, PC5, PC6 e PG2 serão aplicadas e os alarmes correspondentes serão gerados. Neste exemplo, a métrica M1 está presente em todas as condições e todas as condições têm a mesma prioridade de 100. Portanto, oito alarmes são gerados nesse caso.
  • PC1
    Métrica: M1, Prioridade: 100
  • PC2
    Métrica: M1, Prioridade: 100
  • PC3
    Métrica: M1, Prioridade: 100
  • PG1
    Métrica: M1, Prioridade: 100
  • PC4
    Métrica: M1, Prioridade: 100
  • PC5
    Métrica: M1, Prioridade: 100
  • PC6
    Métrica: M1, Prioridade: 100
  • PG2
    Métrica: M1, Prioridade: 100
Caso de uso 2: diretiva de alarme apresenta a condição com a mesma métrica e prioridades diferentes
Se um dispositivo fizer parte de vários grupos em que as condições têm a mesma métrica e prioridades diferentes, a prioridade mais alta será levada em consideração para decidir qual alarme será gerado.O CA UIM verifica se todas as condições para o dispositivo contêm prioridades diferentes para a mesma métrica. Nesse caso, a prioridade mais alta é levada em consideração. Por exemplo, se as métricas e as prioridades forem as seguintes, PC2 e PC4 terão a prioridade mais alta de 200 para a mesma métrica M1. Nesse caso, apenas dois alarmes são gerados para essas condições (PC2 e PC4), pois elas têm a prioridade mais alta dentre todas as outras condições:
  • PC1
    Métrica: M1, Prioridade: 100
  • PC2
    Métrica: M1, Prioridade: 200
  • PC3
    Métrica: M1, Prioridade: 100
  • PG1
    Métrica: M1, Prioridade: 100
  • PC4
    Métrica: M1, Prioridade: 200
  • PC5
    Métrica: M1, Prioridade: 100
  • PC6
    Métrica: M1, Prioridade: 100
  • PG2
    Métrica: M1, Prioridade: 100
Caso de uso 3: diretiva de alarme apresente a condição com várias métricas e a mesma prioridade
Se um dispositivo fizer parte de vários grupos em que as condições têm várias métricas e a mesma prioridade, todas as métricas serão aplicadas ao dispositivo. Por exemplo, se as métricas e as prioridades forem as seguintes, dois alarmes serão gerados para a métrica M1, dois para M2, um para M3, um para M4, um para M5 e um para M6:
  • PC1
    Métrica: M1, Prioridade: 100
  • PC2
    Métrica: M1, Prioridade: 100
  • PC3
    Métrica: M2, Prioridade: 100
  • PG1
    Métrica: M3, Prioridade: 100
  • PC4
    Métrica: M4, Prioridade: 100
  • PC5
    Métrica: M5, Prioridade: 100
  • PC6
    Métrica: M6, Prioridade: 100
  • PG2
    Métrica: M2, Prioridade: 100
Caso de uso 4: diretiva de alarme apresenta a condição com várias métricas e prioridades diferentes
Se um dispositivo fizer parte de vários grupos em que as condições têm várias métricas e prioridades diferentes, a prioridade mais alta será levada em consideração e as métricas correspondentes serão aplicadas. Por exemplo, se as métricas e as prioridades forem as seguintes, dois alarmes serão gerados para a métrica M1, pois PC2 e PC4 têm a prioridade mais alta (200):
  • PC1
    Métrica: M1, Prioridade: 100
  • PC2
    Métrica: M1, Prioridade: 200
  • PC3
    Métrica: M2, Prioridade: 100
  • PG1
    Métrica: M5, Prioridade: 100
  • PC4
    Métrica: M1, Prioridade: 200
  • PC5
    Métrica: M1, Prioridade: 100
  • PC6
    Métrica: M3, Prioridade: 100
  • PG2
    Métrica: M2, Prioridade: 100
Cenários de atualização/migração
Durante a atualização/migração de uma versão anterior para a 9.2.0, os seguintes cenários são considerados:
  • Quando você atualiza uma diretiva de alarme existente (criada na 9.0.2) para a 9.2.0, a prioridade da condição para a diretiva de alarme atualizada é definida para 100 no nível do grupo e no nível da tecnologia de monitoramento, e para o valor mais alto no nível do dispositivo. O comportamento da diretiva de alarme atualizada é o mesmo que foi explicado nos casos de uso mencionados acima (Caso de uso 1, Caso de uso 2, Caso de uso 3 e Caso de uso 4).
  • Na migração de um perfil herdado no nível do dispositivo para um perfil aprimorado, a prioridade da condição da diretiva de alarme no nível do dispositivo sempre recebe o valor mais alto.
  • Na migração de um perfil herdado no nível do grupo para um perfil aprimorado, a prioridade da condição da diretiva de alarme no nível do grupo usa a mesma prioridade do perfil.
Considerações adicionais
Analise as seguintes considerações:
  • O parâmetro metric_precedence no arquivo plugin_metric.cfg é atualizado com a prioridade de condição.
  • Quando um novo recipiente é adicionado à hierarquia ou um existente é excluído da hierarquia, a diretiva de alarme é aplicada com base na nova hierarquia. E, se a prioridade da condição for a mesma, todas as diretivas de alarme na hierarquia serão aplicadas ao dispositivo.
  • Quando uma diretiva de alarme é excluída da hierarquia, todas as entradas relacionadas são removidas do banco de dados e do arquivo plugin_metric.cfg.
  • No caso de duas condições diferentes da diretiva de alarme para o mesmo dispositivo e a mesma métrica, os alarmes são gerados de ambas as condições, pois a prioridade permanece a mesma para ambas.
  • Se uma diretiva de alarme tiver várias condições e você fizer qualquer atualização na diretiva de alarme, a prioridade das condições mudará adequadamente.
Como determino se uma diretiva de alarme precisa ser atualizada?
Você deve observar os alarmes existentes na exibição
Alarmes
(Alarms View Icon). Pode ser que haja muitos alarmes gerados para uma métrica, que os níveis de desempenho que você deseja monitorar estejam fora da norma do setor ou que você queira diferenciar o monitoramento de locais regionais e globais para considerar ocorrências localizadas. Depois de desenvolver uma estratégia de monitoramento, é possível alterar o comportamento do alarme abrindo a diretiva de alarme que gera os alarmes e atualizando, adicionando ou excluindo os limites de alarme. Consulte o próximo tópico para obter informações sobre como acessar uma diretiva de alarme específica.
Como posso acessar diretivas de alarme?
Siga estas etapas:
  1. Clique em
    Configurações
    (Settings Icon).
  2. Selecione o cartão
    Diretivas de alarme
    .
    Uma lista de diretivas de alarme existentes é exibida.
  3. Na exibição
    Diretivas de alarme
    , clique no nome de uma diretiva para exibir a configuração. Use o campo Filtro personalizado para procurar rapidamente uma diretiva específica. Clique nos cabeçalhos de coluna para ordenar as diretivas em ordem alfabética por tecnologia, nome da diretiva ou criador.
As informações a seguir são fornecidas na lista de diretivas para ajudar na localização de uma diretiva de alarme específica.
  • Monitorar
    - exibe a tecnologia de monitoramento de uma diretiva de alarme.
  • Diretiva de alarme
    – fornece o nome da diretiva e as métricas que são configuradas nela.
    O nome da diretiva de alarme é o nome do perfil de monitoramento do qual a diretiva de alarme foi gerada ou o nome inserido quando você criou a diretiva. Passe o mouse sobre as métricas sob o nome da diretiva para ver uma lista completa de métricas configuradas na diretiva.
  • Aplica-se a
    - mostra o dispositivo, grupo, componente, a combinação de componentes monitorados por uma diretiva e o tipo de destino que está sendo monitorado.
  • Criador
    : exibe o nome de usuário que criou uma diretiva de alarme, ou será exibida a
    diretiva padrão da CA
    se o Infrastructure Management tiver gerado a diretiva de alarme automaticamente. A data reflete a data de criação da diretiva ou a data em que a diretiva foi atualizada pela última vez.
É possível criar várias condições de alarme para a mesma métrica?
Você pode configurar várias condições de alarme na mesma métrica. Na mesma diretiva de alarme, é possível configurar a mesma condição de alarme para a mesma métrica, mas aplicar os limites da métrica a diferentes grupos. Isso fornece o monitoramento consistente entre os dispositivos em vários grupos.
Exemplo:
um administrador de monitoramento monitora dispositivos do Windows das unidades de negócios de São Francisco, Chicago e Boston. Os dispositivos do Windows são agrupados por unidade de negócios. Como as diretivas de alarme podem conter configurações de limite de alarme para mais de um dispositivo, grupo ou tecnologia, o administrador de monitoramento cria uma única diretiva de alarme para aplicar aos dispositivos nas três unidades de negócios individualmente. Uma maneira de configurar a diretiva de alarme é criar uma condição de alarme para cada grupo e cada métrica a ser monitorada. A seguinte ilustração mostra uma condição de alarme criada para os grupos de Boston e Chicago:
Condição
Grupo
Métrica
Probe de monitoramento
Componente
Prioridade
Limites
Gerar um alarme quando os limites configurados forem violados.
Boston
Tempo de atividade
cdm
Todos os componentes
100
Crítico, estático, maior que, 80, imediato
Gerar um alarme quando os limites configurados forem violados.
Chicago
Tempo de atividade
cdm
Todos os componentes
100
Crítico, estático, maior que, 80, imediato
Por que eu mudaria os limites de alarme?
Os limites de alarme configurados são transferidos de um perfil de monitoramento durante o processo único de geração de diretiva de alarme. Talvez seja conveniente alterar as configurações de limite pelos seguintes motivos:
  • A gravidade do alarme é muito alta ou muito baixa.
  • Em vez de receber alarmes persistentes (
    imediatos
    ), você deseja receber alarmes somente depois que sucessivas violações do limite de alarme tiverem ocorrido em uma janela de tempo configurada (
    Tempo acima do limite
    ).
  • Você deseja diferentes limites de desempenho para grupos regionais de computadores, ou para dispositivos e servidores antigos vs. novos.
Como posso modificar, adicionar ou excluir limites de alarme?
As diretivas de alarme geradas fornecem alarmes que se baseiam no monitoramento predefinido de práticas recomendadas. Atualize as configurações de limite para refletir as suas necessidades de monitoramento.
Siga estas etapas:
  1. Em uma diretiva de alarme, role para a condição de alarme desejada.
  2. Clique em
    Expandir
    (v) para exibir os limites configurados.
  3. Modifique a gravidade, o tipo de limite (estático ou dinâmico), o operador ou o valor do limite do alarme configurado, conforme a necessidade.
  4. Modifique a hora de criação do alarme configurado.
    Se você selecionar
    Tempo acima do limite
    , digite o número de minutos, horas ou dias que a métrica precisa para violar o valor do limite. Em seguida, digite o número de minutos, horas ou dias para especificar o total da janela de tempo. Por exemplo, quando o
    Tempo acima do limite
    for
    3 horas em 4 horas
    , o Infrastructure Management irá gerar um alarme quando houver uma violação consecutiva do limite por três horas dentro de um período de quatro horas.
  5. Clique em
    Adicionar
    (Add Icon) ou em
    Excluir
    (Delete Icon) para adicionar ou excluir os limites de uma métrica.
  6. Clique em
    Salvar
    (canto inferior direito) para salvar as alterações na diretiva de alarme.
    Observação:
    não será possível salvar as atualizações para uma diretiva de alarme enquanto você não inserir as informações necessárias para cada limite configurado em uma condição de alarme.
    Se você excluir um limite, os alarmes que foram gerados anteriormente permanecerão no sistema até que o limite de tempo da regra do alarme de fechamento seja atingido.
Posso configurar mais de um limite para uma métrica?
É possível configurar mais de um limite para uma métrica de modo a acompanhar as diferentes gravidades. O cenário a seguir descreve um caso em que vários limites de uma métrica alertam um administrador para a execução de diferentes ações para resolução de ocorrências de desempenho.
Caso de uso
Para ajudar a monitorar a experiência do usuário ou a determinar quando atualizar o equipamento, você pode configurar diferentes limites para o uso da CPU. Por exemplo, você pode configurar estes três limites a fim de gerar alarmes para diferentes finalidades:
  • Para ajudar a determinar quando o equipamento deve ser atualizado ou substituído, configure um limite que gere um alarme crítico quando o uso da CPU estiver em 95% por 24 horas em uma janela de 36 horas (alarme de Tempo acima do limite).
  • Configure um segundo limite para gerar um alarme principal sempre que o uso da CPU exceder 90% (alarme imediato). Esse alarme pode ajudar a acompanhar as tarefas de processamento que devem ser programadas para execução após o expediente.
  • Gere um alarme secundário quando o uso da CPU for superior a 60% por 4 dias em uma janela de tempo de 5 dias (alarme Tempo acima do limite). Esse alarme permitirá que você saiba que os usuários estão enfrentando atrasos no processamento de dados.
A captura de tela a seguir mostra vários limites configurados para uma única métrica. Several thresholds configured for a single metric
Como posso editar uma condição de alarme?
Para qualquer condição de alarme, você pode modificar o que está sendo monitorado, a métrica selecionada e o limite. Também é possível monitorar a mesma métrica para um dispositivo ou grupo, ou configurar uma condição de alarme para uma tecnologia. Ao configurar condições de alarme para uma tecnologia, essas condições são aplicadas a qualquer dispositivo com essa tecnologia em seu ambiente.
Siga estas etapas:
  1. Em uma diretiva de alarme, role até a
    Condição
    que deseja alterar.
  2. Clique em
    Editar
    .
  3. Modifique qualquer opção na caixa de diálogo
    Definir condição
    .
    1. Expanda (v) Tipo, Dispositivo, Métrica, Componente, Tecnologia de monitoramento ou Grupo.
    2. Selecione a configuração desejada.
    3. Se você alterar o tipo de condição, certifique-se de que todas as opções sejam configuradas.
    4. Clique em
      OK
      para salvar as atualizações.
  4. Expanda (v)
    Limites
    .
  5. Modifique os limites de alarme existentes, se necessário.
  6. Clique em
    Adicionar limite
    (Add Threshold Icon) para configurar outro limite.
    1. Selecione uma gravidade de alarme, o tipo de limite, um operador e insira um valor de limite.
    2. Em seguida, selecione o tempo de um alarme.
  7. Clique em
    Remove threshold
    (Remove Threshold Icon) para excluir um limite configurado.
  8. Salve
    (canto inferior direito) as atualizações para a diretiva de alarme.
Como posso excluir uma condição de alarme?
Quando você exclui uma condição de alarme de uma diretiva, os alarmes não são mais gerados para a métrica. Se a métrica estiver ativada, o CA UIM continuará gerando dados de métrica.O CA UIM salva o histórico de alarmes pelo período configurado.
Siga estas etapas:
  1. Role para a condição de alarme que deseja excluir.
  2. Clique no
    menu embutido
    (Inline Menu Button Icon) e selecione
    Excluir condição
    .
    Os alarmes não são mais gerados para a condição de alarme excluída.
Como posso personalizar mensagens de alarme?
Cada diretiva de alarme pode ter até três mensagens de alarme predefinidas: uma mensagem geral, uma mensagem de Tempo acima do limite e uma mensagem de alarme de fechamento. Essas mensagens predefinidas fornecem informações suficientes para ajudar na solução de uma ocorrência. No entanto, é possível personalizar as mensagens de alarme para conter informações adicionais. Para cada tipo de mensagem predefinida, há uma lista de variáveis suportadas que você pode usar em uma mensagem para indicar os detalhes exatos de violação de limite e dispositivo. Uma mensagem geral e de alarme de fechamento é exibida para cada diretiva de alarme. A mensagem do alarme de violação Tempo acima do limite é exibida depois que um alarme Tempo acima do limite é configurado. As variáveis e mensagens padrão do alarme de violação são:
  • Mensagem de violação de limite imediata
    ${metric_name} on ${component_name} for ${device_name} is at ${metric_value} ${metric_unit).
    Exemplo: o monitor de CPU em C:/ para test_system está em 90percent.
  • Mensagem de violação de Tempo acima do limite
    ${metric_name} on ${component_name} for ${device_name} is at ${metric_value} ${metric_unit). It has violated the threshold for at least ${tot_slider} ${tot_slider_unit} out of ${tot_time_frame} ${tot_time_frame_unit}.
    Exemplo: o monitor de CPU em C:/ para test_system está em 90%. O limite foi violado por pelo menos 1 minuto no período de 5 minutos.
  • Mensagem de alarme de fechamento
    ${metric_name} on ${component_name} for ${device_name} is OK.
    Exemplo: o monitor da CPU em C:/ para test_system está OK.
Você pode personalizar qualquer uma das mensagens padrão de violações de alarme para fornecer informações que sejam relevantes ao seu ambiente. É possível inserir texto que descreva um local de negócios ou adicionar as variáveis que fornecem as informações que deseja. Para obter uma lista completa das variáveis suportadas, consulte o tópico Variáveis da mensagem de alarme.
Siga estas etapas:
  1. Em uma diretiva de alarme, role até a seção Mensagens de alarme.
  2. Clique no
    menu embutido
    (Inline Menu Button Icon) da mensagem que deseja alterar.
    A caixa de diálogo Mensagens de alarme exibe a mensagem de alarme e as variáveis disponíveis.
  3. Insira o texto e as variáveis adicionais para modificar a mensagem.
  4. A qualquer momento, você pode clicar em
    Restaurar padrão
    para retornar a mensagem modificada para as configurações padrão predefinidas.
  5. Clique em
    Salvar
    para atualizar a mensagem com as alterações.
O que preciso saber sobre limites de alarme?
As configurações de limite de alarme determinam quando um alarme é gerado. Um limite de alarme consiste em três elementos:
  • Gravidade do alarme
    : a gravidade de um alarme.
    Os alarmes podem ser críticos, principais, secundários, de aviso ou informativos.
  • Limite
    : identifica como violações de limite são tratadas.
    Um limite é composto por um tipo de limite (estático ou dinâmico), um operador e um valor.
    • Tipo de limite
      : para alarmes estáticos, as violações são determinadas com base em um valor absoluto que é coletado por uma métrica. Os alarmes dinâmicos são gerados quando a tendência média calculada é uma porcentagem configurada igual, acima ou abaixo da linha de base calculada para uma métrica.
    • Valor de Operador
      e
      Limite
      : identifica o estado aceitável ou nível de desempenho.
      Um alarme é gerado quando uma amostra, coletada para uma métrica em um intervalo configurado, viola o valor do limite.
  • Hora de criação do alarme
    : indica em quanto tempo, depois que uma violação de limite ocorre, um alarme é gerado.
    O Infrastructure Management pode gerar um alarme
    imediatamente
    depois que uma violação de limite ocorre ou depois que um determinado número de violações de limite ocorre em um período configurado (
    Tempo acima do limite
    ).
Os limites de alarme são associados a que?
Um limite de alarme é vinculado a uma única métrica. Você pode configurar os limites de alarme para um dispositivo, uma tecnologia de monitoramento ou um grupo.
Qual é a diferença entre um alarme dinâmico e estático?
Há dois tipos de alarme: estático e dinâmico. Um alarme estático é gerado quando uma métrica atinge um valor de limite configurado. Por exemplo, quando o uso da CPU em um dispositivo de destino atinge 95%, a diretiva gera um alarme crítico. Quando estiver monitorando um dispositivo com problemas persistentes, considere a possibilidade de configurar um alarme estático. Os alarmes dinâmicos são gerados com base na média de movimentação dos dados da linha de base que foram coletados nos últimos 28 dias. Ao especificar um valor de limite para um alarme dinâmico, um alarme é gerado quando a média calculada de dados atinge a porcentagem configurada acima ou abaixo da tendência média. A tendência média calculada pode mudar ao longo do tempo conforme os dados da linha de base coletados são alterados. Se você informar um limite dinâmico superior a 10% para o uso da CPU e a tendência média de uso da CPU nos últimos 28 dias for 85, um alarme será gerado quando o uso da CPU for acima de 95%. Quando estiver monitorando um dispositivo estável e íntegro cujos recursos são usados de maneira consistente, configure um alarme dinâmico.
Qual é a diferença entre os alarmes Imediato e Tempo acima do limite?
O Infrastructure Management pode gerar um alarme
imediatamente
depois que ocorre uma violação de limite ou depois que ocorre um determinado número de violações de limite em um período configurado (
Tempo acima do limite
). O Tempo acima do limite é uma regra de processamento de eventos que reduz o número de alarmes que são gerados quando ocorrem eventos de violação de limite. É possível usar o TOT para filtrar os picos de dados e métricas problemáticas do monitor durante um período definido. Em vez de enviar um alarme imediatamente depois que ocorre uma violação de limite, a função Tempo acima do limite:
  • Monitora os eventos que ocorrem durante uma janela de tempo deslizante definida pelo usuário.
  • Controla o intervalo de tempo em que a métrica está em cada gravidade do alarme.
  • Gera um alarme se o tempo cumulativo em que a métrica está em violação durante a janela deslizante atingir o tempo acima do limite definido.
Por exemplo, você pode configurar um alarme estático ou dinâmico que é gerado quando o limite tiver sido violado continuamente por 5 minutos em um período deslizante de 15 minutos. A figura a seguir quando o alarme é gerado.
Alarme de tempo acima do limite
Time Over Threshold Alarm
É possível alterar o nome de um perfil de monitoramento depois que uma diretiva de alarme correspondente é gerada?
Não altere o nome de um perfil de monitoramento depois que ele tiver sido usado para gerar uma diretiva de alarme. As diretivas de alarme dependem dos perfis de monitoramento. Se você alterar o nome do perfil de monitoramento ou o nome da diretiva de alarme correspondente, o CA UIM irá interromper a geração de alarmes para os dispositivos, grupos ou tecnologias monitorados pela diretiva de alarme. Exceto pela ausência de alarmes, não há nenhuma indicação ou mensagem de erro informando que um perfil foi excluído.
É possível alterar o nome de uma diretiva de alarme que tenha sido gerada a partir de um perfil de monitoramento?
Não altere o nome de uma diretiva de alarme gerada a partir de um perfil de monitoramento. As diretivas de alarme dependem dos perfis de monitoramento. Se você alterar o nome do perfil de monitoramento ou o nome da diretiva de alarme correspondente, o CA UIM irá interromper a geração de alarmes para os dispositivos, grupos ou tecnologias monitorados pela diretiva de alarme. Exceto pela ausência de alarmes, não há nenhuma indicação ou mensagem de erro informando que um perfil foi excluído.
É possível excluir o perfil de monitoramento depois que a diretiva de alarme é gerada?
Não exclua um perfil de monitoramento associado a uma diretiva de alarme. As diretivas de alarme dependem dos perfis de monitoramento. Se você excluir um perfil de monitoramento acidentalmente, o CA UIM irá interromper a geração de alarmes para os dispositivos, grupos ou tecnologias monitorados pela diretiva de alarme associada. Exceto pela ausência de alarmes, não há nenhuma indicação ou mensagem de erro informando que um perfil foi excluído.
Como pesquisar uma diretiva de alarme?
Clique em
Configurações
(ic_settings.png) e, em seguida, selecione o cartão
Diretivas de alarme
. Um mecanismo de filtragem está disponível no canto superior esquerdo da lista de diretivas de alarme. Digite uma tecnologia, o nome de uma diretiva de alarme, o nome de uma métrica ou um criador para pesquisar uma política de alarme específica.
Quantos limites de alarme podem ser configurados para uma métrica?
Para cada métrica, é possível configurar tantos limites quantos forem necessários para monitorar um dispositivo de destino.
Meus alarmes contêm muitas informações ou estão instáveis. O que posso fazer?
Considere a possibilidade de ajustar a configuração de limite do alarme. Se você tiver criado um perfil de configuração de monitoramento usando as configurações de limite predefinidas, é possível que essas configurações não sejam adequadas para o seu ambiente. Se você notar instabilidade nos alarmes, em que o alarme é gerado, fechado rapidamente e gerado novamente em um curto período, considere a possibilidade de configurar a opção Tempo acima do limite para o alarme. Quando a opção Tempo acima do limite <TOT> for configurada, um alarme será gerado apenas quando o limite TOT atingir o número de vezes configurado durante a janela deslizante configurada.
Como posso redefinir uma mensagem de alarme para as configurações padrão?
É possível retornar uma mensagem de alarme personalizada à mensagem de alarme predefinida a qualquer momento.
Siga estas etapas:
  1. Clique na
    ação embutida
    (Inline menu.png) ao lado da mensagem de alarme desejada.
  2. Na caixa de diálogo Mensagem de alarme, clique em
    Redefinir aos padrões
    .
    A mensagem predefinida é exibida no painel Mensagens de alarme. O próximo alarme que for gerado exibirá a mensagem de alarme predefinida.