Gestión de alarmas con políticas de alarmas centralizadas

uim203
HID_Alarm_Policy
Una política de alarmas define un conjunto de condiciones de alarma y métrica en una ubicación centralizada para que los administradores de la monitorización puedan ver y gestionar fácilmente los informes de alarma.Los administradores también pueden crear políticas de alarmas en respuesta a nuevas condiciones y necesidades. Pueden gestionar todos los aspectos del comportamiento de las alarmas en una política de alarmas; por ejemplo, pueden gestionar los umbrales de alarma, el tiempo y los mensajes configurados para las alarmas. La función Políticas de alarmas permite realizar las acciones siguientes:
  • Ver una lista de políticas de alarmas.
  • Agregar políticas de alarmas.
  • Agregar y suprimir condiciones que activan una alarma. 
  • Agregar condiciones de alarma para monitorizar los dispositivos individuales, un grupo de dispositivos o una tecnología de monitorización específica (por ejemplo, Docker).
  • Configurar las alarmas de Umbral de tiempo excedido para reducir el ruido de las alarmas hasta un nivel accionable.
  • Personalizar los mensajes de alarma para proporcionar la información necesaria.
Contenido
2
2
Requisitos previos
A continuación, se detallan los requisitos previos para la creación de una política de alarmas:
  • Asegúrese de que la versión del robot es 7.96 (o posterior).
    • Si la versión del robot es 9.31 o 9.31S, asegúrese de que la versión del servicio de configuración de la monitorización sea 9.31. Si no se mantiene esta compatibilidad, los perfiles MCS y las políticas de alarmas no funcionarán.
  • Asegúrese de que el perfil es un perfil de monitorización mejorado que está recopilando métricas.
  • Asegúrese de que el servicio de configuración de la monitorización (MCS) ya esté configurado.
Creación de una política de alarmas
El proceso completo para crear una política de alarmas requiere trabajar en la Consola del operador. Cree un perfil mejorado en la OC (con la recopilación de métricas activada).Solo cuando se inicia la recopilación de métricas, puede crear una política de alarmas en la Consola del operador.
Siga los pasos siguientes:
  1. Inicie sesión en la OC.
  2. Cree un perfil de monitorización mejorado con la recopilación de métricas activada. La captura de pantalla siguiente muestra un perfil de monitorización mejorado en la OC
  3. En la Consola de operador, haga clic en
    Configuración
    en el panel izquierdo.
  4. Seleccione la tarjeta
    Políticas de alarmas
    .
    Aparecerá la página de
    Políticas de alarmas
    .
  5. Haga clic en el icono del signo más Plus Icon en la parte inferior de la página.
  6. Introduzca un nombre de política en el campo
    Nombre de la política de alarmas
    .
    Introduzca un nombre de política que le ayude a distinguir la política del resto de políticas. Si está creando una política de alarmas para un dispositivo o grupo, puede incluir el nombre del dispositivo o la dirección IP o el nombre del grupo. Incluya las palabras clave en el nombre para facilitar la búsqueda de una política específica.
  7. Haga clic en
    Agregar condición
    (Add Condition Icon).
    Se abrirá el cuadro de diálogo
    Configuración de las condiciones
    . Este cuadro de diálogo permite definir las condiciones de la alarma.
    Una condición de alarma define lo que se monitoriza. Se pueden configurar condiciones de alarma para un grupo (de dispositivos y contenedores), para un dispositivo específico o para una tecnología de monitorización.
  8. Seleccione el tipo de condición de alarma en el cuadro de diálogo
    Configuración de las condiciones
    :
    • Dispositivo
      Monitoriza la métrica de rendimiento o de estado para un componente del dispositivo.
      Para configurar una condición de alarma para un dispositivo, seleccione un nombre de dispositivo, la métrica (por ejemplo, Uso de la CPU) y el componente que desea monitorizar.La captura de pantalla siguiente de ejemplo muestra las configuraciones para el tipo de dispositivo:
      filter_device.png
      Cuando hay varios host que recopilan la misma métrica, la lista de hosts de control también se muestra en la página
      Establecer condición
      . Puede seleccionar solo un host a la vez para crear la condición de alarma. Cree otra condición para recopilar métrica en otro host. La captura de pantalla de ejemplo siguiente muestra la sección
      Selección de un host de monitorización
      que aparece cuando hay varios hosts que recopilan la misma métrica:
      select_monitoring_host.png
    • Tecnología de monitorización
      Monitoriza las métricas asociadas con una tecnología de monitorización específica.
      Para configurar una condición de alarma para una tecnología de monitorización, seleccione una tecnología de monitorización, un perfil de configuración y una métrica. La captura de pantalla de ejemplo siguiente muestra las configuraciones para el tipo de Tecnología de monitorización:
      Monitoring_Technology_Set_Condition.png
    • Group
      Monitoriza la métrica de rendimiento o de estado para un grupo (de contenedores o dispositivos).Se pueden agregar condiciones de alarma que se apliquen a todos los dispositivos de un grupo.Los grupos se muestran como un árbol de navegación: grupos de contenedores seguidos de subgrupos. Expanda un grupo de contenedores para seleccionar un subgrupo. Cuando se crea la condición en el grupo de contenedores, la heredarán todos los subgrupos (grupos de contenedores y grupos de dispositivos secundarios) de dicho grupo de contenedores. La compatibilidad con el grupo de contenedores es útil en situaciones donde se desea tener un umbral único para cada métrica de un dispositivo. Dicha política de umbral se puede propagar desde el grupo de contenedores al grupo de dispositivos y, a continuación, al dispositivo.
      Para activar la funcionalidad de la política de alarmas para los grupos de contenedores, utilice la configuración sin formato MCS para establecer el valor del parámetro
      enable_container_support_for_alarm_policy
      en la sección
      Hora
      como
      true
      . De forma predeterminada, el valor es
      false
      .
      Para configurar una condición de alarma para un grupo, seleccione el nombre de grupo y la métrica que desea monitorizar en todos los dispositivos de un grupo. También puede especificar si desea generar alarmas en todos los componentes o solo para algunos componentes específicos. De forma predeterminada, las alarmas se generan en todos los componentes. Para generar alarmas en componentes concretos, utilice una expresión regular para filtrar los componentes. Seleccione una de las siguientes opciones en función de los requisitos:
      • Todos los componentes
        Permite generar alarmas en todos los componentes de todos los dispositivos de un grupo.
      • RegEx
        Permite filtrar los componentes en función de una expresión regular, lo que permite generar alarmas solo en los componentes filtrados. Utilice metacaracteres como, por ejemplo,
        *
        y
        ?
        para construir una expresión regular y coincidencia de patrones.RegEx son compatibles con las expresiones regulares escritas en PERL. Por ejemplo, si se desea generar alarmas en el uso de la CPU de las CPU (CPU-11, CPU-12 y CPU-13) de todos los dispositivos de un grupo, se puede definir la expresión regular como:
        CPU-1 [1-3]
        .También se puede utilizar un texto simple con operadores de caracteres comodín para que coincidan con las cadenas de destino. Por ejemplo, la expresión
        CPU*
        coincide con todas las CPU del sistema (CPU-0, CPU-1 y así sucesivamente hasta CPU-15). Existen ciertas limitaciones sobre cómo se pueden definir expresiones regulares específicas.
      La captura de pantalla siguiente muestra las configuraciones para el tipo de grupo:
      Group_Set_Condition.png
  9. Haga clic en
    Aceptar
    para guardar la información de la condición.
  10. Especifique una prioridad apropiada en el campo
    Prioridad
    para evaluar la condición de métrica para la política de alarmas en el nivel de grupo. La condición que tiene la prioridad más alta se utiliza para generar alarmas en el dispositivo.El intervalo del valor de prioridad oscila entre 0 y 10000.Puede especificar el valor de prioridad solamente para la política de alarmas en el nivel de grupo, no en el nivel de dispositivo ni en el nivel de tecnología de monitorización. En el nivel de dispositivo, la prioridad de la condición se establece en el valor más alto y prevalecerá sobre otras prioridades de condición para la misma métrica de ese dispositivo. En el nivel de tecnología de monitorización, aunque la interfaz de usuario no muestra la prioridad de la condición, CA UIM internamente establece el valor en 100 y no se puede cambiar.El valor de prioridad predeterminado es 100 en el nivel de grupo y en el nivel de tecnología de monitorización.
    Para obtener más información sobre casos de uso específicos, consulte la sección relacionada.
    La captura de pantalla siguiente muestra la prioridad de una condición para una política de alarmas de nivel de dispositivo. Tenga en cuenta que la prioridad se establece en el valor máximo y que no se puede cambiar el valor:
    Device-level-priority.jpg
    La captura de pantalla siguiente muestra la prioridad de una condición para una política de alarmas de nivel de grupo. Tenga en cuenta que el campo de prioridad muestra la prioridad predeterminada de 100 y que se puede cambiar el valor en este caso:
    group-priority.jpg
  11. Establezca el umbral de alarma introduciendo la severidad de la alarma, el tipo de umbral (estático o dinámico), el operador, el valor del umbral y el tiempo de la alarma (Inmediato o Umbral de tiempo excedido), según sea necesario.
    Si selecciona
    Umbral de tiempo excedido
    , introduzca el número de minutos, horas o días que la métrica estará infringiendo el valor del umbral. Por ejemplo, cuando el valor de
    Umbral de tiempo excedido
    es de tres horas en 4 horas, Infrastructure Management genera una alarma cuando se produce una infracción del umbral consecutiva de tres horas en un período de tiempo de cuatro horas.
    La captura de pantalla siguiente muestra la condición de alarma con la prioridad de la condición establecida en 100 (valor predeterminado), la severidad de la alarma establecida en Crítica, el tipo de umbral en estático, el operador en mayor que, el valor del umbral en 80 y el tiempo de creación de la alarma en Inmediato:
    Group_Alarm_Policy_With_Condition.PNG
  12. Haga clic en la flecha situada junto a la sección
    Mensajes de alarma
    para revisar los mensajes de alarma predeterminados. Se pueden personalizar los mensajes de alarma para que contengan información adicional.
  13. Haga clic en
    Guardar
    (en la esquina inferior derecha) para crear una política de alarmas con una o más condiciones de alarma.
    Esta política de alarmas genera alarmas con los mensajes de alarma predeterminados cuando se infringen los umbrales configurados.
La captura de pantalla siguiente muestra la política de alarmas creada:
Created_Alarm_Policy.PNG
Cuando se crea un perfil mejorado en la OC y la plantilla de la sonda incluye valores de umbral predeterminados, a continuación, se crea una política de alarmas predeterminada en la consola del operador para este perfil mejorado. El creador de la política de alarma predeterminada se muestra como
política predeterminada de CA
en la consola del operador. Además, cuando el perfil no mejorado se convierte en un perfil de mejora, se crea una política de la alarma correspondiente en la consola del operador para el perfil convertido. La creación de esta política de alarmas agrega valores del umbral que están presentes en el perfil no mejorado a la sección de métrica del administrador de trabajos en cola (plugin_metric). El creador de esta política de alarma se muestra como la
migración de perfil de CA
en la consola del operador.
Políticas de alarmas de exportación/importación
Con UIM 20.3.0, la API de gestión de políticas se mejora para admitir la exportación e importación de políticas de alarmas de un dominio a otro. Para realizar estas operaciones, es necesario tener el permiso de lista de control de acceso de administración de políticas.
Se pueden exportar las políticas de alarmas basadas en lo siguiente:
  • Identificadores de la política de alarmas
  • Identificador del grupo
  • Identificador del dispositivo
  • Tecnología: nombre de la sonda
Los formatos de exportación admitidos son XML y JSON.
Para importar políticas de alarmas, asigne los grupos, dispositivos y perfiles a los tipos de destino GRUPO, DISPOSITIVO y TECNOLOGÍA, respectivamente.
El formato de archivo de muestra es el siguiente:
[ { "sourcePolicyTargetId": 0, "sourcePolicyTargetType": "DEVICE", "targetPolicyTargetId": 0 } ]
API agregadas recientemente
POST /v0/policy/export
Parámetros de entrada:
  • policyIds
    : lista de identificadores de las políticas de alarmas que se exportarán.
  • groupId
    : identificador del grupo para recuperar las políticas de alarmas.
  • ID de dispositivo
    : identificador del dispositivo para recuperar las políticas de alarmas.
  • sonda
    : tecnología para recuperar las políticas de alarmas.
  • policyFileType
    : JSON (predeterminado), XML
Devuelve el archivo de políticas de alarmas XML/JSON que se va a importar.
Las políticas de alarmas exportadas se pueden descargar en Swagger haciendo clic en el vínculo en el cuerpo de la respuesta.
ExportedPolicy.PNG
POST  /v0/policy/import
  • targetMappingFile
    : asignación de destino de la política en formato JSON que se utiliza para asignar el dispositivo, el grupo o la tecnología en el archivo fuente y los atributos correspondientes en el entorno de destino durante la importación de políticas de alarmas.
    Ejemplo:
    [ { "sourcePolicyTargetId": 0, "sourcePolicyTargetType": "DEVICE", "targetPolicyTargetId": 0 } ]
  • policiesFile
    : archivo utilizado para importar la política de alarmas.
Devuelve la lista de políticas de alarmas importadas.
Gestión de políticas en el modo de alta disponibilidad
Cuando la sonda policy_management_ws se implementa en varios nodos wasp, debe asegurarse de que todas las sondas no comiencen a procesar las políticas. Es decir, siempre debe haber un solo nodo de procesamiento. Puede hacerlo estableciendo manualmente la configuración o ejecutando la sonda policy_management_ws en el modo de alta disponibilidad (HA). Realice la siguiente configuración en adminconsoleapp que se está ejecutando en el concentrador principal (en la <adminconsole> etiqueta).
Siga estos pasos para ejecutar la sonda policy_management_ws en el modo de alta disponibilidad (HA):
  1. En wasp.cfg, vaya a la carpeta: webapps/adminconsoleapp/custom/uncrypted
  2. Actualice el atributo ha_mode.
    Los valores permitidos son: HA o MANUAL (valor predeterminado).
    • Cuando se establece como HA, todos los nodos de gestión de políticas trabajan de forma coordinada con adminconsoleapp ejecutándose en el concentrador principal. El componente del controlador que se ejecuta como parte de adminconsoleapp controla qué nodo procesar y se asegura de que solamente se procese un nodo al mismo tiempo.
    • Cuando no se establece o se establece en MANUAL, todos los nodos leen el indicador policy_processing del archivo wasp.cfg del nodo correspondiente y procesan las políticas si el valor se establece en true.
  3. Actualice los atributos adicionales heartbeat_interval_min y no_failed_attempts.
    • heartbeat_interval_min: Define el intervalo de tiempo que especifica con qué frecuencia los nodos policy_management_ws envían el latido al controlador que se ejecuta como parte de adminconsoleapp. El valor predeterminado es 5 minutos.
    • no_failed_attempts: Define el número de intentos fallidos de enviar latidos antes de detener el procesamiento de la política. El valor predeterminado es 3. Con la configuración predeterminada, el procesamiento de políticas en un nodo se detiene en 15 minutos en caso de que surjan incidencias de comunicación entre el controlador y el nodo. Después de 20 minutos, un nuevo nodo se convierte en el nodo de procesamiento de políticas.
  4. Haga clic en Guardar.
Configuración manual
Si ha_mode se configura en MANUAL, la administración de políticas funciona en el modo manual. Sin embargo, los administradores pueden elegir manualmente el nodo de conmutación por error en caso de error en el nodo principal.
Para habilitar esta opción:
  1. Implemente la sonda policy_management_ws en todos los servidores de la OC y establezca "policy_processing" como true en uno de los nodos (nodo principal), tal y como se muestra en la siguiente captura de pantalla:
    policy_processing = true no está presente de forma predeterminada. Se debe agregar al archivo wasp.cfg en el servidor de la OC para el que desea procesar las políticas de alarma.
Gestión de umbrales centralizada para tecnologías monitorizadas remotamente
(Desde UIM 20.3.1) La funcionalidad de la política de alarmas proporciona una gestión centralizada de umbrales para las tecnologías que se monitorizan remotamente. En el caso de las sondas remotas, las políticas de alarmas no están vinculadas con el robot, lo que implica que las mismas políticas no se aplican a todos los dispositivos que gestiona una sonda remota. Esta capacidad permite definir umbrales independientes para los distintos dispositivos o grupos que se monitorizan a través de la misma sonda remota.
Por lo tanto, para los dispositivos o grupos que gestiona una sonda remota, las políticas de alarmas ahora se aplican solamente a los dispositivos para los que se crean. Esto garantiza que las alarmas se generen solamente para los dispositivos pertinentes, lo que permite gestionar las políticas y las alarmas de una forma más eficaz.
Esta funcionalidad solo es aplicable para las políticas remotas que se crean después de actualizar a UIM 20.3.1. Tenga en cuenta que UIM 20.3.1 es una versión de parche. El parche de UIM 20.3.1 no incluye ningún instalador de actualización para UIM Server. El parche incluye artefactos independientes separados que puede usar para actualizar los respectivos componentes. Para obtener más información sobre los artefactos que están disponibles como parte de la versión del parche de UIM 20.3.1, consulte el artículo UIM 20.3.1.
Revise el ejemplo siguiente para comprender cómo funciona la funcionalidad mejorada.
Ejemplo
La instalación de ejemplo contiene dos grupos: Grupo A y Grupo B. El primer grupo incluye dos dispositivos: vm1 y vm2. El segundo grupo además incluye dos dispositivos: vm3 y vm4. El equipo 12vm4 está actuando como host de monitorización y está administrando ambos grupos. El perfil del servicio de configuración de la monitorización de conectividad de red (sonda net_connect) se crea en este host de monitorización.
La siguiente captura de pantalla muestra los dispositivos de destino en el Grupo A y el Grupo B, el host de monitorización (12vm4) y el perfil del servicio de configuración de la monitorización:
GroupA_Profile es el perfil implementado en el Grupo A (VM1 y VM2). Este perfil utiliza 12vm4 como el host de monitorización en la configuración de perfil. Además, el tiempo de respuesta de ping corresponde a las métricas que debe recopilar este perfil. Del mismo modo, el Grupo B tiene la misma configuración, donde GroupB_Profile es el perfil con snw12vm4 como host de monitorización y el tiempo de respuesta de ping como las métricas.
La siguiente captura de pantalla muestra la configuración para el Grupo A:
La política de alarmas GroupA_AP alarma se crea en el Grupo A y la otra política de alarmas GroupB_AP en el grupo B. La captura de pantalla siguiente muestra las dos políticas de alarmas:
Ahora, si se comprueban las alarmas, verá que las respectivas políticas están creando alarmas solamente en los dispositivos en los cuales se crean. La captura de pantalla siguiente muestra que la política GroupA_AP está creando alarmas en el Grupo A (vm1 y vm2). De forma similar, el GroupB_AP está creando alarmas en el Grupo B (vm3 y vm4):
En este escenario de ejemplo, antes de la versión 20.3.1, el comportamiento era que, si una política se creaba en el Grupo A, la misma política también se aplicaba a los dispositivos del Grupo B. Ahora, con esta funcionalidad mejorada, las políticas de alarmas no se aplican a ambos dispositivos del grupo, sino que se aplican solamente a los dispositivos asociados al grupo.
Preguntas frecuentes
Esta sección proporciona más información sobre algunas áreas específicas relacionadas con la política de alarmas.
¿Cómo se puede crear una política de alarmas nueva con el estado desactivado?
Cuando se crea una política de alarmas en estado desactivado, la política de alarmas se crea correctamente pero no se aplica de forma predeterminada. Esta capacidad le da la opción de evaluar la política de alarma antes de activarla para recibir alarmas.
Siga los pasos siguientes:
  1. Haga clic en
    Configuración
    (Settings Icon).
  2. Seleccione la tarjeta
    Políticas de alarmas
    .
    Aparecerá una lista de políticas de alarmas existentes.
  3. Haga clic en el icono del signo más Plus Icon en la parte inferior de la página.
    Aparecerá la pantalla Nueva política.
  4. Introduzca un nombre en el campo
    Nombre de la política de alarmas
    .
  5. Haga clic en
    Agregar condición
    (Add Condition Icon).
  6. Seleccione el tipo de condición de alarma en el cuadro de diálogo
    Configuración de las condiciones
    .
  7. Seleccione las opciones que se aplican al tipo de condición de alarma.
  8. Haga clic en
    Aceptar
    para guardar la información de la condición.
  9. Establezca el umbral de alarma. Modifique la severidad de la alarma, el tipo de umbral (estático o dinámico) y el tiempo de la alarma, según sea necesario.
  10. Haga clic en el botón
    Guardar y desactivar
    .
    Se ha creado la política de alarmas en el estado desactivado y la etiqueta de estado para la política de alarmas recién creada muestra el estado
    Desactivado
    en la página de políticas de alarmas.
¿Cómo puedo desactivar (o activar) una política de alarmas existente?
Si desea desactivar (o activar) una política de alarmas existente, puede hacerlo.Mediante la desactivación de la política de alarmas existente, ya no recibirá ninguna alarma de dicha política. Esto permite desactivar temporalmente la política de la alarma sin necesidad de eliminarla. Y cuando desea recibir alarmas desde la misma política de alarmas desactivada, se puede activar simplemente. No será necesario crear una nueva política de alarma.
Siga los pasos siguientes:
  1. Haga clic en
    Configuración
    (Settings Icon).
  2. Seleccione la tarjeta
    Políticas de alarmas
    .
    Aparecerá una lista de políticas de alarmas existentes.
  3. Haga clic en la política de alarmas necesaria.
  4. Alterne entre la opción de la esquina inferior izquierda entre
    Desactivado
    (o Activado)
    .
    La política de alarmas está desactivada (o activada) y se muestra el mensaje de confirmación apropiado. Por ejemplo, el estado de la política muestra la etiqueta Disabled tag.png con respecto a la política de alarmas desactivada al consultar la lista de políticas en la pantalla Políticas de alarmas.
    La captura de pantalla siguiente muestra un ejemplo donde se desactiva una política existente de alarma:
    Alarm_Policy_Disabled.PNG
Haga clic en el botón
Suprimir
(en la esquina inferior izquierda) para suprimir una política de alarmas existente.
¿Cómo puedo suprimir una condición de alarma?
Se puede desactivar una condición de alarma específica de una política de alarmas. En el caso de varias condiciones en una política de alarmas, la desactivación de una condición no afecta a otras condiciones existentes. Al hacerlo se detendrá la generación de alarmas para las condiciones de la alarma desactivada de una política de alarmas, mientras las otras alarmas de las condiciones que sigan activadas continuarán generándose. Por ejemplo, se ha creado una política de alarmas para un dispositivo que monitoriza la sonda de análisis de directorios y archivos (dirscan). Se han creado dos condiciones independientes con distintos valores de umbral para la misma métrica. Ahora desea desactivar una de las condiciones.
Siga los pasos siguientes:
  1. Haga clic en
    Configuración
    (Settings Icon).
  2. Seleccione la tarjeta
    Políticas de alarmas
    .
    Aparecerá una lista de políticas de alarmas existentes.
  3. Haga clic en la política de alarmas necesaria.
  4. Desplácese hasta la condición de alarma que desea desactivar.
  5. Seleccione el
    Menú en línea
    (Inline_menu icon.png) y, a continuación, seleccione
    Desactivar condición
    .
  6. Seleccione
    Guardar
    .
    La condición se ha desactivado y ya no se generarán alarmas para la condición de la alarma desactivada. Se muestra el estado de la condición (Disabled tag.png) situado junto a esta. La captura de pantalla siguiente muestra un ejemplo:
    Disable_Condition.PNG
    Enable_Condition.PNG
Para activar la condición, seleccione
Activar
condición
y haga clic en
Guardar.
El estado de la condición cambia y ya no aparece en la etiqueta Desactivado.
¿Cuáles son las limitaciones del uso de expresiones regulares?
Las siguientes expresiones regulares no pueden filtrar componentes para un grupo:
  • Expresión regular incorrecta:
    CPU-(0|1)
    Solución alternativa:
    Utilice la expresión regular:
    CPU-[0-1]
    Coincide con los componentes:
    CPU-0 y CPU-1
  • Expresión regular incorrecta:
    CPU.11
    Solución alternativa:
    Utilice la expresión regular:
    /CPU.11/
    Coincide con el componente:
    CPU-11
  • Expresión regular incorrecta:
    total/i
    Solución alternativa:
    Utilice la expresión regular:
    /[tT][oO][tT][aA][lL]/
    Coincide con todos los resultados de la cadena
    total
    sin tener en cuenta el caso. Es decir, la expresión coincide con
    total
    ,
    Total
    ,
    tOtal
    ,
    toTal
    ,
    TotAl
    ,
    TOTAL
    , etc.
La expresión regular siguiente tiene limitaciones sobre cómo busca los componentes:
  • tmp1|tmp2
    : Coincide con todos los directorios que empiezan por
    tmp1 (
    such as
    tmp1
    ,
    tmp11
    ,
    tmp14
    ,
    tmp156
    ,
    tmp1.x
    ) y solo
    tmp 2
    .
¿Qué archivo de configuración incluye información relacionada con la política de alarmas?
Cuando se crea una política de alarmas, la información relacionada con todas las políticas de alarmas se escribe en el archivo de configuración plugin_metric (
..\Nimsoft\plugins\plugin_metric\plugin_metric.cfg
). MCS implementa la política de alarmas en el administrador de trabajos en cola. El administrador de trabajos en cola lee la configuración y genera alarmas basadas en la condición. plugin_metric.cfg es el punto central de todas las políticas de alarma relacionadas con todas las sondas de un robot. El siguiente fragmento de código de plugin_metric.cfg muestra la información acerca de una política de alarmas para la sonda dirscan:
policy_metric.png Los registros de las políticas de alarmas están disponibles en
..\Nimsoft\probes\service\wasp
. El nombre del archivo de registro es
policy_management.log
.
¿Cómo puedo corregir el archivo plugin_metric?
Cuando se crea una política de alarmas o un perfil mejorado, la información de configuración se escribe en el archivo plugin_metric. En las versiones del robot anteriores a las versiones seguras, a veces, esta información no se escribe correctamente en el archivo plugin_metric. Por ejemplo, se crea una política de alarmas, pero dicha configuración de la política de alarmas no se implementa correctamente. En este caso, la información correspondiente no se actualiza correctamente en el archivo plugin_metric y esto crea problemas. Asimismo, cuando se suprime un perfil secundario de la IU de la OC, no se suprimirá la misma información desde el archivo plugin_metric. Este problema se ha resuelto en la versión del robot disponible posterior a las versiones CA UIM 9.2.0. Para solucionar estos problemas en su entorno, puede utilizar la devolución de llamada
plugin_metric_correction
que se encuentra disponible para la sonda mon_config_service. Esta devolución de llamada implementa de nuevo los perfiles mejorados y las políticas de alarmas en función de los datos introducidos.
Siga los pasos siguientes:
  1. Asegúrese de no crear los perfiles MCS o las políticas de alarmas cuando se realice esta operación.
  2. (Opcional) Abra la configuración sin formato de mon_config_service y aumente el número de subprocesos a 10 en la sección
    Hora
    para cada parámetro:
    • device_processing_threads
    • config_deployment_threads
    Le recomendamos que aumente el recuento de subprocesos para que finalice el proceso de forma rápida. Después de completar el proceso, cambie la configuración a los valores originales.
  3. Acceda a la utilidad de la sonda (pu) para la sonda mon_config_service.
  4. Localice y seleccione la devolución de llamada
    plugin_metric_correction
    en la lista desplegable.
  5. Introduzca la información adecuada para los siguientes parámetros, según sea necesario:
    • process_all_devices_flag
      Introduzca el valor como verdadero si desea volver a implementar los perfiles mejorados o las políticas de alarmas en todos los dispositivos. Si selecciona este parámetro, todos los demás parámetros no serán necesarios.
    • robot_names
      Introduzca el nombre del robot específico en el que desea volver a implementar los perfiles mejorados o las políticas de alarmas. Si desea utilizar más de una entrada, introduzca una lista separada por comas.
    • computer_system_ids
      Introduzca el ID del sistema informático específico (cs_id) en el que desea volver a implementar los perfiles mejorados o las políticas de alarmas. Si desea utilizar más de una entrada, introduzca una lista separada por comas.
    • cm_group_ids
      Introduzca el ID del grupo específico en el que desea volver a implementar los perfiles mejorados o las políticas de alarmas. Todos los dispositivos que forman parte de ese grupo se tendrán en cuenta para la implementación. Si desea utilizar más de una entrada, introduzca una lista separada por comas.
    Nota:
    se puede utilizar cualquier combinación de
    robot_names
    ,
    computer_system_ids
    y
    cm_group_ids
    .
  6. Ejecute la devolución de llamada.
    Aparecerá un mensaje en el panel derecho que indica que se ha iniciado el proceso para los dispositivos. Sin embargo, tenga en cuenta que no se mostrará ningún mensaje de finalización. El proceso finaliza todas las tareas relacionadas en segundo plano. Si desea comprobar el estado, deberá verificar la base de datos.
  7. Compruebe el estado mediante la ejecución de las consultas siguientes:
    • select * from ssrv2policytargetstatus where cs_id in (<ID>);
    • select * from ssrv2profile where cs_id in (<ID>);
    El estado Correcto significa que se ha producido la reimplementación sin ningún problema.
  8. De forma similar, para averiguar si se ha producido algún error, ejecute la siguiente consulta:
    • select * from ssrv2audittrail where
      userid
      like 'plugin_correction%';
    Como resultado de esta consulta, anote los ID del objeto (ID del sistema informático con errores), revise los mensajes de error, resuélvalos y, a continuación, vuelva a ejecutar la devolución de llamada para estos dispositivos erróneos.
Se ha reparado correctamente el archivo plugin_metric.
¿Cuáles son los escenarios relacionados con la
prioridad de la condición
para las políticas de alarmas?
Tenga en cuenta la siguiente jerarquía de muestra para entender diferentes escenarios:
Condición de prioridad para la política de alarmas
Priority Condition for Alarm Policy
  • Esta jerarquía de muestra incluye un grupo de contenedores raíz (C1).
  • El grupo de contenedores raíz incluye grupos de contenedores secundarios (C2, C3, C4, C5 y C6).
  • Dos grupos de contenedores secundarios (C3 y C6) contienen grupos de dispositivos (G1 en C3 y G2 en C6).
  • Estos grupos de dispositivos incluyen determinados dispositivos (D1 en G1 y D1, D2 en G2). El dispositivo D1 forma parte de dos grupos de dispositivos, G1 y G2.
  • Se crea una condición de política de alarmas (PC1, PC2, PC3, PG1, PC4, PC5, PC6 y PG2) para cada grupo. Las condiciones de política de alarmas GP1 y PG2 son para grupos de dispositivos; las otras condiciones de política de alarmas son grupos de contenedores.
Para aplicar políticas de alarmas al dispositivo D1 en el contexto de la jerarquía anterior, se aplican los siguientes casos de uso:
Caso de uso 1: política de alarmas con la misma métrica y la misma prioridad
Si un dispositivo forma parte de varios grupos donde las condiciones tienen la misma métrica y la misma prioridad, todas las condiciones se aplican al dispositivo. Por ejemplo, si las métricas y las prioridades son las siguientes, se aplican todas las condiciones de la política de alarmas PC1, PC2, PC3, PG1, PC4, PC5, PC6 y PG2, y se generan las alarmas correspondientes. En este ejemplo, la métrica M1 está presente en todas las condiciones y todas las condiciones tienen la misma prioridad de 100. Por lo tanto, en este caso se generan ocho alarmas.
  • PC1
    Métrica: M1, prioridad: 100
  • PC2
    Métrica: M1, prioridad: 100
  • PC3
    Métrica: M1, prioridad: 100
  • PG1
    Métrica: M1, prioridad: 100
  • PC4
    Métrica: M1, prioridad: 100
  • PC5
    Métrica: M1, prioridad: 100
  • PC6
    Métrica: M1, prioridad: 100
  • PG2
    Métrica: M1, prioridad: 100
Caso de uso 2: política de alarmas con condición con la misma métrica y prioridades diferentes
Si un dispositivo forma parte de varios grupos donde las condiciones tienen la misma métrica pero prioridades diferentes, la prioridad más alta se debe tener en cuenta para decidir qué alarma se genera.CA UIM verifica si todas las condiciones para el dispositivo contienen prioridades diferentes para la misma métrica. Si es así, se tiene en cuenta la prioridad más alta. Por ejemplo, si las métricas y las prioridades son como se muestran a continuación, PC2 y PC4 tendrán la prioridad más alta de 200 para la misma métrica M1. En este caso, solo dos alarmas se generan para estas condiciones (PC2 y PC4) porque tienen la prioridad más alta de todas las demás condiciones:
  • PC1
    Métrica: M1, prioridad: 100
  • PC2
    Métrica: M1, prioridad: 200
  • PC3
    Métrica: M1, prioridad: 100
  • PG1
    Métrica: M1, prioridad: 100
  • PC4
    Métrica: M1, prioridad: 200
  • PC5
    Métrica: M1, prioridad: 100
  • PC6
    Métrica: M1, prioridad: 100
  • PG2
    Métrica: M1, prioridad: 100
Caso de uso 3: política de alarmas con condición con varias métricas y la misma prioridad
Si un dispositivo forma parte de varios grupos en los que las condiciones tienen varias métricas y la misma prioridad, todas las métricas se aplicarán al dispositivo. Por ejemplo, si la métrica y las prioridades son las siguientes, se generarán dos alarmas para la métrica M1, dos para M2, una para M3, una para M4, una para M5 y una para M6:
  • PC1
    Métrica: M1, prioridad: 100
  • PC2
    Métrica: M1, prioridad: 100
  • PC3
    Métrica: M2, prioridad: 100
  • PG1
    Métrica: M3, prioridad: 100
  • PC4
    Métrica: M4, prioridad: 100
  • PC5
    Métrica: M5, prioridad: 100
  • PC6
    Métrica: M6, prioridad: 100
  • PG2
    Métrica: M2, prioridad: 100
Caso de uso 4: política de alarmas con condición con varias métricas y prioridades diferentes
Si un dispositivo forma parte de varios grupos en los que las condiciones tienen varias métricas y prioridades diferentes, se tendrá en cuenta la prioridad más alta y se aplicarán las métricas correspondientes. Por ejemplo, si las métricas y las prioridades son las siguientes, se generarán dos alarmas para la métrica M1 porque PC2 y PC4 tienen la prioridad más alta (200):
  • PC1
    Métrica: M1, prioridad: 100
  • PC2
    Métrica: M1, prioridad: 200
  • PC3
    Métrica: M2, prioridad: 100
  • PG1
    Métrica: M5, prioridad: 100
  • PC4
    Métrica: M1, prioridad: 200
  • PC5
    Métrica: M1, prioridad: 100
  • PC6
    Métrica: M3, prioridad: 100
  • PG2
    Métrica: M2, prioridad: 100
Escenarios de la actualización o migración
Durante la actualización o migración desde una versión anterior a la 9.2.0, se tienen en cuenta los siguientes escenarios:
  • Cuando se actualiza una política de alarmas existente (creada en la versión 9.0.2) a 9.2.0, la prioridad de la condición para la política de alarmas actualizada se establece en 100 en el nivel de grupo y en el nivel de tecnología de monitorización, y se establece en el valor máximo en el nivel de dispositivo. El comportamiento de la política de alarmas actualizada es el mismo que el que se ha explicado en los casos de uso mencionados anteriormente (Caso de uso 1, Caso de uso 2, Caso de uso 3 y Caso de uso 4).
  • Al migrar un perfil heredado del nivel de dispositivo a un perfil mejorado, la prioridad de la condición para la política de alarmas de nivel de dispositivo siempre obtendrá la prioridad más alta.
  • Al migrar un perfil heredado del nivel de grupo a un perfil mejorado, la prioridad de la condición para la política de alarmas de nivel de grupo tomará la misma prioridad que la del perfil.
Consideraciones adicionales
Revise las siguientes consideraciones:
  • El parámetro metric_precedence en el archivo plugin_metric.cfg se actualiza con la prioridad de la condición.
  • Cuando se agrega un nuevo contenedor a la jerarquía o cuando se suprime uno existente de la jerarquía, la política de alarmas se aplica en función de la nueva jerarquía. Y, si la prioridad de la condición es la misma, todas las políticas de alarmas en la jerarquía se aplicarán al dispositivo.
  • Cuando se suprime una política de alarmas de la jerarquía, se eliminarán todas las entradas relacionadas de la base de datos y del archivo plugin_metric.cfg.
  • Para dos condiciones de política de alarmas diferentes para el mismo dispositivo y la misma métrica, las alarmas se generarán a partir de las dos condiciones porque la prioridad se mantiene igual para ambas.
  • Si una política de alarmas tiene varias condiciones y se realiza una actualización en la política de alarmas, la prioridad de las condiciones también cambiará.
¿Cómo puedo determinar si una política de alarmas debe actualizarse?
Se deben observar las alarmas existentes en la vista
Alarmas
(Alarms View Icon). Es posible que haya demasiadas alarmas generadas para una métrica, o que los niveles de rendimiento que se desee monitorizar estén fuera de la norma del sector o que se desee diferenciar la monitorización entre regional y global para incidencias localizadas. Una vez que se ha desarrollado una estrategia de monitorización, se puede cambiar el comportamiento de las alarmas. Para ello, abra la política de alarmas que genera las alarmas y actualice, agregue o suprima los umbrales de alarma. Para obtener más información sobre cómo acceder a una política de alarmas específica, consulte el tema siguiente.
¿Cómo se accede a las políticas de alarmas?
Siga los pasos siguientes:
  1. Haga clic en
    Configuración
    (Settings Icon).
  2. Seleccione la tarjeta
    Políticas de alarmas
    .
    Aparecerá una lista de políticas de alarmas existentes.
  3. En la vista
    Políticas de alarmas
    , haga clic en un nombre de política para consultar la configuración. Utilice el campo Filtro personalizado para buscar rápidamente una política específica. Haga clic en los encabezados de columna para ordenar las políticas alfabéticamente por tecnología, nombre de política o creador.
En la lista de políticas se proporciona la siguiente información para ayudar a localizar una política de alarmas específica.
  • Monitor
    : Muestra la tecnología de monitorización para una política de alarmas.
  • Política de alarmas
    : Proporciona el nombre de la política y la métrica configurados en la política.
    El nombre de la política de alarmas es, o bien el nombre del perfil de monitorización desde el que se ha generado la política de alarmas, o bien el nombre introducido al crear la política. Pase el ratón sobre la métrica bajo el nombre de política para ver una lista completa de métricas configuradas en la política.
  • Aplica a
    : Muestra el dispositivo, el grupo, el componente o una combinación de componentes monitorizados por una política, y el tipo de destino que se está monitorizando.
  • Creador
    : Muestra el nombre de usuario del cliente que ha creado una política de alarmas o, si Infrastructure Management ha generado la política de alarmas automáticamente, muestra la
    política de CA predeterminada
    . La fecha refleja la fecha de creación de la política o la fecha a la que se actualizó por última vez.
¿Se pueden crear varias condiciones de alarma para la misma métrica?
Se pueden configurar varias condiciones de alarma desde la misma métrica. En la misma política de alarmas, se puede configurar la misma condición de alarma para la misma métrica, pero aplicar los umbrales de la métrica a grupos distintos. Esto proporciona una monitorización coherente en todos los dispositivos de distintos grupos.
Ejemplo:
Un administrador de monitorización monitoriza los dispositivos de Windows para las unidades de negocio de San Francisco, Chicago y Boston. Los dispositivos de Windows se agrupan por unidad de negocio. Puesto que las políticas de alarmas pueden contener la configuración del umbral de alarma para más de un dispositivo, grupo o tecnología, el administrador de monitorización crea una única política de alarmas para aplicar a los dispositivos de las tres unidades de negocio individualmente. Una forma de configurar la política de alarmas es crear una condición de alarma para cada grupo y cada métrica que se deban monitorizar. La siguiente tabla muestra una condición de alarma creada para los grupos Chicago y Boston.
Condición
Group
Métrica
Sonda de monitorización
Componente
Prioridad
Umbrales
Generar una alarma cuando se infringen los umbrales configurados.
Boston
Tiempo de actividad
cdm
Todos los componentes
100
Crítico, estático, mayor de, 80, inmediato
Generar una alarma cuando se infringen los umbrales configurados.
Chicago
Tiempo de actividad
cdm
Todos los componentes
100
Crítico, estático, mayor de, 80, inmediato
¿Por qué se deben cambiar los umbrales de alarma?
Los umbrales de alarma configurados se transfieren desde un perfil de monitorización durante el proceso de generación de políticas de alarmas único. Es posible que se desee cambiar la configuración de los umbrales por las razones siguientes:
  • La severidad de las alarmas es demasiado alta o baja.
  • En lugar de recibir alarmas persistentes (
    inmediatas
    ), se desea recibir las alarmas solo después de que se hayan producido las infracciones de los umbrales de alarma sucesivos en una ventana de tiempo configurada (
    Umbral de tiempo excedido
    ).
  • Se desean umbrales de rendimiento diferentes para grupos regionales de equipos o para dispositivos y servidores nuevos frente a los antiguos.
¿Cómo modificar, agregar o suprimir umbrales de alarma?
Las políticas de alarmas generadas proporcionan alarmas basadas en una monitorización recomendada predefinida. Actualice la configuración de los umbrales para que reflejen sus necesidades de monitorización.
Siga los pasos siguientes:
  1. En una política de alarmas, desplácese hasta la condición de alarma que desee.
  2. Haga clic en
    Expandir
    (v) para ver los umbrales configurados.
  3. Modifique la severidad de la alarma, el tipo de umbral (estático o dinámico), el operador y el valor del umbral configurados, según sea necesario.
  4. Modifique el tiempo de creación de la alarma configurado.
    Si selecciona
    Umbral de tiempo excedido
    , introduzca el número de minutos, horas o días que la métrica estará infringiendo el valor del umbral. A continuación, introduzca el número de minutos, horas o días para especificar la ventana de tiempo total. Por ejemplo, cuando el valor de
    Umbral de tiempo excedido
    es de
    tres horas en 4 horas
    , Infrastructure Management genera una alarma cuando se produce una infracción del umbral consecutiva de tres horas en un período de tiempo de cuatro horas.
  5. Haga clic en
    Agregar
    (Add Icon) o
    Suprimir
    (Delete Icon) para agregar o suprimir los umbrales de una métrica.
  6. Haga clic en
    Guardar
    (esquina inferior derecha) para guardar los cambios realizados en la política de alarmas.
    Nota
    : No se pueden guardar las actualizaciones de una política de alarmas hasta que haya introducido la información necesaria para cada umbral configurado en una condición de alarma.
    Si se suprime un umbral, las alarmas que se hayan generado previamente permanecerán en el sistema hasta que se alcance el período de tiempo de la regla de cierre de alarmas.
¿Se puede configurar más de un umbral para una métrica?
Se puede configurar más de un umbral para una métrica para realizar un seguimiento de los diferentes niveles de severidad. En el siguiente escenario, se describe un caso en el que varios umbrales para una métrica alertan al administrador de que debe realizar diferentes acciones para solucionar problemas de rendimiento.
Caso de uso
Para ayudarle a realizar un seguimiento de la experiencia del usuario o determinar cuándo se debe actualizar el equipo, se podrían configurar umbrales diferentes para el uso de la CPU. Por ejemplo, se podrían configurar los siguientes tres umbrales para generar alarmas para distintos fines:
  • Para ayudar a determinar cuándo se debe actualizar o reemplazar el equipamiento, se puede configurar un umbral que genere una alarma crítica cuando el uso de la CPU se encuentre al 95 % durante 24 horas en una ventana de tiempo de 36 horas (alarma de Umbral de tiempo excedido).
  • Configurar un segundo umbral para generar una alarma grave cuando el uso de la CPU exceda el 90 % (alarma inmediata). Esta alarma podría ayudar a realizar un seguimiento de los trabajos cuya ejecución hubiera que programarse fuera del horario laboral.
  • Generar una alarma leve cuando el uso de la CPU sea superior al 60 % durante 4 días en una ventana de tiempo de 5 días de tiempo (alarma de Umbral de tiempo excedido). Esta alarma permitiría saber si los usuarios están experimentando retrasos en el procesamiento de los datos.
La captura de pantalla siguiente muestra varios umbrales configurados para una única métrica. Several thresholds configured for a single metric
¿Cómo se puede editar una condición de alarma?
Se puede modificar el elemento que se está monitorizando, la métrica seleccionada y el umbral para cualquier condición de alarma. También se puede monitorizar la misma métrica para un dispositivo o grupo, o configurar una condición de alarma para una tecnología. Al configurar las condiciones de alarma para una tecnología, la condición de alarma se aplica a cualquier dispositivo con esa tecnología en su entorno.
Siga los pasos siguientes:
  1. En una política de alarmas, desplácese hasta la
    condición
    que desea cambiar.
  2. Haga clic en
    Editar
    .
  3. Modifique cualquier opción sel cuadro de diálogo
    Configuración de las condiciones
    .
    1. Expanda (v) Tipo, Dispositivo, Métrica, Componente, Tecnología de monitorización o Grupo.
    2. Seleccione el valor de configuración que desee.
    3. Si cambia el tipo de condición, asegúrese de que todas las opciones estén configuradas.
    4. Haga clic en
      Aceptar
      para guardar las actualizaciones.
  4. Expanda (v)
    Umbrales
    .
  5. Si es necesario, modifique los umbrales de alarma existentes.
  6. Haga clic en
    Agregar umbral
    (Add Threshold Icon) para configurar otro umbral.
    1. Seleccione una severidad de alarma, el tipo de umbral, un operador e introduzca un valor de umbral.
    2. A continuación, seleccione el tiempo para una alarma.
  7. Haga clic en
    Eliminar umbral
    (Remove Threshold Icon) para suprimir un umbral configurado.
  8. Guarde
    (esquina inferior derecha) las actualizaciones de la política de alarmas.
¿Cómo se suprime una condición de alarma?
Cuando se suprime una condición de alarma de una política, ya no se generan más alarmas para la métrica. Si la métrica está activada, CA UIM sigue generando datos de métrica.CA UIM guarda el historial de alarmas durante el período de tiempo configurado.
Siga los pasos siguientes:
  1. Desplácese hasta la condición de alarma que desea suprimir.
  2. Haga clic en el
    Menú en línea
    (Inline Menu Button Icon) y, a continuación, seleccione
    Suprimir condición
    .
    Ya no se generarán más alarmas para la condición de alarma suprimida.
¿Cómo se pueden personalizar los mensajes de alarma?
Cada política de alarmas puede tener hasta tres mensajes de alarma predeterminados: un mensaje general, un mensaje de umbral de tiempo excedido y un mensaje de cierre de la alarma. Estos mensajes predeterminados proporcionan la información suficiente para ayudar al usuario a solucionar un problema. Sin embargo, se pueden personalizar los mensajes de alarma para que contengan información adicional. Para cada tipo de mensaje predefinido, existe una lista de variables admitidas que se pueden utilizar en un mensaje para indicar los detalles exactos de la infracción del umbral y del dispositivo. Aparecerá un mensaje general y un mensaje de cierre de la alarma para cada política de alarmas. El mensaje de infracción de la alarma de umbral de tiempo excedido aparecerá después de configurar una alarma Umbral de tiempo excedido. Las variables y los mensajes de infracción de la alarma predeterminados son los siguientes:
  • Mensaje inmediato de infracción del umbral
    ${metric_name} on ${component_name} for ${device_name} is at ${metric_value} ${metric_unit).
    Ejemplo: El valor de la métrica Monitor de la CPU de C:/ para test_system es el 90 %.
  • Mensaje de infracción de Umbral de tiempo excedido
    ${metric_name} on ${component_name} for ${device_name} is at ${metric_value} ${metric_unit). It has violated the threshold for at least ${tot_slider} ${tot_slider_unit} out of ${tot_time_frame} ${tot_time_frame_unit}.
    Ejemplo: El valor de la métrica Monitor de la CPU de C:/ para test_system es 90 %. Se ha infringido el umbral en, como mínimo, 1 minuto de 5 minutos.
  • Mensaje de cierre de la alarma
    ${metric_name} on ${component_name} for ${device_name} is OK.
    Ejemplo: El valor de la métrica Monitor de la CPU de C:/ para test_system es correcto.
Se puede personalizar cualquiera de los mensajes de infracción de alarma predeterminados para proporcionar información que sea relevante para el entorno. Se puede introducir texto que describa la ubicación del negocio o agregar las variables que proporcionen la información deseada. Para obtener una lista completa de las variables compatibles, consulte el tema Variables de los mensajes de alarma.
Siga los pasos siguientes:
  1. En una política de alarmas, desplácese hasta la sección Mensajes de alarma.
  2. Haga clic en el
    Menú en línea
    (Inline Menu Button Icon) para el mensaje que desea cambiar.
    El cuadro de diálogo Mensajes de alarma muestra el mensaje de alarma y las variables disponibles.
  3. Introduzca el texto y las variables adicionales para modificar el mensaje.
  4. Se puede hacer clic en
    Restablecer valores predeterminados
    en cualquier momento para volver a aplicar los valores de configuración predeterminados predefinidos al mensaje modificado.
  5. Haga clic en
    Guardar
    para actualizar el mensaje con los cambios.
¿Qué se debe saber acerca de los umbrales de alarma?
Los valores de configuración de un umbral de alarma determinan cuando se debe generar una alarma. Un umbral de alarma está formado por tres elementos:
  • Severidad de la alarma
    : La severidad de una alarma.
    Las alarmas pueden ser críticas, graves, leves, de advertencia o informativas.
  • Umbral
    : Identifica cómo se gestionan las infracciones del umbral.
    Un umbral se compone de un tipo de umbral (estático o dinámico), un operador y un valor.
    • Tipo de umbral
      : En el caso de las alarmas estáticas, las infracciones se determinan en función de un valor absoluto que se recopila para una métrica. Las alarmas dinámicas se generan cuando la tendencia del promedio calculado es un porcentaje configurado igual, superior o inferior a la línea de referencia calculada para una métrica.
    • Operador
      y
      Valor del umbral
      : Identifica el estado o nivel de rendimiento aceptables.
      La alarma se genera cuando una muestra recopilada para una métrica a intervalos configurados infringe el valor del umbral.
  • Tiempo de creación de la alarma
    : Indica cuánto tiempo debe transcurrir para que se genere una alarma después de que se haya producido una infracción del umbral.
    Infrastructure Management puede generar una alarma
    inmediatamente
    después de que se haya producido una infracción del umbral o después de un determinado número de infracciones del umbral dentro de un período de tiempo configurado (
    Umbral de tiempo excedido
    ).
¿A qué están vinculados los umbrales de alarma?
Un umbral de alarma está vinculado a una sola métrica. Se pueden configurar umbrales de alarma para un dispositivo, una tecnología de monitorización o un grupo.
¿Cuál es la diferencia entre una alarma dinámica y una alarma estática?
Existen dos tipos de alarmas: estática y dinámica. Cuando una métrica alcanza un valor de umbral configurado, se genera una alarma estática. Por ejemplo, cuando el uso de la CPU en un dispositivo de destino alcanza el 95 %, la política genera una alarma crítica. Cuando se está monitorizando un dispositivo que tiene incidencias persistentes, considere configurar una alarma estática. Las alarmas dinámicas se generan en función del promedio móvil de los datos de la línea de referencia recopilados durante los 28 días anteriores. Cuando se especifica un valor de umbral para una alarma dinámica, se genera una alarma cuando el promedio de los datos calculado alcanza el porcentaje configurado por encima o por debajo de la tendencia del promedio. La tendencia del promedio calculado puede cambiar con el tiempo a medida que los datos de la línea de referencia recopilados cambian. Si se introduce un umbral dinámico superior al 10 % para el uso de la CPU y la tendencia media de uso de la CPU para los últimos 28 días es de 85, se genera una alarma cuando el uso de la CPU supera el 95 %. Cuando se monitoriza un dispositivo estable y en buen funcionamiento cuyos recursos se utilizan de forma coherente, se debe configurar una alarma dinámica.
¿Cuál es la diferencia entre una alarma inmediata y una alarma del umbral de tiempo excedido?
Infrastructure Management puede generar una alarma
inmediatamente
después de que se haya producido una infracción del umbral o después de un determinado número de infracciones del umbral dentro de un período de tiempo configurado (
Umbral de tiempo excedido
). El umbral de tiempo excedido es una regla de procesamiento de eventos que permite reducir el número de alarmas que se generan cuando se producen eventos de infracción del umbral. Se puede utilizar el Umbral de tiempo excedido para filtrar picos de datos y monitorizar métricas problemáticas en un período establecido. En lugar de enviar una alarma inmediatamente después de producirse una infracción del umbral, el umbral de tiempo excedido funciona del modo siguiente:
  • Monitoriza los eventos que ocurren durante una ventana de tiempo establecida por el usuario.
  • Sigue la longitud del tiempo que la métrica se encuentra en cada severidad de la alarma.
  • Activa una alarma si el tiempo acumulativo en que la métrica está en la infracción durante la ventana de tiempo alcanza el Umbral de tiempo excedido establecido.
Por ejemplo, se podría configurar una alarma estática o dinámica para que se generara cuando el umbral se infringiera continuamente durante 5 minutos en un período de tiempo deslizante de 15 minutos. La siguiente ilustración muestra cuando se generaría la alarma.
Alarma de umbral de tiempo excedido
Time Over Threshold Alarm
¿Se puede cambiar el nombre de un perfil de monitorización una vez que se ha generado la política de alarma correspondiente?
No se puede cambiar el nombre de un perfil de monitorización una vez que se ha utilizado para generar una política de alarma. Las políticas de alarma dependen de los perfiles de monitorización. Si se cambia el nombre del perfil de monitorización o el nombre de la política de alarmas correspondiente, CA UIM detiene la generación de alarmas para los dispositivos, los grupos o las tecnologías monitorizados por la política de alarmas. Aparte de la falta de alarmas, no existe ninguna indicación o ningún mensaje de error sobre la eliminación de un perfil.
¿Se puede cambiar el nombre de una política de alarma que se ha generado a partir de un perfil de monitorización?
No se puede cambiar el nombre de una política de alarma que se ha generado a partir de un perfil de monitorización. Las políticas de alarma dependen de los perfiles de monitorización. Si se cambia el nombre del perfil de monitorización o el nombre de la política de alarmas correspondiente, CA UIM detiene la generación de alarmas para los dispositivos, los grupos o las tecnologías monitorizados por la política de alarmas. Aparte de la falta de alarmas, no existe ninguna indicación o ningún mensaje de error sobre la eliminación de un perfil.
¿Se puede suprimir el perfil de monitorización una vez que se ha generado la política de alarma?
No se puede suprimir un perfil de monitorización asociado a una política de alarma. Las políticas de alarma dependen de los perfiles de monitorización. Si se suprime involuntariamente un perfil de monitorización, CA UIM detiene la generación de alarmas para los dispositivos, los grupos o las tecnologías monitorizados por la política de alarmas asociada. Aparte de la falta de alarmas, no existe ninguna indicación o ningún mensaje de error sobre la eliminación de un perfil.
¿Cómo se puede buscar una política de alarma?
Haga clic en
Configuración
(ic_settings.png) y, a continuación, seleccione la tarjeta
Políticas de alarmas
. En la esquina superior izquierda de la lista de políticas de alarma, hay disponible un mecanismo de filtrado. Introduzca una tecnología, un nombre de política de alarma, un nombre de métrica o un creador para buscar una política de alarma específica.
¿Cuántos umbrales de alarma se pueden configurar para una métrica?
Para una sola métrica, se pueden configurar tantos umbrales como se necesite para monitorizar un dispositivo de destino.
Mis alarmas contienen demasiada información o se muestran inconsistentemente. ¿Qué puedo hacer?
Se recomienda revisar y ajustar los valores de configuración para los umbrales de alarma. Si se ha creado un perfil de configuración de la monitorización mediante los valores de configuración de umbral predeterminados, es posible que esta configuración no sea apropiada para el entorno. Si aparecen errores de visualización inconsistente de las alarmas (se genera una alarma, se cierra rápidamente y se genera de nuevo en un período de tiempo corto), se recomienda configurar la opción de intervalo Umbral de tiempo excedido para una alarma. Cuando se configura la opción Umbral de tiempo excedido (TOT), se genera una alarma solamente cuando se alcanza el umbral de Umbral de tiempo excedido el número de veces configurado durante la ventana deslizante configurada.
¿Cómo se puede restablecer un mensaje de alarma a la configuración predeterminada?
Un mensaje de alarma personalizado se puede convertir en el mensaje de alarma predefinido en cualquier momento.
Siga los pasos siguientes:
  1. Haga clic en
    Acción en línea
    (Inline menu.png) junto al mensaje de alarma que desee.
  2. En el cuadro de diálogo Mensaje de alarma, haga clic en
    Restablecer valores predeterminados
    .
    Aparece el mensaje predefinido en el panel Mensajes de alarma. La siguiente alarma que se genere mostrará el mensaje de alarma predefinido.