Detección de anomalías

Una anomalía es un punto de datos o evento que no es coherente con las condiciones de funcionamiento normales. La detección de anomalías para localizar problemas y comprender las tendencias dentro de la infraestructura y las aplicaciones es un caso de uso clave para AIOps. La detección permite a las herramientas reconocer el comportamiento que está fuera de lo corriente (como un servidor que responde más lentamente de lo normal o una actividad de red infrecuente generada por una infracción) y reaccionar en consecuencia.
Si utiliza la detección de anomalías en nuestra solución AIOps, obtendrá las siguientes ventajas:
  • Nuestra solución AIOps recopila estadísticas, no solo alarmas o eventos. Las métricas son imprescindibles para una detección efectiva de anomalías.
  • Con nuestra solución AIOps no es necesario configurar umbrales. Solo puede enviar métricas al data lake y nuestra solución AIOps correlacionará los datos e identificará las anomalías.
  • Nuestra solución AIOps realiza la detección de anomalías con varias variables en lugar de depender solo de una única variable.
  • Nuestra solución AIOps presenta más de diez algoritmos de inteligencia artificial (IA) y aprendizaje automático que hemos ajustado en función de nuestra experiencia en dominios. Estos algoritmos optimizados le permiten realizar un análisis rápido de causa raíz y predecir la TI.
  • Con nuestra asignación de automatización y topología, podemos detectar anomalías con precisión, reducir el ruido de los eventos y detectar la causa raíz de los problemas.
  • Si nuestra solución AIOps no es correcta para identificar una causa raíz, puede tomar datos de los operadores y aprender a partir de esta información.
Línea de referencia dinámica
Si bien entender el concepto de una anomalía puede ser fácil, lo que hace que la detección de anomalías sea especialmente difícil para AIOps en entornos de software modernos es que, en muchos casos, no existe un medio coherente para definir condiciones de funcionamiento
normales
. La cantidad de tráfico de red, memoria y espacio de almacenamiento que consume un entorno determinado puede fluctuar mucho a lo largo del día, lo que también incluye el número de usuarios activos o instancias de aplicación. La detección efectiva en estas circunstancias requiere herramientas AIOps que sean lo suficientemente inteligentes como para establecer líneas de referencia dinámicas. Las líneas de referencia dinámicas permiten a las herramientas determinar qué constituye la actividad normal en circunstancias determinadas (como la hora del día y el número de usuarios registrados para una aplicación) y, a continuación, detectar datos o eventos que no se ajusten a la línea de referencia dinámica.
Detección de anomalías de la serie temporal
Los datos de la serie temporal representan observaciones con marcas de tiempo de diversas sondas que tenemos en el entorno. En las implementaciones de gran tamaño, se pueden recopilar decenas de millones de métricas. La mayoría de estas métricas tienen un promedio de tiempo y pueden proporcionar una gran variedad de detalles sobre el estado transaccional o relacionado con los recursos del sistema.
Cada una de las métricas individuales sigue una distribución. Si no se hace ninguna suposición en la distribución, nuestro algoritmo KDE elabora kernels de las distribuciones de los puntos de datos históricos de cada métrica. Mediante esta distribución, se estima la probabilidad de que se produzca un valor para una métrica. Mediante un desglose basado en el cuartil, esta distribución ayuda a la detección de anomalías a estimar la forma en la que el valor de los datos es raro o común para una métrica concreta en un momento determinado del día. Estas áreas forman bandas que nuestra detección de anomalías puede considerar como normales.
A continuación, nuestra solución AIOps interpreta estas bandas por usted. Se genera una anomalía cuando un valor de métrica se encuentra en la banda poco frecuente durante un tiempo suficientemente largo.
Las métricas sin formato se publican en la Data Science Platform (DSP) en la que se encuentra el motor de detección de anomalías.