Anomalieerkennung

Eine Anomalie ist ein Datenpunkt oder ein Ereignis, der bzw. das nicht mit den normalen Betriebsbedingungen übereinstimmt. Die Erkennung von Anomalien, um Probleme zu erkennen und Trends in Infrastruktur und Anwendungen zu verstehen, ist ein wichtiger Anwendungsfall für AIOps. Durch die Erkennung können Tools ein ungewöhnliches Verhalten erkennen (z. B. ein Server, der langsamer reagiert als üblich, oder eine ungewöhnliche Netzwerkaktivität, die durch einen Verstoß erzeugt wird) und entsprechend reagieren.
Die Anomalieerkennung in unserer AIOps-Lösung bieten Ihnen folgende Vorteile:
  • Unsere AIOps-Lösung erfasst Kennzahlen und nicht nur Alarme oder Ereignisse. Kennzahlen sind ein Muss für eine effektive Anomalieerkennung.
  • Mit unserer AIOps-Lösung müssen Sie keine Grenzwerte einrichten. Sie können Kennzahlen einfach an den Data Lake senden, und unsere AIOps-Lösung korreliert Daten und identifiziert Anomalien.
  • Unsere AIOps-Lösung führt die Anomalieerkennung mit mehreren Variablen durch, statt sich nur auf eine einzige Variable zu verlassen.
  • Unsere AIOps-Lösung umfasst mehr als zehn AI- und ML-Algorithmen, die wir auf der Grundlage unseres Fachwissens abgestimmt haben. Diese optimierten Algorithmen ermöglichen eine schnelle Ursachenanalyse und eine vorausschauende IT.
  • Mit unserer Automatisierung und Topologiezuordnung können wir Anomalien genau erkennen, Ereignisrauschen unterdrücken und die Ursachen von Problemen identifizieren.
  • Wenn unsere AIOps-Lösung bei der Identifizierung einer Ursache nicht korrekt sein sollte, kann sie Eingaben von Operatoren übernehmen und aus diesen Informationen lernen.
Dynamisches Baselining
Während das Verständnis des Konzepts einer Anomalie einfach sein mag, stellt die Anomalieerkennung für AIOps in modernen Software-Umgebungen eine besondere Herausforderung dar, da es in vielen Fällen keine konsistente Möglichkeit gibt,
normale
Betriebsbedingungen zu definieren. Die Menge an Netzwerkverkehr, Speicher und Speicherplatz, die eine bestimmte Umgebung verbraucht, kann im Laufe des Tages stark schwanken, was auch die Anzahl der aktiven Benutzer oder Anwendungsinstanzen einschließt. Eine effektive Erkennung unter diesen Umständen erfordert AIOps-Tools, die intelligent genug sind, um dynamisches Baselining festzulegen. Dynamische Baselines ermöglichen es den Tools, zu bestimmen, was unter gegebenen Umständen eine normale Aktivität darstellt (z. B. die Tageszeit und die Anzahl der registrierten Benutzer für eine Anwendung), und dann Daten oder Ereignisse zu erkennen, die nicht mit der dynamischen Baseline übereinstimmen.
Anomalieerkennung in Zeitreihen
Die Zeitreihendaten stellen zeitgestempelte Beobachtungen verschiedener Probes dar, die wir in der Umgebung haben. Bei großen Bereitstellungen können wir Zehnmillionen von Kennzahlen erfassen. Die meisten dieser Kennzahlen sind zeitlich gemittelt und können sehr detaillierte Informationen über den transaktions- oder ressourcenbezogenen Zustand des Systems angeben.
Jede der einzelnen Kennzahlen folgt einer Verteilung. Ohne Annahmen über die Verteilung zu treffen, zeichnet unser KDE-Algorithmus Kernel von Verteilungen für die historischen Datenpunkte jeder Kennzahl. Bei Verwendung dieser Verteilung wird die Wahrscheinlichkeit eines Werts geschätzt, der für eine Kennzahl auftritt. Mithilfe einer quartilbasierten Aufschlüsselung hilft diese Verteilung der Anomalieerkennung abzuschätzen, wie selten oder häufig ein Datenwert für eine bestimmte Kennzahl zu einer bestimmten Tageszeit ist. Diese Bereiche bilden Bänder, die unsere Anomalieerkennung dann als normal betrachten kann.
Unsere AIOps-Lösung interpretiert diese Bänder dann für Sie. Eine Anomalie wird generiert, wenn sich ein Kennzahlenwert lange genug im Band "Selten" befindet.
Die Rohkennzahlen werden auf der DSP (Data Science Platform) veröffentlicht, auf der sich die Engine der Anomalieerkennung befindet.