Clusteranalyse

Das Aufdecken von Ähnlichkeitsstrukturen


Ähnlichkeitsstrukturen identifizieren

Bei der Clusteranalyse geht es um das Auffinden von Ähnlichkeitsstrukturen in Datenräumen. Diese Datenräume können beispielsweise durch physikalische Messgrößen aufgespannt werden. Ziel der Clusteranalyse ist es, vorhandene Messpunkte so in Gruppen einzuteilen, dass sie innerhalb einer Gruppe möglichst ähnlich und zwischen den Gruppen möglichst verschieden sind.


Detektion von Anomalien

Die auf diese Weise ermittelten Cluster lassen sich mittels Domänenwissen interpretieren und zur Klassifikation noch unbekannter Messpunkte bzw. zur Detektion von Anomalien verwenden. Die Verteilung der Anomalien im Datenraum kann dabei Hinweise auf die Ursache von Fehlern liefern.


Clustering mit dem
k-Means-Algorithmus

Einer der bekanntesten Verfahren der Clusteranalyse ist der k-Means-Algorithmus. Dieser startet mit einer vorgegebenen Anzahl von zufällig verteilten Clusterzentren. Dabei wird jedem Datenpunkt ein Zentrum zugeordnet, so dass die Summe aller Abstände zwischen Datenpunkt und zugeordnetem Zentrum minimal ist. Die Zentren werden durch Mittelwertberechnungen für jedes Cluster neu bestimmt und den Datenpunkten neu zugeordnet. Dieser Zuordnungsprozess erfolgt iterativ so lange, bis die optimale Clusterkonfiguration gefunden wurde.

Identifikation von Fehlerzuständen

Mit Hilfe von Clusteranalyseverfahren lassen sich, als ein mögliches Anwendungsfeld, Systemzustände von Vielzustandssystemen identifizieren. Diese Zustände entsprechen dabei den gefundenen Ähnlichkeitsstrukturen der Messdaten eines intakten Systems. Messdaten können beispielsweise Sensordaten wie Drehmomente oder Ströme sein, welche Systemzustände beschreiben können. Diese Abbildung einer Clusteranalyse zeigt hierzu exemplarisch drei identifizierte Betriebszustände eines Motors im Spannungs-Drehmoment-Raum (siehe farbige Ellipsen). Messdaten, die nicht eindeutig zugeordnet werden können, werden als Ausreißer (orange) klassifiziert.     

Der Qualitätszustand des Motors kann nun durch die Anzahl und Verteilung der Ausreißer bewertet werden. Zusätzlich können Ausreißer Hinweise über die Art von Fehlern oder Verschleißprozessen liefern. Das kann eine Fehleridentifikation beschleunigen und damit die Ausfallzeiten der Maschine reduzieren.  

Ihr Nutzen aus der Clusteranalyse

Fehler
frühzeitig erkennen

Ausfallzeiten
reduzieren

Wartungskosten
senken

Prozesse
optimieren

Haben Sie Fragen? Wir beraten Sie gerne.

Katana ist Ihr Big Data Analytics-Experte für Industrie 4.0-Anwendungen. Mit modernster Cloud-Technologie und der Expertise eigener Data Scientisten und Data Ingenieuren ermöglichen wir eine schnelle und hochflexible Analyse Ihrer industriellen Daten und die Operationalisierung von gewinnbringenden Smart Services in die Systemlandschaft Ihres Unternehmens. Kontaktieren Sie uns und realisieren Sie mit einem starken Partner Ihr Digitalisierungsvorhaben.

 

Datengetriebene Services erfolgreich entwickeln

Leitfaden für Voraussetzungen, Herausforderungen und das richtige Vorgehen bei der Entwicklung maßgeschneiderter Smart Services.

Download White Paper