Clusteranalyse

Das Aufdecken von Ähnlichkeitsstrukturen


Ähnlichkeitsstrukturen identifizieren
mit der Clusteranalyse

Bei der Clusteranalyse geht es um das Auffinden von Ähnlichkeitsstrukturen in n-dimensionalen Datenräumen, welche beispielsweise durch physikalische Messgrößen aufgespannt werden.

Ziel der Clusteranalyse ist es, vorhandene Messpunkte so in Gruppen einzuteilen, dass sie innerhalb einer Gruppe möglichst ähnlich und zwischen den Gruppen möglichst verschieden sind.


Erkennung von Anomalien

Die auf diese Weise ermittelten Cluster lassen sich mittels Domänenwissen interpretieren und zur Klassifikation noch unbekannter Messpunkte bzw. zur Detektion von Anomalien verwenden.


Clustering mit dem
k-Means-Algorithmus

Einer ihrer bekanntesten Vertreter ist der k-Means-Algorithmus. Der Algorithmus startet mit einer vorgegebenen Anzahl N von zufällig verteilten Clusterzentren. Dabei wird jedem Datenpunkt ein Zentrum zugeordnet, so dass die Summe aller Abstände zwischen Datenpunkt und zugeordnetem Zentrum minimal ist.

Die Zentren werden durch Mittelwertberechnungen für jedes Cluster neu bestimmt und den Datenpunkten neu zugeordnet. Dies wiederholt sich so lange, bis sich die Positionen der Zentren nicht mehr ändern.

Ein Analysebeispiel aus der Praxis

Mit Hilfe von Clusteranalyseverfahren lassen sich, als ein mögliches Anwendungsfeld, Systemzustände von Vielzustandssystemen identifizieren. Diese Zustände entsprechen dabei den gefundenen Ähnlichkeitsstrukturen der Messdaten eines intakten Systems.

Messdaten können beispielsweise Sensordaten sein, wie Drehmomente oder Ströme, welche Systemzustände beschreiben können. Die Abbildung der Clusteranalyse zeigt hierzu exemplarisch die drei identifizierten Betriebszustände eines Motors im Spannungs-Drehmoment Plot, siehe farbige Ellipsen.

Messdaten die nicht eindeutig zugeordnet werden können, werden als Ausreißer (rot) dargestellt.

Der Qualitätszustand des Motors kann nun durch die Anzahl und Verteilung der Ausreißer bewertet werden. Zusätzlich kann dieser, Erkenntnisse über die Art des Fehlers oder des Verschleißprozesses liefern, was eine Fehlersuche deutlich beschleunigen kann und Ausfallzeiten der Maschine reduzieren lässt.

Ihr Nutzen aus der Clusteranalyse

Fehler frühzeitig erkennen

Ausfallzeiten
reduzieren

Wartungskosten
senken

Prozesse
optimieren

Haben Sie Fragen? Wir beraten Sie gerne.

Der Datenanalysebereich Katana der USU-Gruppe verfügt über langjährige Erfahrung in der Anwendung von maschinellen Lernverfahren im industriellen Bereich. Nutzen Sie unser Wissen und unsere Lösungen zur Optimierung Ihrer Produktionsprozesse um Kosten zu senken und Qualität zu steigern.