KI für Zeitreihen: Sequenzielle Daten
aus der Reihe: “Die Evolution der Künstlichen Intelligenz für sequenzielle Daten”
Was versteht man unter sequenziellen Daten?
Sequenzielle Daten sind Informationen, die in einer spezifischen Reihenfolge organisiert sind, wobei diese Reihenfolge für das Verständnis und die Analyse der Daten entscheidend ist. Das trifft unter anderem auf natürliche Sprache in Form von Texten oder gesprochener Sprache zu, insbesondere aber auch auf Zeitreihen, die bspw. durch Sensoren erzeugt werden.
Was sind Zeitreihen und wo kommen sie vor?
Zeitreihen spielen vor allem in technischen Zusammenhängen eine große Rolle. Sie bestehen aus Messwerten, die z.B. von Sensoren erfasst werden. Jedem Messwert ist ein eindeutiger Zeitstempel zugeordnet. Hierdurch erhalten die Daten nicht nur eine Reihenfolge, sondern implizit auch eine Information über die Zeitabstände zwischen den Messwerten. Ein Beispiel einer einfachen Zeitreihe, bei der eine Messgröße über die Dauer eines Fertigungsprozesses aufgenommen wird, könnte so aussehen:
Die Messwerte könnten etwa die Prozesskraft einer Werkzeugmaschine, den Druck eines Pressstempels oder die elektrische Leistungsaufnahme einer Anlage widerspiegeln. Anhand der Abbildung können wir mehrere charakteristische Beobachtungen feststellen:
- Abtastintervall: Die Daten sind in einem regelmäßigen Intervall aufgenommen worden. Je nach verwendeter Technik für Messung und Speicherung der Messwerte können Zeitreihen auch unregelmäßige Intervalle aufweisen.
- Wertebereich: Es kommen positive und negative Werte in einstelliger Größenordnung vor. In der Praxis ist zudem die physikalische Einheit relevant.
- Periodizität: Die Werte sind nicht konstant, sondern zeigen eine Abfolge von Hoch- und Tiefpunkten, die sich allerdings in ihrer Intensität unterscheiden. Auch die Zeitdauer der “Hochs” und “Tiefs” ist nicht einheitlich.
- Trend: Ausgehend vom vorliegenden kurzen Zeitabschnitt lässt sich kein langfristiger Trend ablesen. In der Praxis spielen Trends eine große Rolle bei Vorhersagen aus Langzeitdaten und beim Vergleich weit auseinander liegender Stichproben.
- Rauschen: Zusätzlich sind die Daten durch Zufallsprozesse “verrauscht” oder von anderen Einflussgrößen abhängig, sodass sich kein klares Muster ergibt.
Warum ist die Analyse von Zeitreihen von Bedeutung?
Die festgestellten Merkmale sind typische Beispiele für Herausforderungen, die sich bei der Analyse von Zeitreihen stellen, insbesondere auch wenn eine KI dafür benutzt wird. Es handelt sich nicht um eine triviale Aufgabe, sondern um ein Feld, auf dem nach wie vor intensiv an neuen Methoden geforscht wird. Dabei werden typischerweise folgende Fragestellungen bzw. Ziele adressiert:
- Mustererkennung: Robuste Identifikation wiederkehrender Abfolgen, etwa zur Langzeitüberwachung oder zur Detektion von Anomalien
- Bewertung / Klassifikation: Qualitätsaussagen und Fehlerzuordnung für Empfehlungssysteme oder zur Ursachenanalyse
- Vorhersage: Extrapolation bestehender Daten in die Zukunft, z.B. zur Früherkennung kritischer Zustände oder anderer besonderer Ereignisse
Geeignete KI-Modelle für Zeitreihen können beispielsweise dabei helfen, den Ausschuss zu reduzieren, fällige Wartungen vorab zu planen oder die Deckung des Energiebedarfs aus lokalen Erzeugungsanlagen zu optimieren. Indem sie zu einer schnellen und präzisen Entscheidungsfindung beitragen, haben sie das Potenzial, die betriebliche Effizienz in vielen Bereichen zu steigern.
In den nächsten Beiträgen zu dieser Serie werden wir verschiedene Analyse- und KI-Modelle für sequenzielle Daten genauer beleuchten.