Temporal and Spatial Data Mining

Von zeitlichen und räumlichen Daten zu Wissen

Data Mining bezeichnet den Prozess des automatischen Gewinnens von gültigem, neuartigem, potentiell nützlichem und auch verständlichem Wissen aus großen Datenmengen (nach Fayyad, Piatetsky-Shapiro, Smyth und Uthurusamy, 1996). Eine häufig anzutreffende Eigenschaft vieler Daten ist, dass diese zeitlich (temporal) und räumlich (spatial) verteilt entstehen. Insbesondere in Form von Zeitreihen sind diese in einer Vielzahl von Bereichen, wie z. B. Medizin, Biochemie, Finanzwirtschaft, Prozessüberwachung, Robotik etc. zu finden. Durch das sog. Ubiquitous Computing und die damit stetig wachsende Anzahl an eingebetteten Systemen, beispielsweise in Smartphones, Fahrzeugen, Unterhaltungselektronik oder auch Kleidung sowie dem damit verbundenen ansteigenden Einsatz verschiedenster Sensoren ergeben sich dabei fortlaufend neue Anwendungsfelder. Typische Anwendungen sind etwa die Erkennung von Veränderungen und Störungen im Verlauf eines Signals, z. B. in einem EKG (Elektrokardiogramm), die Entdeckung von wiederholt auftretenden Mustern und Zusammenhängen zwischen unterschiedlichen Verläufen, z. B. in Devisenkursen, oder die Vorhersage von Verläufen und zukünftigen Entwicklungen, z. B. bei Börsenkursen.

Inhalt der Vorlesung

Die Vorlesung beschäftigt sich mit Grundlagen der Mustererkennung in Zeitreihen (z. B. Sensorsignale) und räumlich verteilt erfassten Daten (z. B. in Sensornetzen). Es werden u.a. folgende Themen besprochen: Grundlagen (z. B. Segmentierung von Zeitreihen, Korrelation von Daten, Merkmale zur Beschreibung temporaler/räumlicher Daten), Abstandsmessung von Zeitreihen (z. B. DTW, LCSS, Zeitreihenkernel), Clustering/Klassifikation, Motiverkennung, Anomalieerkennung mit verschiedenen Techniken (z. B. Nearest Neighbor, Neuronalen Netze, Support Vector Machines), verschiedenste Beispielanwendungen (Unterschriftenverifikation, Aktivitätserkennung, Kontexterkennung mit Smartphones u. a.).

Inhalt der Übung

Ziel der Übung ist, dass die Teilnehmer(innen) selbständig Aufgaben aus dem Bereich des Temporal und Spatial Data Mining lösen können. Praktische Rechnerübungen nehmen daher einen großen Raum ein, u. a. mit dem frei verfügbaren Werkzeug RapidMiner.



Unterschriftenverifikation



Aktivitätserkennung



Anomalieerkennung

Informationen
  • Ansprechpartner für die Vorlesung ist Prof. Dr. Bernhard Sick.

  • Formale, allgemeine Angaben zur Vorlesung (z. B. Zuordnung zu Anwendungsgebieten, Kreditpunkte, Prüfungsart) sind im Modulhandbuch zu finden.
    Studiengang -> Prüfungsordnung -> Modul
  • Jeweils aktuelle Informationen zur laufenden Vorlesung (z. B. Folien, Literaturhinweise, Prüfungstermine) werden im Moodle der Universität Kassel bereitgestellt.

  • Link zum Vorlesungsverzeichnis