Stochastik

Was ist „Stochastik“?

Stochastik kombiniert die beiden Gebiete Wahrscheinlichkeitstheorie und Statistik, die in enger Beziehung stehen:

  • Die Wahrscheinlichkeitstheorie beschäftigt sich mit der Modellierung und der Untersuchung von Zufallsgeschehen.
  • Statistik stellt Methoden zum Umgang mit quantitativen Informationen (Daten) bereit (z. B. Analyse empirischer Daten).

Anwendungen der Stochastik finden sich in vielen Gebieten, beispielsweise technischen Gebieten wie Telekommunikation oder Qualitätskontrolle und Produktionsüberwachung und nicht-technischen Gebieten wie Bank- und Versicherungswesen oder Meinungsforschung.

Inhalt der Vorlesung

Die Vorlesung beginnt mit einer kurzen Einführung in die beschreibende Statistik. Hier geht es darum, gesammelte Daten geeignet aufzubereiten und in einer ersten Analyse grundlegende Zusammenhänge zu erkennen. Es tauchen bereits viele Begriffe auf, die später präzisiert werden, wie z. B. Erwartungswert und Varianz. Im Folgenden werden die Grundlagen der Stochastik behandelt. Es wird formal definiert, was Wahrscheinlichkeiten sind und wie man damit rechnen kann. Dabei werden beispielhaft einige gebräuchliche diskrete und kontinuierliche Wahrscheinlichkeitsverteilungen wie z. B. Binomialverteilung, Geometrische Verteilung, Exponentialverteilung oder Normal- bzw. Gaußverteilung vorgestellt sowie wichtige Rechenregeln im Zusammenhang erklärt. Im Zusammenhang mit der Definition von Wahrscheinlichkeiten werden auch Grundlagen der Kombinatorik wiederholt. Nach einem Ausblick auf allgemeine Wahrscheinlichkeitsräume schließt die Vorlesung mit einem Ausblick auf die Maximum-Likelihood-Schätzung der Parameter von Verteilungen bzw. auf statistische Tests.

Für den Studiengang Informatik wird die Vorlesung um einen deutlich kürzeren, zweiten Teil ergänzt, der sich mit probabilistischen Grundlagen der Mustererkennung beschäftigt.

Inhalt der Übung

In der Übung steht die Anwendung und Wiederholung des Vorlesungsstoffs sowie die Klausurvorbereitung im Vordergrund. Der Fokus liegt dabei auf technischen Anwendungsaufgaben aber auch anderen bekannten Problemen wie z. B. dem Zwei-Ziegen-Dilemma oder dem Geburtstagsparadoxon.

Beispiel für eine Anwendungs-Aufgabe:

Ein Prozessorhersteller möchte die Lebensdauer einer neuen Serie von Prozessoren evaluieren. Dazu wurden 10 Prozessoren für einige Tage unter extremen Bedingungen betrieben und gemessen, wann die einzelnen Prozessoren ausfallen:

Prozessor 1 2 3 4 5 6 7 8 9 10
Funktionszeit in Tagen 2 6 1 3 2 1 4 1 7 3

Zur Modellierung der Lebensdauer kann eine Exponentialverteilung verwendet werden.

Mit der Maximum-Likelihood-Methode kann der Parameter λ der Exponentialverteilung geschätzt werden, im Beispiel ergibt sich λ = 1/3:



Dargestellt ist hier in rot die Exponentialverteilung, in blau die empirische Verteilungsfunktion der Daten.

In diesem Beispiel passt die geschätzte Exponentialverteilung gut zur Verteilung der Daten. Ein anderer Prozessorhersteller hat folgende Messwerte gesammelt:

Prozessor 1 2 3 4 5 6 7 8 9 10
Funktionszeit in Tagen 5 1 7 6 3 6 5 7 6 4



Hier erhält man als Schätzung für den Parameter λ der Exponentialverteilung λ = 1/5. An der Darstellung erkennt man hier, dass die geschätzte Verteilung nicht besonders gut zu den Messdaten passt.

Informationen

  • Ansprechpartner für die Vorlesung sind Prof. Dr. Bernhard Sick und M.Sc. Daniel Kottke.

  • Formale, allgemeine Angaben zur Vorlesung (z. B. Zuordnung zu Anwendungsgebieten, Kreditpunkte, Prüfungsart) sind im Modulhandbuch zu finden.
    Studiengang -> Prüfungsordnung -> Modul

  • Jeweils aktuelle Informationen zur laufenden Vorlesung (z. B. Folien, Literaturhinweise, Prüfungstermine) werden im Moodle der Universität Kassel bereitgestellt.

  • Link zum Vorlesungsverzeichnis