Experimentieren und Evaluieren
Prüfung
Vorbereitung
- Übungsaufgaben heraus suchen und auf Zeit lösen
- Übungen aus Büchern
- T-Verteilung nicht Prüfungsrelevant
- Chi-Quadrat, Normalverteilung und diskrete Verteilung -> Rechnungen, von den anderen aber etwa kennen, wofür sie eingesetzt werden und wie sie aussehen
- Keine Rechenaufgaben über DoE
Bedingungen
- Formelsammlung / Zusammenfassung (kleine Beispiele erlaubt)
- Keine Übungsaufgaben
- Tabellen (Chi-Quadrat, Normalverteilung)
- Taschenrechner
- Multiple-Choice (+ "Sicher"- Option, +1, 0 - +2, -2)
Vorlesung 1 - Einführung Experimentplanung / Statistik
Hypothese: kommt von "Unterstellung"
Verifikation: Formaler logischer Beweis (ist die Spezifikation richtig?)
Validierung: Prüfen des Modells (ist es im Wertebereich gültig?)
Bsp: Ein künstlicher Dummy für Crash-Tests. Ist der Dummy eine realistische Abbildung?
- Richtiges falsch implementiert -> nicht validiert
-
Falsches richtig implementiert -> Spezifikation falsch - nicht verifiziert
-
Folie 17
Dieser Fehler ist zufällig Ein systematischer Fehler wäre zb. ein ungenaues Lineal, oder ein Messgerät falsch ablesen -
Absoluter Fehler hat Masseinheit
- Relativer Fehler ist der Bezug des Fehlers auf den gemessenen Wert
Vorlesung 2 - Statistische Grundbegriffe und Ablauf der statistischen Untersuchung
- Folie 3
Utilization: Verwendungsgrad der Maschine (0%-100%, bzw. 0 bis 1)
auch Blockierungs- bzw Wartewahrscheinlichkeit
Grundgesamtheit: zb. alle Maschinen in einer Produktionskette
Merkmal: Information
Merkmalsträger: zb. Maschine mit diesem Merkmal
Merkmalswert: Wert der Messung
Nominalskala: Werte, die gleichbedeutend sind (zb. Geschlecht)
Ordinalskala: Werte mit Rang (zb. Schulnoten (=qualitative Merkmale))
Metrische Skala: Als reelle oder ganze Zahlen (diskret) abgetragen, immer quantitative Werte
-
Folie 10:
Bsp. Temperatur: Celsius ist ein Intervall, "zufälliger" Nullpunkt.
Kelvin hat einen absoluten Nullpunkt -> Verhältnisskala -
Folie 12:
Datenverarbeitung:- Sind die Daten korrekt, oder wurden grobe Fehler gemacht?
- Einschränkung der Datenmengen
zb. Mittelwert berechnen
Intervalle festlegen
-
Folie 13:
relative Häufigkeit ist auch die Wahrscheinlichkeit
Summe der relativen Häufigkeiten = 1 -
Folie 14:
akkumulierte Häufigkeit: von kleinen nach grösseren Werten immer die Werte zusammen addieren -
Fragen:
Konkretisierung des Ziels: Problem ermitteln, Ziel festlegen, Messungen einschränken
Vorlesung 3 - Häufigkeitsverteilung
- Folie 5: Median
- Wenn Anzahl Merkmalswerte gerade, wird der Mittlerwert der beiden mittleren Werte genommen
- Rechenansatz: Über Ähnlichkeit von kleinem Dreieck zum grossen Dreieck
Literatur
Bourier Kapitel 3.1 und 3.2
Vorlesung 4 - Zeitreihen, Regression, Korrelation
-
Folie 5:
Gleitender Mittelwert:- Mittelwert der ersten 3 Werte: 5, 8, 7 = 6.66 -> bei
t=2
eintragen - Mittelwert Zahlen 2-4: 8 + 7 + 8 = 23/3 = 7.66 -> bei
t = 3
eintragen - Mittelwert Zahlen 3-5: 7 + 8 + 9 = 8 -> bei
t = 4
eintragen
...
Je grösser das Messfenster (hier 3 Werte), desto mehr wird geglättet
- Mittelwert der ersten 3 Werte: 5, 8, 7 = 6.66 -> bei
-
Folie 6:
Eine Funktion durch die punktewolke legen (bei linearer Regression eine lineare Funktion)
Ziel: Einen funktionalen Zusammenhang der Messwerte herausfinden, dass man auch Zwischenwerte ungefähr bestimmen kann -
Folie 13:
- Wenn beide Werte xi und yi über oder unter dem Mittelwert sind, gibt es eine positive Korrelation. Wenn nur einer davon unter dem Mittelwert ist, gibt es eine negative Korrelation
- Bild unten rechts: vollkommen unkorreliert
-
Folie 15:
Wenn r = 0, heisst es nur, dass es keinen linearen Zusammenhang gibt -
Folie 16
Es gibt aber trotzdem eine Korrelation, aber keine lineare!
Kontrollfragen:
- Scheinkorrelation: Korrelation, die aber keine ist ("Correlation doesnt equal causation")
- Gleitenden Durchschnitt: Glätten der Daten, um einen Trend zu erkennen
Vorlesung 5 - Wahrscheinlichkeit / Kombinatorik
-
Folie 4:
2) Es gibt unendlich viele reelle Zahlen () in einem Intervall (kontinuierlich) -
Folie 6:
Das Roulette bildet ein System mit 6 Ereignissen, jedes Ereignis ist eine Teilmenge von
Vorlesung 6 - Zufallsvariable und Verteilungen
Kontrollfragen:
- Funktion von Folge zufälliger Werte
- stetig: unendlich viele zwischenwerte
- seed = startwert, Zahlen haben statistische Eigenschaften, sind reproduzierbar
- Sequenzlänge: Anzahl der Zufallszahlen
- Weil unterschiedliche Prozesse simuliert werden, die unterschiedlich verteilt sind
- Ja, hat grosse Auswirkungen. Wenn Fehler in Datenanalyse geschehen, gibt es auch Fehler im Resultat
Literatur
Bourier 7.1.1 - 7.1.3, 7.2.1 - 7.2.3
Vorlesung 7 - Grundlagen schliessende Statistik
- Folie 4
- Schliessende Statistik: Man kennt die Realisierungen (durch Experiment), sucht aber die Verteilungsfunktion
- Mit vielen Messungen nähert man sich charakteristischen Grössen an
- Folie 5
- Charakteristische Grössen können errechnet werden. Ist das dann aber allgemeingültig?
- Experimente sind nur Stichproben
- Entscheidung durch Vergleich dieser errechneten Grössen und der Theorie
- Folie 12
- t-Verteilung ist etwas "pessimistischer" als Normalverteilung
- Folie 14
- Varianz: Wenn , wird die Varianz gegen 0. D.h wenn die Stichprobe die gesamte Grundmenge erfasst, ist die Varianz 0
Vorlesung 8 - schliessende Stat. & Schätzverfahren
Folien 7. Grundlagen der schliessenden Statistik
Siehe Handnotizen
Literatur
- Bourier Kapitel 8
- Kommentierte Formelsammlung, Skripteserver
Folien 8. Schätzverfahren
Verfahren, wenn und unbekannt sind.
- Folie 5
- ist der Schätzwert
- ist der richtige Wert
- Folie 6
- Differenziere:
Vorlesung 9 - Schätzverfahren (2)
Geänderte Folien "8.Schätzverfahren+.pdf"
Siehe Handnotizen
Literatur
Bourier Kapitel 9
Vorlesung 10 - Testverfahren
Problem: Wenn ein zweites Experiment durchgeführt wird, sind die Ergebnisse dann tatsächlich besser? Sind sie signifikant besser?
- Verteilungs- bzw. Anpassungstest
- Bei Simulationen relevant, da die Zufallszahlen einer Verteilungsfunktion gehorchen sollen
- Folie 5
- ist die Wahrscheinlichkeit, dass die Zahl innerhalb des Intervalls ist, bzw , dass sie ausserhalb ist
- Fehlerarten
- Erste Art: Hypothese falscherweise ablehnen
- Zweiter Art: Hypothese falscherweise annehmen
- Je näher Hypothese und wahrer Wert zusammen liegen, desto höher ist die Fehlerwahrscheinlichkeit
Siehe Handnotizen
- Eine Signifikanz feststellen
- Nullhypothese: Annahme, die angenommen oder abgelehnt werden soll
- Signifikanzzahl: Irrtumswahrscheinlichkeit. Bereich, in der wir die Hypothese an- oder ablehnen
-
Testentscheidung: Wenn wir Annahmebereich verlassen, wird sie abgelehnt, sonst angenommen
-
Fehlerarten: s. oben
- Einseitiger Parametertest: Nur auf untere oder obere Grenze überprüfen
- Gewisse Anzahl Stichproben nötig
Literatur
Bourier Kapitel 10
Vorlesung 11 - DoE Einführung
Übersicht der ganzen Zusammenhänge: siehe Handnotizen
--
Vorlesung 12 - DoE
Zum DoE kommen an der Prüfung nur Wissensfragen, keine Berechnungen