Experimentieren und Evaluieren
Prüfung
Vorbereitung
- Übungsaufgaben heraus suchen und auf Zeit lösen
 - Übungen aus Büchern
 - T-Verteilung nicht Prüfungsrelevant
 - Chi-Quadrat, Normalverteilung und diskrete Verteilung -> Rechnungen, von den anderen aber etwa kennen, wofür sie eingesetzt werden und wie sie aussehen
 - Keine Rechenaufgaben über DoE
 
Bedingungen
- Formelsammlung / Zusammenfassung (kleine Beispiele erlaubt)
 - Keine Übungsaufgaben
 - Tabellen (Chi-Quadrat, Normalverteilung)
 - Taschenrechner
 - Multiple-Choice (+ "Sicher"- Option, +1, 0 - +2, -2)
 
Vorlesung 1 - Einführung Experimentplanung / Statistik
Hypothese: kommt von "Unterstellung"
Verifikation: Formaler logischer Beweis (ist die Spezifikation richtig?)
Validierung: Prüfen des Modells (ist es im Wertebereich gültig?)
    Bsp: Ein künstlicher Dummy für Crash-Tests. Ist der Dummy eine realistische Abbildung?
- Richtiges falsch implementiert -> nicht validiert
 - 
Falsches richtig implementiert -> Spezifikation falsch - nicht verifiziert
 - 
Folie 17
Dieser Fehler ist zufällig Ein systematischer Fehler wäre zb. ein ungenaues Lineal, oder ein Messgerät falsch ablesen - 
Absoluter Fehler hat Masseinheit
 - Relativer Fehler ist der Bezug des Fehlers auf den gemessenen Wert
 
Vorlesung 2 - Statistische Grundbegriffe und Ablauf der statistischen Untersuchung
- Folie 3
Utilization: Verwendungsgrad der Maschine (0%-100%, bzw. 0 bis 1)
auch Blockierungs- bzw Wartewahrscheinlichkeit 
Grundgesamtheit: zb. alle Maschinen in einer Produktionskette
Merkmal: Information
Merkmalsträger: zb. Maschine mit diesem Merkmal
Merkmalswert: Wert der Messung
Nominalskala: Werte, die gleichbedeutend sind (zb. Geschlecht)
Ordinalskala: Werte mit Rang (zb. Schulnoten (=qualitative Merkmale))
Metrische Skala: Als reelle oder ganze Zahlen (diskret) abgetragen, immer quantitative Werte
- 
Folie 10:
Bsp. Temperatur: Celsius ist ein Intervall, "zufälliger" Nullpunkt.
Kelvin hat einen absoluten Nullpunkt -> Verhältnisskala - 
Folie 12:
Datenverarbeitung:- Sind die Daten korrekt, oder wurden grobe Fehler gemacht?
 - Einschränkung der Datenmengen
zb. Mittelwert berechnen
Intervalle festlegen 
 - 
Folie 13:
relative Häufigkeit ist auch die Wahrscheinlichkeit
Summe der relativen Häufigkeiten = 1 - 
Folie 14:
akkumulierte Häufigkeit: von kleinen nach grösseren Werten immer die Werte zusammen addieren - 
Fragen:
Konkretisierung des Ziels: Problem ermitteln, Ziel festlegen, Messungen einschränken 
Vorlesung 3 - Häufigkeitsverteilung
- Folie 5: Median
- Wenn Anzahl Merkmalswerte gerade, wird der Mittlerwert der beiden mittleren Werte genommen
 - Rechenansatz: Über Ähnlichkeit von kleinem Dreieck zum grossen Dreieck
 
 
Literatur
Bourier Kapitel 3.1 und 3.2
Vorlesung 4 - Zeitreihen, Regression, Korrelation
- 
Folie 5:
Gleitender Mittelwert:- Mittelwert der ersten 3 Werte: 5, 8, 7 = 6.66 -> bei 
t=2eintragen - Mittelwert Zahlen 2-4: 8 + 7 + 8 = 23/3 = 7.66 -> bei 
t = 3eintragen - Mittelwert Zahlen 3-5: 7 + 8 + 9 = 8 -> bei 
t = 4eintragen
... 
Je grösser das Messfenster (hier 3 Werte), desto mehr wird geglättet
 - Mittelwert der ersten 3 Werte: 5, 8, 7 = 6.66 -> bei 
 - 
Folie 6:
Eine Funktion durch die punktewolke legen (bei linearer Regression eine lineare Funktion)
Ziel: Einen funktionalen Zusammenhang der Messwerte herausfinden, dass man auch Zwischenwerte ungefähr bestimmen kann - 
Folie 13:
- Wenn beide Werte xi und yi über oder unter dem Mittelwert sind, gibt es eine positive Korrelation. Wenn nur einer davon unter dem Mittelwert ist, gibt es eine negative Korrelation
 - Bild unten rechts: vollkommen unkorreliert
 
 - 
Folie 15:
Wenn r = 0, heisst es nur, dass es keinen linearen Zusammenhang gibt - 
Folie 16
 
Es gibt aber trotzdem eine Korrelation, aber keine lineare!
Kontrollfragen:
- Scheinkorrelation: Korrelation, die aber keine ist ("Correlation doesnt equal causation")
- Gleitenden Durchschnitt: Glätten der Daten, um einen Trend zu erkennen
Vorlesung 5 - Wahrscheinlichkeit / Kombinatorik
- 
Folie 4:
2) Es gibt unendlich viele reelle Zahlen () in einem Intervall (kontinuierlich) - 
Folie 6:
Das Roulette bildet ein System mit 6 Ereignissen, jedes Ereignis ist eine Teilmenge von 
Vorlesung 6 - Zufallsvariable und Verteilungen
Kontrollfragen:
- Funktion von Folge zufälliger Werte
 - stetig: unendlich viele zwischenwerte
 - seed = startwert, Zahlen haben statistische Eigenschaften, sind reproduzierbar
 - Sequenzlänge: Anzahl der Zufallszahlen
 - Weil unterschiedliche Prozesse simuliert werden, die unterschiedlich verteilt sind
 - Ja, hat grosse Auswirkungen. Wenn Fehler in Datenanalyse geschehen, gibt es auch Fehler im Resultat
 
Literatur
Bourier 7.1.1 - 7.1.3, 7.2.1 - 7.2.3
Vorlesung 7 - Grundlagen schliessende Statistik
- Folie 4
- Schliessende Statistik: Man kennt die Realisierungen (durch Experiment), sucht aber die Verteilungsfunktion
 - Mit vielen Messungen nähert man sich charakteristischen Grössen an
 
 - Folie 5
- Charakteristische Grössen können errechnet werden. Ist das dann aber allgemeingültig?
 - Experimente sind nur Stichproben
 - Entscheidung durch Vergleich dieser errechneten Grössen und der Theorie
 
 - Folie 12
- t-Verteilung ist etwas "pessimistischer" als Normalverteilung
 
 - Folie 14
- Varianz: Wenn , wird die Varianz gegen 0. D.h wenn die Stichprobe die gesamte Grundmenge erfasst, ist die Varianz 0
 
 
Vorlesung 8 - schliessende Stat. & Schätzverfahren
Folien 7. Grundlagen der schliessenden Statistik
Siehe Handnotizen
Literatur
- Bourier Kapitel 8
 - Kommentierte Formelsammlung, Skripteserver
 
Folien 8. Schätzverfahren
Verfahren, wenn und unbekannt sind.
- Folie 5
- ist der Schätzwert
 - ist der richtige Wert
 
 - Folie 6
- Differenziere:
 
 
Vorlesung 9 - Schätzverfahren (2)
Geänderte Folien "8.Schätzverfahren+.pdf"
Siehe Handnotizen
Literatur
Bourier Kapitel 9
Vorlesung 10 - Testverfahren
Problem: Wenn ein zweites Experiment durchgeführt wird, sind die Ergebnisse dann tatsächlich besser? Sind sie signifikant besser?
- Verteilungs- bzw. Anpassungstest
- Bei Simulationen relevant, da die Zufallszahlen einer Verteilungsfunktion gehorchen sollen
 
 - Folie 5
- ist die Wahrscheinlichkeit, dass die Zahl innerhalb des Intervalls ist, bzw , dass sie ausserhalb ist
 
 - Fehlerarten
- Erste Art: Hypothese falscherweise ablehnen
 - Zweiter Art: Hypothese falscherweise annehmen
- Je näher Hypothese und wahrer Wert zusammen liegen, desto höher ist die Fehlerwahrscheinlichkeit
 
 
 
Siehe Handnotizen
- Eine Signifikanz feststellen
 - Nullhypothese: Annahme, die angenommen oder abgelehnt werden soll
 - Signifikanzzahl: Irrtumswahrscheinlichkeit. Bereich, in der wir die Hypothese an- oder ablehnen
 - 
Testentscheidung: Wenn wir Annahmebereich verlassen, wird sie abgelehnt, sonst angenommen
 - 
Fehlerarten: s. oben
 - Einseitiger Parametertest: Nur auf untere oder obere Grenze überprüfen
 - Gewisse Anzahl Stichproben nötig
 
Literatur
Bourier Kapitel 10
Vorlesung 11 - DoE Einführung
Übersicht der ganzen Zusammenhänge: siehe Handnotizen
--
Vorlesung 12 - DoE
Zum DoE kommen an der Prüfung nur Wissensfragen, keine Berechnungen