Wie funktioniert Machine Learning?

Erklärvideo: Grundideen Machine Learning

Warum sinnvolle Features wichtig sind …

Josh Gordon ist Entwickler bei Google AI und Dozent für Deep Learning an der Columbia University. Im folgenden Video erklärt er (auf Englisch) anhand einiger Beispiele, warum gute Features informativ, eigenständig und einfach zu verstehen sein sollen.

↔️ Transfer

Inwiefern ähneln sich die Grundideen des Machine Learning mit dem, was Psychologiestudierende in ihren Statistik oder Methoden-Vorlesungen bereits kennengerlernt haben.

--- shuffle_answers: false primaryColor: '#197980' secondaryColor: '#e8e8e8' --- # Die Input-Variablen oder Features entsprechen im psychologischen Umfeld den: - [x] unabhängigen Variablen (UVs) > Richtig. - [ ] abhängigen Variablen (AVs) - [ ] Störvariablen - [x] Prädiktoren (Regressionsanalyse) > Richtig. - [ ] Kriterium (Regressionsanalyse) # Die Output- oder Target-Variablen entsprechen im psychologischen Umfeld den: - [ ] unabhängigen Variablen (UVs) - [x] abhängigen Variablen (AVs) > Richtig. - [ ] Störvariablen - [ ] Prädiktoren (Regressionsanalyse) - [x] Kriterium (Regressionsanalyse) > Richtig.
💡 Erklärung

In der “psychologischen Statistik” versucht man

  • den Einfluss unabhängiger Variablen
  • auf abhängige Variablen
  • unter Kontrolle von Störvariablen zu bestimmen.

So werden z.B. in einem Regressionsmodell schrittweise Prädiktoren hinzugefügt und überprüft, ob diese signifikant mehr Varianz des Kriteriums aufklären. Man spricht hierbei auch von der sog. “inkrementellen Validität”, also des von einem Prädiktor zusätzlich erklärten Varianzanteils eines Kriteriums nach Berücksichtigung anderer Prädiktoren.

Im Grunde beruhen die meisten Machine Learning Ansätze auf einem Regressionsmodell, also der unterschiedlich starken Gewichtung von Prädiktoren (“Features”) bei der Vorhersage eines Kriteriums (“Targets”). Je höher der eigenständige Varianzerklärungsanteil, desto besser sagt dieser Prädiktor das Kriterium vorher.

❓ Trick-Question

--- shuffle_answers: true primaryColor: '#197980' secondaryColor: '#e8e8e8' --- # Wenn ich nun auf Basis von einem Set von Prädiktoren ("Features") eine Krankheit oder ein bestimmtes Verhalten relativ gut und genau vorhersagen kann, kenne ich dann also die Gründe für diese Krankheit / dieses Verhalten? - [x] Nein, man kann aus diesen Daten keine kausalen Schlüsse ziehen. > Richtig. - [ ] Ja, schließlich machen Machine Learning Modelle sehr treffende Prognosen.
Warum? 😳

Durch das Verwenden von Regressionsmodellen oder Machine Learning Modellen ist noch kein Rückschluss auf die tatsächliche Ursache für das Auftreten einer bestimmten Krankheit oder eines bestimmten Verhaltens möglich. Die einzige Aussage ist, dass ein bestimmter Prädiktor (“Feature”) stark mit dem Kriterium (“Target”) zusammenhängt.

Dementsprechend sind mithilfe von Machine Learning sehr gute Prognosen möglich, aber eben kein Rückschluss auf die Wirkrichtung.

Wie in der Statistik gelernt, werden kausale Aussagen nur durch experimentelle Designs möglich, wenn also unabhängige Variablen manipuliert wurden und diese Manipulation zu einer Änderung in der abhängigen Variable geführt hat.