Wie funktioniert Machine Learning?
Erklärvideo: Grundideen Machine Learning
Warum sinnvolle Features wichtig sind …
Josh Gordon ist Entwickler bei Google AI und Dozent für Deep Learning an der Columbia University. Im folgenden Video erklärt er (auf Englisch) anhand einiger Beispiele, warum gute Features informativ, eigenständig und einfach zu verstehen sein sollen.
↔️ Transfer
Inwiefern ähneln sich die Grundideen des Machine Learning mit dem, was Psychologiestudierende in ihren Statistik oder Methoden-Vorlesungen bereits kennengerlernt haben.
💡 Erklärung
In der “psychologischen Statistik” versucht man
- den Einfluss unabhängiger Variablen
- auf abhängige Variablen
- unter Kontrolle von Störvariablen zu bestimmen.
So werden z.B. in einem Regressionsmodell schrittweise Prädiktoren hinzugefügt und überprüft, ob diese signifikant mehr Varianz des Kriteriums aufklären. Man spricht hierbei auch von der sog. “inkrementellen Validität”, also des von einem Prädiktor zusätzlich erklärten Varianzanteils eines Kriteriums nach Berücksichtigung anderer Prädiktoren.
Im Grunde beruhen die meisten Machine Learning Ansätze auf einem Regressionsmodell, also der unterschiedlich starken Gewichtung von Prädiktoren (“Features”) bei der Vorhersage eines Kriteriums (“Targets”). Je höher der eigenständige Varianzerklärungsanteil, desto besser sagt dieser Prädiktor das Kriterium vorher.
❓ Trick-Question
Warum? 😳
Durch das Verwenden von Regressionsmodellen oder Machine Learning Modellen ist noch kein Rückschluss auf die tatsächliche Ursache für das Auftreten einer bestimmten Krankheit oder eines bestimmten Verhaltens möglich. Die einzige Aussage ist, dass ein bestimmter Prädiktor (“Feature”) stark mit dem Kriterium (“Target”) zusammenhängt.
Dementsprechend sind mithilfe von Machine Learning sehr gute Prognosen möglich, aber eben kein Rückschluss auf die Wirkrichtung.
Wie in der Statistik gelernt, werden kausale Aussagen nur durch experimentelle Designs möglich, wenn also unabhängige Variablen manipuliert wurden und diese Manipulation zu einer Änderung in der abhängigen Variable geführt hat.