Oftmals erweist sich bei der Aufstellung von Erklärungsmodellen die Auswahl der am besten geeigneten Spezifikation als nicht einfach. Im Regelfall stehen verschiedene Modellvarianten und Variablensätze zur Auswahl. Die Beurteilung, welche Kombination die beste Erklärungsgüte besitzt, ist dabei diffizil (Breiman und Spector 1992). In der Regel wird darauf vertraut, anhand der Residual-Methode den Datenfit der einzelnen Varianten zu beurteilen. Orientiert man sich dabei lediglich an dem Datenfit unter Benutzung eines einzelnen Datensatzes, so kann es zum so genannten „overfitting`` kommen. Dabei wird der Fehler des Modells systematisch unterschätzt. In Abbildung 34.1 wird dieses Phänomen grafisch dargestellt.
CITATION STYLE
Kuhlmann, J. (2009). Ausgewählte Verfahren der Holdout- und Kreuzvalidierung. In Methodik der empirischen Forschung (pp. 537–546). Gabler Verlag. https://doi.org/10.1007/978-3-322-96406-9_34
Mendeley helps you to discover research relevant for your work.