{"id":84,"date":"2020-10-16T17:06:18","date_gmt":"2020-10-16T15:06:18","guid":{"rendered":"http:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/"},"modified":"2025-08-07T14:46:53","modified_gmt":"2025-08-07T12:46:53","slug":"regression","status":"web-only","type":"chapter","link":"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/","title":{"rendered":"Regression"},"content":{"raw":"<h1>5.0 Einf\u00fchrung<\/h1>\r\n<div style=\"text-align: justify;\">Im vorangegangene Kapitel haben wir die lineare Korrelation kennen gelernt, die die Richtung und St\u00e4rke des Zusammenhangs zweier Variablen angibt. Mit der (bivariaten) linearen Regression l\u00e4sst sich <strong>eine Gleichung<\/strong> erstellen <strong>zur Vorhersage einer Variablen auf Basis einer anderen Variablen<\/strong>. H\u00e4ngen zwei Variablen zusammen (wie z.B. K\u00f6rpergr\u00f6\u00dfe und Schuhgr\u00f6\u00dfe), so ist es m\u00f6glich, eine Variable jeweils auf Basis der anderen vorherzusagen. Wenn wir also z.B. die K\u00f6rpergr\u00f6\u00dfe einer Person wissen, k\u00f6nnten wir mithilfe einer <strong>Regressionsgleichung<\/strong> vorhersagen, welche Schuhgr\u00f6\u00dfe eine Person haben k\u00f6nnte. Dabei wird jedoch schnell klar, dass diese Vorhersage immer fehlerbehaftet bzw. ungenau ist, da es sich nur um eine Sch\u00e4tzung auf Basis eines Modells handelt\u00a0 (Ausnahme: Korrelation von +\/- 1.0). Wie Sie sehen sind die Themen Korrelation und Regression eng verwandt. Die Korrelation besch\u00e4ftigt sich mit der Frage nach dem Zusammenhang zwischen zwei Variablen. Die Regression nutzt diesen Zusammenhang, um Werte der einen Variable auf Basis der Werte der anderen Variable vorherzusagen.<\/div>\r\n<div><img class=\"aligncenter wp-image-1213 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12.png\" alt=\"\" width=\"536\" height=\"296\" \/><\/div>\r\n<div><\/div>\r\n<div><a href=\"https:\/\/youtu.be\/ClSj7QShgdg\">Video 5.0 Regression | Einf\u00fchrung<\/a><\/div>\r\n<div>\r\n\r\n[embed]https:\/\/www.youtube.com\/embed\/ClSj7QShgdg[\/embed]\r\n\r\n<\/div>\r\n<h1>5.1 Die Regressionsgleichung<\/h1>\r\n<p style=\"text-align: justify;\">Wie wir schon im Kapitel 1 besprochen haben, wird die Vorhersagevariable als unabh\u00e4ngige Variable (UV) oder <strong>Pr\u00e4diktorvariable<\/strong> bezeichnet; die Variable, die vorhergesagt werden soll, als abh\u00e4ngige Variable (AV) oder <strong>Kriteriumsvariable<\/strong>. Im Folgenden werden wir uns mit der Regressionsgleichung der<strong> bivariaten Regression<\/strong> besch\u00e4ftigen, also f\u00fcr den Fall mit genau einer Vorhersagevariable und einer abh\u00e4ngigen Variable. Es gibt jedoch auch eine multiple Regression (mit mehreren Pr\u00e4diktoren), die Sie sp\u00e4ter kennenlernen werden. Wir besch\u00e4ftigen uns an dieser Stelle auch nur mit der g\u00e4ngigsten Form der Regression, der sogenannten <strong>linearen Regression<\/strong>.\u00a0 Diese erm\u00f6glicht eine Vorhersage unter der Annahme, dass es einen linearen, also gradlinigen Zusammenhang zwischen den Variablen gibt (Vgl. lineare Korrelation). Die Vorhersagefunktion sieht daher auch sehr einfach aus: <strong>Alle Vorhersagewerte liegen auf einer Geraden<\/strong>. Die Funktionsgleichung, die eine Gerade im zweidimensionalen Raum beschreibt kennen Sie sicherlich schon aus der Schulzeit. Dort wird diese meist mit <strong><em>f(x)= m \u22c5 x +b\u00a0<\/em><\/strong>beschrieben. Wobei <em><strong>m<\/strong><\/em> die Steigung ausdr\u00fcckt und <em><strong>b<\/strong><\/em> den Y-Achsenabschnitt (oder Ordinatenabschnitt). Die Regressionsgleichung ist nichts anderes als diese lineare Funktion angewendet auf zwei Variablen. Jedoch sind in der Statistik <strong>andere Abk\u00fcrzungen<\/strong> \u00fcblich. Der <strong>Y-Achsenabschnitt<\/strong> wird mit <em><strong>a<\/strong><\/em> bezeichnet, die <strong>Steigung<\/strong> wird mit <em><strong>b<\/strong><\/em> bezeichnet, und <strong>Regressionskoeffizient<\/strong> genannt.<\/p>\r\n<img class=\"aligncenter wp-image-1214 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5.png\" alt=\"\" width=\"520\" height=\"446\" \/>\r\n<p style=\"text-align: justify;\">Die Funktion soll in Abh\u00e4ngigkeit des Pr\u00e4diktors x, das Kriterium y vorhersagen (Daher steht vorne y). Da es sich hierbei um eine Sch\u00e4tzung handelt, die immer fehlerbehaftet ist, wird noch ein Fehlerterm (z.B. \u03b5) eingef\u00fcgt. Alternativ zu diesem Fehlerterm wird jedoch meist das y mit einem \"Dach\" versehen, was in der Statistik ausdr\u00fcckt, dass es sich um eine Sch\u00e4tzung handelt. Der Fehlerterm kann somit entfallen. In Summe lautet die Regressionsgleichung also:<\/p>\r\n<img class=\"aligncenter wp-image-1215 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5.png\" alt=\"\" width=\"858\" height=\"391\" \/>\r\n<p style=\"text-align: justify;\">Der Index <strong><em>i<\/em><\/strong> dr\u00fcckt aus, dass Sie mit dieser Gleichung beliebige Werte der einen Variable f\u00fcr die Vorhersage des dazu geh\u00f6rigen Werts der anderen Variable nutzen k\u00f6nnen. Im Falle des Eingangsbeispiels mit K\u00f6rpergr\u00f6\u00dfe und Schuhgr\u00f6\u00dfe bedeutet dies, dass wir die Schuhgr\u00f6\u00dfe einer Person <em><strong>i<\/strong><\/em> vorhersagen bzw. sch\u00e4tzen k\u00f6nnen, wenn wir die die K\u00f6rpergr\u00f6\u00dfe eben dieser Person <em><strong>i<\/strong><\/em> kennen.<\/p>\r\n&nbsp;\r\n<div class=\"textbox textbox--examples\"><header class=\"textbox__header\">\r\n<p class=\"textbox__title\">Beispiel Regressionsgleichung<\/p>\r\n\r\n<\/header>\r\n<div class=\"textbox__content\">\r\n<p style=\"text-align: justify;\">Unten abgebildet sehen Sie beispielhaft die grafische Darstellung einer Regressionsgleichung als Linie. Die Gleichung Y=0,5x + 1 beschreibt diese Linie eindeutig im zweidimensionalen Raum. Der Achsenabschnitt betr\u00e4gt 1, was bedeutet das die Gerade genau beim Wert 1 die Y-Achse scheidet. Die Steigung betr\u00e4gt 0,5, d.h. f\u00fcr jeweils eine \"Schritt\" auf der X-Achse, geht es nur einen halbe \"Schritt\" nach oben. Alle Vorhersage-Werte liegen genau auf dieser Geraden. So w\u00fcrden wir z.B. f\u00fcr den x-Wert 5 den y-Wert 3,5 vorhersagen. Dieser Wert l\u00e4sst sich einfach durch Einsetzen in die Regression errechnen: Y= 0,5 \u22c5 5 + 1 . Wir k\u00f6nnen nun also f\u00fcr beliebige x-Werte die korrespondierenden y-Werte vorhersagen.<\/p>\r\n<img class=\"aligncenter wp-image-1217 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7.png\" alt=\"\" width=\"626\" height=\"312\" \/>\r\n\r\n<\/div>\r\n<\/div>\r\n&nbsp;\r\n\r\n<a href=\"https:\/\/youtu.be\/3sm3FhHXL7g\">Video 5.1 Regression | Regressionsgleichung<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/3sm3FhHXL7g\r\n<div><\/div>\r\n<h1>5.2 Methode der kleinsten Quadrate<\/h1>\r\n<div style=\"text-align: justify;\">Wir wissen nun, wie die Regressionsgleichung funktioniert. Doch wie wird diese bestimmt? Wie komme ich denn nun auf genau die Gleichung, die m\u00f6glichst gut z.B. die Anzahl der verkauften Burger in einem unserer FiveProfs-Burgerl\u00e4den auf Basis der Tagestemperatur vorhersagt? <strong>Hierf\u00fcr ben\u00f6tigen wir grunds\u00e4tzlich zun\u00e4chst einmal Daten<\/strong>. In diesem Fall z.B. Verkaufszahlen von FiveProfs Burgern und den entsprechenden Durchschnittstemperaturen von einer gro\u00dfen Anzahl an Tagen. Das Resultat w\u00e4re zun\u00e4chst einmal eine Punktewolke, oder genauer gesagt ein Streudiagramm. Die Punkte repr\u00e4sentieren also jeweils die Werte von Tagen, bei denen wir beides wissen: die Anzahl der verkauften Burger und die durchschnittliche Tagestemperatur.<\/div>\r\n<div><img class=\"wp-image-1224 size-full aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9.png\" alt=\"\" width=\"403\" height=\"296\" \/><\/div>\r\n<div style=\"text-align: justify;\">Aus diesen Werten wollen wir nun die Gleichung ermitteln, die uns helfen soll, f\u00fcr weitere Tage, bei denen wir nur die Tagestemperatur kennen, den entsprechenden Burgerverkauf vorherzusagen. Hierf\u00fcr wollen wir nun in das Streudiagramm unsere Vorhersagelinie (<span style=\"font-size: 1.125rem;\">Regressionsgleichung) einzeichnen.\u00a0<\/span><\/div>\r\n<div><img class=\"aligncenter wp-image-1226 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7.png\" alt=\"\" width=\"403\" height=\"296\" \/><\/div>\r\n<div style=\"text-align: justify;\">Im obigen Beispiel wurde bereits eine solche <strong>Trend-Linie in die Punktwolke eingezeichnet<\/strong>. Diese Gerade entspricht der Regressionsgleichung und ist so eingezeichnet, dass der <strong>Abstand aller Punkte zur Linie minimal ist<\/strong>. Der Abstand der Werte zur Vorhersagelinie wird auch <strong>Residuum<\/strong> (Rest) genannt.<\/div>\r\n<div><img class=\"aligncenter wp-image-1239 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10.png\" alt=\"\" width=\"403\" height=\"296\" \/><\/div>\r\n<div style=\"text-align: justify;\">Wie man sieht, trifft diese Vorhersage f\u00fcr manche Werte sehr gut zu (geringer Abstand von der Geraden) f\u00fcr andere Werte ist die Vorhersage jedoch weniger gut (gro\u00dfer Abstand von der Geraden). <span style=\"font-size: 1.125rem;\"><span style=\"font-size: 1.125rem;\">Das Ziel ist dabei die Bestimmung einer Geraden, die den Gesamttrend aller Punkte am besten wiedergibt bzw. repr\u00e4sentiert. Dies kann man auch mathematisch machen, indem man die Gleichung sucht, bei der die Abweichungen aller Werte von der Geraden minimal sind. Hierbei werden die Abst\u00e4nde quadriert, um zu verhindern, dass sich die Abweichungen gegenseitig nivellieren. Das Ziel ist daher, <\/span><\/span><span style=\"font-size: 1.125rem;\">die Summe der quadrierten Abweichungen (Residuen) zu minimieren. Dies erkl\u00e4rt auch den Namen dieses Verfahrens, das n\u00e4mlich <\/span><strong>Methode<\/strong><span style=\"font-size: 1.125rem;\"><strong> der kleinsten Quadrate<\/strong> genannt wird.<\/span><\/div>\r\n<div><\/div>\r\n<div>\r\n<div><span style=\"font-size: 1.125rem;\">Wir wollen die Summe der quadrierten Abweichungen minimieren und setzen f\u00fcr den Vorhersagewert\u00a0<\/span><img class=\"alignnone wp-image-455\" style=\"font-size: 14pt;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/><span style=\"font-size: 1.125rem;\"> die obige Regressionsgleichung ein.<\/span><\/div>\r\n<div><img class=\"size-medium wp-image-1241 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-300x269.png\" alt=\"\" width=\"300\" height=\"269\" \/><\/div>\r\n<div>\u00dcber partielle Ableitungen nach a bzw. b (die wir an dieser Stelle nicht vertiefen) lassen sich allgemeine L\u00f6sungen finden, die diese Bedingung erf\u00fcllen:<\/div>\r\n<div><\/div>\r\n<div><img class=\"aligncenter wp-image-1242 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5.png\" alt=\"\" width=\"502\" height=\"291\" \/><\/div>\r\n<div><\/div>\r\n<div>\r\n<p style=\"text-align: justify;\">Bei b<sub>yx<\/sub> und a<sub>yx<\/sub> bezeichnet der erste Index (hier: y) die Variable, die vorhergesagt wird (Kriterium) und der zweite Index die Variable, die vorhersagt (Pr\u00e4diktor - hier: x). Um den Regressionskoeffizient <em><strong>b<\/strong><\/em> (die Steigung der Geraden) zu bestimmen, ben\u00f6tigen Sie also die Kovarianz der beiden Variablen, sowie die Varianz des Pr\u00e4diktors (x) . Danach k\u00f6nnen Sie durch die einfache Multiplikation mit dem Mittelwert des Pr\u00e4diktors (x) den Achsenabschnitt<strong><em> a<\/em><\/strong> bestimmen.<\/p>\r\n<p style=\"text-align: justify;\">In der Praxis werden Sie eher selten eine Regressionsgleichung von Hand bestimmen. Dennoch ist es hilfreich zu verstehen, wie diese Gerade berechnet wird, da dieses sogenannte Generelle Lineare Modell (GLM) die Basis f\u00fcr fast alle sp\u00e4teren statistischen Verfahren bildet.<\/p>\r\n&nbsp;\r\n<div>\r\n\r\n<a href=\"https:\/\/youtu.be\/lQU2tBGOgzo\">Video 5.2 Regression | Methode der kleinsten Quadrate<\/a>\r\n\r\n<\/div>\r\n<\/div>\r\n<div>\r\n\r\n[embed]https:\/\/www.youtube.com\/embed\/lQU2tBGOgzo[\/embed]\r\n\r\n<\/div>\r\n<\/div>\r\n<h1>5.3 Vorhersagen<\/h1>\r\n<p style=\"text-align: justify;\">Die Regressionsgleichung kann ganz praktisch dazu verwendet werden konkrete Vorhersagen zu machen. F\u00fcr die Vorhersage von Burgerverk\u00e4ufen in einer unserer FiveProfs-Filialen auf Basis der Tagestemperatur lautet die Gleichung <img class=\"alignnone wp-image-455\" style=\"font-size: 1em; font-weight: lighter;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/> = 775 - 13,75 \u22c5 x<sub>i<\/sub> . Hiermit k\u00f6nnen wir nun f\u00fcr eine beliebige Tagestemperatur die Burgerverk\u00e4ufe in unserer Filiale vorhersagen. Wenn wir z.B. eine Temperatur von 20\u00b0C einsetzen, erhalten wir einen Vorhersagewert von 500 Burgern, die in unserer Filiale verkauft werden (Berechnung: 775 - 13,75 \u22c5 20).<\/p>\r\n<img class=\"aligncenter wp-image-1243 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7.png\" alt=\"\" width=\"403\" height=\"296\" \/>\r\n<p style=\"text-align: justify;\">Die Vorhersage muss jedoch nicht zwangl\u00e4ufig mit der Realit\u00e4t \u00fcbereinstimmen. In der Grafik ist deutlich erkennbar, dass viele Punkte leicht \u00fcber oder unter der Vorhersagegeraden liegen - daher sprechen wir immer von einer Sch\u00e4tzung. Diese Sch\u00e4tzung kann verbessert werden in dem man mehr Daten aufnimmt, also die Gleichung auf Basis von mehr Tagen (bzw. in anderen F\u00e4llen: Personen) errechnet. Eine weitere M\u00f6glichkeit besteht darin, weitere Pr\u00e4diktoren (wie hier z.B. die Regenwahrscheinlichkeit) mit aufzunehmen. Dazu werden wir an sp\u00e4terer Stelle kommen. Was wir jedoch schon jetzt ben\u00f6tigen, ist ein Ma\u00df daf\u00fcr, wie gut unsere Sch\u00e4tzung ist und genau damit m\u00f6chten wir uns - nach dem n\u00e4chsten Beispiel - besch\u00e4ftigen.<\/p>\r\n<a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" \/><\/a>\r\n<div class=\"textbox textbox--examples\"><header class=\"textbox__header\">\r\n<p class=\"textbox__title\">Beispiel Kreuzfahrtschiffe<\/p>\r\n\r\n<\/header>\r\n<div class=\"textbox__content\">\r\n<p style=\"text-align: justify;\">In einer Stadt soll ein neuer Liegeplatz f\u00fcr Kreuzfahrtschiffe gebaut werden. Die maximal Breite der Schiffe, die die Hafeneinfahrt passieren k\u00f6nnen betr\u00e4gt 35 Meter. Nun wollen Sie herausfinden, wie lang der geplante Liegeplatz werden sollte, damit er ein \u00fcbliches Kreuzfahrtschiff aufnehmen kann. Wir wollen also auf Basis der Breite von 35 Metern (Pr\u00e4diktor) die voraussichtliche L\u00e4nge der Schiffe vorhersagen (Kriterium). Hierf\u00fcr m\u00fcssen Sie zun\u00e4chst Daten von Kreuzfahrtschiffen sammeln. Grunds\u00e4tzlich gilt: Je mehr Daten, desto besser die Vorhersage. In diesem Beispiel haben wir jedoch nur 11 Kreuzfahrtschiffe ber\u00fccksichtigt. Im hier abgebildeten Streudiagramm ist bereits die Regressionsgerade eingezeichnet.<\/p>\r\n<img class=\"alignnone wp-image-73 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt.png\" alt=\"\" width=\"751\" height=\"451\" \/>\r\n<p style=\"text-align: justify;\">Wie man sieht gibt es einen (nicht-perfekten) Zusammenhang zwischen der L\u00e4nge und der Breite der Kreuzfahrtschiffe. Um die Regressionsgerade zu bestimmen ben\u00f6tigen wir die Kovarianz der beiden Variablen cov(<sub>x,y<\/sub>) = 227,51, sowie die Varianz des Pr\u00e4diktors s<sup>2<\/sup><sub>x<\/sub>= 22,74. Hieraus k\u00f6nnen wir die Regressionsgleichung bestimmen:<\/p>\r\n<img class=\"alignnone wp-image-455\" style=\"font-size: 1em; font-weight: lighter;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/>\u00a0= -54,63 + 10 \u22c5 x<sub>i<\/sub>\r\n\r\nMit dieser Gleichung k\u00f6nnen wir nun dem Planer der Hafenanlage helfen. Hierzu setzen wir f\u00fcr x=35 ein und erhalten <img class=\"alignnone wp-image-464\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert2.png\" alt=\"\" width=\"13\" height=\"21\" \/>= -54,63 + 10 \u22c5 35 = 295,37\r\n<p style=\"text-align: justify;\">Die vorhergesagte L\u00e4nge f\u00fcr ein Kreuzfahrtschiff mit 35 Meter Breite betr\u00e4gt also rund 295 Meter. Hierbei sollten sie jedoch beachten, dass es sich um eine Sch\u00e4tzung handelt, von der einzelne Kreuzfahrtschiffe in der Realit\u00e4t abweichen (siehe Abst\u00e4nde der Punkte von der Linie). Daher ist dem Hafenplaner gut daran geraten einen gewissen Sicherheitsaufschlag mit einzuplanen. Wie man bestimmen kann, wie genau eine solche Vorhersage ist, wollen wir im Folgenden betrachten.<\/p>\r\n\r\n<\/div>\r\n<\/div>\r\n<div><\/div>\r\n<div><a href=\"https:\/\/youtu.be\/eebTDonbSDs\">Video 5.3. Regression | Vorhersagen<\/a><\/div>\r\n<div>\r\n\r\n[embed]https:\/\/www.youtube.com\/embed\/eebTDonbSDs[\/embed]\r\n\r\n<\/div>\r\n<h1>5.4 Vorhersageg\u00fcte<\/h1>\r\n<p style=\"text-align: justify;\">Wir haben nun eine Methode entwickelt, mit der wir auf Basis von Daten Vorhersagen ableiten k\u00f6nnen. Wie wir gesehen haben, sind diese Vorhersagen jedoch nur Sch\u00e4tzungen und weichen manchmal mehr und manchmal weniger stark von der Realit\u00e4t ab.\u00a0 Wenn Sie die Folgenden zwei Streudiagramme betrachten, wird dies nochmal klarer: Beide haben eine lineare Regressionsgerade auf der die Vorhersagewerte liegen. Jedoch sind im Fall Burgerverk\u00e4ufe und Tagestemperatur die echten Werte (rote Punkte) deutlich n\u00e4her an der Geraden als in der rechten Grafik, in welcher die Burgerverk\u00e4ufe auf Basis der Luftfeuchtigkeit vorausgesagt werden. Das bedeutet, dass die Vorhersage f\u00fcr die Burgerverk\u00e4ufe mit der Tagestemperatur als Pr\u00e4diktor deutlich besser funktioniert als mit der Luftfeuchtigkeit als Pr\u00e4diktor.<\/p>\r\n<img class=\"aligncenter wp-image-1245 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7.png\" alt=\"\" width=\"780\" height=\"303\" \/>\r\n<p style=\"text-align: justify;\">Wir k\u00f6nnen also \u00fcber das Streudiagramm schon sehr leicht optisch sehen, wie gut eine Vorhersage funktioniert. Genau an dieser Stelle wollen wir nun weitermachen und Kennwerte entwickeln, die uns objektiv sagen, wie gut eine Vorhersage ist. Hierbei gehen wir zun\u00e4chst genau so vor, dass wir die Abweichungen der echten Werte (auch beobachtete Werte) von der Geraden (vorhergesagte Werte) betrachten. Diese Abweichungen nennen sich <strong>Regressionsresiduen<\/strong> (<em><strong>y<sup>*<\/sup><sub>i<\/sub><\/strong><\/em>). Das Ausma\u00df der Abweichungen ist ein Indikator daf\u00fcr, wie genau die Regression in ihrer Vorhersage ist. Die Regressionsresiduen selbst sind jedoch nur schwer interpretierbar, da diese wieder von der Skala der Variablen abh\u00e4ngen (Anzahl der verkauften Burger hat automatisch gr\u00f6\u00dfere Residuuen als die Tagestemperatur in \u00b0C). Die L\u00f6sung: Wir setzen die Summe der Residuuen ins Verh\u00e4ltnis zu einem anderen Wert. Doch welchem?<\/p>\r\nHierf\u00fcr wollen wir zun\u00e4chst den Begriff der Varianz erweitern. Wir haben bisher gelernt, dass die Varianz die (quadrierte) Summe der Abweichung aller Werte von Mittelwert ist.\u00a0 Dies ist die im untenstehenden Bild links gezeigte Gesamtvarianz. Die Gesamtvarianz kann im Falle der Regression in zwei Komponenten geteilt werden: In die Regressionsvarianz und die Fehlervarianz. Die Regressionsvarianz dr\u00fcck aus, welche Abweichungen vom Mittelwert, das Regressionsmodell vorhersagt. Die Fehlervarianz dr\u00fcckt aus, wie die tats\u00e4chlichen Werte von dieser Vorhersage abweichen (daher nicht-erkl\u00e4rte Varianz). Hier nochmal in der \u00dcbersicht:\r\n<ul>\r\n \t<li>\u00a0<img class=\"alignnone wp-image-493\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_ges.png\" alt=\"\" width=\"20\" height=\"30\" \/>Gesamtvarianz: Quadrierte Abweichung aller Werte vom Mittelwert (unten gelb dargestellt)<\/li>\r\n \t<li>\u00a0<img class=\"alignnone wp-image-492\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_reg.png\" alt=\"\" width=\"20\" height=\"25\" \/>Regressionsvarianz (Auch erkl\u00e4rte Varianz): Quadrierte Abweichung der vorhergesagten Werte vom Mittelwert (unten orange dargestellt)<\/li>\r\n \t<li><img class=\"alignnone wp-image-491\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_fehler.png\" alt=\"\" width=\"20\" height=\"24\" \/>Fehlervarianz (Auch nicht-erkl\u00e4rte Varianz): Quadrierte Abweichung aller Werte von vorhergesagtem Wert (unten dunkelrot dargestellt)<\/li>\r\n<\/ul>\r\n<img class=\"aligncenter wp-image-1246 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5.png\" alt=\"\" width=\"1030\" height=\"421\" \/>\r\n\r\n<a href=\"https:\/\/youtu.be\/B6kscLpZoA4\">Video 5.4 Regression | Modellg\u00fcte<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/B6kscLpZoA4\r\n\r\nGrunds\u00e4tzlich gilt, dass ein Regressionsmodell umso besser ist, je kleiner die Fehlervarianz im Vergleich zur vorhergesagten Varianz ist. Dies wird als <strong>F-Statistik<\/strong> bezeichnet und wird errechnet, in dem man die durch das Modell erkl\u00e4rte Varianz (Regressionsvarianz) ins Verh\u00e4ltnis zur nicht erkl\u00e4rten Varianz (Fehlervarianz) stellt. Dieser Quotient gibt damit an, um wie viel sich die Vorhersageg\u00fcte durch mein Modell verbessert, im Verh\u00e4ltnis zur noch nicht erkl\u00e4rten Varianz. Anders ausgedr\u00fcckt zeigt dieser Wert an, ob sich durch das Regressionsmodell die Vorhersage verbessert im Vergleich zur Vorhersage nur durch den Mittelwert. Ein gutes Modell sollte daher immer mindestens einen<strong> F-Wert &gt;1<\/strong> haben.\r\n\r\n<img class=\"aligncenter wp-image-1248 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5.png\" alt=\"\" width=\"787\" height=\"134\" \/>\r\n<div>Die absolute Gr\u00f6\u00dfe des F-Werts ist jedoch nur im Vergleich zwischen mehreren Regressionsmodellen interpretierbar (Ein Modell mit F-Wert 8 macht bessere Vorhersagen als ein Modell mit F-Wert 4). Es gibt jedoch auch ein G\u00fctema\u00df, welches direkt im Hinblick auf die Gr\u00f6\u00dfe interpretierbar ist: Der sogenannte <strong>Determinationskoeffizient (R<sup>2<\/sup>)<\/strong>. Diesen erh\u00e4lt man in dem die Regressionsvarianz durch die Gesamtvarianz geteilt wird. Der Quotient dr\u00fcckt damit den Varianzanteil der abh\u00e4ngigen Variablen aus, der mit der unabh\u00e4ngigen vorhergesagt bzw. erkl\u00e4rt werden kann. Der Vorteil: Das Ergebnis ist ein Prozentwert, der ausdr\u00fcckt wieviel Prozent der Varianz des Kriteriums durch den Pr\u00e4diktor erkl\u00e4rt wird. Aufgrund dieser recht anschaulichen Interpretierbarkeit ist dieser Wert auch das beliebteste G\u00fctema\u00df in der wissenschaftlichen Praxis. Der Determinationskoeffizient entspricht im Fall der bivariaten Regression dem Quadrat des Korrelationskoeffizienten. Wir h\u00e4tten diesen also auch einfacher berechnen k\u00f6nnen indem wir einfach den Korrelationskoeffizienten <em><strong>r<\/strong><\/em> quadrieren. Dies erkl\u00e4rt auch die Abk\u00fcrzung <em><strong>R<sup>2<\/sup><\/strong><\/em>.<\/div>\r\n<img class=\"aligncenter wp-image-1249 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5.png\" alt=\"\" width=\"865\" height=\"219\" \/>\r\n<div class=\"textbox textbox--examples\"><header class=\"textbox__header\">\r\n<p class=\"textbox__title\">Beispiel Interpretation Regression und G\u00fctema\u00dfe<\/p>\r\n\r\n<\/header>\r\n<div class=\"textbox__content\">\r\n\r\nEin Dozent hat ein Regressionsmodell gebaut, welches die Note in der Statistik-Klausur vorhersagt und nutz daf\u00fcr als Pr\u00e4diktor die Anzahl der Stunden, die die Person\u00a0 jeweils auf die Klausur gelernt hat. Als Ergebnis erh\u00e4lt der Dozent folgende Regressionsgleichung:\r\n\r\n<img class=\"alignnone wp-image-501\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert2-1.png\" alt=\"\" width=\"14\" height=\"22\" \/>i= 4,5 + (-0,05 \u22c5x<sub>i<\/sub>)\r\n\r\nZus\u00e4tzlich erh\u00e4lt er folgende G\u00fctema\u00dfe:\r\n\r\n<em><strong>R<sup>2<\/sup><\/strong><\/em>= 0,4 und<em><strong> F<\/strong> <\/em>= 15\r\n\r\nZun\u00e4chst k\u00f6nnen wir in diesem Fall die Regressionsgleichung auch inhaltlich interpretieren. Der Y-Achsenabschnitt <em><strong>a<\/strong><\/em> betr\u00e4gt 4,5, was bedeutet, dass der Vorhersagewert f\u00fcr x=0 bei 4,5 liegt. Anders ausgedr\u00fcckt: Ein Studierender, der 0 Stunden Vorbereitung f\u00fcr die Klausur investiert muss mit einer durchschnittlichen Note 4,5 rechnen (Nicht immer l\u00e4sst sich der Y-Achsenabschnitt so sinnvoll interpretieren wie hier). Auch <em><strong>b<\/strong><\/em> l\u00e4sst sich inhaltlich interpretieren. Pro Stunde Vorbereitungszeit sinkt die Note um 0,05. Das bedeutet zum Beispiel, dass das Model f\u00fcr eine Person mit 30h Vorbereitung, eine Note 3 vorhersagt.\r\n\r\nDoch nun ist nat\u00fcrlich noch die Frage, wie gut diese Vorhersage ist. Der F-Wert liegt \u00fcber 1 und wir k\u00f6nnen also sagen, dass das Modell eine Verbesserung der Vorhersage erm\u00f6glicht, im Vergleich zur Vorhersage durch den Mittelwert (wenn ich also f\u00fcr jeden Studierenden den Klassemittelwert als Vorhersagegr\u00f6\u00dfe nehmen w\u00fcrde). Der <em><strong>R<sup>2<\/sup><\/strong><\/em> Wert gibt weiter an , dass in diesem Fall 40% (0,4) der Varianz der abh\u00e4ngigen Variable durch die unabh\u00e4ngige Variable erkl\u00e4rt werden. Auf das Beispiel angewendet besagt dies, dass wir mit diesem Modell 40% der Schwankung in der Statistik-Klausurnote erkl\u00e4ren k\u00f6nnen. Die \u00fcbrigen 60% sind nicht aufgekl\u00e4rte Varianz und werden also durch weitere (nicht im Modell vorhandene) Faktoren, wie z.B. Intelligenz beeinflusst.\r\n\r\n<\/div>\r\n<\/div>\r\n<a href=\"https:\/\/youtu.be\/RgMbiROPozY\">Video 5.5 Regression | Determinationskoeffizient und F-Statistik<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/RgMbiROPozY\r\n<h1>5.5 Voraussetzung f\u00fcr die lineare Regression<\/h1>\r\nUm eine lineare Regression berechnen zu k\u00f6nnen, m\u00fcssen eine Reihe von Voraussetzungen erf\u00fcllt sein. Diesen wollen wir uns nun kurz widmen:\r\n<ul>\r\n \t<li>Der Pr\u00e4diktor muss intervallskaliert sein. Ausnahme: dichotom nominalskalierte Variablen mit einer sogenannten Dummy-Codierung, also nur den Auspr\u00e4gungen \"0\" und \"1\", k\u00f6nnen ebenfalls als Pr\u00e4diktor genutzt werden<\/li>\r\n \t<li>Das Kriterium muss intervallskaliert sein. F\u00fcr andere Skalenniveaus gibt es eigene Verfahren (z.B. ordinale, multinominale, logistische Regression)<\/li>\r\n \t<li>Der Zusammenhang der Variablen muss theoretisch linear sein. Hierf\u00fcr hilft es das Streudiagramm zu betrachten. F\u00fcr andere Zusammenh\u00e4nge gibt es nicht-lineare Regressionsmodelle (z.B. quadratische Regression)<\/li>\r\n \t<li>Es sollten m\u00f6glichst wenig Ausreiser in den Daten sein, da diese einen gro\u00dfen Einfluss auf die Vorhersageg\u00fcte haben k\u00f6nnen. Auch hier hilft es das Streudiagramm zu betrachten.<\/li>\r\n<\/ul>\r\n<div class=\"textbox textbox--key-takeaways\"><header class=\"textbox__header\">\r\n<p class=\"textbox__title\">Expertenwissen: Regression in der Inferenzstatistik<\/p>\r\n\r\n<\/header>\r\n<div class=\"textbox__content\">\r\n\r\nF\u00fcr die Anwendung der Regression in der Inferenzstatistik gibt es noch weitere Voraussetzungen, die wir sp\u00e4ter beim Thema der multiplen Regression vertiefen werden. Diese sind:\r\n<ul>\r\n \t<li>Die Einzelwerte verschiedener Merkmalstr\u00e4ger m\u00fcssen voneinander unabh\u00e4ngig zustande gekommen sein<\/li>\r\n \t<li>Residuen d\u00fcrfen nicht korrelieren<\/li>\r\n \t<li>Die Residuen sollen normalverteilt sein<\/li>\r\n \t<li>Homoskedastizit\u00e4t: Streuungen der zu einem x-Wert geh\u00f6renden y-Werte m\u00fcssen \u00fcber den ganzen Wertebereich von x homogen sein<\/li>\r\n<\/ul>\r\n<\/div>\r\n<\/div>\r\n&nbsp;\r\n\r\n<a href=\"https:\/\/youtu.be\/7X9ultpOaQE\">Video 5.6 Regression | Vorraussetzungen<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/7X9ultpOaQE\r\n<h1>5.6 Standardisierung der Regressionsgeraden<\/h1>\r\nWir k\u00f6nnen nun mehrere Regressionsmodelle im Hinblick auf die Vorhersageg\u00fcte vergleichen. Wollen wir jedoch den Regressionskoeffizienten b von mehreren Regressionsmodellen vergleichen, haben wir ein Problem: Das Gewicht b ist nicht unabh\u00e4ngig von der entsprechenden Skalierung zu interpretieren, d.h. Gewichte verschiedener Regressionsgleichungen k\u00f6nnen nicht miteinander verglichen werden. So f\u00fchrt zum Beispiel die K\u00f6rpergr\u00f6\u00dfe in Zentimetern als Pr\u00e4diktor zu einem gr\u00f6\u00dferen <em><strong>b<\/strong><\/em> als die K\u00f6rpergr\u00f6\u00dfe in Metern. Daher spricht man auch oft vom unstandardisierten Regressionsgewicht <em><strong>b<\/strong><\/em>. \u00dcber Standardisierung an den Standardabweichungen werden die Gewichte miteinander vergleichbar. Der standardisierte Regressionskoeffizient <strong>\ud835\udefd<\/strong> (<strong>\ud835\udefd<\/strong><em><strong>-Gewicht<\/strong><\/em>) ist im Falle der bivariaten Regression identisch mit der Produkt-Moment-Korrelation r, d.h. kann Werte zwischen -1 bis +1 annehmen. Die Standardisierung erfolgt wieder an den Standardabweichungen beider Variablen, wie folgt:\r\n\r\n<img class=\"aligncenter wp-image-1250 size-large\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-1024x176.png\" alt=\"\" width=\"1024\" height=\"176\" \/>\r\n\r\nDas Ergebnis dieser Gleichung sollte Ihnen bekannt vorkommen. Es entspricht der Formel f\u00fcr die Produkt-Moment-Korrelation. Dies zeigt auf mathematischem Wege die Verwandtschaft von Korrelation und Regression.\r\n\r\n<a href=\"https:\/\/youtu.be\/KsYtDe16Cps\">Video 5.8 Regression | Standardisiertes Regressionmodell<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/KsYtDe16Cps\r\n\r\nMit der Standardisierung lassen sich aber auch spannende Praxisprobleme l\u00f6sen. Daher wollen wir uns im folgenden Kapitel mit einer besonders n\u00fctzlichen Form der Standardisierung, der sog. Z-Transformation besch\u00e4ftigen.\r\n<h1>5.7 Regression mit Jamovi<\/h1>\r\nRegressionsmodelle lassen sich in Jamovi einfach erstellen. Das entsprechende Men\u00fc befindet sich unter:\r\n\r\n<em><strong>Analysen &gt; Regression &gt; Lineare Regression<\/strong><\/em>\r\n\r\nHier wird die abh\u00e4ngige Variable (Kriterium) in das Feld \"Abh\u00e4ngige Variable\" eingetragen, w\u00e4hrend die unabh\u00e4ngige Variable (Pr\u00e4diktor) in das Feld \"Kovariaten\" gezogen wird. Weitere Einstellungen sind m\u00f6glich, aber f\u00fcr ein einfaches Modell nicht notwendig.\r\n\r\nDie Ausgabe enth\u00e4lt die Regressionskoeffizienten, die zur Aufstellung der Regressionsgleichung ben\u00f6tigt werden. Zudem wird das G\u00fctema\u00dfe R\u00b2 ausgegeben, was eine Einsch\u00e4tzung der Modellg\u00fcte erm\u00f6glicht. Wer zus\u00e4tzlich gerne die die F-Statistik haben m\u00f6chte muss unter \"Modellkoeffizienten\" auf \"ANOVA-Test\" klicken.\r\n\r\nVor der Interpretation eines Regressionsmodells sollte \u00fcberpr\u00fcft werden, ob ein linearer Zusammenhang zwischen den Variablen besteht. Dies l\u00e4sst sich mit einem Streudiagramm visualisieren, das \u00fcber\r\n\r\n<em><strong>Analysen &gt; Erforschung &gt; Streudiagramm<\/strong><\/em>\r\n\r\nerstellt werden kann. Mit einem klick auf \"Linear\" kann auch eine Regressionsgerade hinzugef\u00fcgt werden, die der Regressionsgleichung oben entspricht.\r\n\r\nBeides wird im folgenden Video gezeigt.\r\n\r\nhttps:\/\/youtu.be\/k5dzhf1R9vw\r\n<h1>5.8 Regression mit SPSS<\/h1>\r\n<p style=\"text-align: justify;\">Regressionsmodelle lassen sich in SPSS mit wenigen Klicks erstellen, jedoch ist die Interpretation der Ausgabe nicht ganz einfach. Zur Erstellung eines Regressionsmodells gibt es in SPSS folgendes Men\u00fc:<\/p>\r\n<p style=\"text-align: justify;\">Analysieren &gt; Regression &gt; Linear.<\/p>\r\n<p style=\"text-align: justify;\">Hier wird zun\u00e4chst die abh\u00e4ngige Variable eingetragen (Kriterium, also die Variable die wir vorhersagen wollen) und dann die unabh\u00e4ngige Variable (Pr\u00e4diktor, die Variable, die wir zur Vorhersage nutzen). Das Men\u00fc bietet viele weitere Einstellung, die aber f\u00fcr ein einfaches Regressionsmodell nicht notwendig sind. Die resultierende Ausgabe gibt uns die Regressionskoeffizienten, also die Werte, die wir ben\u00f6tigen um die Regressionsgleichung aufzustellen. \u00dcberdies werden standardm\u00e4\u00dfig die G\u00fctema\u00dfe R<sup>2<\/sup> und F-Statistik mit ausgegeben, die es uns erlauben zu beurteilen, wie gut das Modell Vorhersagen macht. Im Folgenden Video wird dies Schritt f\u00fcr Schritt erkl\u00e4rt:<\/p>\r\n<a href=\"https:\/\/youtu.be\/nyrRMyj0QMU\">5.9 Regressionsmodelle mit SPSS erstellen<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/nyrRMyj0QMU\r\n<p style=\"text-align: justify;\">Wie\u00a0 in den vorigen Kapiteln besprochen setzt die Berechnung eines Regressionsmodells voraus, dass auch wirklich ein linearer Zusammenhang zwischen den Variablen besteht. Daher sollten zur Interpretation eines Regressionsmodell die Daten immer auch in grafischer Form mit Hilfe eines Streudiagramms betrachtete werden. In SPSS bieten Streudiagramme zudem auch die M\u00f6glichkeit, direkt eine Regressionsgrade einzuzeichnen, sowie die Regressionsgleichung und das G\u00fctema\u00df R<sup>2<\/sup> auszugeben. Wie dies funktioniert, wird im n\u00e4chsten Video besprochen:<\/p>\r\n<a href=\"https:\/\/youtu.be\/L6uHFxssky8\">5.10 Streudiagramm mit Regressionsgerade in SPSS<\/a>\r\n\r\nhttps:\/\/www.youtube.com\/embed\/L6uHFxssky8\r\n<h1>5.9 \u00dcbungsfragen<\/h1>\r\nBei den folgenden Aufgaben k\u00f6nnen Sie Ihr theoretisches Verst\u00e4ndnis unter Beweis stellen. Auf den Karteikarten sind jeweils auf der Vorderseite die Frage und auf der R\u00fcckseite die Antwort dargestellt. Viel Erfolg bei der Bearbeitung!\r\n\r\n[h5p id=\"57\"]\r\n\r\n[h5p id=\"86\"]\r\n\r\n[h5p id=\"153\"]\r\n\r\n[h5p id=\"154\"]\r\n\r\n&nbsp;\r\n\r\nIn diesem Teil sollen verschiedene Aussagen auf ihren Wahrheitsgehalt gepr\u00fcft werden. In Form von Multiple Choice Aufgaben soll f\u00fcr jede Aussage gepr\u00fcft werden, ob diese stimmt oder nicht.\u00a0Wenn die Aussage richtig ist, klicke auf das Quadrat am Anfang der jeweiligen Aussage. Viel Erfolg!\r\n\r\n&nbsp;\r\n\r\n[h5p id=\"19\"]\r\n\r\n[h5p id=\"20\"]\r\n\r\n[h5p id=\"88\"]\r\n<h1>5.10 \u00dcbungsaufgaben<\/h1>\r\n<div><\/div>\r\n<div><\/div>\r\n<div>Wir haben ein Regressionsmodell erstellt um den Umsatz je Burger-Filiale aus der Anzahl der Mitarbeiter zu prognostizieren. Unten sehen Sie zun\u00e4chst das Streudiagramm mit eingezeichneter Regressionsgrade. Lesen Sie hieraus zun\u00e4chst grafisch ab: Wie viel Umsatz erwarten Sie in einer Filiale mit 10 Mitarbeitern, wie viel in einer Filiale mit 16 Mitarbeitern?<\/div>\r\n<div><\/div>\r\n<div>[h5p id=\"91\"]<\/div>\r\n<div><\/div>\r\n<div>Wir haben nun in SPSS die Regressionsgrade berechnet und wollen zun\u00e4chst die Modellg\u00fcte beurteilen. In wie fern ist das Modell aus Ihrer Sicht geeigent den Filialumsatz vorherzusagen?<\/div>\r\n<div><\/div>\r\n<div>[h5p id=\"92\"]<\/div>\r\n<div><\/div>\r\n<div>Im letzten Schritt wollen wir nun die Regressionsgleichung aufstellen, bringen Sie hierzu die notwendigen Koeffizienten aus dem Output unten in die Form der Regressionsgleichung und klicken Sie f\u00fcr die finale Regressionsgleichung auf die Karteikarte unten.<\/div>\r\n<div><\/div>\r\n<div>[h5p id=\"93\"]<\/div>\r\n<div><\/div>\r\n<div>[h5p id=\"94\"]<\/div>\r\n<a href=\"https:\/\/open.spotify.com\/show\/5ro31tpkiOMYJQwprTARqG?si=qsUsnFtWSXSYJELIv0sPHA\" target=\"_blank\" rel=\"noopener\"><img class=\"alignnone size-full wp-image-1877\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt.png\" alt=\"\" width=\"985\" height=\"286\" \/><\/a>","rendered":"<h1>5.0 Einf\u00fchrung<\/h1>\n<div style=\"text-align: justify;\">Im vorangegangene Kapitel haben wir die lineare Korrelation kennen gelernt, die die Richtung und St\u00e4rke des Zusammenhangs zweier Variablen angibt. Mit der (bivariaten) linearen Regression l\u00e4sst sich <strong>eine Gleichung<\/strong> erstellen <strong>zur Vorhersage einer Variablen auf Basis einer anderen Variablen<\/strong>. H\u00e4ngen zwei Variablen zusammen (wie z.B. K\u00f6rpergr\u00f6\u00dfe und Schuhgr\u00f6\u00dfe), so ist es m\u00f6glich, eine Variable jeweils auf Basis der anderen vorherzusagen. Wenn wir also z.B. die K\u00f6rpergr\u00f6\u00dfe einer Person wissen, k\u00f6nnten wir mithilfe einer <strong>Regressionsgleichung<\/strong> vorhersagen, welche Schuhgr\u00f6\u00dfe eine Person haben k\u00f6nnte. Dabei wird jedoch schnell klar, dass diese Vorhersage immer fehlerbehaftet bzw. ungenau ist, da es sich nur um eine Sch\u00e4tzung auf Basis eines Modells handelt\u00a0 (Ausnahme: Korrelation von +\/- 1.0). Wie Sie sehen sind die Themen Korrelation und Regression eng verwandt. Die Korrelation besch\u00e4ftigt sich mit der Frage nach dem Zusammenhang zwischen zwei Variablen. Die Regression nutzt diesen Zusammenhang, um Werte der einen Variable auf Basis der Werte der anderen Variable vorherzusagen.<\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1213\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12.png\" alt=\"\" width=\"536\" height=\"296\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12.png 929w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12-300x166.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12-768x424.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12-65x36.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12-225x124.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild1-12-350x193.png 350w\" sizes=\"(max-width: 536px) 100vw, 536px\" \/><\/div>\n<div><\/div>\n<div><a href=\"https:\/\/youtu.be\/ClSj7QShgdg\">Video 5.0 Regression | Einf\u00fchrung<\/a><\/div>\n<div>\n<p><iframe loading=\"lazy\" title=\"5.0 Regression | Einf\u00fchrung\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/ClSj7QShgdg?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<\/div>\n<h1>5.1 Die Regressionsgleichung<\/h1>\n<p style=\"text-align: justify;\">Wie wir schon im Kapitel 1 besprochen haben, wird die Vorhersagevariable als unabh\u00e4ngige Variable (UV) oder <strong>Pr\u00e4diktorvariable<\/strong> bezeichnet; die Variable, die vorhergesagt werden soll, als abh\u00e4ngige Variable (AV) oder <strong>Kriteriumsvariable<\/strong>. Im Folgenden werden wir uns mit der Regressionsgleichung der<strong> bivariaten Regression<\/strong> besch\u00e4ftigen, also f\u00fcr den Fall mit genau einer Vorhersagevariable und einer abh\u00e4ngigen Variable. Es gibt jedoch auch eine multiple Regression (mit mehreren Pr\u00e4diktoren), die Sie sp\u00e4ter kennenlernen werden. Wir besch\u00e4ftigen uns an dieser Stelle auch nur mit der g\u00e4ngigsten Form der Regression, der sogenannten <strong>linearen Regression<\/strong>.\u00a0 Diese erm\u00f6glicht eine Vorhersage unter der Annahme, dass es einen linearen, also gradlinigen Zusammenhang zwischen den Variablen gibt (Vgl. lineare Korrelation). Die Vorhersagefunktion sieht daher auch sehr einfach aus: <strong>Alle Vorhersagewerte liegen auf einer Geraden<\/strong>. Die Funktionsgleichung, die eine Gerade im zweidimensionalen Raum beschreibt kennen Sie sicherlich schon aus der Schulzeit. Dort wird diese meist mit <strong><em>f(x)= m \u22c5 x +b\u00a0<\/em><\/strong>beschrieben. Wobei <em><strong>m<\/strong><\/em> die Steigung ausdr\u00fcckt und <em><strong>b<\/strong><\/em> den Y-Achsenabschnitt (oder Ordinatenabschnitt). Die Regressionsgleichung ist nichts anderes als diese lineare Funktion angewendet auf zwei Variablen. Jedoch sind in der Statistik <strong>andere Abk\u00fcrzungen<\/strong> \u00fcblich. Der <strong>Y-Achsenabschnitt<\/strong> wird mit <em><strong>a<\/strong><\/em> bezeichnet, die <strong>Steigung<\/strong> wird mit <em><strong>b<\/strong><\/em> bezeichnet, und <strong>Regressionskoeffizient<\/strong> genannt.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1214\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5.png\" alt=\"\" width=\"520\" height=\"446\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5.png 685w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5-300x257.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5-65x56.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5-225x193.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild2-5-350x300.png 350w\" sizes=\"(max-width: 520px) 100vw, 520px\" \/><\/p>\n<p style=\"text-align: justify;\">Die Funktion soll in Abh\u00e4ngigkeit des Pr\u00e4diktors x, das Kriterium y vorhersagen (Daher steht vorne y). Da es sich hierbei um eine Sch\u00e4tzung handelt, die immer fehlerbehaftet ist, wird noch ein Fehlerterm (z.B. \u03b5) eingef\u00fcgt. Alternativ zu diesem Fehlerterm wird jedoch meist das y mit einem &#8222;Dach&#8220; versehen, was in der Statistik ausdr\u00fcckt, dass es sich um eine Sch\u00e4tzung handelt. Der Fehlerterm kann somit entfallen. In Summe lautet die Regressionsgleichung also:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1215 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5.png\" alt=\"\" width=\"858\" height=\"391\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5.png 858w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5-300x137.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5-768x350.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5-65x30.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5-225x103.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild3-5-350x159.png 350w\" sizes=\"(max-width: 858px) 100vw, 858px\" \/><\/p>\n<p style=\"text-align: justify;\">Der Index <strong><em>i<\/em><\/strong> dr\u00fcckt aus, dass Sie mit dieser Gleichung beliebige Werte der einen Variable f\u00fcr die Vorhersage des dazu geh\u00f6rigen Werts der anderen Variable nutzen k\u00f6nnen. Im Falle des Eingangsbeispiels mit K\u00f6rpergr\u00f6\u00dfe und Schuhgr\u00f6\u00dfe bedeutet dies, dass wir die Schuhgr\u00f6\u00dfe einer Person <em><strong>i<\/strong><\/em> vorhersagen bzw. sch\u00e4tzen k\u00f6nnen, wenn wir die die K\u00f6rpergr\u00f6\u00dfe eben dieser Person <em><strong>i<\/strong><\/em> kennen.<\/p>\n<p>&nbsp;<\/p>\n<div class=\"textbox textbox--examples\">\n<header class=\"textbox__header\">\n<p class=\"textbox__title\">Beispiel Regressionsgleichung<\/p>\n<\/header>\n<div class=\"textbox__content\">\n<p style=\"text-align: justify;\">Unten abgebildet sehen Sie beispielhaft die grafische Darstellung einer Regressionsgleichung als Linie. Die Gleichung Y=0,5x + 1 beschreibt diese Linie eindeutig im zweidimensionalen Raum. Der Achsenabschnitt betr\u00e4gt 1, was bedeutet das die Gerade genau beim Wert 1 die Y-Achse scheidet. Die Steigung betr\u00e4gt 0,5, d.h. f\u00fcr jeweils eine &#8222;Schritt&#8220; auf der X-Achse, geht es nur einen halbe &#8222;Schritt&#8220; nach oben. Alle Vorhersage-Werte liegen genau auf dieser Geraden. So w\u00fcrden wir z.B. f\u00fcr den x-Wert 5 den y-Wert 3,5 vorhersagen. Dieser Wert l\u00e4sst sich einfach durch Einsetzen in die Regression errechnen: Y= 0,5 \u22c5 5 + 1 . Wir k\u00f6nnen nun also f\u00fcr beliebige x-Werte die korrespondierenden y-Werte vorhersagen.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1217 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7.png\" alt=\"\" width=\"626\" height=\"312\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7.png 626w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7-300x150.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7-65x32.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7-225x112.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild4-7-350x174.png 350w\" sizes=\"(max-width: 626px) 100vw, 626px\" \/><\/p>\n<\/div>\n<\/div>\n<p>&nbsp;<\/p>\n<p><a href=\"https:\/\/youtu.be\/3sm3FhHXL7g\">Video 5.1 Regression | Regressionsgleichung<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.1 Regression | Regressionsgleichung\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/3sm3FhHXL7g?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<div><\/div>\n<h1>5.2 Methode der kleinsten Quadrate<\/h1>\n<div style=\"text-align: justify;\">Wir wissen nun, wie die Regressionsgleichung funktioniert. Doch wie wird diese bestimmt? Wie komme ich denn nun auf genau die Gleichung, die m\u00f6glichst gut z.B. die Anzahl der verkauften Burger in einem unserer FiveProfs-Burgerl\u00e4den auf Basis der Tagestemperatur vorhersagt? <strong>Hierf\u00fcr ben\u00f6tigen wir grunds\u00e4tzlich zun\u00e4chst einmal Daten<\/strong>. In diesem Fall z.B. Verkaufszahlen von FiveProfs Burgern und den entsprechenden Durchschnittstemperaturen von einer gro\u00dfen Anzahl an Tagen. Das Resultat w\u00e4re zun\u00e4chst einmal eine Punktewolke, oder genauer gesagt ein Streudiagramm. Die Punkte repr\u00e4sentieren also jeweils die Werte von Tagen, bei denen wir beides wissen: die Anzahl der verkauften Burger und die durchschnittliche Tagestemperatur.<\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1224 size-full aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9.png\" alt=\"\" width=\"403\" height=\"296\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9.png 403w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9-300x220.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9-65x48.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9-225x165.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild5-9-350x257.png 350w\" sizes=\"(max-width: 403px) 100vw, 403px\" \/><\/div>\n<div style=\"text-align: justify;\">Aus diesen Werten wollen wir nun die Gleichung ermitteln, die uns helfen soll, f\u00fcr weitere Tage, bei denen wir nur die Tagestemperatur kennen, den entsprechenden Burgerverkauf vorherzusagen. Hierf\u00fcr wollen wir nun in das Streudiagramm unsere Vorhersagelinie (<span style=\"font-size: 1.125rem;\">Regressionsgleichung) einzeichnen.\u00a0<\/span><\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1226 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7.png\" alt=\"\" width=\"403\" height=\"296\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7.png 403w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7-300x220.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7-65x48.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7-225x165.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild6-7-350x257.png 350w\" sizes=\"(max-width: 403px) 100vw, 403px\" \/><\/div>\n<div style=\"text-align: justify;\">Im obigen Beispiel wurde bereits eine solche <strong>Trend-Linie in die Punktwolke eingezeichnet<\/strong>. Diese Gerade entspricht der Regressionsgleichung und ist so eingezeichnet, dass der <strong>Abstand aller Punkte zur Linie minimal ist<\/strong>. Der Abstand der Werte zur Vorhersagelinie wird auch <strong>Residuum<\/strong> (Rest) genannt.<\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1239 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10.png\" alt=\"\" width=\"403\" height=\"296\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10.png 403w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10-300x220.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10-65x48.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10-225x165.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild7-10-350x257.png 350w\" sizes=\"(max-width: 403px) 100vw, 403px\" \/><\/div>\n<div style=\"text-align: justify;\">Wie man sieht, trifft diese Vorhersage f\u00fcr manche Werte sehr gut zu (geringer Abstand von der Geraden) f\u00fcr andere Werte ist die Vorhersage jedoch weniger gut (gro\u00dfer Abstand von der Geraden). <span style=\"font-size: 1.125rem;\"><span style=\"font-size: 1.125rem;\">Das Ziel ist dabei die Bestimmung einer Geraden, die den Gesamttrend aller Punkte am besten wiedergibt bzw. repr\u00e4sentiert. Dies kann man auch mathematisch machen, indem man die Gleichung sucht, bei der die Abweichungen aller Werte von der Geraden minimal sind. Hierbei werden die Abst\u00e4nde quadriert, um zu verhindern, dass sich die Abweichungen gegenseitig nivellieren. Das Ziel ist daher, <\/span><\/span><span style=\"font-size: 1.125rem;\">die Summe der quadrierten Abweichungen (Residuen) zu minimieren. Dies erkl\u00e4rt auch den Namen dieses Verfahrens, das n\u00e4mlich <\/span><strong>Methode<\/strong><span style=\"font-size: 1.125rem;\"><strong> der kleinsten Quadrate<\/strong> genannt wird.<\/span><\/div>\n<div><\/div>\n<div>\n<div><span style=\"font-size: 1.125rem;\">Wir wollen die Summe der quadrierten Abweichungen minimieren und setzen f\u00fcr den Vorhersagewert\u00a0<\/span><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-455\" style=\"font-size: 14pt;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/><span style=\"font-size: 1.125rem;\"> die obige Regressionsgleichung ein.<\/span><\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-1241 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-300x269.png\" alt=\"\" width=\"300\" height=\"269\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-300x269.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-65x58.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-225x202.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11-350x314.png 350w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild8-11.png 596w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/div>\n<div>\u00dcber partielle Ableitungen nach a bzw. b (die wir an dieser Stelle nicht vertiefen) lassen sich allgemeine L\u00f6sungen finden, die diese Bedingung erf\u00fcllen:<\/div>\n<div><\/div>\n<div><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1242\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5.png\" alt=\"\" width=\"502\" height=\"291\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5.png 842w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5-300x174.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5-768x444.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5-65x38.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5-225x130.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild9-5-350x202.png 350w\" sizes=\"(max-width: 502px) 100vw, 502px\" \/><\/div>\n<div><\/div>\n<div>\n<p style=\"text-align: justify;\">Bei b<sub>yx<\/sub> und a<sub>yx<\/sub> bezeichnet der erste Index (hier: y) die Variable, die vorhergesagt wird (Kriterium) und der zweite Index die Variable, die vorhersagt (Pr\u00e4diktor &#8211; hier: x). Um den Regressionskoeffizient <em><strong>b<\/strong><\/em> (die Steigung der Geraden) zu bestimmen, ben\u00f6tigen Sie also die Kovarianz der beiden Variablen, sowie die Varianz des Pr\u00e4diktors (x) . Danach k\u00f6nnen Sie durch die einfache Multiplikation mit dem Mittelwert des Pr\u00e4diktors (x) den Achsenabschnitt<strong><em> a<\/em><\/strong> bestimmen.<\/p>\n<p style=\"text-align: justify;\">In der Praxis werden Sie eher selten eine Regressionsgleichung von Hand bestimmen. Dennoch ist es hilfreich zu verstehen, wie diese Gerade berechnet wird, da dieses sogenannte Generelle Lineare Modell (GLM) die Basis f\u00fcr fast alle sp\u00e4teren statistischen Verfahren bildet.<\/p>\n<p>&nbsp;<\/p>\n<div>\n<p><a href=\"https:\/\/youtu.be\/lQU2tBGOgzo\">Video 5.2 Regression | Methode der kleinsten Quadrate<\/a><\/p>\n<\/div>\n<\/div>\n<div>\n<p><iframe loading=\"lazy\" title=\"5.2 Regression | Methode der kleinsten Quadrate\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/lQU2tBGOgzo?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<\/div>\n<\/div>\n<h1>5.3 Vorhersagen<\/h1>\n<p style=\"text-align: justify;\">Die Regressionsgleichung kann ganz praktisch dazu verwendet werden konkrete Vorhersagen zu machen. F\u00fcr die Vorhersage von Burgerverk\u00e4ufen in einer unserer FiveProfs-Filialen auf Basis der Tagestemperatur lautet die Gleichung <img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-455\" style=\"font-size: 1em; font-weight: lighter;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/> = 775 &#8211; 13,75 \u22c5 x<sub>i<\/sub> . Hiermit k\u00f6nnen wir nun f\u00fcr eine beliebige Tagestemperatur die Burgerverk\u00e4ufe in unserer Filiale vorhersagen. Wenn wir z.B. eine Temperatur von 20\u00b0C einsetzen, erhalten wir einen Vorhersagewert von 500 Burgern, die in unserer Filiale verkauft werden (Berechnung: 775 &#8211; 13,75 \u22c5 20).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1243 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7.png\" alt=\"\" width=\"403\" height=\"296\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7.png 403w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7-300x220.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7-65x48.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7-225x165.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild10-7-350x257.png 350w\" sizes=\"(max-width: 403px) 100vw, 403px\" \/><\/p>\n<p style=\"text-align: justify;\">Die Vorhersage muss jedoch nicht zwangl\u00e4ufig mit der Realit\u00e4t \u00fcbereinstimmen. In der Grafik ist deutlich erkennbar, dass viele Punkte leicht \u00fcber oder unter der Vorhersagegeraden liegen &#8211; daher sprechen wir immer von einer Sch\u00e4tzung. Diese Sch\u00e4tzung kann verbessert werden in dem man mehr Daten aufnimmt, also die Gleichung auf Basis von mehr Tagen (bzw. in anderen F\u00e4llen: Personen) errechnet. Eine weitere M\u00f6glichkeit besteht darin, weitere Pr\u00e4diktoren (wie hier z.B. die Regenwahrscheinlichkeit) mit aufzunehmen. Dazu werden wir an sp\u00e4terer Stelle kommen. Was wir jedoch schon jetzt ben\u00f6tigen, ist ein Ma\u00df daf\u00fcr, wie gut unsere Sch\u00e4tzung ist und genau damit m\u00f6chten wir uns &#8211; nach dem n\u00e4chsten Beispiel &#8211; besch\u00e4ftigen.<\/p>\n<p><a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg 1200w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-300x200.jpg 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-1024x683.jpg 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-768x512.jpg 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-65x43.jpg 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-225x150.jpg 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-350x233.jpg 350w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/><\/a><\/p>\n<div class=\"textbox textbox--examples\">\n<header class=\"textbox__header\">\n<p class=\"textbox__title\">Beispiel Kreuzfahrtschiffe<\/p>\n<\/header>\n<div class=\"textbox__content\">\n<p style=\"text-align: justify;\">In einer Stadt soll ein neuer Liegeplatz f\u00fcr Kreuzfahrtschiffe gebaut werden. Die maximal Breite der Schiffe, die die Hafeneinfahrt passieren k\u00f6nnen betr\u00e4gt 35 Meter. Nun wollen Sie herausfinden, wie lang der geplante Liegeplatz werden sollte, damit er ein \u00fcbliches Kreuzfahrtschiff aufnehmen kann. Wir wollen also auf Basis der Breite von 35 Metern (Pr\u00e4diktor) die voraussichtliche L\u00e4nge der Schiffe vorhersagen (Kriterium). Hierf\u00fcr m\u00fcssen Sie zun\u00e4chst Daten von Kreuzfahrtschiffen sammeln. Grunds\u00e4tzlich gilt: Je mehr Daten, desto besser die Vorhersage. In diesem Beispiel haben wir jedoch nur 11 Kreuzfahrtschiffe ber\u00fccksichtigt. Im hier abgebildeten Streudiagramm ist bereits die Regressionsgerade eingezeichnet.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-73 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt.png\" alt=\"\" width=\"751\" height=\"451\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt.png 751w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt-300x180.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt-65x39.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt-225x135.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/kreuzfahrt-350x210.png 350w\" sizes=\"(max-width: 751px) 100vw, 751px\" \/><\/p>\n<p style=\"text-align: justify;\">Wie man sieht gibt es einen (nicht-perfekten) Zusammenhang zwischen der L\u00e4nge und der Breite der Kreuzfahrtschiffe. Um die Regressionsgerade zu bestimmen ben\u00f6tigen wir die Kovarianz der beiden Variablen cov(<sub>x,y<\/sub>) = 227,51, sowie die Varianz des Pr\u00e4diktors s<sup>2<\/sup><sub>x<\/sub>= 22,74. Hieraus k\u00f6nnen wir die Regressionsgleichung bestimmen:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-455\" style=\"font-size: 1em; font-weight: lighter;\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert-2.png\" alt=\"\" width=\"14\" height=\"20\" \/>\u00a0= -54,63 + 10 \u22c5 x<sub>i<\/sub><\/p>\n<p>Mit dieser Gleichung k\u00f6nnen wir nun dem Planer der Hafenanlage helfen. Hierzu setzen wir f\u00fcr x=35 ein und erhalten <img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-464\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert2.png\" alt=\"\" width=\"13\" height=\"21\" \/>= -54,63 + 10 \u22c5 35 = 295,37<\/p>\n<p style=\"text-align: justify;\">Die vorhergesagte L\u00e4nge f\u00fcr ein Kreuzfahrtschiff mit 35 Meter Breite betr\u00e4gt also rund 295 Meter. Hierbei sollten sie jedoch beachten, dass es sich um eine Sch\u00e4tzung handelt, von der einzelne Kreuzfahrtschiffe in der Realit\u00e4t abweichen (siehe Abst\u00e4nde der Punkte von der Linie). Daher ist dem Hafenplaner gut daran geraten einen gewissen Sicherheitsaufschlag mit einzuplanen. Wie man bestimmen kann, wie genau eine solche Vorhersage ist, wollen wir im Folgenden betrachten.<\/p>\n<\/div>\n<\/div>\n<div><\/div>\n<div><a href=\"https:\/\/youtu.be\/eebTDonbSDs\">Video 5.3. Regression | Vorhersagen<\/a><\/div>\n<div>\n<p><iframe loading=\"lazy\" title=\"5.3. Regression | Vorhersagen\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/eebTDonbSDs?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<\/div>\n<h1>5.4 Vorhersageg\u00fcte<\/h1>\n<p style=\"text-align: justify;\">Wir haben nun eine Methode entwickelt, mit der wir auf Basis von Daten Vorhersagen ableiten k\u00f6nnen. Wie wir gesehen haben, sind diese Vorhersagen jedoch nur Sch\u00e4tzungen und weichen manchmal mehr und manchmal weniger stark von der Realit\u00e4t ab.\u00a0 Wenn Sie die Folgenden zwei Streudiagramme betrachten, wird dies nochmal klarer: Beide haben eine lineare Regressionsgerade auf der die Vorhersagewerte liegen. Jedoch sind im Fall Burgerverk\u00e4ufe und Tagestemperatur die echten Werte (rote Punkte) deutlich n\u00e4her an der Geraden als in der rechten Grafik, in welcher die Burgerverk\u00e4ufe auf Basis der Luftfeuchtigkeit vorausgesagt werden. Das bedeutet, dass die Vorhersage f\u00fcr die Burgerverk\u00e4ufe mit der Tagestemperatur als Pr\u00e4diktor deutlich besser funktioniert als mit der Luftfeuchtigkeit als Pr\u00e4diktor.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1245 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7.png\" alt=\"\" width=\"780\" height=\"303\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7.png 780w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7-300x117.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7-768x298.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7-65x25.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7-225x87.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild11-7-350x136.png 350w\" sizes=\"(max-width: 780px) 100vw, 780px\" \/><\/p>\n<p style=\"text-align: justify;\">Wir k\u00f6nnen also \u00fcber das Streudiagramm schon sehr leicht optisch sehen, wie gut eine Vorhersage funktioniert. Genau an dieser Stelle wollen wir nun weitermachen und Kennwerte entwickeln, die uns objektiv sagen, wie gut eine Vorhersage ist. Hierbei gehen wir zun\u00e4chst genau so vor, dass wir die Abweichungen der echten Werte (auch beobachtete Werte) von der Geraden (vorhergesagte Werte) betrachten. Diese Abweichungen nennen sich <strong>Regressionsresiduen<\/strong> (<em><strong>y<sup>*<\/sup><sub>i<\/sub><\/strong><\/em>). Das Ausma\u00df der Abweichungen ist ein Indikator daf\u00fcr, wie genau die Regression in ihrer Vorhersage ist. Die Regressionsresiduen selbst sind jedoch nur schwer interpretierbar, da diese wieder von der Skala der Variablen abh\u00e4ngen (Anzahl der verkauften Burger hat automatisch gr\u00f6\u00dfere Residuuen als die Tagestemperatur in \u00b0C). Die L\u00f6sung: Wir setzen die Summe der Residuuen ins Verh\u00e4ltnis zu einem anderen Wert. Doch welchem?<\/p>\n<p>Hierf\u00fcr wollen wir zun\u00e4chst den Begriff der Varianz erweitern. Wir haben bisher gelernt, dass die Varianz die (quadrierte) Summe der Abweichung aller Werte von Mittelwert ist.\u00a0 Dies ist die im untenstehenden Bild links gezeigte Gesamtvarianz. Die Gesamtvarianz kann im Falle der Regression in zwei Komponenten geteilt werden: In die Regressionsvarianz und die Fehlervarianz. Die Regressionsvarianz dr\u00fcck aus, welche Abweichungen vom Mittelwert, das Regressionsmodell vorhersagt. Die Fehlervarianz dr\u00fcckt aus, wie die tats\u00e4chlichen Werte von dieser Vorhersage abweichen (daher nicht-erkl\u00e4rte Varianz). Hier nochmal in der \u00dcbersicht:<\/p>\n<ul>\n<li>\u00a0<img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-493\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_ges.png\" alt=\"\" width=\"20\" height=\"30\" \/>Gesamtvarianz: Quadrierte Abweichung aller Werte vom Mittelwert (unten gelb dargestellt)<\/li>\n<li>\u00a0<img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-492\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_reg.png\" alt=\"\" width=\"20\" height=\"25\" \/>Regressionsvarianz (Auch erkl\u00e4rte Varianz): Quadrierte Abweichung der vorhergesagten Werte vom Mittelwert (unten orange dargestellt)<\/li>\n<li><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-491\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/s_fehler.png\" alt=\"\" width=\"20\" height=\"24\" \/>Fehlervarianz (Auch nicht-erkl\u00e4rte Varianz): Quadrierte Abweichung aller Werte von vorhergesagtem Wert (unten dunkelrot dargestellt)<\/li>\n<\/ul>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1246 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5.png\" alt=\"\" width=\"1030\" height=\"421\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5.png 1030w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-300x123.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-1024x419.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-768x314.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-65x27.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-225x92.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild12-5-350x143.png 350w\" sizes=\"(max-width: 1030px) 100vw, 1030px\" \/><\/p>\n<p><a href=\"https:\/\/youtu.be\/B6kscLpZoA4\">Video 5.4 Regression | Modellg\u00fcte<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.4 Regression | Modellg\u00fcte\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/B6kscLpZoA4?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p>Grunds\u00e4tzlich gilt, dass ein Regressionsmodell umso besser ist, je kleiner die Fehlervarianz im Vergleich zur vorhergesagten Varianz ist. Dies wird als <strong>F-Statistik<\/strong> bezeichnet und wird errechnet, in dem man die durch das Modell erkl\u00e4rte Varianz (Regressionsvarianz) ins Verh\u00e4ltnis zur nicht erkl\u00e4rten Varianz (Fehlervarianz) stellt. Dieser Quotient gibt damit an, um wie viel sich die Vorhersageg\u00fcte durch mein Modell verbessert, im Verh\u00e4ltnis zur noch nicht erkl\u00e4rten Varianz. Anders ausgedr\u00fcckt zeigt dieser Wert an, ob sich durch das Regressionsmodell die Vorhersage verbessert im Vergleich zur Vorhersage nur durch den Mittelwert. Ein gutes Modell sollte daher immer mindestens einen<strong> F-Wert &gt;1<\/strong> haben.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1248\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5.png\" alt=\"\" width=\"787\" height=\"134\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5.png 893w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5-300x51.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5-768x131.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5-65x11.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5-225x38.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild13-5-350x60.png 350w\" sizes=\"(max-width: 787px) 100vw, 787px\" \/><\/p>\n<div>Die absolute Gr\u00f6\u00dfe des F-Werts ist jedoch nur im Vergleich zwischen mehreren Regressionsmodellen interpretierbar (Ein Modell mit F-Wert 8 macht bessere Vorhersagen als ein Modell mit F-Wert 4). Es gibt jedoch auch ein G\u00fctema\u00df, welches direkt im Hinblick auf die Gr\u00f6\u00dfe interpretierbar ist: Der sogenannte <strong>Determinationskoeffizient (R<sup>2<\/sup>)<\/strong>. Diesen erh\u00e4lt man in dem die Regressionsvarianz durch die Gesamtvarianz geteilt wird. Der Quotient dr\u00fcckt damit den Varianzanteil der abh\u00e4ngigen Variablen aus, der mit der unabh\u00e4ngigen vorhergesagt bzw. erkl\u00e4rt werden kann. Der Vorteil: Das Ergebnis ist ein Prozentwert, der ausdr\u00fcckt wieviel Prozent der Varianz des Kriteriums durch den Pr\u00e4diktor erkl\u00e4rt wird. Aufgrund dieser recht anschaulichen Interpretierbarkeit ist dieser Wert auch das beliebteste G\u00fctema\u00df in der wissenschaftlichen Praxis. Der Determinationskoeffizient entspricht im Fall der bivariaten Regression dem Quadrat des Korrelationskoeffizienten. Wir h\u00e4tten diesen also auch einfacher berechnen k\u00f6nnen indem wir einfach den Korrelationskoeffizienten <em><strong>r<\/strong><\/em> quadrieren. Dies erkl\u00e4rt auch die Abk\u00fcrzung <em><strong>R<sup>2<\/sup><\/strong><\/em>.<\/div>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1249\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5.png\" alt=\"\" width=\"865\" height=\"219\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5.png 1007w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5-300x76.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5-768x194.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5-65x16.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5-225x57.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild14-5-350x89.png 350w\" sizes=\"(max-width: 865px) 100vw, 865px\" \/><\/p>\n<div class=\"textbox textbox--examples\">\n<header class=\"textbox__header\">\n<p class=\"textbox__title\">Beispiel Interpretation Regression und G\u00fctema\u00dfe<\/p>\n<\/header>\n<div class=\"textbox__content\">\n<p>Ein Dozent hat ein Regressionsmodell gebaut, welches die Note in der Statistik-Klausur vorhersagt und nutz daf\u00fcr als Pr\u00e4diktor die Anzahl der Stunden, die die Person\u00a0 jeweils auf die Klausur gelernt hat. Als Ergebnis erh\u00e4lt der Dozent folgende Regressionsgleichung:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-501\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/y-wert2-1.png\" alt=\"\" width=\"14\" height=\"22\" \/>i= 4,5 + (-0,05 \u22c5x<sub>i<\/sub>)<\/p>\n<p>Zus\u00e4tzlich erh\u00e4lt er folgende G\u00fctema\u00dfe:<\/p>\n<p><em><strong>R<sup>2<\/sup><\/strong><\/em>= 0,4 und<em><strong> F<\/strong> <\/em>= 15<\/p>\n<p>Zun\u00e4chst k\u00f6nnen wir in diesem Fall die Regressionsgleichung auch inhaltlich interpretieren. Der Y-Achsenabschnitt <em><strong>a<\/strong><\/em> betr\u00e4gt 4,5, was bedeutet, dass der Vorhersagewert f\u00fcr x=0 bei 4,5 liegt. Anders ausgedr\u00fcckt: Ein Studierender, der 0 Stunden Vorbereitung f\u00fcr die Klausur investiert muss mit einer durchschnittlichen Note 4,5 rechnen (Nicht immer l\u00e4sst sich der Y-Achsenabschnitt so sinnvoll interpretieren wie hier). Auch <em><strong>b<\/strong><\/em> l\u00e4sst sich inhaltlich interpretieren. Pro Stunde Vorbereitungszeit sinkt die Note um 0,05. Das bedeutet zum Beispiel, dass das Model f\u00fcr eine Person mit 30h Vorbereitung, eine Note 3 vorhersagt.<\/p>\n<p>Doch nun ist nat\u00fcrlich noch die Frage, wie gut diese Vorhersage ist. Der F-Wert liegt \u00fcber 1 und wir k\u00f6nnen also sagen, dass das Modell eine Verbesserung der Vorhersage erm\u00f6glicht, im Vergleich zur Vorhersage durch den Mittelwert (wenn ich also f\u00fcr jeden Studierenden den Klassemittelwert als Vorhersagegr\u00f6\u00dfe nehmen w\u00fcrde). Der <em><strong>R<sup>2<\/sup><\/strong><\/em> Wert gibt weiter an , dass in diesem Fall 40% (0,4) der Varianz der abh\u00e4ngigen Variable durch die unabh\u00e4ngige Variable erkl\u00e4rt werden. Auf das Beispiel angewendet besagt dies, dass wir mit diesem Modell 40% der Schwankung in der Statistik-Klausurnote erkl\u00e4ren k\u00f6nnen. Die \u00fcbrigen 60% sind nicht aufgekl\u00e4rte Varianz und werden also durch weitere (nicht im Modell vorhandene) Faktoren, wie z.B. Intelligenz beeinflusst.<\/p>\n<\/div>\n<\/div>\n<p><a href=\"https:\/\/youtu.be\/RgMbiROPozY\">Video 5.5 Regression | Determinationskoeffizient und F-Statistik<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.5. Regression | Determinationskoeffizient und F-Statistik\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/RgMbiROPozY?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>5.5 Voraussetzung f\u00fcr die lineare Regression<\/h1>\n<p>Um eine lineare Regression berechnen zu k\u00f6nnen, m\u00fcssen eine Reihe von Voraussetzungen erf\u00fcllt sein. Diesen wollen wir uns nun kurz widmen:<\/p>\n<ul>\n<li>Der Pr\u00e4diktor muss intervallskaliert sein. Ausnahme: dichotom nominalskalierte Variablen mit einer sogenannten Dummy-Codierung, also nur den Auspr\u00e4gungen &#8222;0&#8220; und &#8222;1&#8220;, k\u00f6nnen ebenfalls als Pr\u00e4diktor genutzt werden<\/li>\n<li>Das Kriterium muss intervallskaliert sein. F\u00fcr andere Skalenniveaus gibt es eigene Verfahren (z.B. ordinale, multinominale, logistische Regression)<\/li>\n<li>Der Zusammenhang der Variablen muss theoretisch linear sein. Hierf\u00fcr hilft es das Streudiagramm zu betrachten. F\u00fcr andere Zusammenh\u00e4nge gibt es nicht-lineare Regressionsmodelle (z.B. quadratische Regression)<\/li>\n<li>Es sollten m\u00f6glichst wenig Ausreiser in den Daten sein, da diese einen gro\u00dfen Einfluss auf die Vorhersageg\u00fcte haben k\u00f6nnen. Auch hier hilft es das Streudiagramm zu betrachten.<\/li>\n<\/ul>\n<div class=\"textbox textbox--key-takeaways\">\n<header class=\"textbox__header\">\n<p class=\"textbox__title\">Expertenwissen: Regression in der Inferenzstatistik<\/p>\n<\/header>\n<div class=\"textbox__content\">\n<p>F\u00fcr die Anwendung der Regression in der Inferenzstatistik gibt es noch weitere Voraussetzungen, die wir sp\u00e4ter beim Thema der multiplen Regression vertiefen werden. Diese sind:<\/p>\n<ul>\n<li>Die Einzelwerte verschiedener Merkmalstr\u00e4ger m\u00fcssen voneinander unabh\u00e4ngig zustande gekommen sein<\/li>\n<li>Residuen d\u00fcrfen nicht korrelieren<\/li>\n<li>Die Residuen sollen normalverteilt sein<\/li>\n<li>Homoskedastizit\u00e4t: Streuungen der zu einem x-Wert geh\u00f6renden y-Werte m\u00fcssen \u00fcber den ganzen Wertebereich von x homogen sein<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<p>&nbsp;<\/p>\n<p><a href=\"https:\/\/youtu.be\/7X9ultpOaQE\">Video 5.6 Regression | Vorraussetzungen<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.6 Regression | Vorraussetzungen\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/7X9ultpOaQE?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>5.6 Standardisierung der Regressionsgeraden<\/h1>\n<p>Wir k\u00f6nnen nun mehrere Regressionsmodelle im Hinblick auf die Vorhersageg\u00fcte vergleichen. Wollen wir jedoch den Regressionskoeffizienten b von mehreren Regressionsmodellen vergleichen, haben wir ein Problem: Das Gewicht b ist nicht unabh\u00e4ngig von der entsprechenden Skalierung zu interpretieren, d.h. Gewichte verschiedener Regressionsgleichungen k\u00f6nnen nicht miteinander verglichen werden. So f\u00fchrt zum Beispiel die K\u00f6rpergr\u00f6\u00dfe in Zentimetern als Pr\u00e4diktor zu einem gr\u00f6\u00dferen <em><strong>b<\/strong><\/em> als die K\u00f6rpergr\u00f6\u00dfe in Metern. Daher spricht man auch oft vom unstandardisierten Regressionsgewicht <em><strong>b<\/strong><\/em>. \u00dcber Standardisierung an den Standardabweichungen werden die Gewichte miteinander vergleichbar. Der standardisierte Regressionskoeffizient <strong>\ud835\udefd<\/strong> (<strong>\ud835\udefd<\/strong><em><strong>-Gewicht<\/strong><\/em>) ist im Falle der bivariaten Regression identisch mit der Produkt-Moment-Korrelation r, d.h. kann Werte zwischen -1 bis +1 annehmen. Die Standardisierung erfolgt wieder an den Standardabweichungen beider Variablen, wie folgt:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1250 size-large\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-1024x176.png\" alt=\"\" width=\"1024\" height=\"176\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-1024x176.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-300x52.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-768x132.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-65x11.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-225x39.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6-350x60.png 350w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Bild15-6.png 1389w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/p>\n<p>Das Ergebnis dieser Gleichung sollte Ihnen bekannt vorkommen. Es entspricht der Formel f\u00fcr die Produkt-Moment-Korrelation. Dies zeigt auf mathematischem Wege die Verwandtschaft von Korrelation und Regression.<\/p>\n<p><a href=\"https:\/\/youtu.be\/KsYtDe16Cps\">Video 5.8 Regression | Standardisiertes Regressionmodell<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.8 Regression | Standardisiertes Regressionmodell\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/KsYtDe16Cps?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p>Mit der Standardisierung lassen sich aber auch spannende Praxisprobleme l\u00f6sen. Daher wollen wir uns im folgenden Kapitel mit einer besonders n\u00fctzlichen Form der Standardisierung, der sog. Z-Transformation besch\u00e4ftigen.<\/p>\n<h1>5.7 Regression mit Jamovi<\/h1>\n<p>Regressionsmodelle lassen sich in Jamovi einfach erstellen. Das entsprechende Men\u00fc befindet sich unter:<\/p>\n<p><em><strong>Analysen &gt; Regression &gt; Lineare Regression<\/strong><\/em><\/p>\n<p>Hier wird die abh\u00e4ngige Variable (Kriterium) in das Feld &#8222;Abh\u00e4ngige Variable&#8220; eingetragen, w\u00e4hrend die unabh\u00e4ngige Variable (Pr\u00e4diktor) in das Feld &#8222;Kovariaten&#8220; gezogen wird. Weitere Einstellungen sind m\u00f6glich, aber f\u00fcr ein einfaches Modell nicht notwendig.<\/p>\n<p>Die Ausgabe enth\u00e4lt die Regressionskoeffizienten, die zur Aufstellung der Regressionsgleichung ben\u00f6tigt werden. Zudem wird das G\u00fctema\u00dfe R\u00b2 ausgegeben, was eine Einsch\u00e4tzung der Modellg\u00fcte erm\u00f6glicht. Wer zus\u00e4tzlich gerne die die F-Statistik haben m\u00f6chte muss unter &#8222;Modellkoeffizienten&#8220; auf &#8222;ANOVA-Test&#8220; klicken.<\/p>\n<p>Vor der Interpretation eines Regressionsmodells sollte \u00fcberpr\u00fcft werden, ob ein linearer Zusammenhang zwischen den Variablen besteht. Dies l\u00e4sst sich mit einem Streudiagramm visualisieren, das \u00fcber<\/p>\n<p><em><strong>Analysen &gt; Erforschung &gt; Streudiagramm<\/strong><\/em><\/p>\n<p>erstellt werden kann. Mit einem klick auf &#8222;Linear&#8220; kann auch eine Regressionsgerade hinzugef\u00fcgt werden, die der Regressionsgleichung oben entspricht.<\/p>\n<p>Beides wird im folgenden Video gezeigt.<\/p>\n<p><iframe loading=\"lazy\" title=\"5.9 Regressionsmodelle mit Jamovi erstellen\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/k5dzhf1R9vw?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>5.8 Regression mit SPSS<\/h1>\n<p style=\"text-align: justify;\">Regressionsmodelle lassen sich in SPSS mit wenigen Klicks erstellen, jedoch ist die Interpretation der Ausgabe nicht ganz einfach. Zur Erstellung eines Regressionsmodells gibt es in SPSS folgendes Men\u00fc:<\/p>\n<p style=\"text-align: justify;\">Analysieren &gt; Regression &gt; Linear.<\/p>\n<p style=\"text-align: justify;\">Hier wird zun\u00e4chst die abh\u00e4ngige Variable eingetragen (Kriterium, also die Variable die wir vorhersagen wollen) und dann die unabh\u00e4ngige Variable (Pr\u00e4diktor, die Variable, die wir zur Vorhersage nutzen). Das Men\u00fc bietet viele weitere Einstellung, die aber f\u00fcr ein einfaches Regressionsmodell nicht notwendig sind. Die resultierende Ausgabe gibt uns die Regressionskoeffizienten, also die Werte, die wir ben\u00f6tigen um die Regressionsgleichung aufzustellen. \u00dcberdies werden standardm\u00e4\u00dfig die G\u00fctema\u00dfe R<sup>2<\/sup> und F-Statistik mit ausgegeben, die es uns erlauben zu beurteilen, wie gut das Modell Vorhersagen macht. Im Folgenden Video wird dies Schritt f\u00fcr Schritt erkl\u00e4rt:<\/p>\n<p><a href=\"https:\/\/youtu.be\/nyrRMyj0QMU\">5.9 Regressionsmodelle mit SPSS erstellen<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.9 Regressionsmodelle mit SPSS erstellen\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/nyrRMyj0QMU?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p style=\"text-align: justify;\">Wie\u00a0 in den vorigen Kapiteln besprochen setzt die Berechnung eines Regressionsmodells voraus, dass auch wirklich ein linearer Zusammenhang zwischen den Variablen besteht. Daher sollten zur Interpretation eines Regressionsmodell die Daten immer auch in grafischer Form mit Hilfe eines Streudiagramms betrachtete werden. In SPSS bieten Streudiagramme zudem auch die M\u00f6glichkeit, direkt eine Regressionsgrade einzuzeichnen, sowie die Regressionsgleichung und das G\u00fctema\u00df R<sup>2<\/sup> auszugeben. Wie dies funktioniert, wird im n\u00e4chsten Video besprochen:<\/p>\n<p><a href=\"https:\/\/youtu.be\/L6uHFxssky8\">5.10 Streudiagramm mit Regressionsgerade in SPSS<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"5.10 Streudiagramm mit Regressionsgerade in SPSS\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/L6uHFxssky8?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>5.9 \u00dcbungsfragen<\/h1>\n<p>Bei den folgenden Aufgaben k\u00f6nnen Sie Ihr theoretisches Verst\u00e4ndnis unter Beweis stellen. Auf den Karteikarten sind jeweils auf der Vorderseite die Frage und auf der R\u00fcckseite die Antwort dargestellt. Viel Erfolg bei der Bearbeitung!<\/p>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-57\" class=\"h5p-iframe\" data-content-id=\"57\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-86\" class=\"h5p-iframe\" data-content-id=\"86\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-153\" class=\"h5p-iframe\" data-content-id=\"153\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-154\" class=\"h5p-iframe\" data-content-id=\"154\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<p>&nbsp;<\/p>\n<p>In diesem Teil sollen verschiedene Aussagen auf ihren Wahrheitsgehalt gepr\u00fcft werden. In Form von Multiple Choice Aufgaben soll f\u00fcr jede Aussage gepr\u00fcft werden, ob diese stimmt oder nicht.\u00a0Wenn die Aussage richtig ist, klicke auf das Quadrat am Anfang der jeweiligen Aussage. Viel Erfolg!<\/p>\n<p>&nbsp;<\/p>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-19\" class=\"h5p-iframe\" data-content-id=\"19\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-20\" class=\"h5p-iframe\" data-content-id=\"20\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-88\" class=\"h5p-iframe\" data-content-id=\"88\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<h1>5.10 \u00dcbungsaufgaben<\/h1>\n<div><\/div>\n<div><\/div>\n<div>Wir haben ein Regressionsmodell erstellt um den Umsatz je Burger-Filiale aus der Anzahl der Mitarbeiter zu prognostizieren. Unten sehen Sie zun\u00e4chst das Streudiagramm mit eingezeichneter Regressionsgrade. Lesen Sie hieraus zun\u00e4chst grafisch ab: Wie viel Umsatz erwarten Sie in einer Filiale mit 10 Mitarbeitern, wie viel in einer Filiale mit 16 Mitarbeitern?<\/div>\n<div><\/div>\n<div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-91\" class=\"h5p-iframe\" data-content-id=\"91\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<\/div>\n<div><\/div>\n<div>Wir haben nun in SPSS die Regressionsgrade berechnet und wollen zun\u00e4chst die Modellg\u00fcte beurteilen. In wie fern ist das Modell aus Ihrer Sicht geeigent den Filialumsatz vorherzusagen?<\/div>\n<div><\/div>\n<div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-92\" class=\"h5p-iframe\" data-content-id=\"92\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<\/div>\n<div><\/div>\n<div>Im letzten Schritt wollen wir nun die Regressionsgleichung aufstellen, bringen Sie hierzu die notwendigen Koeffizienten aus dem Output unten in die Form der Regressionsgleichung und klicken Sie f\u00fcr die finale Regressionsgleichung auf die Karteikarte unten.<\/div>\n<div><\/div>\n<div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-93\" class=\"h5p-iframe\" data-content-id=\"93\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<\/div>\n<div><\/div>\n<div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-94\" class=\"h5p-iframe\" data-content-id=\"94\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<\/div>\n<p><a href=\"https:\/\/open.spotify.com\/show\/5ro31tpkiOMYJQwprTARqG?si=qsUsnFtWSXSYJELIv0sPHA\" target=\"_blank\" rel=\"noopener\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-1877\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt.png\" alt=\"\" width=\"985\" height=\"286\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt.png 985w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt-300x87.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt-768x223.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt-65x19.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt-225x65.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2020\/10\/Unbenannt-350x102.png 350w\" sizes=\"(max-width: 985px) 100vw, 985px\" \/><\/a><\/p>\n","protected":false},"author":1,"menu_order":2,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":53,"_links":{"self":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/84"}],"collection":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":37,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/84\/revisions"}],"predecessor-version":[{"id":1884,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/84\/revisions\/1884"}],"part":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/parts\/53"}],"metadata":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/84\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/media?parent=84"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapter-type?post=84"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/contributor?post=84"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/license?post=84"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}