{"id":1627,"date":"2022-03-03T22:09:30","date_gmt":"2022-03-03T21:09:30","guid":{"rendered":"http:\/\/statistikgrundlagen.de\/ebook\/?post_type=chapter&#038;p=1627"},"modified":"2022-10-11T20:09:53","modified_gmt":"2022-10-11T18:09:53","slug":"multiple_regression_","status":"web-only","type":"chapter","link":"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/multiple_regression_\/","title":{"rendered":"Multiple Regression"},"content":{"raw":"<h1>18.0 Einf\u00fchrung Multiple Regression<\/h1>\r\nIn <a href=\"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/\">Kapitel 5<\/a> haben Sie bereits die bivariate Regression kennengelernt. Diese basiert auf einem linearen Zusammenhang zwischen einem Pr\u00e4diktor (unabh\u00e4ngige Variable) und einer abh\u00e4ngigen Variable. Beispielsweise k\u00f6nnen wir durch eine bivariate Regression die Produktbewertung f\u00fcr einen Burger durch die Geschmacksbewertung (Pr\u00e4diktor) vorhersagen. Wie gut unser aufgestelltes Modell ist, sagt uns der Determinationskoeffizient R<sup>2<\/sup>, welcher beschreibt, wie viel Varianz der abh\u00e4ngigen Variable durch den Pr\u00e4diktor aufgekl\u00e4rt werden kann.\r\n\r\nNun ist es in in der Praxis so, dass nicht nur ein Faktor, sondern mehrere unabh\u00e4ngige Faktoren eine abh\u00e4ngige Variable beeinflussen k\u00f6nnen und somit auch f\u00fcr ihre Vorhersage in Betracht kommen. So kann die Produktbewertung unseres Burgers nicht nur durch Geschmacks beeinflusst werden, sondern auch durch den Preis oder das \u00e4u\u00dfere Erscheinungsbild. Um diesen vermuteten Zusammenhang zu testen, berechnen wir eine multiple Regression. Diese modelliert einen linearen Zusammenhang (=eine\u00a0 Regressionsgerade) zwischen einer Kriteriumsvariablen und mehreren Pr\u00e4diktoren. Dadurch k\u00f6nnen wir die abh\u00e4ngige Variable nicht nur auf Basis eines Pr\u00e4diktors, sondern mehrerer Pr\u00e4diktoren vorhersagen.\r\n\r\n<img class=\"aligncenter wp-image-1639 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-1024x525.png\" alt=\"\" width=\"597\" height=\"306\" \/>\r\n\r\nZiel der multiplen Regression ist es durch die Aufstellung einer Regressionsgeraden m\u00f6glichst viel Varianz der abh\u00e4ngigen Variable durch die Pr\u00e4diktoren aufkl\u00e4ren zu k\u00f6nnen. Stellt man sich das bildlich vor, so dient jeder Pr\u00e4diktor (z.B. Preis, Geschmack) dazu ein St\u00fcckchen mehr der Varianz in der Produktbewertung des Burgers aufzukl\u00e4ren (dunkelroter Bereich).\r\n\r\n<img class=\"aligncenter wp-image-1640 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-1024x587.png\" alt=\"\" width=\"507\" height=\"291\" \/>\r\n\r\nOft ist es so, dass die Pr\u00e4diktoren nicht vollst\u00e4ndig unabh\u00e4ngig voneinander sind, sondern sich gegenseitig beeinflussen. So auch in unserem Beispiel: Das Auge ist bekanntlich mit und so korrelieren auch unsere beiden Pr\u00e4diktoren \"Aussehen\" und \"Geschmack\" miteinander. Dies ist nicht weiter schlimm, solange sich die Korrelationen zwischen den Pr\u00e4diktoren in Grenzen halten. Jedoch bedeutet dies auch, dass beide Pr\u00e4diktoren eine gemeinsame Varianzaufkl\u00e4rung besitzen, die sich nicht mehr klar einem Pr\u00e4diktor zuordnen l\u00e4sst. Bildlich gesehen \u00fcberlappen sich die dunkelroten Fl\u00e4chen der beiden korrelierenden Pr\u00e4diktoren.\r\n\r\n<img class=\"aligncenter wp-image-1641 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-1024x587.png\" alt=\"\" width=\"524\" height=\"301\" \/>\r\n\r\nDas besondere bei der multiplen Regression ist nun, das wenn Pr\u00e4diktoren untereinander korrelieren, nur die neu hinzukommende aufgekl\u00e4rte Varianz durch den Pr\u00e4diktor ber\u00fccksichtigt wird. So wird lediglich die Varianzaufkl\u00e4rung des dunkelroten Bereichs beim Pr\u00e4diktor \"Aussehen\" ber\u00fccksichtigt.\r\n\r\n<a href=\"https:\/\/youtu.be\/NQfLoHNirzk\">17.1 Multiple Regression | Einf\u00fchrung<\/a>\r\n\r\nhttps:\/\/youtu.be\/NQfLoHNirzk\r\n<h1>18.1 Regressionsgleichung<\/h1>\r\nDurch die multiple Regression k\u00f6nnen wir eine Regressionsgleichung aufstellen, die auf Basis der unabh\u00e4ngigen Pr\u00e4diktoren die abh\u00e4ngige Variable sch\u00e4tzt. Diese Gleichung basiert auf der selben Struktur wie die bivariate Regression (<a href=\"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/\">Kapitel 5<\/a>).\r\n\r\n<img class=\"aligncenter wp-image-1642 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-1024x387.png\" alt=\"\" width=\"582\" height=\"220\" \/>\r\n\r\nDa bei der multiplen Regression mehr als nur ein Pr\u00e4diktor betrachtet wird, muss die obenstehende Formel um die weiter hinzukommenden Pr\u00e4diktoren erg\u00e4nzt werden. Diese werden in der Regressionsgleichung hintereinander aufaddiert und bilden so die gemeinsame Sch\u00e4tzung f\u00fcr die abh\u00e4ngige Variable.\r\n\r\n<img class=\"aligncenter wp-image-1643 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-1024x238.png\" alt=\"\" width=\"723\" height=\"168\" \/>\r\n\r\nF\u00fcr unser oben gennanntes Beispiel ergibt sich somit folgende Regressionsgleichung:\r\n\r\n<img class=\"aligncenter wp-image-1644 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-1024x44.png\" alt=\"\" width=\"861\" height=\"37\" \/>\r\n\r\nIm Unterschied zur bivariaten Regressionsgleichung gibt es bei der multiplen Regression f\u00fcr jeden einzelnen Pr\u00e4diktor zwei m\u00f6gliche Regressionsgewichte - das <strong>unstandardisierte Regressionsgewicht b<\/strong> und das <strong>standardisierte Regressionsgewicht \u03b2<\/strong> (beta). Das unstandardisierte Regressionsgewicht b kennen Sie bereits aus Kapitel 5. Es beschreibt die Steigung der Geraden und ist inhaltlich interpretierbar. Beispielsweise hat unser Pr\u00e4diktor \"Preis\" ein b=-1,5. In diesem Fall sinkt die Produktbewertung unseres Burgers (AV) um 1,5 Bewertungspunkte mit jedem Euro, welcher beim Preis des Burgers hinzukommt. Das unstandardisierte Regressionsgewicht b hat jedoch einen zentralen Nachteil: Wenn die Pr\u00e4diktoren auf unterschiedlichen Skalen erfasst werden (bspw. ein Pr\u00e4diktor in \u20ac und ein anderer Pr\u00e4diktor auf einer Likert-Skala), k\u00f6nnen wir die Regressionsgewichte mehr nicht miteinander vergleichen. Wir wissen nicht, welcher der Pr\u00e4diktoren nun den gr\u00f6\u00dften Einfluss auf die abh\u00e4ngige Variable hat. Um dieses Problem zu l\u00f6sen, m\u00fcssen wir unsere Regressionsgewichte an der Standardabweichung standardisieren. So sind sie zwar inhaltlich nicht mehr interpretierbar, jedoch besitzen sie nun ein fest definierten Wertebereich, welcher sich von -1 bis +1 erstreckt. Dadurch lassen sich die \u03b2-Gewichte \u00fcber alle Pr\u00e4diktoren hinweg vergleichen und wir k\u00f6nnen zum Beispiel sehr einfach ablesen, welcher Pr\u00e4diktor den gr\u00f6\u00dften Einfluss hat.\r\n<table style=\"border-collapse: collapse; width: 100%;\" border=\"0\">\r\n<tbody>\r\n<tr>\r\n<td style=\"width: 22.0018%;\"><\/td>\r\n<td style=\"width: 23.2295%;\"><strong>Wertebereich<\/strong><\/td>\r\n<td style=\"width: 54.7686%;\"><strong>Eigenschaften<\/strong><\/td>\r\n<\/tr>\r\n<tr>\r\n<td style=\"width: 22.0018%;\">unstandardisiertes Regressionsgewicht b<\/td>\r\n<td style=\"width: 23.2295%;\">abh\u00e4ngig von gew\u00e4hlter Skala<\/td>\r\n<td style=\"width: 54.7686%;\">\r\n<ul>\r\n \t<li>inhaltlich interpretierbar<\/li>\r\n \t<li>zwischen Pr\u00e4diktoren vergleichbar, wenn diese auf der selben Skala gemessen werden<\/li>\r\n<\/ul>\r\n<\/td>\r\n<\/tr>\r\n<tr>\r\n<td style=\"width: 22.0018%;\">standardisiertes Regressionsgewicht \u03b2<\/td>\r\n<td style=\"width: 23.2295%;\">[-1, +1]<\/td>\r\n<td style=\"width: 54.7686%;\">\r\n<ul>\r\n \t<li>inhaltlich nicht interpretierbar<\/li>\r\n \t<li>zwischen Pr\u00e4diktoren vergleichbar<\/li>\r\n \t<li>interpretierbar wir Korrelationen (r)<\/li>\r\n<\/ul>\r\n<\/td>\r\n<\/tr>\r\n<\/tbody>\r\n<\/table>\r\nNoch nicht ganz verstanden? Das nachfolgende Video erkl\u00e4rt Ihnen die Regressionsgleichung der multiplen Regression anhand eines weiteren Beispiels aus der FiveProfs Kette.\r\n\r\n<a href=\"https:\/\/youtu.be\/OY4a8vkYOnU\">17.2 Multiple Regression | Regressionsgleichung<\/a>\r\n\r\nhttps:\/\/youtu.be\/OY4a8vkYOnU\r\n<h1>18.2 Voraussetzungen<\/h1>\r\nVor der Durchf\u00fchrung einer multiplen Regression m\u00fcssen zun\u00e4chst die Voraussetzungen gepr\u00fcft werden. Diese entsprechen zun\u00e4chst den Voraussetzungen der\u00a0 bivariaten Regression in <a href=\"http:\/\/statistikgrundlagen.de\/ebook\/part\/zusammenhaenge-und-standardisierung\/\">Kapitel 5<\/a>:\r\n<ul>\r\n \t<li>metrisch skalierte abh\u00e4ngige und unabh\u00e4ngige Variablen\r\nBei den Pr\u00e4diktoren k\u00f6nnen zudem nominal Skalierte Variablen mithilfe einer Dummy-Codierung in das Regressionsmodell mit aufgenommen werden.<\/li>\r\n \t<li>linearer Zusammenhang zwischen den Pr\u00e4diktoren und der abh\u00e4ngigen Variable\r\nDiese Voraussetzung l\u00e4sst sich beispielsweise anhand eines Streudiagramms graphisch \u00fcberpr\u00fcfen. Sind exponentielle oder logistische Verl\u00e4ufe in den Daten erkennbar, so lohnt es sich auf andere multiple Regressionen, wie beispielsweise die polynomiale oder logistische Regression zur\u00fcckzugreifen.<\/li>\r\n \t<li>Normalverteilung der Residuen\r\nBei einer ausreichend gro\u00dfen Stichprobengr\u00f6\u00dfe kann die \u00dcberpr\u00fcfung dieser Voraussetzung vernachl\u00e4ssigt werden. Laut dem zentralen Grenzwerttheorem kann hierbei eine Normalverteilung unterstellt werden. Bei kleinen Stichproben hingegen sollte zur Bestimmung der Normalverteilung ein entsprechender Test (z.B. Kolmogorov-Smirnov-Test, Lilliefors-Test) oder eine graphische \u00dcberpr\u00fcfung am QQ-Plot durchgef\u00fchrt werden.<\/li>\r\n \t<li>Homoskedastizit\u00e4t (=Varianzhomogenit\u00e4t)\r\nDiese kann \u00fcber den Levene Test oder graphisch \u00fcberpr\u00fcft werden. F\u00fcr die graphische \u00dcberpr\u00fcfung eignet sich im Statistikprogramm R\u00a0 das Scale-Location-Diagramm. Um Homoskedastizit\u00e4t unterstellen zu k\u00f6nnen, sollten die Datenpunkte im Diagramm gleichm\u00e4\u00dfig streuen und die darin enthaltene Linie sollte ungef\u00e4hr parallel zur x-Achse verlaufen.<\/li>\r\n \t<li>Ausreiser oder einflussreiche Punkte\r\nDiese k\u00f6nnen mit Hilfe einer Leverage-Analyse erkannt und bei Bedarf eliminiert werden. Bei der Leverage-Analyse wird der Hebel ( engl. Leverage) bzw. der Einfluss eines Wertes auf die Regressionsgerade bestimmt. Ein gro\u00dfer Hebel bei einem Datenpunkt ist soweit unbedenklich, wenn sich der Wert \"konform\" zur Regressionsgeraden verh\u00e4lt. Trotz hoher Hebelwirkung \u00e4ndert er in diesem Fall den Verlauf der Regressionsgleichung kaum. Kritisch wird es, wenn ein Wert einen hohen Einfluss auf die Regressionsgerade hat und gleichzeitig eine hohe Abweichung von der Vorhersage aufweist. Dann beeinflusst er den Verlauf der gesamten Regressionsgleichung in hohem Ma\u00dfe und kann zu Verzerrungen in der Vorhersage f\u00fchren. Das Ma\u00df f\u00fcr solch einen einflussreichen Punkt ist die Cook's Distance. Ist diese gr\u00f6\u00dfer als 0,5, wird der Wert als Ausreiser bewertet. Diese Cook's Distance kann beispielsweise im Residuals vs. Leverage Diagramm im Statistikprogramm R graphisch bestimmt werden. Liegen die Werte hinter der gestichelten Linie, handelt es sich um einen Ausreiser<\/li>\r\n<\/ul>\r\nZu diesen Voraussetzungen, die Sie bereits aus der bivariaten Regression kennen, kommen noch zwei weitere hinzu:\r\n<ul>\r\n \t<li>Unabh\u00e4ngigkeit der Residuen (=Keine Autokorrelation der Residuen)\r\nDiese Voraussetzung ist verletzt, wenn die Auspr\u00e4gung eines Residuums zu einem bestimmten Messzeitpunkt von einem zeitlich fr\u00fcherem Residuum beeinflusst wird. Residuen k\u00f6nnen untereinander korrelieren, wenn z.B. die Fragen in einer Umfrage nicht unabh\u00e4ngig voneinander sind und somit auch ihre Antworten miteinander zusammenh\u00e4ngen. Zur \u00dcberpr\u00fcfung dieser Voraussetzung kann der Durbin-Watson-Test durchgef\u00fchrt werden. Dieser sollte nicht signifikant werden, um eine Unabh\u00e4ngigkeit in den Residuen unterstellen zu k\u00f6nnen.<\/li>\r\n \t<li>Multikollinearit\u00e4t\r\nWie schon in der Einleitung beschrieben, k\u00f6nnen die Pr\u00e4diktoren untereinander korrelieren. Dies ist nicht weiter problematisch, solange die Korrelationen zwischen den Pr\u00e4diktoren einen Schwellenwert von r = 0.8 nicht \u00fcberschreiten. Hierzu k\u00f6nnen bivariate Korrelationen berechnet werden, oder ersatzweise auch der Variance Inflation Factor (VIF) berechnet werden. Dieser sollte einen Wert kleiner als 10 aufweisen.<\/li>\r\n<\/ul>\r\nDas folgende Video erkl\u00e4rt Ihnen die Voraussetzungen und ihre \u00dcberpr\u00fcfung anhand eines Beispiels aus der FiveProfs Kette.\r\n\r\n<a href=\"https:\/\/youtu.be\/_VxvsLa3YKo\">17.3 Multiple Regression | Voraussetzungen<\/a>\r\n\r\nhttps:\/\/youtu.be\/_VxvsLa3YKo\r\n<h1>18.3 Ergebnisse der multiplen Regression<\/h1>\r\nSind die Voraussetzungen erf\u00fcllt, k\u00f6nnen wir mithilfe von Statistikprogrammen wie SPSS oder R eine multiple Regression berechnen und herausfinden, welche Faktoren einen signifikanten Einfluss auf die Produktbewertung unseres Burgers haben. Als Ergebnis der Berechnung erhalten wir solche (oder \u00e4hnliche) Tabelle:\r\n\r\n<img class=\"aligncenter wp-image-1648 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-1024x354.png\" alt=\"\" width=\"593\" height=\"205\" \/>\r\n\r\nIn der ersten Spalte sehen wir die unstandardisierten Regressionsgewichte. Mit ihrer Hilfe k\u00f6nnen wir unsere Regressionsgleichung aufstellen. Die Konstante (erste Zeile) spiegelt dabei den Ordinatenabschnitt wider. F\u00fcr unser Beispiel ergibt sich somit folgende Regressionsgleichung:\r\n\r\n<img class=\"aligncenter wp-image-1649 \" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-1024x50.png\" alt=\"\" width=\"697\" height=\"34\" \/>\r\n\r\nIn der zweiten Spalte sehen Sie nun die standardisierten Regressionsgewichte \u03b2. Diese geben uns Aufschluss \u00fcber den Einfluss des jeweiligen Pr\u00e4diktors auf die abh\u00e4ngige Variable. Wir k\u00f6nnen Sie \u00e4hnlich wie Korrelationen interpretieren und so die Einfl\u00fcsse der einzelnen Pr\u00e4diktoren auf die abh\u00e4ngige Variable miteinander vergleichen. In unserem Beispiel hat also der Preis den gr\u00f6\u00dften Einfluss auf die Bewertung mit einem Regressionsgewicht von \u03b2 = 0,541. Der Geschmack hat nur den zweitgr\u00f6\u00dften Einfluss mit einem Regressionsgewicht von \u03b2 = 0,414.\r\n\r\nDie letzten beiden Spalten geben Aufschluss, ob der jeweilige Pr\u00e4diktor einen signifikanten Einfluss auf die abh\u00e4ngige Variable hat oder, ob wir doch eher von einem Zufall ausgehen sollten. Wird der entsprechende p-Wert signifikant (p&lt;.05), k\u00f6nnen wir sagen, dass der Pr\u00e4diktor die Produktbewertung unseres Burgers signifikant beeinflusst. Der Wert basiert auf einem t-Test f\u00fcr 1 Stichprobe, welcher die Hypothese testet, ob \u03b2 in der Population gleich 0 ist (H<sub>0<\/sub>) oder nicht. Ist \u03b2 gleich 0, dann hat sie keinen Einfluss auf die abh\u00e4ngige Variable. In unserem Beispiel besitzt z.B. der Pr\u00e4diktor Aussehen keinen signifikanten Einfluss auf die Produktbewertung des Burgers.\r\n\r\nDas folgende Video zeigt Ihnen die multiple Regression an einem weiteren Beispiel aus der FiveProfs Kette.\r\n\r\n<a href=\"https:\/\/youtu.be\/mFZU111khN0\">17.4 Multiple Regression | Erkl\u00e4rung des Modells an einem Beispiel<\/a>\r\n\r\nhttps:\/\/youtu.be\/mFZU111khN0\r\n<h1>18.4 Modellg\u00fcte<\/h1>\r\nIm letzten Abschnitt haben wir ein multiples Regressionsmodell aufgestellt. Was wir jedoch noch nicht wissen, ist, wie gut das Modell nun eigentlich ist. Diese Frage beantworten wir, indem wir die G\u00fctekriterien betrachten. Diese geben uns Auskunft dar\u00fcber, wie gut unsere Regressionsgleichung die abh\u00e4ngige Variable vorhersagen kann. Die G\u00fctekriterien entsprechen dabei denen der bivariaten Regression aus <a href=\"http:\/\/statistikgrundlagen.de\/ebook\/part\/zusammenhaenge-und-standardisierung\/\">Kapitel 5<\/a>.\r\n<h2>Determinationskoeffizient R<sup>2<\/sup><\/h2>\r\nDer Determinationskoeffizient R<sup>2\u00a0<\/sup>beschreibt, wie viel Varianz der abh\u00e4ngigen Variable durch die Pr\u00e4diktoren im multiplen Regressionsmodell aufgekl\u00e4rt werden kann. Die Werte reichen von 0 bis 1 und k\u00f6nnen in Prozentangaben ausgedr\u00fcckt werden. Ein R<sup>2<\/sup>= .457 sagt aus, dass sich durch die Pr\u00e4diktoren 45,7% der Varianz der abh\u00e4ngigen Variable aufkl\u00e4ren lassen. Der Determinationskoeffizient ergibt sich, wenn wir die Modellvarianz durch die Gesamtvarianz teilen. Die restliche nicht aufgekl\u00e4rte Varianz deutet auf Fehlervarianz hin, die beispielsweise durch nicht einbezogene Pr\u00e4diktoren (z.B. pers\u00f6nliche Gem\u00fctslage) oder andere unsystematische Einfl\u00fcsse entstehen kann.\r\n\r\n<img class=\" wp-image-1650 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-300x76.png\" alt=\"\" width=\"225\" height=\"57\" \/>\r\n<h2>F-Wert<\/h2>\r\nAlternativ kann auch der F-Wert in Betracht gezogen werden. Dieser ergibt sich, wenn wir die Modellvarianz durch die Fehlervarianz teilen. Wir vergleichen somit wie gut das Modell ist, im Vergleich zu den Fehlern, die es macht. Hierbei sollte der F-Wert immer &gt;1 sein.\r\n\r\n<img class=\" wp-image-1651 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-300x84.png\" alt=\"\" width=\"214\" height=\"60\" \/>\r\n\r\nUm die Anwendung der G\u00fctekriterien an einem Beispiel nochmal nachzuvollziehen, k\u00f6nnen Sie sich abschlie\u00dfend folgendes Video anschauen.\r\n\r\n<a href=\"https:\/\/youtu.be\/RyjL6Cj1fvg\">17.5 Multiple Regression | Modellg\u00fcte am Beispiel<\/a>\r\n\r\nhttps:\/\/youtu.be\/RyjL6Cj1fvg\r\n\r\n\r\n<a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" \/><\/a>\r\n\r\n&nbsp;\r\n<h1>13.7 \u00dcbungsfragen<\/h1>\r\nBei den folgenden Aufgaben k\u00f6nnen Sie Ihr theoretisches Verst\u00e4ndnis unter Beweis stellen. Auf den Karteikarten sind jeweils auf der Vorderseite die Frage und auf der R\u00fcckseite die Antwort dargestellt. Viel Erfolg bei der Bearbeitung!\r\n\r\n&nbsp;\r\n\r\n[h5p id=\"155\"]\r\n\r\n[h5p id=\"156\"]\r\n\r\n[h5p id=\"157\"]\r\n\r\n&nbsp;\r\n\r\nIn diesem Teil sollen verschiedene Aussagen auf ihren Wahrheitsgehalt gepr\u00fcft werden. In Form von Multiple Choice Aufgaben soll f\u00fcr jede Aussage gepr\u00fcft werden, ob diese stimmt oder nicht.\u00a0Wenn die Aussage richtig ist, klicke auf das Quadrat am Anfang der jeweiligen Aussage. Viel Erfolg!\r\n\r\n&nbsp;\r\n\r\n[h5p id=\"158\"]\r\n\r\n[h5p id=\"159\"]\r\n\r\n&nbsp;\r\n\r\n\r\n<a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch2.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" \/><\/a>\r\n","rendered":"<h1>18.0 Einf\u00fchrung Multiple Regression<\/h1>\n<p>In <a href=\"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/\">Kapitel 5<\/a> haben Sie bereits die bivariate Regression kennengelernt. Diese basiert auf einem linearen Zusammenhang zwischen einem Pr\u00e4diktor (unabh\u00e4ngige Variable) und einer abh\u00e4ngigen Variable. Beispielsweise k\u00f6nnen wir durch eine bivariate Regression die Produktbewertung f\u00fcr einen Burger durch die Geschmacksbewertung (Pr\u00e4diktor) vorhersagen. Wie gut unser aufgestelltes Modell ist, sagt uns der Determinationskoeffizient R<sup>2<\/sup>, welcher beschreibt, wie viel Varianz der abh\u00e4ngigen Variable durch den Pr\u00e4diktor aufgekl\u00e4rt werden kann.<\/p>\n<p>Nun ist es in in der Praxis so, dass nicht nur ein Faktor, sondern mehrere unabh\u00e4ngige Faktoren eine abh\u00e4ngige Variable beeinflussen k\u00f6nnen und somit auch f\u00fcr ihre Vorhersage in Betracht kommen. So kann die Produktbewertung unseres Burgers nicht nur durch Geschmacks beeinflusst werden, sondern auch durch den Preis oder das \u00e4u\u00dfere Erscheinungsbild. Um diesen vermuteten Zusammenhang zu testen, berechnen wir eine multiple Regression. Diese modelliert einen linearen Zusammenhang (=eine\u00a0 Regressionsgerade) zwischen einer Kriteriumsvariablen und mehreren Pr\u00e4diktoren. Dadurch k\u00f6nnen wir die abh\u00e4ngige Variable nicht nur auf Basis eines Pr\u00e4diktors, sondern mehrerer Pr\u00e4diktoren vorhersagen.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1639\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-1024x525.png\" alt=\"\" width=\"597\" height=\"306\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-1024x525.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-300x154.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-768x394.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-1536x787.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-2048x1050.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-65x33.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-225x115.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild1-350x179.png 350w\" sizes=\"(max-width: 597px) 100vw, 597px\" \/><\/p>\n<p>Ziel der multiplen Regression ist es durch die Aufstellung einer Regressionsgeraden m\u00f6glichst viel Varianz der abh\u00e4ngigen Variable durch die Pr\u00e4diktoren aufkl\u00e4ren zu k\u00f6nnen. Stellt man sich das bildlich vor, so dient jeder Pr\u00e4diktor (z.B. Preis, Geschmack) dazu ein St\u00fcckchen mehr der Varianz in der Produktbewertung des Burgers aufzukl\u00e4ren (dunkelroter Bereich).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1640\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-1024x587.png\" alt=\"\" width=\"507\" height=\"291\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-1024x587.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-300x172.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-768x440.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-1536x880.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-2048x1173.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-65x37.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-225x129.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild3-350x200.png 350w\" sizes=\"(max-width: 507px) 100vw, 507px\" \/><\/p>\n<p>Oft ist es so, dass die Pr\u00e4diktoren nicht vollst\u00e4ndig unabh\u00e4ngig voneinander sind, sondern sich gegenseitig beeinflussen. So auch in unserem Beispiel: Das Auge ist bekanntlich mit und so korrelieren auch unsere beiden Pr\u00e4diktoren &#8222;Aussehen&#8220; und &#8222;Geschmack&#8220; miteinander. Dies ist nicht weiter schlimm, solange sich die Korrelationen zwischen den Pr\u00e4diktoren in Grenzen halten. Jedoch bedeutet dies auch, dass beide Pr\u00e4diktoren eine gemeinsame Varianzaufkl\u00e4rung besitzen, die sich nicht mehr klar einem Pr\u00e4diktor zuordnen l\u00e4sst. Bildlich gesehen \u00fcberlappen sich die dunkelroten Fl\u00e4chen der beiden korrelierenden Pr\u00e4diktoren.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1641\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-1024x587.png\" alt=\"\" width=\"524\" height=\"301\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-1024x587.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-300x172.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-768x440.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-1536x880.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-2048x1173.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-65x37.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-225x129.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild4-350x200.png 350w\" sizes=\"(max-width: 524px) 100vw, 524px\" \/><\/p>\n<p>Das besondere bei der multiplen Regression ist nun, das wenn Pr\u00e4diktoren untereinander korrelieren, nur die neu hinzukommende aufgekl\u00e4rte Varianz durch den Pr\u00e4diktor ber\u00fccksichtigt wird. So wird lediglich die Varianzaufkl\u00e4rung des dunkelroten Bereichs beim Pr\u00e4diktor &#8222;Aussehen&#8220; ber\u00fccksichtigt.<\/p>\n<p><a href=\"https:\/\/youtu.be\/NQfLoHNirzk\">17.1 Multiple Regression | Einf\u00fchrung<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"17.1 Multiple Regression | Einf\u00fchrung\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/NQfLoHNirzk?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>18.1 Regressionsgleichung<\/h1>\n<p>Durch die multiple Regression k\u00f6nnen wir eine Regressionsgleichung aufstellen, die auf Basis der unabh\u00e4ngigen Pr\u00e4diktoren die abh\u00e4ngige Variable sch\u00e4tzt. Diese Gleichung basiert auf der selben Struktur wie die bivariate Regression (<a href=\"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/regression\/\">Kapitel 5<\/a>).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1642\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-1024x387.png\" alt=\"\" width=\"582\" height=\"220\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-1024x387.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-300x113.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-768x290.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-1536x580.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-65x25.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-225x85.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5-350x132.png 350w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild5.png 1889w\" sizes=\"(max-width: 582px) 100vw, 582px\" \/><\/p>\n<p>Da bei der multiplen Regression mehr als nur ein Pr\u00e4diktor betrachtet wird, muss die obenstehende Formel um die weiter hinzukommenden Pr\u00e4diktoren erg\u00e4nzt werden. Diese werden in der Regressionsgleichung hintereinander aufaddiert und bilden so die gemeinsame Sch\u00e4tzung f\u00fcr die abh\u00e4ngige Variable.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1643\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-1024x238.png\" alt=\"\" width=\"723\" height=\"168\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-1024x238.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-300x70.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-768x178.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-1536x356.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-2048x475.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-65x15.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-225x52.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild6-350x81.png 350w\" sizes=\"(max-width: 723px) 100vw, 723px\" \/><\/p>\n<p>F\u00fcr unser oben gennanntes Beispiel ergibt sich somit folgende Regressionsgleichung:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1644\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-1024x44.png\" alt=\"\" width=\"861\" height=\"37\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-1024x44.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-300x13.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-768x33.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-1536x66.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-2048x88.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-65x3.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-225x10.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild7-350x15.png 350w\" sizes=\"(max-width: 861px) 100vw, 861px\" \/><\/p>\n<p>Im Unterschied zur bivariaten Regressionsgleichung gibt es bei der multiplen Regression f\u00fcr jeden einzelnen Pr\u00e4diktor zwei m\u00f6gliche Regressionsgewichte &#8211; das <strong>unstandardisierte Regressionsgewicht b<\/strong> und das <strong>standardisierte Regressionsgewicht \u03b2<\/strong> (beta). Das unstandardisierte Regressionsgewicht b kennen Sie bereits aus Kapitel 5. Es beschreibt die Steigung der Geraden und ist inhaltlich interpretierbar. Beispielsweise hat unser Pr\u00e4diktor &#8222;Preis&#8220; ein b=-1,5. In diesem Fall sinkt die Produktbewertung unseres Burgers (AV) um 1,5 Bewertungspunkte mit jedem Euro, welcher beim Preis des Burgers hinzukommt. Das unstandardisierte Regressionsgewicht b hat jedoch einen zentralen Nachteil: Wenn die Pr\u00e4diktoren auf unterschiedlichen Skalen erfasst werden (bspw. ein Pr\u00e4diktor in \u20ac und ein anderer Pr\u00e4diktor auf einer Likert-Skala), k\u00f6nnen wir die Regressionsgewichte mehr nicht miteinander vergleichen. Wir wissen nicht, welcher der Pr\u00e4diktoren nun den gr\u00f6\u00dften Einfluss auf die abh\u00e4ngige Variable hat. Um dieses Problem zu l\u00f6sen, m\u00fcssen wir unsere Regressionsgewichte an der Standardabweichung standardisieren. So sind sie zwar inhaltlich nicht mehr interpretierbar, jedoch besitzen sie nun ein fest definierten Wertebereich, welcher sich von -1 bis +1 erstreckt. Dadurch lassen sich die \u03b2-Gewichte \u00fcber alle Pr\u00e4diktoren hinweg vergleichen und wir k\u00f6nnen zum Beispiel sehr einfach ablesen, welcher Pr\u00e4diktor den gr\u00f6\u00dften Einfluss hat.<\/p>\n<table style=\"border-collapse: collapse; width: 100%;\">\n<tbody>\n<tr>\n<td style=\"width: 22.0018%;\"><\/td>\n<td style=\"width: 23.2295%;\"><strong>Wertebereich<\/strong><\/td>\n<td style=\"width: 54.7686%;\"><strong>Eigenschaften<\/strong><\/td>\n<\/tr>\n<tr>\n<td style=\"width: 22.0018%;\">unstandardisiertes Regressionsgewicht b<\/td>\n<td style=\"width: 23.2295%;\">abh\u00e4ngig von gew\u00e4hlter Skala<\/td>\n<td style=\"width: 54.7686%;\">\n<ul>\n<li>inhaltlich interpretierbar<\/li>\n<li>zwischen Pr\u00e4diktoren vergleichbar, wenn diese auf der selben Skala gemessen werden<\/li>\n<\/ul>\n<\/td>\n<\/tr>\n<tr>\n<td style=\"width: 22.0018%;\">standardisiertes Regressionsgewicht \u03b2<\/td>\n<td style=\"width: 23.2295%;\">[-1, +1]<\/td>\n<td style=\"width: 54.7686%;\">\n<ul>\n<li>inhaltlich nicht interpretierbar<\/li>\n<li>zwischen Pr\u00e4diktoren vergleichbar<\/li>\n<li>interpretierbar wir Korrelationen (r)<\/li>\n<\/ul>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Noch nicht ganz verstanden? Das nachfolgende Video erkl\u00e4rt Ihnen die Regressionsgleichung der multiplen Regression anhand eines weiteren Beispiels aus der FiveProfs Kette.<\/p>\n<p><a href=\"https:\/\/youtu.be\/OY4a8vkYOnU\">17.2 Multiple Regression | Regressionsgleichung<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"17.2 Multiple Regression |  Regressionsgleichung\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/OY4a8vkYOnU?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>18.2 Voraussetzungen<\/h1>\n<p>Vor der Durchf\u00fchrung einer multiplen Regression m\u00fcssen zun\u00e4chst die Voraussetzungen gepr\u00fcft werden. Diese entsprechen zun\u00e4chst den Voraussetzungen der\u00a0 bivariaten Regression in <a href=\"http:\/\/statistikgrundlagen.de\/ebook\/part\/zusammenhaenge-und-standardisierung\/\">Kapitel 5<\/a>:<\/p>\n<ul>\n<li>metrisch skalierte abh\u00e4ngige und unabh\u00e4ngige Variablen<br \/>\nBei den Pr\u00e4diktoren k\u00f6nnen zudem nominal Skalierte Variablen mithilfe einer Dummy-Codierung in das Regressionsmodell mit aufgenommen werden.<\/li>\n<li>linearer Zusammenhang zwischen den Pr\u00e4diktoren und der abh\u00e4ngigen Variable<br \/>\nDiese Voraussetzung l\u00e4sst sich beispielsweise anhand eines Streudiagramms graphisch \u00fcberpr\u00fcfen. Sind exponentielle oder logistische Verl\u00e4ufe in den Daten erkennbar, so lohnt es sich auf andere multiple Regressionen, wie beispielsweise die polynomiale oder logistische Regression zur\u00fcckzugreifen.<\/li>\n<li>Normalverteilung der Residuen<br \/>\nBei einer ausreichend gro\u00dfen Stichprobengr\u00f6\u00dfe kann die \u00dcberpr\u00fcfung dieser Voraussetzung vernachl\u00e4ssigt werden. Laut dem zentralen Grenzwerttheorem kann hierbei eine Normalverteilung unterstellt werden. Bei kleinen Stichproben hingegen sollte zur Bestimmung der Normalverteilung ein entsprechender Test (z.B. Kolmogorov-Smirnov-Test, Lilliefors-Test) oder eine graphische \u00dcberpr\u00fcfung am QQ-Plot durchgef\u00fchrt werden.<\/li>\n<li>Homoskedastizit\u00e4t (=Varianzhomogenit\u00e4t)<br \/>\nDiese kann \u00fcber den Levene Test oder graphisch \u00fcberpr\u00fcft werden. F\u00fcr die graphische \u00dcberpr\u00fcfung eignet sich im Statistikprogramm R\u00a0 das Scale-Location-Diagramm. Um Homoskedastizit\u00e4t unterstellen zu k\u00f6nnen, sollten die Datenpunkte im Diagramm gleichm\u00e4\u00dfig streuen und die darin enthaltene Linie sollte ungef\u00e4hr parallel zur x-Achse verlaufen.<\/li>\n<li>Ausreiser oder einflussreiche Punkte<br \/>\nDiese k\u00f6nnen mit Hilfe einer Leverage-Analyse erkannt und bei Bedarf eliminiert werden. Bei der Leverage-Analyse wird der Hebel ( engl. Leverage) bzw. der Einfluss eines Wertes auf die Regressionsgerade bestimmt. Ein gro\u00dfer Hebel bei einem Datenpunkt ist soweit unbedenklich, wenn sich der Wert &#8222;konform&#8220; zur Regressionsgeraden verh\u00e4lt. Trotz hoher Hebelwirkung \u00e4ndert er in diesem Fall den Verlauf der Regressionsgleichung kaum. Kritisch wird es, wenn ein Wert einen hohen Einfluss auf die Regressionsgerade hat und gleichzeitig eine hohe Abweichung von der Vorhersage aufweist. Dann beeinflusst er den Verlauf der gesamten Regressionsgleichung in hohem Ma\u00dfe und kann zu Verzerrungen in der Vorhersage f\u00fchren. Das Ma\u00df f\u00fcr solch einen einflussreichen Punkt ist die Cook&#8217;s Distance. Ist diese gr\u00f6\u00dfer als 0,5, wird der Wert als Ausreiser bewertet. Diese Cook&#8217;s Distance kann beispielsweise im Residuals vs. Leverage Diagramm im Statistikprogramm R graphisch bestimmt werden. Liegen die Werte hinter der gestichelten Linie, handelt es sich um einen Ausreiser<\/li>\n<\/ul>\n<p>Zu diesen Voraussetzungen, die Sie bereits aus der bivariaten Regression kennen, kommen noch zwei weitere hinzu:<\/p>\n<ul>\n<li>Unabh\u00e4ngigkeit der Residuen (=Keine Autokorrelation der Residuen)<br \/>\nDiese Voraussetzung ist verletzt, wenn die Auspr\u00e4gung eines Residuums zu einem bestimmten Messzeitpunkt von einem zeitlich fr\u00fcherem Residuum beeinflusst wird. Residuen k\u00f6nnen untereinander korrelieren, wenn z.B. die Fragen in einer Umfrage nicht unabh\u00e4ngig voneinander sind und somit auch ihre Antworten miteinander zusammenh\u00e4ngen. Zur \u00dcberpr\u00fcfung dieser Voraussetzung kann der Durbin-Watson-Test durchgef\u00fchrt werden. Dieser sollte nicht signifikant werden, um eine Unabh\u00e4ngigkeit in den Residuen unterstellen zu k\u00f6nnen.<\/li>\n<li>Multikollinearit\u00e4t<br \/>\nWie schon in der Einleitung beschrieben, k\u00f6nnen die Pr\u00e4diktoren untereinander korrelieren. Dies ist nicht weiter problematisch, solange die Korrelationen zwischen den Pr\u00e4diktoren einen Schwellenwert von r = 0.8 nicht \u00fcberschreiten. Hierzu k\u00f6nnen bivariate Korrelationen berechnet werden, oder ersatzweise auch der Variance Inflation Factor (VIF) berechnet werden. Dieser sollte einen Wert kleiner als 10 aufweisen.<\/li>\n<\/ul>\n<p>Das folgende Video erkl\u00e4rt Ihnen die Voraussetzungen und ihre \u00dcberpr\u00fcfung anhand eines Beispiels aus der FiveProfs Kette.<\/p>\n<p><a href=\"https:\/\/youtu.be\/_VxvsLa3YKo\">17.3 Multiple Regression | Voraussetzungen<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"17.3 Multiple Regression Vorraussetzungen\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/_VxvsLa3YKo?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>18.3 Ergebnisse der multiplen Regression<\/h1>\n<p>Sind die Voraussetzungen erf\u00fcllt, k\u00f6nnen wir mithilfe von Statistikprogrammen wie SPSS oder R eine multiple Regression berechnen und herausfinden, welche Faktoren einen signifikanten Einfluss auf die Produktbewertung unseres Burgers haben. Als Ergebnis der Berechnung erhalten wir solche (oder \u00e4hnliche) Tabelle:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1648\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-1024x354.png\" alt=\"\" width=\"593\" height=\"205\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-1024x354.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-300x104.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-768x266.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-1536x531.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-2048x708.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-65x22.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-225x78.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild8-1-350x121.png 350w\" sizes=\"(max-width: 593px) 100vw, 593px\" \/><\/p>\n<p>In der ersten Spalte sehen wir die unstandardisierten Regressionsgewichte. Mit ihrer Hilfe k\u00f6nnen wir unsere Regressionsgleichung aufstellen. Die Konstante (erste Zeile) spiegelt dabei den Ordinatenabschnitt wider. F\u00fcr unser Beispiel ergibt sich somit folgende Regressionsgleichung:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-1649\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-1024x50.png\" alt=\"\" width=\"697\" height=\"34\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-1024x50.png 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-300x15.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-768x38.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-1536x75.png 1536w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-2048x100.png 2048w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-65x3.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-225x11.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild9-350x17.png 350w\" sizes=\"(max-width: 697px) 100vw, 697px\" \/><\/p>\n<p>In der zweiten Spalte sehen Sie nun die standardisierten Regressionsgewichte \u03b2. Diese geben uns Aufschluss \u00fcber den Einfluss des jeweiligen Pr\u00e4diktors auf die abh\u00e4ngige Variable. Wir k\u00f6nnen Sie \u00e4hnlich wie Korrelationen interpretieren und so die Einfl\u00fcsse der einzelnen Pr\u00e4diktoren auf die abh\u00e4ngige Variable miteinander vergleichen. In unserem Beispiel hat also der Preis den gr\u00f6\u00dften Einfluss auf die Bewertung mit einem Regressionsgewicht von \u03b2 = 0,541. Der Geschmack hat nur den zweitgr\u00f6\u00dften Einfluss mit einem Regressionsgewicht von \u03b2 = 0,414.<\/p>\n<p>Die letzten beiden Spalten geben Aufschluss, ob der jeweilige Pr\u00e4diktor einen signifikanten Einfluss auf die abh\u00e4ngige Variable hat oder, ob wir doch eher von einem Zufall ausgehen sollten. Wird der entsprechende p-Wert signifikant (p&lt;.05), k\u00f6nnen wir sagen, dass der Pr\u00e4diktor die Produktbewertung unseres Burgers signifikant beeinflusst. Der Wert basiert auf einem t-Test f\u00fcr 1 Stichprobe, welcher die Hypothese testet, ob \u03b2 in der Population gleich 0 ist (H<sub>0<\/sub>) oder nicht. Ist \u03b2 gleich 0, dann hat sie keinen Einfluss auf die abh\u00e4ngige Variable. In unserem Beispiel besitzt z.B. der Pr\u00e4diktor Aussehen keinen signifikanten Einfluss auf die Produktbewertung des Burgers.<\/p>\n<p>Das folgende Video zeigt Ihnen die multiple Regression an einem weiteren Beispiel aus der FiveProfs Kette.<\/p>\n<p><a href=\"https:\/\/youtu.be\/mFZU111khN0\">17.4 Multiple Regression | Erkl\u00e4rung des Modells an einem Beispiel<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"17.4 Multiple Regression | Erkl\u00e4rung des Modells an einem Beispiel\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/mFZU111khN0?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h1>18.4 Modellg\u00fcte<\/h1>\n<p>Im letzten Abschnitt haben wir ein multiples Regressionsmodell aufgestellt. Was wir jedoch noch nicht wissen, ist, wie gut das Modell nun eigentlich ist. Diese Frage beantworten wir, indem wir die G\u00fctekriterien betrachten. Diese geben uns Auskunft dar\u00fcber, wie gut unsere Regressionsgleichung die abh\u00e4ngige Variable vorhersagen kann. Die G\u00fctekriterien entsprechen dabei denen der bivariaten Regression aus <a href=\"http:\/\/statistikgrundlagen.de\/ebook\/part\/zusammenhaenge-und-standardisierung\/\">Kapitel 5<\/a>.<\/p>\n<h2>Determinationskoeffizient R<sup>2<\/sup><\/h2>\n<p>Der Determinationskoeffizient R<sup>2\u00a0<\/sup>beschreibt, wie viel Varianz der abh\u00e4ngigen Variable durch die Pr\u00e4diktoren im multiplen Regressionsmodell aufgekl\u00e4rt werden kann. Die Werte reichen von 0 bis 1 und k\u00f6nnen in Prozentangaben ausgedr\u00fcckt werden. Ein R<sup>2<\/sup>= .457 sagt aus, dass sich durch die Pr\u00e4diktoren 45,7% der Varianz der abh\u00e4ngigen Variable aufkl\u00e4ren lassen. Der Determinationskoeffizient ergibt sich, wenn wir die Modellvarianz durch die Gesamtvarianz teilen. Die restliche nicht aufgekl\u00e4rte Varianz deutet auf Fehlervarianz hin, die beispielsweise durch nicht einbezogene Pr\u00e4diktoren (z.B. pers\u00f6nliche Gem\u00fctslage) oder andere unsystematische Einfl\u00fcsse entstehen kann.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1650 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-300x76.png\" alt=\"\" width=\"225\" height=\"57\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-300x76.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-768x194.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-65x16.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-225x57.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10-350x88.png 350w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild10.png 836w\" sizes=\"(max-width: 225px) 100vw, 225px\" \/><\/p>\n<h2>F-Wert<\/h2>\n<p>Alternativ kann auch der F-Wert in Betracht gezogen werden. Dieser ergibt sich, wenn wir die Modellvarianz durch die Fehlervarianz teilen. Wir vergleichen somit wie gut das Modell ist, im Vergleich zu den Fehlern, die es macht. Hierbei sollte der F-Wert immer &gt;1 sein.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-1651 aligncenter\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-300x84.png\" alt=\"\" width=\"214\" height=\"60\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-300x84.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-65x18.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-225x63.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11-350x98.png 350w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Bild11.png 756w\" sizes=\"(max-width: 214px) 100vw, 214px\" \/><\/p>\n<p>Um die Anwendung der G\u00fctekriterien an einem Beispiel nochmal nachzuvollziehen, k\u00f6nnen Sie sich abschlie\u00dfend folgendes Video anschauen.<\/p>\n<p><a href=\"https:\/\/youtu.be\/RyjL6Cj1fvg\">17.5 Multiple Regression | Modellg\u00fcte am Beispiel<\/a><\/p>\n<p><iframe loading=\"lazy\" title=\"17.5 Multiple Regression | Modellg\u00fcte am Beispiel\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/RyjL6Cj1fvg?feature=oembed&#38;rel=0\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p><a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1.jpg 1200w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-300x200.jpg 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-1024x683.jpg 1024w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-768x512.jpg 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-65x43.jpg 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-225x150.jpg 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch1-350x233.jpg 350w\" sizes=\"(max-width: 1200px) 100vw, 1200px\" \/><\/a><\/p>\n<p>&nbsp;<\/p>\n<h1>13.7 \u00dcbungsfragen<\/h1>\n<p>Bei den folgenden Aufgaben k\u00f6nnen Sie Ihr theoretisches Verst\u00e4ndnis unter Beweis stellen. Auf den Karteikarten sind jeweils auf der Vorderseite die Frage und auf der R\u00fcckseite die Antwort dargestellt. Viel Erfolg bei der Bearbeitung!<\/p>\n<p>&nbsp;<\/p>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-155\" class=\"h5p-iframe\" data-content-id=\"155\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-156\" class=\"h5p-iframe\" data-content-id=\"156\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-157\" class=\"h5p-iframe\" data-content-id=\"157\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<p>&nbsp;<\/p>\n<p>In diesem Teil sollen verschiedene Aussagen auf ihren Wahrheitsgehalt gepr\u00fcft werden. In Form von Multiple Choice Aufgaben soll f\u00fcr jede Aussage gepr\u00fcft werden, ob diese stimmt oder nicht.\u00a0Wenn die Aussage richtig ist, klicke auf das Quadrat am Anfang der jeweiligen Aussage. Viel Erfolg!<\/p>\n<p>&nbsp;<\/p>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-158\" class=\"h5p-iframe\" data-content-id=\"158\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<div class=\"h5p-iframe-wrapper\"><iframe id=\"h5p-iframe-159\" class=\"h5p-iframe\" data-content-id=\"159\" style=\"height:1px\" src=\"about:blank\" frameBorder=\"0\" scrolling=\"no\"><\/iframe><\/div>\n<p>&nbsp;<\/p>\n<p><a href=\"https:\/\/amzn.to\/3dYLUip\" target=\"_blank\" rel=\"noopener noreferrer\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone wp-image-1675 size-full\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2022\/03\/Buch2.jpg\" alt=\"Das Statistik Buch von Five Profs\" width=\"1200\" height=\"800\" \/><\/a><\/p>\n","protected":false},"author":3,"menu_order":3,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":1606,"_links":{"self":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1627"}],"collection":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/users\/3"}],"version-history":[{"count":20,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1627\/revisions"}],"predecessor-version":[{"id":1681,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1627\/revisions\/1681"}],"part":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/parts\/1606"}],"metadata":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1627\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/media?parent=1627"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapter-type?post=1627"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/contributor?post=1627"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/license?post=1627"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}