{"id":1770,"date":"2023-04-12T14:50:47","date_gmt":"2023-04-12T12:50:47","guid":{"rendered":"http:\/\/statistikgrundlagen.de\/ebook\/?post_type=chapter&#038;p=1770"},"modified":"2023-11-28T12:55:57","modified_gmt":"2023-11-28T11:55:57","slug":"ancova-kovarianzanalyse-mit-r","status":"publish","type":"chapter","link":"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/ancova-kovarianzanalyse-mit-r\/","title":{"rendered":"ANCOVA Kovarianzanalyse mit R"},"content":{"raw":"<h1>ANCOVA Kovarianzanalyse<\/h1>\r\nDie Kovarianzanalyse (ANCOVA) ist ein statistisches Verfahren, mit dem die Beziehung zwischen einer kontinuierlichen abh\u00e4ngigen Variablen und einer oder mehreren kategorialen unabh\u00e4ngigen Variablen analysiert wird, w\u00e4hrend gleichzeitig f\u00fcr die Auswirkungen einer oder mehrerer kontinuierlicher Kovariaten kontrolliert wird. Die allgemeine Idee hinter der ANCOVA besteht darin, die Variation in der abh\u00e4ngigen Variable, die durch die Kovariablen erkl\u00e4rt wird, zu bereinigen, so dass die verbleibende Variation den Auswirkungen der unabh\u00e4ngigen Variablen zugeschrieben werden kann.\r\n\r\nANCOVA kann in R mit der Funktion lm<em>()<\/em> durchgef\u00fchrt werden, also dem generellen linearen Modell. Die grundlegende Syntax f\u00fcr die Verwendung von lm() zur Durchf\u00fchrung einer ANCOVA lautet wie folgt:\r\n\r\nANCOVA &lt;- lm(abh\u00e4ngige_Variable ~ unabh\u00e4ngige_Variable + Kovariate, Daten = data_frame)\r\n\r\nHier wird die abh\u00e4ngige Variable auf der linken Seite der Formel angegeben, und die unabh\u00e4ngige Variable und Kovariate(n) werden auf der rechten Seite der Formel angegeben, getrennt durch ein + Symbol.\r\n<div id=\"beispiel-1\" class=\"section level2 hasAnchor\">\r\n<h1>Beispiel<\/h1>\r\nWir nutzen Datensatz mtcars (in R Hinterlegt). Wir wollen der Frage nachgehen, ob Autos mit Automatikgetriebe (am) mehr Benzin verbrauchen (mpg), als solche mit Schaltgetriebe? Beachten Sie, dass der Verbrauch der Fahrzeuge hier in Miles per Gallon (mpg) angegeben ist und hier ein kleinerer Wert einen gr\u00f6\u00dferen Verbrauch angibt (Das Fahrzeug schafft weniger Meilen mit einer Galone Benzin).\r\n\r\n<\/div>\r\n<div id=\"daten-laden-1\" class=\"section level2 hasAnchor\">\r\n<h1>Daten laden<\/h1>\r\nDa die Daten in r hinterlegt sind, m\u00fcssen wir die Daten nicht laden, sondern k\u00f6nnen direkt darauf zugreifen. Schauen wir uns die Daten zun\u00e4chst einmal an.\r\n<div id=\"cb193\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb193-1\"><span class=\"fu\">head<\/span>(mtcars)<\/span>\r\n<span id=\"cb193-2\"><span class=\"do\">##                    mpg cyl disp  hp drat    wt  qsec vs am gear<\/span><\/span>\r\n<span id=\"cb193-3\"><span class=\"do\">## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4<\/span><\/span>\r\n<span id=\"cb193-4\"><span class=\"do\">## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4<\/span><\/span>\r\n<span id=\"cb193-5\"><span class=\"do\">## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4<\/span><\/span>\r\n<span id=\"cb193-6\"><span class=\"do\">## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3<\/span><\/span>\r\n<span id=\"cb193-7\"><span class=\"do\">## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3<\/span><\/span>\r\n<span id=\"cb193-8\"><span class=\"do\">## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3<\/span><\/span>\r\n<span id=\"cb193-9\"><span class=\"do\">##                   carb<\/span><\/span>\r\n<span id=\"cb193-10\"><span class=\"do\">## Mazda RX4            4<\/span><\/span>\r\n<span id=\"cb193-11\"><span class=\"do\">## Mazda RX4 Wag        4<\/span><\/span>\r\n<span id=\"cb193-12\"><span class=\"do\">## Datsun 710           1<\/span><\/span>\r\n<span id=\"cb193-13\"><span class=\"do\">## Hornet 4 Drive       1<\/span><\/span>\r\n<span id=\"cb193-14\"><span class=\"do\">## Hornet Sportabout    2<\/span><\/span>\r\n<span id=\"cb193-15\"><span class=\"do\">## Valiant              1<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nVerwenden Sie die Hilfefunktion zu diesem Datensatz mit <em>?mtcars<\/em>, um diesen n\u00e4her zu verstehen. Das Wichtigste: Bei der Variable am bedeutet 0 Automatikgetriebe und 1 Handschaltung.\r\n\r\n<\/div>\r\n<div id=\"deskriptive-analyse-1\" class=\"section level2 hasAnchor\">\r\n<h1>Deskriptive Analyse<\/h1>\r\nBetrachten wir die Daten zun\u00e4chst mit Hilfe eines Boxplots.\r\n<div id=\"cb194\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb194-1\"><span class=\"fu\">boxplot<\/span>(mtcars<span class=\"sc\">$<\/span>mpg<span class=\"sc\">~<\/span>mtcars<span class=\"sc\">$<\/span>am)<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-227-1.png\" width=\"672\" \/>\r\n\r\nDas Getriebe scheint einen Einfluss auf den Verbrauch zu haben, ob dieser auch statistisch signifikant ist, k\u00f6nnte man zum Beispiel mit einem t-Test oder eben auch einer ANOVA testen.\r\n<div id=\"cb195\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb195-1\">Test <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov<\/span>(mpg<span class=\"sc\">~<\/span>am,<span class=\"at\">data =<\/span> mtcars)<\/span>\r\n<span id=\"cb195-2\"><span class=\"fu\">summary<\/span>(Test)<\/span>\r\n<span id=\"cb195-3\"><span class=\"do\">##             Df Sum Sq Mean Sq F value   Pr(&gt;F)    <\/span><\/span>\r\n<span id=\"cb195-4\"><span class=\"do\">## am           1  405.2   405.2   16.86 0.000285 ***<\/span><\/span>\r\n<span id=\"cb195-5\"><span class=\"do\">## Residuals   30  720.9    24.0                     <\/span><\/span>\r\n<span id=\"cb195-6\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb195-7\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nDer t-Test wird signifikant. Der Unterschied im Verbrauch ist also statistisch signifikant. Das hei\u00dft aber nicht unbedingt, dass das Getriebe auch urs\u00e4chlich ist f\u00fcr den h\u00f6heren Verbrauch. Hier hilft uns die ANCOVA.\r\n\r\n<\/div>\r\n<div id=\"hypothese-f\u00fcr-die-kovariate\" class=\"section level2 hasAnchor\">\r\n<h1>Hypothese f\u00fcr die Kovariate<\/h1>\r\nEs k\u00f6nnte sein, dass der Einfluss eigentlich durch die Motorleistung (hp) verursacht wird und bei gleichbleibender Leistung (hp) das Getriebe gar keinen Einfluss auf den Verbauch (mpg) hat.\r\n\r\n<\/div>\r\n<div id=\"voraussetzungen-pr\u00fcfen-1\" class=\"section level2 hasAnchor\">\r\n<h1>Voraussetzungen pr\u00fcfen<\/h1>\r\nDie Voraussetzungen sind bei ANCOVA insbesondere Varianzhomogenit\u00e4t und Unabh\u00e4ngigkeit des Pr\u00e4diktors von der Kovariate\r\n\r\n<strong>Varianzhomogenit\u00e4t<\/strong>\r\n\r\nTesten wir zun\u00e4chst die Varianzhomogenit\u00e4t mit dem Levene-Test. Die Notation ist wie bisher, jedoch m\u00fcssen wir die Variable Getriebe (am) als Faktor hinterlegen. Dies machen wir hier mit <em>as.factor<\/em>.\r\n<div id=\"cb196\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb196-1\"><span class=\"fu\">library<\/span>(car)<\/span>\r\n<span id=\"cb196-2\"><span class=\"fu\">leveneTest<\/span>(mtcars<span class=\"sc\">$<\/span>mpg, <span class=\"fu\">as.factor<\/span>(mtcars<span class=\"sc\">$<\/span>am))<\/span>\r\n<span id=\"cb196-3\"><span class=\"do\">## Levene's Test for Homogeneity of Variance (center = median)<\/span><\/span>\r\n<span id=\"cb196-4\"><span class=\"do\">##       Df F value  Pr(&gt;F)  <\/span><\/span>\r\n<span id=\"cb196-5\"><span class=\"do\">## group  1  4.1876 0.04957 *<\/span><\/span>\r\n<span id=\"cb196-6\"><span class=\"do\">##       30                  <\/span><\/span>\r\n<span id=\"cb196-7\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb196-8\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nDer Test wird knapp signifikant. Wir m\u00fcssen unsere Ergebnisse also mit Vorsicht betrachten oder robuste Methoden nutzen. Da der Wert genau an der Grenze ist, machen wir an dieser Stelle mit der ANCOVA weiter.\r\n\r\n<strong>Unabh\u00e4ngigkeit des Pr\u00e4diktors von der Kovariate<\/strong>\r\n\r\nWir m\u00fcssen die Frage beantworten, ob es auf den verschiedenen Stufen der UV (Getriebeart) statistisch signifikante Unterschiede in der Kovariate (Leistung) gibt\r\n\r\nHierzu f\u00fchren wir eine ANOVA mit dem Pr\u00e4diktor und der Kovariate aus.\r\n<div id=\"cb197\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb197-1\">ANOVA_Test<span class=\"ot\">&lt;-<\/span><span class=\"fu\">aov<\/span>(hp<span class=\"sc\">~<\/span>am, <span class=\"at\">data=<\/span>mtcars)<\/span>\r\n<span id=\"cb197-2\"><span class=\"fu\">summary<\/span>(ANOVA_Test)<\/span>\r\n<span id=\"cb197-3\"><span class=\"do\">##             Df Sum Sq Mean Sq F value Pr(&gt;F)<\/span><\/span>\r\n<span id=\"cb197-4\"><span class=\"do\">## am           1   8619    8619   1.886   0.18<\/span><\/span>\r\n<span id=\"cb197-5\"><span class=\"do\">## Residuals   30 137107    4570<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nDas Ergebnis zeigt, dass es keinen signifikanten Unterschied in der Leistung, abh\u00e4ngig vom Getriebe, gibt. Der Pr\u00e4diktor (Getriebe) ist also von der Kovariate unabh\u00e4ngig.\r\n\r\n<\/div>\r\n<div id=\"ancova-durchf\u00fchren\" class=\"section level2 hasAnchor\">\r\n<h1>ANCOVA durchf\u00fchren<\/h1>\r\nWir wollen testen, ob der Einfluss auf den Verbrauch durch die Motorleistung (hp) verursacht wird und bei gleichbleibender Leistung (hp) das Getriebe gar keinen Einfluss auf den Verbauch (mpg) hat. Um diese M\u00f6glichkeit zu testen, f\u00fchren wir eine ANCOVA durch und kontrollieren f\u00fcr die Leistung (hp).\r\n\r\nWir nutzen im n\u00e4chsten Schritt das lineare Modell, welches wir mit <em>lm<\/em> aufrufen. Die gesamte Notation lautet: <em>lm(AV~UV<\/em>Kovariate)*\r\n<div id=\"cb198\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb198-1\">ANCOVA_CARS <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">lm<\/span>(mpg<span class=\"sc\">~<\/span>am<span class=\"sc\">*<\/span>hp,<span class=\"at\">data =<\/span> mtcars)<\/span>\r\n<span id=\"cb198-2\"><span class=\"fu\">summary<\/span>(ANCOVA_CARS)<\/span>\r\n<span id=\"cb198-3\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-4\"><span class=\"do\">## Call:<\/span><\/span>\r\n<span id=\"cb198-5\"><span class=\"do\">## lm(formula = mpg ~ am * hp, data = mtcars)<\/span><\/span>\r\n<span id=\"cb198-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-7\"><span class=\"do\">## Residuals:<\/span><\/span>\r\n<span id=\"cb198-8\"><span class=\"do\">##     Min      1Q  Median      3Q     Max <\/span><\/span>\r\n<span id=\"cb198-9\"><span class=\"do\">## -4.3818 -2.2696  0.1344  1.7058  5.8752 <\/span><\/span>\r\n<span id=\"cb198-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-11\"><span class=\"do\">## Coefficients:<\/span><\/span>\r\n<span id=\"cb198-12\"><span class=\"do\">##               Estimate Std. Error t value         Pr(&gt;|t|)    <\/span><\/span>\r\n<span id=\"cb198-13\"><span class=\"do\">## (Intercept) 26.6248479  2.1829432  12.197 0.00000000000101 ***<\/span><\/span>\r\n<span id=\"cb198-14\"><span class=\"do\">## am           5.2176534  2.6650931   1.958           0.0603 .  <\/span><\/span>\r\n<span id=\"cb198-15\"><span class=\"do\">## hp          -0.0591370  0.0129449  -4.568 0.00009018507863 ***<\/span><\/span>\r\n<span id=\"cb198-16\"><span class=\"do\">## am:hp        0.0004029  0.0164602   0.024           0.9806    <\/span><\/span>\r\n<span id=\"cb198-17\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb198-18\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span>\r\n<span id=\"cb198-19\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-20\"><span class=\"do\">## Residual standard error: 2.961 on 28 degrees of freedom<\/span><\/span>\r\n<span id=\"cb198-21\"><span class=\"do\">## Multiple R-squared:  0.782,  Adjusted R-squared:  0.7587 <\/span><\/span>\r\n<span id=\"cb198-22\"><span class=\"do\">## F-statistic: 33.49 on 3 and 28 DF,  p-value: 0.000000002112<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nDie Ergebnisse zeigen, dass nun, mit Kovariate, nur die Leistung (hp) einen signifikanten Einfluss auf den Verbrauch hat. Der Faktor Getriebe (am) hat nun keinen siginifikanten Einfluss auf den Verbrauch hat (mpg) mehr. Auch der Interaktionseffekt wird nicht signifikant.\r\n\r\nMit anderen Worten: Bei konstanter Leistung gibt es keinen signifikanten Unterschied im Verbrauch zwischen Fahrzeugen mit und ohne Automatikgetriebe.\r\n\r\nUm besser zu verstehen, wie die Getriebe, die Leistung und der Verbauch zusammenh\u00e4ngen, erstellen wir ein Interaktionsdiagramm\r\n\r\nHierf\u00fcr nutzen wir das Paket <em>rockchalk<\/em>\r\n<div id=\"cb199\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb199-1\"><span class=\"fu\">library<\/span>(rockchalk)<\/span>\r\n<span id=\"cb199-2\">slopes <span class=\"ot\">&lt;-<\/span><span class=\"fu\">plotSlopes<\/span>(ANCOVA_CARS,<span class=\"at\">plotx=<\/span><span class=\"st\">\"hp\"<\/span>, <span class=\"at\">modx=<\/span><span class=\"st\">\"am\"<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-232-1.png\" width=\"672\" \/>\r\n\r\nDas Diagramm zeigt, dass es keinen Interaktionseffekt gibt (Linien fast parallel), was wir auch in den Daten bereits gesehen haben. Das hei\u00dft, mit zunehmender Leistung nimmt der Verbrauch zu (mpg nimmt ab), unabh\u00e4ngig davon, ob manuelles oder Automatikgetriebe.\r\n\r\nIn diesem Video zeige ich, wie das in R funktioniert:\r\n<div class=\"vembedr\" align=\"center\">\r\n<div><iframe src=\"https:\/\/www.youtube.com\/embed\/CttWPwq_mc4\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\r\n<\/div>\r\n<\/div>","rendered":"<h1>ANCOVA Kovarianzanalyse<\/h1>\n<p>Die Kovarianzanalyse (ANCOVA) ist ein statistisches Verfahren, mit dem die Beziehung zwischen einer kontinuierlichen abh\u00e4ngigen Variablen und einer oder mehreren kategorialen unabh\u00e4ngigen Variablen analysiert wird, w\u00e4hrend gleichzeitig f\u00fcr die Auswirkungen einer oder mehrerer kontinuierlicher Kovariaten kontrolliert wird. Die allgemeine Idee hinter der ANCOVA besteht darin, die Variation in der abh\u00e4ngigen Variable, die durch die Kovariablen erkl\u00e4rt wird, zu bereinigen, so dass die verbleibende Variation den Auswirkungen der unabh\u00e4ngigen Variablen zugeschrieben werden kann.<\/p>\n<p>ANCOVA kann in R mit der Funktion lm<em>()<\/em> durchgef\u00fchrt werden, also dem generellen linearen Modell. Die grundlegende Syntax f\u00fcr die Verwendung von lm() zur Durchf\u00fchrung einer ANCOVA lautet wie folgt:<\/p>\n<p>ANCOVA &lt;- lm(abh\u00e4ngige_Variable ~ unabh\u00e4ngige_Variable + Kovariate, Daten = data_frame)<\/p>\n<p>Hier wird die abh\u00e4ngige Variable auf der linken Seite der Formel angegeben, und die unabh\u00e4ngige Variable und Kovariate(n) werden auf der rechten Seite der Formel angegeben, getrennt durch ein + Symbol.<\/p>\n<div id=\"beispiel-1\" class=\"section level2 hasAnchor\">\n<h1>Beispiel<\/h1>\n<p>Wir nutzen Datensatz mtcars (in R Hinterlegt). Wir wollen der Frage nachgehen, ob Autos mit Automatikgetriebe (am) mehr Benzin verbrauchen (mpg), als solche mit Schaltgetriebe? Beachten Sie, dass der Verbrauch der Fahrzeuge hier in Miles per Gallon (mpg) angegeben ist und hier ein kleinerer Wert einen gr\u00f6\u00dferen Verbrauch angibt (Das Fahrzeug schafft weniger Meilen mit einer Galone Benzin).<\/p>\n<\/div>\n<div id=\"daten-laden-1\" class=\"section level2 hasAnchor\">\n<h1>Daten laden<\/h1>\n<p>Da die Daten in r hinterlegt sind, m\u00fcssen wir die Daten nicht laden, sondern k\u00f6nnen direkt darauf zugreifen. Schauen wir uns die Daten zun\u00e4chst einmal an.<\/p>\n<div id=\"cb193\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb193-1\"><span class=\"fu\">head<\/span>(mtcars)<\/span>\r\n<span id=\"cb193-2\"><span class=\"do\">##                    mpg cyl disp  hp drat    wt  qsec vs am gear<\/span><\/span>\r\n<span id=\"cb193-3\"><span class=\"do\">## Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4<\/span><\/span>\r\n<span id=\"cb193-4\"><span class=\"do\">## Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4<\/span><\/span>\r\n<span id=\"cb193-5\"><span class=\"do\">## Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4<\/span><\/span>\r\n<span id=\"cb193-6\"><span class=\"do\">## Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3<\/span><\/span>\r\n<span id=\"cb193-7\"><span class=\"do\">## Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3<\/span><\/span>\r\n<span id=\"cb193-8\"><span class=\"do\">## Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3<\/span><\/span>\r\n<span id=\"cb193-9\"><span class=\"do\">##                   carb<\/span><\/span>\r\n<span id=\"cb193-10\"><span class=\"do\">## Mazda RX4            4<\/span><\/span>\r\n<span id=\"cb193-11\"><span class=\"do\">## Mazda RX4 Wag        4<\/span><\/span>\r\n<span id=\"cb193-12\"><span class=\"do\">## Datsun 710           1<\/span><\/span>\r\n<span id=\"cb193-13\"><span class=\"do\">## Hornet 4 Drive       1<\/span><\/span>\r\n<span id=\"cb193-14\"><span class=\"do\">## Hornet Sportabout    2<\/span><\/span>\r\n<span id=\"cb193-15\"><span class=\"do\">## Valiant              1<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Verwenden Sie die Hilfefunktion zu diesem Datensatz mit <em>?mtcars<\/em>, um diesen n\u00e4her zu verstehen. Das Wichtigste: Bei der Variable am bedeutet 0 Automatikgetriebe und 1 Handschaltung.<\/p>\n<\/div>\n<div id=\"deskriptive-analyse-1\" class=\"section level2 hasAnchor\">\n<h1>Deskriptive Analyse<\/h1>\n<p>Betrachten wir die Daten zun\u00e4chst mit Hilfe eines Boxplots.<\/p>\n<div id=\"cb194\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb194-1\"><span class=\"fu\">boxplot<\/span>(mtcars<span class=\"sc\">$<\/span>mpg<span class=\"sc\">~<\/span>mtcars<span class=\"sc\">$<\/span>am)<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-227-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Das Getriebe scheint einen Einfluss auf den Verbrauch zu haben, ob dieser auch statistisch signifikant ist, k\u00f6nnte man zum Beispiel mit einem t-Test oder eben auch einer ANOVA testen.<\/p>\n<div id=\"cb195\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb195-1\">Test <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov<\/span>(mpg<span class=\"sc\">~<\/span>am,<span class=\"at\">data =<\/span> mtcars)<\/span>\r\n<span id=\"cb195-2\"><span class=\"fu\">summary<\/span>(Test)<\/span>\r\n<span id=\"cb195-3\"><span class=\"do\">##             Df Sum Sq Mean Sq F value   Pr(&gt;F)    <\/span><\/span>\r\n<span id=\"cb195-4\"><span class=\"do\">## am           1  405.2   405.2   16.86 0.000285 ***<\/span><\/span>\r\n<span id=\"cb195-5\"><span class=\"do\">## Residuals   30  720.9    24.0                     <\/span><\/span>\r\n<span id=\"cb195-6\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb195-7\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Der t-Test wird signifikant. Der Unterschied im Verbrauch ist also statistisch signifikant. Das hei\u00dft aber nicht unbedingt, dass das Getriebe auch urs\u00e4chlich ist f\u00fcr den h\u00f6heren Verbrauch. Hier hilft uns die ANCOVA.<\/p>\n<\/div>\n<div id=\"hypothese-f\u00fcr-die-kovariate\" class=\"section level2 hasAnchor\">\n<h1>Hypothese f\u00fcr die Kovariate<\/h1>\n<p>Es k\u00f6nnte sein, dass der Einfluss eigentlich durch die Motorleistung (hp) verursacht wird und bei gleichbleibender Leistung (hp) das Getriebe gar keinen Einfluss auf den Verbauch (mpg) hat.<\/p>\n<\/div>\n<div id=\"voraussetzungen-pr\u00fcfen-1\" class=\"section level2 hasAnchor\">\n<h1>Voraussetzungen pr\u00fcfen<\/h1>\n<p>Die Voraussetzungen sind bei ANCOVA insbesondere Varianzhomogenit\u00e4t und Unabh\u00e4ngigkeit des Pr\u00e4diktors von der Kovariate<\/p>\n<p><strong>Varianzhomogenit\u00e4t<\/strong><\/p>\n<p>Testen wir zun\u00e4chst die Varianzhomogenit\u00e4t mit dem Levene-Test. Die Notation ist wie bisher, jedoch m\u00fcssen wir die Variable Getriebe (am) als Faktor hinterlegen. Dies machen wir hier mit <em>as.factor<\/em>.<\/p>\n<div id=\"cb196\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb196-1\"><span class=\"fu\">library<\/span>(car)<\/span>\r\n<span id=\"cb196-2\"><span class=\"fu\">leveneTest<\/span>(mtcars<span class=\"sc\">$<\/span>mpg, <span class=\"fu\">as.factor<\/span>(mtcars<span class=\"sc\">$<\/span>am))<\/span>\r\n<span id=\"cb196-3\"><span class=\"do\">## Levene's Test for Homogeneity of Variance (center = median)<\/span><\/span>\r\n<span id=\"cb196-4\"><span class=\"do\">##       Df F value  Pr(&gt;F)  <\/span><\/span>\r\n<span id=\"cb196-5\"><span class=\"do\">## group  1  4.1876 0.04957 *<\/span><\/span>\r\n<span id=\"cb196-6\"><span class=\"do\">##       30                  <\/span><\/span>\r\n<span id=\"cb196-7\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb196-8\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Der Test wird knapp signifikant. Wir m\u00fcssen unsere Ergebnisse also mit Vorsicht betrachten oder robuste Methoden nutzen. Da der Wert genau an der Grenze ist, machen wir an dieser Stelle mit der ANCOVA weiter.<\/p>\n<p><strong>Unabh\u00e4ngigkeit des Pr\u00e4diktors von der Kovariate<\/strong><\/p>\n<p>Wir m\u00fcssen die Frage beantworten, ob es auf den verschiedenen Stufen der UV (Getriebeart) statistisch signifikante Unterschiede in der Kovariate (Leistung) gibt<\/p>\n<p>Hierzu f\u00fchren wir eine ANOVA mit dem Pr\u00e4diktor und der Kovariate aus.<\/p>\n<div id=\"cb197\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb197-1\">ANOVA_Test<span class=\"ot\">&lt;-<\/span><span class=\"fu\">aov<\/span>(hp<span class=\"sc\">~<\/span>am, <span class=\"at\">data=<\/span>mtcars)<\/span>\r\n<span id=\"cb197-2\"><span class=\"fu\">summary<\/span>(ANOVA_Test)<\/span>\r\n<span id=\"cb197-3\"><span class=\"do\">##             Df Sum Sq Mean Sq F value Pr(&gt;F)<\/span><\/span>\r\n<span id=\"cb197-4\"><span class=\"do\">## am           1   8619    8619   1.886   0.18<\/span><\/span>\r\n<span id=\"cb197-5\"><span class=\"do\">## Residuals   30 137107    4570<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Das Ergebnis zeigt, dass es keinen signifikanten Unterschied in der Leistung, abh\u00e4ngig vom Getriebe, gibt. Der Pr\u00e4diktor (Getriebe) ist also von der Kovariate unabh\u00e4ngig.<\/p>\n<\/div>\n<div id=\"ancova-durchf\u00fchren\" class=\"section level2 hasAnchor\">\n<h1>ANCOVA durchf\u00fchren<\/h1>\n<p>Wir wollen testen, ob der Einfluss auf den Verbrauch durch die Motorleistung (hp) verursacht wird und bei gleichbleibender Leistung (hp) das Getriebe gar keinen Einfluss auf den Verbauch (mpg) hat. Um diese M\u00f6glichkeit zu testen, f\u00fchren wir eine ANCOVA durch und kontrollieren f\u00fcr die Leistung (hp).<\/p>\n<p>Wir nutzen im n\u00e4chsten Schritt das lineare Modell, welches wir mit <em>lm<\/em> aufrufen. Die gesamte Notation lautet: <em>lm(AV~UV<\/em>Kovariate)*<\/p>\n<div id=\"cb198\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb198-1\">ANCOVA_CARS <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">lm<\/span>(mpg<span class=\"sc\">~<\/span>am<span class=\"sc\">*<\/span>hp,<span class=\"at\">data =<\/span> mtcars)<\/span>\r\n<span id=\"cb198-2\"><span class=\"fu\">summary<\/span>(ANCOVA_CARS)<\/span>\r\n<span id=\"cb198-3\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-4\"><span class=\"do\">## Call:<\/span><\/span>\r\n<span id=\"cb198-5\"><span class=\"do\">## lm(formula = mpg ~ am * hp, data = mtcars)<\/span><\/span>\r\n<span id=\"cb198-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-7\"><span class=\"do\">## Residuals:<\/span><\/span>\r\n<span id=\"cb198-8\"><span class=\"do\">##     Min      1Q  Median      3Q     Max <\/span><\/span>\r\n<span id=\"cb198-9\"><span class=\"do\">## -4.3818 -2.2696  0.1344  1.7058  5.8752 <\/span><\/span>\r\n<span id=\"cb198-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-11\"><span class=\"do\">## Coefficients:<\/span><\/span>\r\n<span id=\"cb198-12\"><span class=\"do\">##               Estimate Std. Error t value         Pr(&gt;|t|)    <\/span><\/span>\r\n<span id=\"cb198-13\"><span class=\"do\">## (Intercept) 26.6248479  2.1829432  12.197 0.00000000000101 ***<\/span><\/span>\r\n<span id=\"cb198-14\"><span class=\"do\">## am           5.2176534  2.6650931   1.958           0.0603 .  <\/span><\/span>\r\n<span id=\"cb198-15\"><span class=\"do\">## hp          -0.0591370  0.0129449  -4.568 0.00009018507863 ***<\/span><\/span>\r\n<span id=\"cb198-16\"><span class=\"do\">## am:hp        0.0004029  0.0164602   0.024           0.9806    <\/span><\/span>\r\n<span id=\"cb198-17\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb198-18\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span>\r\n<span id=\"cb198-19\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb198-20\"><span class=\"do\">## Residual standard error: 2.961 on 28 degrees of freedom<\/span><\/span>\r\n<span id=\"cb198-21\"><span class=\"do\">## Multiple R-squared:  0.782,  Adjusted R-squared:  0.7587 <\/span><\/span>\r\n<span id=\"cb198-22\"><span class=\"do\">## F-statistic: 33.49 on 3 and 28 DF,  p-value: 0.000000002112<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Die Ergebnisse zeigen, dass nun, mit Kovariate, nur die Leistung (hp) einen signifikanten Einfluss auf den Verbrauch hat. Der Faktor Getriebe (am) hat nun keinen siginifikanten Einfluss auf den Verbrauch hat (mpg) mehr. Auch der Interaktionseffekt wird nicht signifikant.<\/p>\n<p>Mit anderen Worten: Bei konstanter Leistung gibt es keinen signifikanten Unterschied im Verbrauch zwischen Fahrzeugen mit und ohne Automatikgetriebe.<\/p>\n<p>Um besser zu verstehen, wie die Getriebe, die Leistung und der Verbauch zusammenh\u00e4ngen, erstellen wir ein Interaktionsdiagramm<\/p>\n<p>Hierf\u00fcr nutzen wir das Paket <em>rockchalk<\/em><\/p>\n<div id=\"cb199\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb199-1\"><span class=\"fu\">library<\/span>(rockchalk)<\/span>\r\n<span id=\"cb199-2\">slopes <span class=\"ot\">&lt;-<\/span><span class=\"fu\">plotSlopes<\/span>(ANCOVA_CARS,<span class=\"at\">plotx=<\/span><span class=\"st\">\"hp\"<\/span>, <span class=\"at\">modx=<\/span><span class=\"st\">\"am\"<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-232-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Das Diagramm zeigt, dass es keinen Interaktionseffekt gibt (Linien fast parallel), was wir auch in den Daten bereits gesehen haben. Das hei\u00dft, mit zunehmender Leistung nimmt der Verbrauch zu (mpg nimmt ab), unabh\u00e4ngig davon, ob manuelles oder Automatikgetriebe.<\/p>\n<p>In diesem Video zeige ich, wie das in R funktioniert:<\/p>\n<div class=\"vembedr\" style=\"margin: auto;\">\n<div><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/CttWPwq_mc4\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\n<\/div>\n<\/div>\n","protected":false},"author":1,"menu_order":9,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":1725,"_links":{"self":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1770"}],"collection":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":3,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1770\/revisions"}],"predecessor-version":[{"id":1845,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1770\/revisions\/1845"}],"part":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/parts\/1725"}],"metadata":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1770\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/media?parent=1770"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapter-type?post=1770"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/contributor?post=1770"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/license?post=1770"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}