{"id":1753,"date":"2023-04-12T14:33:44","date_gmt":"2023-04-12T12:33:44","guid":{"rendered":"http:\/\/statistikgrundlagen.de\/ebook\/?post_type=chapter&#038;p=1753"},"modified":"2023-11-17T09:36:59","modified_gmt":"2023-11-17T08:36:59","slug":"einfaktorielle-anova-one-way-independent-anova-mit-r","status":"publish","type":"chapter","link":"https:\/\/statistikgrundlagen.de\/ebook\/chapter\/einfaktorielle-anova-one-way-independent-anova-mit-r\/","title":{"rendered":"Einfaktorielle ANOVA mit R (One-Way Independent ANOVA)"},"content":{"raw":"<h1>Einfaktorielle ANOVA (One-Way Independent ANOVA)<\/h1>\r\nDie einfaktorielle unabh\u00e4ngige ANOVA (Auch One-Way Independent ANOVA) ist eine statistische Methode zum Vergleich der Mittelwerte mehrerer Gruppen. Hierbei werden die Mittelwerte einer Variablen (abh\u00e4ngige Variable) zwischen verschiedenen Gruppen (unabh\u00e4ngige Variable) verglichen. Sie ist damit eine Alternative zum t-Test, welcher nur zwei Gruppenmittelwerte vergleichen kann.\r\n\r\nDie einfaktorielle unabh\u00e4ngige ANOVA wird sehr h\u00e4ufig in der Praxis eingesetzt. Nehmen wir beispielsweise an, ein Forscher ist daran interessiert, die Wirksamkeit einer neuen Lehrmethode auf die Sch\u00fclerleistungen zu bewerten. Der Forscher teilt die Sch\u00fcler nach dem Zufallsprinzip einer von drei Gruppen zu: einer Kontrollgruppe (traditionelle Lehrmethode), einer Versuchsgruppe 1 (neue Lehrmethode 1) und einer Versuchsgruppe 2 (neue Lehrmethode 2). Anschlie\u00dfend misst der Forscher die Leistungen der Sch\u00fcler anhand eines standardisierten Tests. Die Ergebnisse zeigen, dass die Kontrollgruppe eine mittlere Testpunktzahl von 75, die Versuchsgruppe 1 eine mittlere Testpunktzahl von 80 und die Versuchsgruppe 2 eine mittlere Testpunktzahl von 85 erreicht.\r\n\r\nMit Hilfe einer einseitigen unabh\u00e4ngigen ANOVA kann nun festgestellt werden, ob es einen signifikanten Unterschied zwischen den Mittelwerten der drei Gruppen gibt. Die Nullhypothese lautet, dass es keinen Unterschied zwischen den Mittelwerten der Gruppen gibt, w\u00e4hrend die Alternativhypothese lautet, dass es einen Unterschied zwischen den Mittelwerten der Gruppen gibt.\r\n<div id=\"schritt-1-vorbereitung\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 1 Vorbereitung<\/h1>\r\nNotwendige Pakete Laden:\r\n<div id=\"cb151\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb151-1\"><span class=\"fu\">library<\/span>(foreign)<\/span>\r\n<span id=\"cb151-2\"><span class=\"fu\">library<\/span>(car)<\/span>\r\n<span id=\"cb151-3\"><span class=\"fu\">library<\/span>(psych)<\/span>\r\n<span id=\"cb151-4\"><span class=\"fu\">library<\/span>(afex)<\/span>\r\n<span id=\"cb151-5\"><span class=\"fu\">library<\/span>(phia)<\/span>\r\n<span id=\"cb151-6\"><span class=\"fu\">library<\/span>(emmeans)<\/span><\/code><\/pre>\r\n<\/div>\r\nWissenschaftliche Notation ausschalten (Ausser Sie m\u00f6gen e+10 Notationen :-) )\r\n<div id=\"cb152\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb152-1\"><span class=\"fu\">options<\/span>(<span class=\"at\">scipen =<\/span> <span class=\"dv\">999<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\nGrunds\u00e4tzlich empfiehlt sich f\u00fcr die Durchf\u00fchrung der ANOVA folgendes Vorgehen:\r\n<ol style=\"list-style-type: decimal;\">\r\n \t<li>Eingabe \/ Import der Daten<\/li>\r\n \t<li>Daten untersuchen mit deskriptiven Statistiken (Mittelwerte, Grafiken erzeugen)<\/li>\r\n \t<li>Voraussetzungen pr\u00fcfen (insb. Skalen &amp; Varianzhomogenit\u00e4t, ggf. Normalit\u00e4t der AV in den Gruppen, wobei die ANOVA relativ robust gegen Verletzungen der Normalit\u00e4t ist)<\/li>\r\n \t<li>ANOVA durchf\u00fchren<\/li>\r\n \t<li>Kontraste oder Post-Hoc Tests durchf\u00fchren bzw. berechnen<\/li>\r\n<\/ol>\r\nNehmen wir als Beispiel wieder an, Sie wollen die Wirksamkeit der Wunderpille testen. Dies haben wir im vorausgegangenen Kapitel mit einem t-Test gemacht. Nun wollen wir die Hypothese testen, dass zwei Pillen ein noch wirksameres Mittel sind, um die Trinkfestigkeit zu steigern.\r\n\r\nSie schicken dieses Mal drei Gruppen von je 10 Personen auf den Cannstatter Wasen (unabh\u00e4ngiges Versuchsdesign mit 3 Gruppen):\r\n<ul>\r\n \t<li>Kontrollgruppe<\/li>\r\n \t<li>Gruppe, die eine Pille nimmt<\/li>\r\n \t<li>Gruppe, die zwei Pillen nimmt<\/li>\r\n<\/ul>\r\nDaten einlesen:\r\n<div id=\"cb153\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb153-1\">Trinkfestigkeit<span class=\"ot\">&lt;-<\/span><span class=\"fu\">read.csv2<\/span>(<span class=\"at\">file=<\/span><span class=\"st\">\"Trinkfestigkeit.csv\"<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\n<\/div>\r\n<div id=\"schritt-2-deskriptive-unterschiede\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 2 Deskriptive Unterschiede<\/h1>\r\nGibt es einen signifikanten Unterschied zwischen den 3 Gruppen? Das schauen wir uns dies zun\u00e4chst deskriptiv an und erzeugen einen Boxplot.\r\n<div id=\"cb154\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb154-1\"><span class=\"fu\">boxplot<\/span>(Trinkfestigkeit<span class=\"sc\">$<\/span>ohnePille,Trinkfestigkeit<span class=\"sc\">$<\/span>mitPille,Trinkfestigkeit<span class=\"sc\">$<\/span>mit2Pillen, <\/span>\r\n<span id=\"cb154-2\">        <span class=\"at\">names=<\/span><span class=\"fu\">c<\/span>(<span class=\"st\">\"ohne Pille\"<\/span>,<span class=\"st\">\"Mit Pille\"<\/span>, <span class=\"st\">\"Mit 2 Pillen\"<\/span>))<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-180-1.png\" width=\"672\" \/>\r\n\r\nWie man sieht, unterscheidet sich vor allem der Median ohne Pille deutlich von den anderen beiden Werten. Die Streuung scheint jedoch bei der Gruppe mit zwei Pillen am gr\u00f6\u00dften zu sein.\r\n\r\n<\/div>\r\n<div id=\"schritt-3-voraussetzungen-pr\u00fcfen\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 3 Voraussetzungen pr\u00fcfen<\/h1>\r\nBei der einseitigen unabh\u00e4ngigen ANOVA werden mehrere Annahmen \u00fcber die zu analysierenden Daten getroffen. Zu diesen Annahmen geh\u00f6ren:\r\n<ul>\r\n \t<li>Unabh\u00e4ngigkeit: Die Beobachtungen in jeder Gruppe sind unabh\u00e4ngig voneinander. Dies ist hier gegeben, da es drei unterschiedliche Gruppen sind.<\/li>\r\n \t<li>Skalenniveau: Die abh\u00e4ngige Variable muss metrisch skaliert sein. Dies ist hier gegeben (Menge in ml)<\/li>\r\n \t<li>Gleiche Varianzen: Die Varianzen der Grundgesamtheiten, aus denen die Stichproben gezogen werden, sind gleich. Dies pr\u00fcfen wir nun mit dem Levene-Test.<\/li>\r\n<\/ul>\r\nHinweis zur Normalit\u00e4t: In \u00e4lteren Statistik-B\u00fcchern wird auch empfohlen auf Normalit\u00e4t der Residuen (seltener, der Daten) zu pr\u00fcfen. Da die ANOVA jedoch relativ robust gegen Verletzungen der Normalit\u00e4t ist, wird diese Voraussetzung in der Regel heute nicht mehr gepr\u00fcft.\r\n\r\n<strong>Pr\u00fcfen der Varianzhomogenitaet<\/strong>\r\n\r\nDa der Levene-Test nur Daten im Long-Format akzeptiert, wandeln wir die Daten zun\u00e4chst in das Long-Format um.\r\n<div id=\"cb155\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb155-1\">Trink.long <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">stack<\/span>(Trinkfestigkeit)<\/span><\/code><\/pre>\r\n<\/div>\r\nNehmen wir uns die Zeit und benennen die Variablen\r\n<div id=\"cb156\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb156-1\"><span class=\"fu\">colnames<\/span>(Trink.long) <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">c<\/span>(<span class=\"st\">\"Menge\"<\/span>,<span class=\"st\">\"Gruppe\"<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\nSo sehen die Daten nun im Long-Format aus.\r\n<div id=\"cb157\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb157-1\"><span class=\"fu\">head<\/span>(Trink.long)<\/span>\r\n<span id=\"cb157-2\"><span class=\"do\">##   Menge    Gruppe<\/span><\/span>\r\n<span id=\"cb157-3\"><span class=\"do\">## 1   950 ohnePille<\/span><\/span>\r\n<span id=\"cb157-4\"><span class=\"do\">## 2  1540 ohnePille<\/span><\/span>\r\n<span id=\"cb157-5\"><span class=\"do\">## 3  2450 ohnePille<\/span><\/span>\r\n<span id=\"cb157-6\"><span class=\"do\">## 4  2650 ohnePille<\/span><\/span>\r\n<span id=\"cb157-7\"><span class=\"do\">## 5  1320 ohnePille<\/span><\/span>\r\n<span id=\"cb157-8\"><span class=\"do\">## 6   910 ohnePille<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nNun f\u00fchren wir den Test auf Varianzhomogenitaet durch. Die Argumente kennen Sie bereits aus dem Kapitel zum t-Test.\r\n<div id=\"cb158\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb158-1\"><span class=\"fu\">leveneTest<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long) <\/span>\r\n<span id=\"cb158-2\"><span class=\"do\">## Levene's Test for Homogeneity of Variance (center = median)<\/span><\/span>\r\n<span id=\"cb158-3\"><span class=\"do\">##       Df F value Pr(&gt;F)<\/span><\/span>\r\n<span id=\"cb158-4\"><span class=\"do\">## group  2  2.1436 0.1368<\/span><\/span>\r\n<span id=\"cb158-5\"><span class=\"do\">##       27<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\n<\/div>\r\n<div id=\"schritt-3-anova-durchf\u00fchren\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 3 ANOVA durchf\u00fchren<\/h1>\r\nUm eine einseitige ANOVA in R durchzuf\u00fchren, k\u00f6nnen Sie die Funktion <em>aov()<\/em> verwenden. Die grundlegende Syntax f\u00fcr diese Funktion lautet wie folgt: <em>aov(y ~ x, Daten)<\/em> wobei y die abh\u00e4ngige Variable, x die unabh\u00e4ngige Variable (Gruppierungsvariable) und Daten der Datensatz ist.\r\n\r\nWenden wir dies nun auf unsere Daten an. Bei der Varianzanalyse, als auch sp\u00e4ter bei Regressionsmodellen, ist es sinnvoll, diese in einem neuen Objekt zu speichern. Sie k\u00f6nnen hier selbst einen Namen vergeben. In diesem Beispiel nennen wir das Objekt \u201cANOVA1\u201d\r\n<div id=\"cb159\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb159-1\">ANOVA1 <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long)<\/span><\/code><\/pre>\r\n<\/div>\r\nNun schauen wir uns die Ergebnisse der ANOVA an. Hierzu nutzen wir die <em>summary()<\/em> Funktion und wenden diese auf unser Objekt an.\r\n<div id=\"cb160\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb160-1\"><span class=\"fu\">summary<\/span>(ANOVA1)<\/span>\r\n<span id=\"cb160-2\"><span class=\"do\">##             Df   Sum Sq  Mean Sq F value  Pr(&gt;F)   <\/span><\/span>\r\n<span id=\"cb160-3\"><span class=\"do\">## Gruppe       2 29481007 14740503   5.705 0.00858 **<\/span><\/span>\r\n<span id=\"cb160-4\"><span class=\"do\">## Residuals   27 69762730  2583805                   <\/span><\/span>\r\n<span id=\"cb160-5\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb160-6\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nWenn Sie die Funktion summary() auf ein einseitiges ANOVA-Objekt anwenden, liefert die Ausgabe mehrere wichtige Informationen, die f\u00fcr die Interpretation der Testergebnisse n\u00fctzlich sind.\r\n\r\nBetrachten wir zun\u00e4chst die erste Zeile \u201cGruppe\u201d, hier erhalten wir folgende Informationen:\r\n<ul>\r\n \t<li>Df: Freiheitsgrade. Dies ist die Anzahl der Beobachtungen, die in der Analyse frei variieren k\u00f6nnen.<\/li>\r\n \t<li>Sum Sq: Summe der Quadrate. Sie ist ein Ma\u00df f\u00fcr die Gesamtvariation in den Daten.<\/li>\r\n \t<li>Mean Sq: Mittlere Quadrate. Es ist das Verh\u00e4ltnis der Summe der Quadrate zu den Freiheitsgraden. Diese wird verwendet, um das F-Verh\u00e4ltnis zu berechnen, das das Verh\u00e4ltnis der Varianz zwischen den Gruppen zur Varianz innerhalb der Gruppen darstellt.<\/li>\r\n \t<li>F-Wert: Der berechnete F-Wert aus dem ANOVA-Test.<\/li>\r\n \t<li>Pr(&gt;F): Der p-Wert. Er gibt die Wahrscheinlichkeit an, dass der Mittelwertunterschied auf einen Zufall zur\u00fcckzuf\u00fchren ist. Ein p-Wert von weniger als 0,05 wird im Allgemeinen als statistisch signifikant angesehen.<\/li>\r\n<\/ul>\r\nIn der zweiten Zeile \u201cResiduals\u201d werden die Differenzen zwischen den beobachteten Werten (den tats\u00e4chlichen Testergebnissen) und den vorhergesagten Werten (den Testergebnissen, die zu erwarten w\u00e4ren, wenn die Nullhypothese wahr w\u00e4re) angezeigt. Diese Residuen werden zur Berechnung der gruppeninternen Varianz verwendet, die ein Ma\u00df f\u00fcr die Variation innerhalb jeder Gruppe ist.\r\n\r\nIn der letzen Zeile werden die Signifikanzcodes erl\u00e4utert. Dies ist nur eine Legende und daher immer gleich. Signifikanzcodes werden verwendet, um die Signifikanz der Ergebnisse schnell zu erkennen. Liegt der p-Wert beispielsweise unter 0,05, wird er mit \u201c*\u201d angegeben, was auf einen signifikanten Unterschied der Mittelwerte zwischen den Gruppen hinweist. .\r\n\r\nIn diesem Fall wird die ANOVA signifikant, das bedeutet, dass sich mindestens zwei Gruppen signifikant unterscheiden. Bei der Interpretation der Ergebnisse einer einseitigen unabh\u00e4ngigen ANOVA ist zu beachten, dass ein signifikanter Unterschied in den Mittelwerten nicht unbedingt bedeutet, dass sich alle Gruppen unterscheiden. Es bedeutet lediglich, dass ein signifikanter Unterschied in den Mittelwerten mindestens bei zwei untersuchten Gruppen besteht. Daher m\u00fcssen wir im n\u00e4chsten Schritt noch eine sogenannte Post-Hoc Analyse durchf\u00fchren, um zu ermitteln, zwischen welchen der drei Gruppen signifikante Unterschiede bestehen.\r\n\r\nHinweis zur Verletzung der Voraussetzungen:\r\n\r\nWenn die Voraussetzung der Varianzhomogenit\u00e4t verletzt ist (also Varianzheterogenit\u00e4t vorliegt) kann eine ANOVA mit der <em>oneway.test<\/em> Funktion durchgef\u00fchrt werden. Diese beinhaltet eine Welch-Korrektur.\r\n<div id=\"cb161\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb161-1\"><span class=\"fu\">oneway.test<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long)<\/span>\r\n<span id=\"cb161-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb161-3\"><span class=\"do\">##  One-way analysis of means (not assuming equal variances)<\/span><\/span>\r\n<span id=\"cb161-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb161-5\"><span class=\"do\">## data:  Menge and Gruppe<\/span><\/span>\r\n<span id=\"cb161-6\"><span class=\"do\">## F = 7.8096, num df = 2.000, denom df = 16.775, p-value =<\/span><\/span>\r\n<span id=\"cb161-7\"><span class=\"do\">## 0.004007<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nIn diesem Video zeige ich, wie das in R funktioniert:\r\n<div class=\"vembedr\" align=\"center\">\r\n<div><iframe src=\"https:\/\/www.youtube.com\/embed\/WnnvSrdwnOU\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\r\n<\/div>\r\nAlternativ bietet sich f\u00fcr die Durchf\u00fchrung der Varianzanalyse auch das <em>afex<\/em>-Paket an. Dieses bietet insbesondere Vorteile f\u00fcr die Interpretation der mehrfaktoriellen ANOVA im n\u00e4chsten Schritt, kann aber auch bei der einfaktoriellen ANOVA angewendet werden. Die ANOVA Funktion in <em>afex<\/em> nennt sich <em>aov_car<\/em>. Die Notation entspricht dem oben beschriebenen Vorgehen bei der <em>aov<\/em> Funktion, nur dass zus\u00e4tzlich noch ein Error-Term definiert werden muss, der sich auf eine ID-Variable beziehen muss. Dies ist eine Variable, die jedem Versuchsteilnehmer eine eindeutige Nummer zuweist und ist insbesondere bei Messwiederholungs-Daten unerl\u00e4sslich. Unser kleiner Datensatz hat diese fortlaufende Nummer jedoch leider nicht, daher m\u00fcssen wir diese zuerst generieren:\r\n<div id=\"cb162\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb162-1\">Trink.long<span class=\"sc\">$<\/span>ID <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">c<\/span>(<span class=\"dv\">1<\/span><span class=\"sc\">:<\/span><span class=\"dv\">30<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\nDann laden wir das Paket und f\u00fchren die ANOVA durch. Das neue Objekt nennen wir \u201cANOVA1A\u201d.\r\n<div id=\"cb163\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb163-1\">ANOVA1A <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov_car<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe <span class=\"sc\">+<\/span> <span class=\"fu\">Error<\/span>(ID), <span class=\"at\">data=<\/span>Trink.long)<\/span>\r\n<span id=\"cb163-2\"><span class=\"do\">## Contrasts set to contr.sum for the following variables: Gruppe<\/span><\/span>\r\n<span id=\"cb163-3\"><span class=\"fu\">summary<\/span>(ANOVA1A)<\/span>\r\n<span id=\"cb163-4\"><span class=\"do\">## Anova Table (Type 3 tests)<\/span><\/span>\r\n<span id=\"cb163-5\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb163-6\"><span class=\"do\">## Response: Menge<\/span><\/span>\r\n<span id=\"cb163-7\"><span class=\"do\">##        num Df den Df     MSE     F     ges   Pr(&gt;F)   <\/span><\/span>\r\n<span id=\"cb163-8\"><span class=\"do\">## Gruppe      2     27 2583805 5.705 0.29706 0.008579 **<\/span><\/span>\r\n<span id=\"cb163-9\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb163-10\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nDer Output enstpricht in diesem Fall 1:1 dem Output, den wir zuvor mit der <em>aov<\/em> Funktion generiert haben (mit der Ausnahme, dass keine Residuen angezeigt werden). Daher entspricht die Interpretation der obigen.\r\n\r\nIn diesem Video zeige ich, wie das in R funktioniert:\r\n<div class=\"vembedr\" align=\"center\">\r\n<div><iframe src=\"https:\/\/www.youtube.com\/embed\/3mIZ5K_InhE\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\r\n<\/div>\r\n<\/div>\r\n<div id=\"schritt-4-post-hoc-verfahren\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 4 Post-Hoc Verfahren<\/h1>\r\nJetzt wissen wir, dass es einen Einfluss auf die Trinkfestigkeit gibt. Aber noch nicht welchen. Hierf\u00fcr ben\u00f6tigen wir sog. Post-hoc-Tests, um festzustellen, welche spezifischen Gruppenpaare f\u00fcr einen signifikanten Unterschied in den Mittelwerten verantwortlich sind, wenn ein einseitiger ANOVA-Test einen signifikanten Unterschied ergibt. Post-hoc-Tests werden \u00fcblicherweise nur nach einem signifikanten ANOVA-Ergebnis angewendet. Es gibt mehrere verschiedene Post-hoc-Tests, die f\u00fcr die einseitige ANOVA verwendet werden k\u00f6nnen, darunter der Tukey-HSD-Test, der Scheff\u00e9-Test und der Bonferroni-Test.\r\n\r\n<strong>Post-Hoc-Tests<\/strong>\r\n\r\nWir machen nun paarweise t-Tests, um zu ermitteln, welche Gruppen sich signifikant unterscheiden. Bei mehreren t-Tests mit derselben Stichprobe muss aufgrund der Alpha-Fehler-Inflation eine Korrektur vorgenommen werden. Mit zunehmender Anzahl der Vergleiche steigt auch die Wahrscheinlichkeit eines Alpha-Fehlers, was zu einem erh\u00f6hten Risiko falsch positiver Ergebnisse f\u00fchren kann. Die Bonferroni-Korrektur ist eine Methode zur Kontrolle der Alpha-Fehler-Inflation durch Anpassung der p-Wert-Schwelle f\u00fcr die Signifikanz.\r\n\r\nDie Korrektur ist dabei recht einfach: Bei der Bonferroni-Korrektur wird das Signifikanzniveau (Alpha) durch die Anzahl der durchgef\u00fchrten Vergleiche geteilt, wodurch ein konservativerer Schwellenwert f\u00fcr die Signifikanz entsteht. Wenn beispielsweise das Signifikanzniveau auf 0,05 festgelegt ist und 10 Vergleiche durchgef\u00fchrt werden, w\u00fcrde die Bonferroni-Korrektur 0,05 durch 10 teilen, was ein neues Signifikanzniveau von 0,005 ergibt.\r\n\r\nHierzu nutzen wir die Funktion <em>pairwise.t.test<\/em> mit dem Argument <em>p.adj=\u201cbonferroni\u201d<\/em>.\r\n<div id=\"cb164\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb164-1\"><span class=\"fu\">pairwise.t.test<\/span>(Trink.long<span class=\"sc\">$<\/span>Menge, Trink.long<span class=\"sc\">$<\/span>Gruppe, <span class=\"at\">p.adj=<\/span><span class=\"st\">\"bonferroni\"<\/span>)<\/span>\r\n<span id=\"cb164-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-3\"><span class=\"do\">##  Pairwise comparisons using t tests with pooled SD <\/span><\/span>\r\n<span id=\"cb164-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-5\"><span class=\"do\">## data:  Trink.long$Menge and Trink.long$Gruppe <\/span><\/span>\r\n<span id=\"cb164-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-7\"><span class=\"do\">##            ohnePille mitPille<\/span><\/span>\r\n<span id=\"cb164-8\"><span class=\"do\">## mitPille   0.047     -       <\/span><\/span>\r\n<span id=\"cb164-9\"><span class=\"do\">## mit2Pillen 0.011     1.000   <\/span><\/span>\r\n<span id=\"cb164-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-11\"><span class=\"do\">## P value adjustment method: bonferroni<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nWir sehen nun also, dass sich bei Einnahme einer Pille, die Trinkfestigkeit signifikant erh\u00f6ht (p = .047) und bei der Einnahme von zwei Pillen, dies Trinkfestigkeit ebenfalls signifikant steigt (p = .011) im Vergleich zur Kontrollgruppe ohne Pille. Jedoch gibt es keinen signifikanten Unterschied zwischen den Gruppen die eine und zwei Pillen genommen haben (p = 1), daher kann keine Empfehlung f\u00fcr das nehmen einer weiteren Pille ausgesprochen werden.\r\n\r\nHinweis: Im Falle von Varianzheterogenit\u00e4t sollte zus\u00e4tzlich das Argument <em>pool.sd=FALSE<\/em> aufgenommen werden\r\n<div id=\"cb165\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb165-1\"><span class=\"fu\">pairwise.t.test<\/span>(Trink.long<span class=\"sc\">$<\/span>Menge, Trink.long<span class=\"sc\">$<\/span>Gruppe, <span class=\"at\">p.adj=<\/span><span class=\"st\">\"bonferroni\"<\/span>,<span class=\"at\">pool.sd=<\/span><span class=\"cn\">FALSE<\/span>)<\/span>\r\n<span id=\"cb165-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-3\"><span class=\"do\">##  Pairwise comparisons using t tests with non-pooled SD <\/span><\/span>\r\n<span id=\"cb165-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-5\"><span class=\"do\">## data:  Trink.long$Menge and Trink.long$Gruppe <\/span><\/span>\r\n<span id=\"cb165-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-7\"><span class=\"do\">##            ohnePille mitPille<\/span><\/span>\r\n<span id=\"cb165-8\"><span class=\"do\">## mitPille   0.012     -       <\/span><\/span>\r\n<span id=\"cb165-9\"><span class=\"do\">## mit2Pillen 0.030     1.000   <\/span><\/span>\r\n<span id=\"cb165-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-11\"><span class=\"do\">## P value adjustment method: bonferroni<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nEs ist wichtig zu beachten, dass die Bonferroni-Korrektur eine sehr konservative Methode ist, die dazu neigt, die Typ-II-Fehlerrate zu erh\u00f6hen (eine falsche Nullhypothese wird nicht zur\u00fcckgewiesen), und sie ist m\u00f6glicherweise nicht geeignet, wenn die Anzahl der Vergleiche gro\u00df ist. Andere Methoden wie die Tukey sind hier gute Alternativen, da sie die Typ-II-Fehlerrate nicht so stark erh\u00f6hen.\r\n<h2><strong>Tukey\u2019s HSD Test<\/strong><\/h2>\r\nDer Tukey-HSD-Test (Honestly Significant Difference) ist ein weiterer Post-hoc-Test. Der Test vergleicht alle m\u00f6glichen Paare von Gruppenmittelwerten und berechnet einen Bereich von Unterschieden, die als statistisch signifikant angesehen werden, die sogenannten HSD-Intervalle. Liegt der Unterschied zwischen den Mittelwerten zweier Gruppen au\u00dferhalb dieses Intervalls, wird er als statistisch signifikant angesehen und die Gruppen werden als unterschiedlich betrachtet.\r\n\r\nDer Test ist recht einfach ausgef\u00fchrt.\r\n<div id=\"cb166\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb166-1\"><span class=\"fu\">TukeyHSD<\/span>(ANOVA1) <\/span>\r\n<span id=\"cb166-2\"><span class=\"do\">##   Tukey multiple comparisons of means<\/span><\/span>\r\n<span id=\"cb166-3\"><span class=\"do\">##     95% family-wise confidence level<\/span><\/span>\r\n<span id=\"cb166-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb166-5\"><span class=\"do\">## Fit: aov(formula = Menge ~ Gruppe, data = Trink.long)<\/span><\/span>\r\n<span id=\"cb166-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb166-7\"><span class=\"do\">## $Gruppe<\/span><\/span>\r\n<span id=\"cb166-8\"><span class=\"do\">##                      diff         lwr      upr     p adj<\/span><\/span>\r\n<span id=\"cb166-9\"><span class=\"do\">## mitPille-ohnePille   1854    71.64362 3636.356 0.0402560<\/span><\/span>\r\n<span id=\"cb166-10\"><span class=\"do\">## mit2Pillen-ohnePille 2285   502.64362 4067.356 0.0099925<\/span><\/span>\r\n<span id=\"cb166-11\"><span class=\"do\">## mit2Pillen-mitPille   431 -1351.35638 2213.356 0.8215272<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nAlternativ zum Tukey\u2019s HSD Test k\u00f6nnen mit dem <em>emmeans<\/em> Paket und gleichnamiger Funktion tuckey-korrigierte Paarvergleiche abgerufen werden. Hierzu muss immer die unabh\u00e4ngige Variable (also die Gruppierungsvariable) mit dem Befehl <em>specs<\/em> in Anf\u00fchrungszeichen angegeben werden. Die Ergebnisse k\u00f6nnen dann am besten mit der <em>pairs<\/em> Funktion ausgegeben werden (F\u00fcr den Paarvergleich).\r\n<div id=\"cb167\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb167-1\">ph1 <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">emmeans<\/span>(ANOVA1, <span class=\"at\">specs=<\/span><span class=\"st\">\"Gruppe\"<\/span>)<\/span>\r\n<span id=\"cb167-2\"><span class=\"fu\">pairs<\/span>(ph1)<\/span>\r\n<span id=\"cb167-3\"><span class=\"do\">##  contrast               estimate  SE df t.ratio p.value<\/span><\/span>\r\n<span id=\"cb167-4\"><span class=\"do\">##  ohnePille - mitPille      -1854 719 27  -2.579  0.0403<\/span><\/span>\r\n<span id=\"cb167-5\"><span class=\"do\">##  ohnePille - mit2Pillen    -2285 719 27  -3.179  0.0100<\/span><\/span>\r\n<span id=\"cb167-6\"><span class=\"do\">##  mitPille - mit2Pillen      -431 719 27  -0.600  0.8215<\/span><\/span>\r\n<span id=\"cb167-7\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb167-8\"><span class=\"do\">## P value adjustment: tukey method for comparing a family of 3 estimates<\/span><\/span><\/code><\/pre>\r\n<\/div>\r\nEine weitere Alternative w\u00e4ren geplante Kontraste. Hiermit k\u00f6nnen gezielte Gruppenvergleiche hergestellt werden, was noch sensitivere Ergebnisse erm\u00f6glicht, falls es bereits spezielle Hypothesen gibt. Diese werden an dieser Stelle jedoch nicht weiter vertieft.\r\n\r\nIn diesem Video zeige ich, wie das in R funktioniert:\r\n<div class=\"vembedr\" align=\"center\">\r\n<div><iframe src=\"https:\/\/www.youtube.com\/embed\/Hmfz_xhqCHI\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\r\n<\/div>\r\n<\/div>\r\n<div id=\"schritt-5-grafische-verfahren\" class=\"section level2 hasAnchor\">\r\n<h1>Schritt 5 Grafische Verfahren<\/h1>\r\nBei der Ergebnisdarstellung einer ANOVA bieten sich grunds\u00e4tzlich grafische Darstellungen an. Dies wird sp\u00e4ter bei mehrfaktoriellen Designs besonders spannend (Interaktionsdiagramm), kann aber auch schon bei einer einfaktoriellen ANOVA genutzt werden.\r\n\r\nPlot aus dem Paket \u201cphia\u201d mit der Funktion \"Interaction Means\". Wichtiger Hinweis: Diese Funktion erstellt standardm\u00e4\u00dfig Fehlerbalken mit einem Standardfehler. Wenn Sie diese mit dem \u00fcblichen 95% Konfidenzintervall erstellen wollen, m\u00fcssen Sie die \"plot\" Funktion noch um das Argument errorbar=\"ci95\" erg\u00e4nzen.\r\n<div id=\"cb168\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb168-1\"><span class=\"fu\">plot<\/span>(<span class=\"fu\">interactionMeans<\/span>(ANOVA1))\r\n<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-197-1.png\" width=\"672\" \/>\r\n\r\nAlternativ kann mit der Funktion <em>afex_plot<\/em> aus dem <em>afex<\/em> Paket eine sch\u00f6nere Grafik erzeugt werden, die auf GGPlot2 basiert und direkt das 95% Konfidenzintervall ausgiebt.\r\n<div id=\"cb169\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb169-1\"><span class=\"fu\">afex_plot<\/span>(ANOVA1A, <span class=\"at\">x=<\/span><span class=\"st\">\"Gruppe\"<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-198-1.png\" width=\"672\" \/>\r\n\r\nDie Darstellung ist ein Fehlerbalken-Diagramm mit den Mittelwerten und Standardabweichungen der Gruppen, wobei die Mittelwerte durch die Punkte und die Standardabweichungen durch die Boxplots selbst dargestellt sind. Zu sehen sind ausserdem (in hellerem Grau) auch die Rohdaten.\r\n<div class=\"vembedr\" align=\"center\">\r\n<div><iframe src=\"https:\/\/www.youtube.com\/embed\/-RmFv2u2JK4\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\r\n<\/div>\r\n<\/div>\r\n<div id=\"\u00fcbungsaufgabe\" class=\"section level2 hasAnchor\">\r\n<h1>\u00dcbung<\/h1>\r\nWir wollen die Wirksamkeit von Di\u00e4ten vergleichen. Wir haben ein Datenset (diet3.csv) von 78 Personen, die jeweils eine von 3 Di\u00e4ten durchlaufen haben. Wir haben das Gewicht vor der Di\u00e4t, das Gewicht nach der Di\u00e4t, die Variable \u201cweightlost\u201d, die Ihnen die Gewichtsabnahme (Zunahme) in Pfund angibt und einige Hintergrundinformationen.\r\n\r\nVergleichen Sie die 3 Di\u00e4ten im Hinblick auf ihre Wirksamkeit (AV ist \u201cweightlost\u201d).\r\n\r\nDie L\u00f6sung zu dieser \u00dcbungsaufgabe gibt es im neuen Buch<a href=\"https:\/\/amzn.to\/3MLBUb8\"> Statistik mit R &amp; RStudio<\/a>.\r\n\r\n<a href=\"https:\/\/amzn.to\/3MLBUb8\"><img class=\"alignnone size-full wp-image-1822\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3.png\" alt=\"\" width=\"900\" height=\"577\" \/><\/a>\r\n\r\n<\/div>\r\n<div id=\"\u00fcbungsaufgabe-1\" class=\"section level2 hasAnchor\">\r\n<h1>\u00dcbung<\/h1>\r\nWir wollen wissen, ob sich das Besucheraufkommen auf der Stuttgarter K\u00f6nigstrasse (Koenig_Mitte) signifikant zwischen den Wochentagen (Tag) unterscheidet.\r\n\r\nHierzu haben wir im Kapitel \u201cGrafiken\u201d folgenden plot erzeugt:\r\nDaten einlesen:\r\n<div id=\"cb170\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb170-1\"><span class=\"fu\">library<\/span>(readxl)<\/span>\r\n<span id=\"cb170-2\">Passanten <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">read_excel<\/span>(<span class=\"st\">\"Passanten2019.xlsx\"<\/span>)<\/span><\/code><\/pre>\r\n<\/div>\r\nPlot:\r\n<div id=\"cb171\" class=\"sourceCode\">\r\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb171-1\">Passanten<span class=\"sc\">$<\/span>Tag <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">as.factor<\/span>(Passanten<span class=\"sc\">$<\/span>Tag)<\/span>\r\n<span id=\"cb171-2\">Passanten<span class=\"sc\">$<\/span>Tag <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">ordered<\/span>(Passanten<span class=\"sc\">$<\/span>Tag,<span class=\"at\">levels=<\/span><span class=\"fu\">c<\/span>(<span class=\"st\">\"Mo\"<\/span>,<span class=\"st\">\"Di\"<\/span>,<span class=\"st\">\"Mi\"<\/span>,<span class=\"st\">\"Do\"<\/span>,<span class=\"st\">\"Fr\"<\/span>,<span class=\"st\">\"Sa\"<\/span>,<span class=\"st\">\"So\"<\/span>))<\/span>\r\n<span id=\"cb171-3\"><span class=\"fu\">plot<\/span>(Passanten<span class=\"sc\">$<\/span>Koenig_Mitte<span class=\"sc\">~<\/span>Passanten<span class=\"sc\">$<\/span>Tag)<\/span><\/code><\/pre>\r\n<\/div>\r\n<img src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-201-1.png\" width=\"672\" \/>\r\n\r\nVergleichen Sie die Wochentage, welche unterscheiden sich signifikant?\r\n\r\nDie L\u00f6sung zu dieser \u00dcbungsaufgabe gibt es im neuen Buch<a href=\"https:\/\/amzn.to\/3MLBUb8\"> Statistik mit R &amp; RStudio<\/a>.\r\n\r\n&nbsp;\r\n\r\n<\/div>","rendered":"<h1>Einfaktorielle ANOVA (One-Way Independent ANOVA)<\/h1>\n<p>Die einfaktorielle unabh\u00e4ngige ANOVA (Auch One-Way Independent ANOVA) ist eine statistische Methode zum Vergleich der Mittelwerte mehrerer Gruppen. Hierbei werden die Mittelwerte einer Variablen (abh\u00e4ngige Variable) zwischen verschiedenen Gruppen (unabh\u00e4ngige Variable) verglichen. Sie ist damit eine Alternative zum t-Test, welcher nur zwei Gruppenmittelwerte vergleichen kann.<\/p>\n<p>Die einfaktorielle unabh\u00e4ngige ANOVA wird sehr h\u00e4ufig in der Praxis eingesetzt. Nehmen wir beispielsweise an, ein Forscher ist daran interessiert, die Wirksamkeit einer neuen Lehrmethode auf die Sch\u00fclerleistungen zu bewerten. Der Forscher teilt die Sch\u00fcler nach dem Zufallsprinzip einer von drei Gruppen zu: einer Kontrollgruppe (traditionelle Lehrmethode), einer Versuchsgruppe 1 (neue Lehrmethode 1) und einer Versuchsgruppe 2 (neue Lehrmethode 2). Anschlie\u00dfend misst der Forscher die Leistungen der Sch\u00fcler anhand eines standardisierten Tests. Die Ergebnisse zeigen, dass die Kontrollgruppe eine mittlere Testpunktzahl von 75, die Versuchsgruppe 1 eine mittlere Testpunktzahl von 80 und die Versuchsgruppe 2 eine mittlere Testpunktzahl von 85 erreicht.<\/p>\n<p>Mit Hilfe einer einseitigen unabh\u00e4ngigen ANOVA kann nun festgestellt werden, ob es einen signifikanten Unterschied zwischen den Mittelwerten der drei Gruppen gibt. Die Nullhypothese lautet, dass es keinen Unterschied zwischen den Mittelwerten der Gruppen gibt, w\u00e4hrend die Alternativhypothese lautet, dass es einen Unterschied zwischen den Mittelwerten der Gruppen gibt.<\/p>\n<div id=\"schritt-1-vorbereitung\" class=\"section level2 hasAnchor\">\n<h1>Schritt 1 Vorbereitung<\/h1>\n<p>Notwendige Pakete Laden:<\/p>\n<div id=\"cb151\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb151-1\"><span class=\"fu\">library<\/span>(foreign)<\/span>\r\n<span id=\"cb151-2\"><span class=\"fu\">library<\/span>(car)<\/span>\r\n<span id=\"cb151-3\"><span class=\"fu\">library<\/span>(psych)<\/span>\r\n<span id=\"cb151-4\"><span class=\"fu\">library<\/span>(afex)<\/span>\r\n<span id=\"cb151-5\"><span class=\"fu\">library<\/span>(phia)<\/span>\r\n<span id=\"cb151-6\"><span class=\"fu\">library<\/span>(emmeans)<\/span><\/code><\/pre>\n<\/div>\n<p>Wissenschaftliche Notation ausschalten (Ausser Sie m\u00f6gen e+10 Notationen \ud83d\ude42 )<\/p>\n<div id=\"cb152\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb152-1\"><span class=\"fu\">options<\/span>(<span class=\"at\">scipen =<\/span> <span class=\"dv\">999<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p>Grunds\u00e4tzlich empfiehlt sich f\u00fcr die Durchf\u00fchrung der ANOVA folgendes Vorgehen:<\/p>\n<ol style=\"list-style-type: decimal;\">\n<li>Eingabe \/ Import der Daten<\/li>\n<li>Daten untersuchen mit deskriptiven Statistiken (Mittelwerte, Grafiken erzeugen)<\/li>\n<li>Voraussetzungen pr\u00fcfen (insb. Skalen &amp; Varianzhomogenit\u00e4t, ggf. Normalit\u00e4t der AV in den Gruppen, wobei die ANOVA relativ robust gegen Verletzungen der Normalit\u00e4t ist)<\/li>\n<li>ANOVA durchf\u00fchren<\/li>\n<li>Kontraste oder Post-Hoc Tests durchf\u00fchren bzw. berechnen<\/li>\n<\/ol>\n<p>Nehmen wir als Beispiel wieder an, Sie wollen die Wirksamkeit der Wunderpille testen. Dies haben wir im vorausgegangenen Kapitel mit einem t-Test gemacht. Nun wollen wir die Hypothese testen, dass zwei Pillen ein noch wirksameres Mittel sind, um die Trinkfestigkeit zu steigern.<\/p>\n<p>Sie schicken dieses Mal drei Gruppen von je 10 Personen auf den Cannstatter Wasen (unabh\u00e4ngiges Versuchsdesign mit 3 Gruppen):<\/p>\n<ul>\n<li>Kontrollgruppe<\/li>\n<li>Gruppe, die eine Pille nimmt<\/li>\n<li>Gruppe, die zwei Pillen nimmt<\/li>\n<\/ul>\n<p>Daten einlesen:<\/p>\n<div id=\"cb153\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb153-1\">Trinkfestigkeit<span class=\"ot\">&lt;-<\/span><span class=\"fu\">read.csv2<\/span>(<span class=\"at\">file=<\/span><span class=\"st\">\"Trinkfestigkeit.csv\"<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<\/div>\n<div id=\"schritt-2-deskriptive-unterschiede\" class=\"section level2 hasAnchor\">\n<h1>Schritt 2 Deskriptive Unterschiede<\/h1>\n<p>Gibt es einen signifikanten Unterschied zwischen den 3 Gruppen? Das schauen wir uns dies zun\u00e4chst deskriptiv an und erzeugen einen Boxplot.<\/p>\n<div id=\"cb154\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb154-1\"><span class=\"fu\">boxplot<\/span>(Trinkfestigkeit<span class=\"sc\">$<\/span>ohnePille,Trinkfestigkeit<span class=\"sc\">$<\/span>mitPille,Trinkfestigkeit<span class=\"sc\">$<\/span>mit2Pillen, <\/span>\r\n<span id=\"cb154-2\">        <span class=\"at\">names=<\/span><span class=\"fu\">c<\/span>(<span class=\"st\">\"ohne Pille\"<\/span>,<span class=\"st\">\"Mit Pille\"<\/span>, <span class=\"st\">\"Mit 2 Pillen\"<\/span>))<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-180-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Wie man sieht, unterscheidet sich vor allem der Median ohne Pille deutlich von den anderen beiden Werten. Die Streuung scheint jedoch bei der Gruppe mit zwei Pillen am gr\u00f6\u00dften zu sein.<\/p>\n<\/div>\n<div id=\"schritt-3-voraussetzungen-pr\u00fcfen\" class=\"section level2 hasAnchor\">\n<h1>Schritt 3 Voraussetzungen pr\u00fcfen<\/h1>\n<p>Bei der einseitigen unabh\u00e4ngigen ANOVA werden mehrere Annahmen \u00fcber die zu analysierenden Daten getroffen. Zu diesen Annahmen geh\u00f6ren:<\/p>\n<ul>\n<li>Unabh\u00e4ngigkeit: Die Beobachtungen in jeder Gruppe sind unabh\u00e4ngig voneinander. Dies ist hier gegeben, da es drei unterschiedliche Gruppen sind.<\/li>\n<li>Skalenniveau: Die abh\u00e4ngige Variable muss metrisch skaliert sein. Dies ist hier gegeben (Menge in ml)<\/li>\n<li>Gleiche Varianzen: Die Varianzen der Grundgesamtheiten, aus denen die Stichproben gezogen werden, sind gleich. Dies pr\u00fcfen wir nun mit dem Levene-Test.<\/li>\n<\/ul>\n<p>Hinweis zur Normalit\u00e4t: In \u00e4lteren Statistik-B\u00fcchern wird auch empfohlen auf Normalit\u00e4t der Residuen (seltener, der Daten) zu pr\u00fcfen. Da die ANOVA jedoch relativ robust gegen Verletzungen der Normalit\u00e4t ist, wird diese Voraussetzung in der Regel heute nicht mehr gepr\u00fcft.<\/p>\n<p><strong>Pr\u00fcfen der Varianzhomogenitaet<\/strong><\/p>\n<p>Da der Levene-Test nur Daten im Long-Format akzeptiert, wandeln wir die Daten zun\u00e4chst in das Long-Format um.<\/p>\n<div id=\"cb155\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb155-1\">Trink.long <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">stack<\/span>(Trinkfestigkeit)<\/span><\/code><\/pre>\n<\/div>\n<p>Nehmen wir uns die Zeit und benennen die Variablen<\/p>\n<div id=\"cb156\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb156-1\"><span class=\"fu\">colnames<\/span>(Trink.long) <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">c<\/span>(<span class=\"st\">\"Menge\"<\/span>,<span class=\"st\">\"Gruppe\"<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p>So sehen die Daten nun im Long-Format aus.<\/p>\n<div id=\"cb157\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb157-1\"><span class=\"fu\">head<\/span>(Trink.long)<\/span>\r\n<span id=\"cb157-2\"><span class=\"do\">##   Menge    Gruppe<\/span><\/span>\r\n<span id=\"cb157-3\"><span class=\"do\">## 1   950 ohnePille<\/span><\/span>\r\n<span id=\"cb157-4\"><span class=\"do\">## 2  1540 ohnePille<\/span><\/span>\r\n<span id=\"cb157-5\"><span class=\"do\">## 3  2450 ohnePille<\/span><\/span>\r\n<span id=\"cb157-6\"><span class=\"do\">## 4  2650 ohnePille<\/span><\/span>\r\n<span id=\"cb157-7\"><span class=\"do\">## 5  1320 ohnePille<\/span><\/span>\r\n<span id=\"cb157-8\"><span class=\"do\">## 6   910 ohnePille<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Nun f\u00fchren wir den Test auf Varianzhomogenitaet durch. Die Argumente kennen Sie bereits aus dem Kapitel zum t-Test.<\/p>\n<div id=\"cb158\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb158-1\"><span class=\"fu\">leveneTest<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long) <\/span>\r\n<span id=\"cb158-2\"><span class=\"do\">## Levene's Test for Homogeneity of Variance (center = median)<\/span><\/span>\r\n<span id=\"cb158-3\"><span class=\"do\">##       Df F value Pr(&gt;F)<\/span><\/span>\r\n<span id=\"cb158-4\"><span class=\"do\">## group  2  2.1436 0.1368<\/span><\/span>\r\n<span id=\"cb158-5\"><span class=\"do\">##       27<\/span><\/span><\/code><\/pre>\n<\/div>\n<\/div>\n<div id=\"schritt-3-anova-durchf\u00fchren\" class=\"section level2 hasAnchor\">\n<h1>Schritt 3 ANOVA durchf\u00fchren<\/h1>\n<p>Um eine einseitige ANOVA in R durchzuf\u00fchren, k\u00f6nnen Sie die Funktion <em>aov()<\/em> verwenden. Die grundlegende Syntax f\u00fcr diese Funktion lautet wie folgt: <em>aov(y ~ x, Daten)<\/em> wobei y die abh\u00e4ngige Variable, x die unabh\u00e4ngige Variable (Gruppierungsvariable) und Daten der Datensatz ist.<\/p>\n<p>Wenden wir dies nun auf unsere Daten an. Bei der Varianzanalyse, als auch sp\u00e4ter bei Regressionsmodellen, ist es sinnvoll, diese in einem neuen Objekt zu speichern. Sie k\u00f6nnen hier selbst einen Namen vergeben. In diesem Beispiel nennen wir das Objekt \u201cANOVA1\u201d<\/p>\n<div id=\"cb159\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb159-1\">ANOVA1 <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long)<\/span><\/code><\/pre>\n<\/div>\n<p>Nun schauen wir uns die Ergebnisse der ANOVA an. Hierzu nutzen wir die <em>summary()<\/em> Funktion und wenden diese auf unser Objekt an.<\/p>\n<div id=\"cb160\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb160-1\"><span class=\"fu\">summary<\/span>(ANOVA1)<\/span>\r\n<span id=\"cb160-2\"><span class=\"do\">##             Df   Sum Sq  Mean Sq F value  Pr(&gt;F)   <\/span><\/span>\r\n<span id=\"cb160-3\"><span class=\"do\">## Gruppe       2 29481007 14740503   5.705 0.00858 **<\/span><\/span>\r\n<span id=\"cb160-4\"><span class=\"do\">## Residuals   27 69762730  2583805                   <\/span><\/span>\r\n<span id=\"cb160-5\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb160-6\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Wenn Sie die Funktion summary() auf ein einseitiges ANOVA-Objekt anwenden, liefert die Ausgabe mehrere wichtige Informationen, die f\u00fcr die Interpretation der Testergebnisse n\u00fctzlich sind.<\/p>\n<p>Betrachten wir zun\u00e4chst die erste Zeile \u201cGruppe\u201d, hier erhalten wir folgende Informationen:<\/p>\n<ul>\n<li>Df: Freiheitsgrade. Dies ist die Anzahl der Beobachtungen, die in der Analyse frei variieren k\u00f6nnen.<\/li>\n<li>Sum Sq: Summe der Quadrate. Sie ist ein Ma\u00df f\u00fcr die Gesamtvariation in den Daten.<\/li>\n<li>Mean Sq: Mittlere Quadrate. Es ist das Verh\u00e4ltnis der Summe der Quadrate zu den Freiheitsgraden. Diese wird verwendet, um das F-Verh\u00e4ltnis zu berechnen, das das Verh\u00e4ltnis der Varianz zwischen den Gruppen zur Varianz innerhalb der Gruppen darstellt.<\/li>\n<li>F-Wert: Der berechnete F-Wert aus dem ANOVA-Test.<\/li>\n<li>Pr(&gt;F): Der p-Wert. Er gibt die Wahrscheinlichkeit an, dass der Mittelwertunterschied auf einen Zufall zur\u00fcckzuf\u00fchren ist. Ein p-Wert von weniger als 0,05 wird im Allgemeinen als statistisch signifikant angesehen.<\/li>\n<\/ul>\n<p>In der zweiten Zeile \u201cResiduals\u201d werden die Differenzen zwischen den beobachteten Werten (den tats\u00e4chlichen Testergebnissen) und den vorhergesagten Werten (den Testergebnissen, die zu erwarten w\u00e4ren, wenn die Nullhypothese wahr w\u00e4re) angezeigt. Diese Residuen werden zur Berechnung der gruppeninternen Varianz verwendet, die ein Ma\u00df f\u00fcr die Variation innerhalb jeder Gruppe ist.<\/p>\n<p>In der letzen Zeile werden die Signifikanzcodes erl\u00e4utert. Dies ist nur eine Legende und daher immer gleich. Signifikanzcodes werden verwendet, um die Signifikanz der Ergebnisse schnell zu erkennen. Liegt der p-Wert beispielsweise unter 0,05, wird er mit \u201c*\u201d angegeben, was auf einen signifikanten Unterschied der Mittelwerte zwischen den Gruppen hinweist. .<\/p>\n<p>In diesem Fall wird die ANOVA signifikant, das bedeutet, dass sich mindestens zwei Gruppen signifikant unterscheiden. Bei der Interpretation der Ergebnisse einer einseitigen unabh\u00e4ngigen ANOVA ist zu beachten, dass ein signifikanter Unterschied in den Mittelwerten nicht unbedingt bedeutet, dass sich alle Gruppen unterscheiden. Es bedeutet lediglich, dass ein signifikanter Unterschied in den Mittelwerten mindestens bei zwei untersuchten Gruppen besteht. Daher m\u00fcssen wir im n\u00e4chsten Schritt noch eine sogenannte Post-Hoc Analyse durchf\u00fchren, um zu ermitteln, zwischen welchen der drei Gruppen signifikante Unterschiede bestehen.<\/p>\n<p>Hinweis zur Verletzung der Voraussetzungen:<\/p>\n<p>Wenn die Voraussetzung der Varianzhomogenit\u00e4t verletzt ist (also Varianzheterogenit\u00e4t vorliegt) kann eine ANOVA mit der <em>oneway.test<\/em> Funktion durchgef\u00fchrt werden. Diese beinhaltet eine Welch-Korrektur.<\/p>\n<div id=\"cb161\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb161-1\"><span class=\"fu\">oneway.test<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe, <span class=\"at\">data=<\/span>Trink.long)<\/span>\r\n<span id=\"cb161-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb161-3\"><span class=\"do\">##  One-way analysis of means (not assuming equal variances)<\/span><\/span>\r\n<span id=\"cb161-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb161-5\"><span class=\"do\">## data:  Menge and Gruppe<\/span><\/span>\r\n<span id=\"cb161-6\"><span class=\"do\">## F = 7.8096, num df = 2.000, denom df = 16.775, p-value =<\/span><\/span>\r\n<span id=\"cb161-7\"><span class=\"do\">## 0.004007<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>In diesem Video zeige ich, wie das in R funktioniert:<\/p>\n<div class=\"vembedr\" style=\"margin: auto;\">\n<div><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/WnnvSrdwnOU\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\n<\/div>\n<p>Alternativ bietet sich f\u00fcr die Durchf\u00fchrung der Varianzanalyse auch das <em>afex<\/em>-Paket an. Dieses bietet insbesondere Vorteile f\u00fcr die Interpretation der mehrfaktoriellen ANOVA im n\u00e4chsten Schritt, kann aber auch bei der einfaktoriellen ANOVA angewendet werden. Die ANOVA Funktion in <em>afex<\/em> nennt sich <em>aov_car<\/em>. Die Notation entspricht dem oben beschriebenen Vorgehen bei der <em>aov<\/em> Funktion, nur dass zus\u00e4tzlich noch ein Error-Term definiert werden muss, der sich auf eine ID-Variable beziehen muss. Dies ist eine Variable, die jedem Versuchsteilnehmer eine eindeutige Nummer zuweist und ist insbesondere bei Messwiederholungs-Daten unerl\u00e4sslich. Unser kleiner Datensatz hat diese fortlaufende Nummer jedoch leider nicht, daher m\u00fcssen wir diese zuerst generieren:<\/p>\n<div id=\"cb162\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb162-1\">Trink.long<span class=\"sc\">$<\/span>ID <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">c<\/span>(<span class=\"dv\">1<\/span><span class=\"sc\">:<\/span><span class=\"dv\">30<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p>Dann laden wir das Paket und f\u00fchren die ANOVA durch. Das neue Objekt nennen wir \u201cANOVA1A\u201d.<\/p>\n<div id=\"cb163\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb163-1\">ANOVA1A <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">aov_car<\/span>(Menge <span class=\"sc\">~<\/span> Gruppe <span class=\"sc\">+<\/span> <span class=\"fu\">Error<\/span>(ID), <span class=\"at\">data=<\/span>Trink.long)<\/span>\r\n<span id=\"cb163-2\"><span class=\"do\">## Contrasts set to contr.sum for the following variables: Gruppe<\/span><\/span>\r\n<span id=\"cb163-3\"><span class=\"fu\">summary<\/span>(ANOVA1A)<\/span>\r\n<span id=\"cb163-4\"><span class=\"do\">## Anova Table (Type 3 tests)<\/span><\/span>\r\n<span id=\"cb163-5\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb163-6\"><span class=\"do\">## Response: Menge<\/span><\/span>\r\n<span id=\"cb163-7\"><span class=\"do\">##        num Df den Df     MSE     F     ges   Pr(&gt;F)   <\/span><\/span>\r\n<span id=\"cb163-8\"><span class=\"do\">## Gruppe      2     27 2583805 5.705 0.29706 0.008579 **<\/span><\/span>\r\n<span id=\"cb163-9\"><span class=\"do\">## ---<\/span><\/span>\r\n<span id=\"cb163-10\"><span class=\"do\">## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Der Output enstpricht in diesem Fall 1:1 dem Output, den wir zuvor mit der <em>aov<\/em> Funktion generiert haben (mit der Ausnahme, dass keine Residuen angezeigt werden). Daher entspricht die Interpretation der obigen.<\/p>\n<p>In diesem Video zeige ich, wie das in R funktioniert:<\/p>\n<div class=\"vembedr\" style=\"margin: auto;\">\n<div><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/3mIZ5K_InhE\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\n<\/div>\n<\/div>\n<div id=\"schritt-4-post-hoc-verfahren\" class=\"section level2 hasAnchor\">\n<h1>Schritt 4 Post-Hoc Verfahren<\/h1>\n<p>Jetzt wissen wir, dass es einen Einfluss auf die Trinkfestigkeit gibt. Aber noch nicht welchen. Hierf\u00fcr ben\u00f6tigen wir sog. Post-hoc-Tests, um festzustellen, welche spezifischen Gruppenpaare f\u00fcr einen signifikanten Unterschied in den Mittelwerten verantwortlich sind, wenn ein einseitiger ANOVA-Test einen signifikanten Unterschied ergibt. Post-hoc-Tests werden \u00fcblicherweise nur nach einem signifikanten ANOVA-Ergebnis angewendet. Es gibt mehrere verschiedene Post-hoc-Tests, die f\u00fcr die einseitige ANOVA verwendet werden k\u00f6nnen, darunter der Tukey-HSD-Test, der Scheff\u00e9-Test und der Bonferroni-Test.<\/p>\n<p><strong>Post-Hoc-Tests<\/strong><\/p>\n<p>Wir machen nun paarweise t-Tests, um zu ermitteln, welche Gruppen sich signifikant unterscheiden. Bei mehreren t-Tests mit derselben Stichprobe muss aufgrund der Alpha-Fehler-Inflation eine Korrektur vorgenommen werden. Mit zunehmender Anzahl der Vergleiche steigt auch die Wahrscheinlichkeit eines Alpha-Fehlers, was zu einem erh\u00f6hten Risiko falsch positiver Ergebnisse f\u00fchren kann. Die Bonferroni-Korrektur ist eine Methode zur Kontrolle der Alpha-Fehler-Inflation durch Anpassung der p-Wert-Schwelle f\u00fcr die Signifikanz.<\/p>\n<p>Die Korrektur ist dabei recht einfach: Bei der Bonferroni-Korrektur wird das Signifikanzniveau (Alpha) durch die Anzahl der durchgef\u00fchrten Vergleiche geteilt, wodurch ein konservativerer Schwellenwert f\u00fcr die Signifikanz entsteht. Wenn beispielsweise das Signifikanzniveau auf 0,05 festgelegt ist und 10 Vergleiche durchgef\u00fchrt werden, w\u00fcrde die Bonferroni-Korrektur 0,05 durch 10 teilen, was ein neues Signifikanzniveau von 0,005 ergibt.<\/p>\n<p>Hierzu nutzen wir die Funktion <em>pairwise.t.test<\/em> mit dem Argument <em>p.adj=\u201cbonferroni\u201d<\/em>.<\/p>\n<div id=\"cb164\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb164-1\"><span class=\"fu\">pairwise.t.test<\/span>(Trink.long<span class=\"sc\">$<\/span>Menge, Trink.long<span class=\"sc\">$<\/span>Gruppe, <span class=\"at\">p.adj=<\/span><span class=\"st\">\"bonferroni\"<\/span>)<\/span>\r\n<span id=\"cb164-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-3\"><span class=\"do\">##  Pairwise comparisons using t tests with pooled SD <\/span><\/span>\r\n<span id=\"cb164-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-5\"><span class=\"do\">## data:  Trink.long$Menge and Trink.long$Gruppe <\/span><\/span>\r\n<span id=\"cb164-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-7\"><span class=\"do\">##            ohnePille mitPille<\/span><\/span>\r\n<span id=\"cb164-8\"><span class=\"do\">## mitPille   0.047     -       <\/span><\/span>\r\n<span id=\"cb164-9\"><span class=\"do\">## mit2Pillen 0.011     1.000   <\/span><\/span>\r\n<span id=\"cb164-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb164-11\"><span class=\"do\">## P value adjustment method: bonferroni<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Wir sehen nun also, dass sich bei Einnahme einer Pille, die Trinkfestigkeit signifikant erh\u00f6ht (p = .047) und bei der Einnahme von zwei Pillen, dies Trinkfestigkeit ebenfalls signifikant steigt (p = .011) im Vergleich zur Kontrollgruppe ohne Pille. Jedoch gibt es keinen signifikanten Unterschied zwischen den Gruppen die eine und zwei Pillen genommen haben (p = 1), daher kann keine Empfehlung f\u00fcr das nehmen einer weiteren Pille ausgesprochen werden.<\/p>\n<p>Hinweis: Im Falle von Varianzheterogenit\u00e4t sollte zus\u00e4tzlich das Argument <em>pool.sd=FALSE<\/em> aufgenommen werden<\/p>\n<div id=\"cb165\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb165-1\"><span class=\"fu\">pairwise.t.test<\/span>(Trink.long<span class=\"sc\">$<\/span>Menge, Trink.long<span class=\"sc\">$<\/span>Gruppe, <span class=\"at\">p.adj=<\/span><span class=\"st\">\"bonferroni\"<\/span>,<span class=\"at\">pool.sd=<\/span><span class=\"cn\">FALSE<\/span>)<\/span>\r\n<span id=\"cb165-2\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-3\"><span class=\"do\">##  Pairwise comparisons using t tests with non-pooled SD <\/span><\/span>\r\n<span id=\"cb165-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-5\"><span class=\"do\">## data:  Trink.long$Menge and Trink.long$Gruppe <\/span><\/span>\r\n<span id=\"cb165-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-7\"><span class=\"do\">##            ohnePille mitPille<\/span><\/span>\r\n<span id=\"cb165-8\"><span class=\"do\">## mitPille   0.012     -       <\/span><\/span>\r\n<span id=\"cb165-9\"><span class=\"do\">## mit2Pillen 0.030     1.000   <\/span><\/span>\r\n<span id=\"cb165-10\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb165-11\"><span class=\"do\">## P value adjustment method: bonferroni<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Es ist wichtig zu beachten, dass die Bonferroni-Korrektur eine sehr konservative Methode ist, die dazu neigt, die Typ-II-Fehlerrate zu erh\u00f6hen (eine falsche Nullhypothese wird nicht zur\u00fcckgewiesen), und sie ist m\u00f6glicherweise nicht geeignet, wenn die Anzahl der Vergleiche gro\u00df ist. Andere Methoden wie die Tukey sind hier gute Alternativen, da sie die Typ-II-Fehlerrate nicht so stark erh\u00f6hen.<\/p>\n<h2><strong>Tukey\u2019s HSD Test<\/strong><\/h2>\n<p>Der Tukey-HSD-Test (Honestly Significant Difference) ist ein weiterer Post-hoc-Test. Der Test vergleicht alle m\u00f6glichen Paare von Gruppenmittelwerten und berechnet einen Bereich von Unterschieden, die als statistisch signifikant angesehen werden, die sogenannten HSD-Intervalle. Liegt der Unterschied zwischen den Mittelwerten zweier Gruppen au\u00dferhalb dieses Intervalls, wird er als statistisch signifikant angesehen und die Gruppen werden als unterschiedlich betrachtet.<\/p>\n<p>Der Test ist recht einfach ausgef\u00fchrt.<\/p>\n<div id=\"cb166\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb166-1\"><span class=\"fu\">TukeyHSD<\/span>(ANOVA1) <\/span>\r\n<span id=\"cb166-2\"><span class=\"do\">##   Tukey multiple comparisons of means<\/span><\/span>\r\n<span id=\"cb166-3\"><span class=\"do\">##     95% family-wise confidence level<\/span><\/span>\r\n<span id=\"cb166-4\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb166-5\"><span class=\"do\">## Fit: aov(formula = Menge ~ Gruppe, data = Trink.long)<\/span><\/span>\r\n<span id=\"cb166-6\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb166-7\"><span class=\"do\">## $Gruppe<\/span><\/span>\r\n<span id=\"cb166-8\"><span class=\"do\">##                      diff         lwr      upr     p adj<\/span><\/span>\r\n<span id=\"cb166-9\"><span class=\"do\">## mitPille-ohnePille   1854    71.64362 3636.356 0.0402560<\/span><\/span>\r\n<span id=\"cb166-10\"><span class=\"do\">## mit2Pillen-ohnePille 2285   502.64362 4067.356 0.0099925<\/span><\/span>\r\n<span id=\"cb166-11\"><span class=\"do\">## mit2Pillen-mitPille   431 -1351.35638 2213.356 0.8215272<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Alternativ zum Tukey\u2019s HSD Test k\u00f6nnen mit dem <em>emmeans<\/em> Paket und gleichnamiger Funktion tuckey-korrigierte Paarvergleiche abgerufen werden. Hierzu muss immer die unabh\u00e4ngige Variable (also die Gruppierungsvariable) mit dem Befehl <em>specs<\/em> in Anf\u00fchrungszeichen angegeben werden. Die Ergebnisse k\u00f6nnen dann am besten mit der <em>pairs<\/em> Funktion ausgegeben werden (F\u00fcr den Paarvergleich).<\/p>\n<div id=\"cb167\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb167-1\">ph1 <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">emmeans<\/span>(ANOVA1, <span class=\"at\">specs=<\/span><span class=\"st\">\"Gruppe\"<\/span>)<\/span>\r\n<span id=\"cb167-2\"><span class=\"fu\">pairs<\/span>(ph1)<\/span>\r\n<span id=\"cb167-3\"><span class=\"do\">##  contrast               estimate  SE df t.ratio p.value<\/span><\/span>\r\n<span id=\"cb167-4\"><span class=\"do\">##  ohnePille - mitPille      -1854 719 27  -2.579  0.0403<\/span><\/span>\r\n<span id=\"cb167-5\"><span class=\"do\">##  ohnePille - mit2Pillen    -2285 719 27  -3.179  0.0100<\/span><\/span>\r\n<span id=\"cb167-6\"><span class=\"do\">##  mitPille - mit2Pillen      -431 719 27  -0.600  0.8215<\/span><\/span>\r\n<span id=\"cb167-7\"><span class=\"do\">## <\/span><\/span>\r\n<span id=\"cb167-8\"><span class=\"do\">## P value adjustment: tukey method for comparing a family of 3 estimates<\/span><\/span><\/code><\/pre>\n<\/div>\n<p>Eine weitere Alternative w\u00e4ren geplante Kontraste. Hiermit k\u00f6nnen gezielte Gruppenvergleiche hergestellt werden, was noch sensitivere Ergebnisse erm\u00f6glicht, falls es bereits spezielle Hypothesen gibt. Diese werden an dieser Stelle jedoch nicht weiter vertieft.<\/p>\n<p>In diesem Video zeige ich, wie das in R funktioniert:<\/p>\n<div class=\"vembedr\" style=\"margin: auto;\">\n<div><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/Hmfz_xhqCHI\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\n<\/div>\n<\/div>\n<div id=\"schritt-5-grafische-verfahren\" class=\"section level2 hasAnchor\">\n<h1>Schritt 5 Grafische Verfahren<\/h1>\n<p>Bei der Ergebnisdarstellung einer ANOVA bieten sich grunds\u00e4tzlich grafische Darstellungen an. Dies wird sp\u00e4ter bei mehrfaktoriellen Designs besonders spannend (Interaktionsdiagramm), kann aber auch schon bei einer einfaktoriellen ANOVA genutzt werden.<\/p>\n<p>Plot aus dem Paket \u201cphia\u201d mit der Funktion &#8222;Interaction Means&#8220;. Wichtiger Hinweis: Diese Funktion erstellt standardm\u00e4\u00dfig Fehlerbalken mit einem Standardfehler. Wenn Sie diese mit dem \u00fcblichen 95% Konfidenzintervall erstellen wollen, m\u00fcssen Sie die &#8222;plot&#8220; Funktion noch um das Argument errorbar=&#8220;ci95&#8243; erg\u00e4nzen.<\/p>\n<div id=\"cb168\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb168-1\"><span class=\"fu\">plot<\/span>(<span class=\"fu\">interactionMeans<\/span>(ANOVA1))\r\n<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-197-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Alternativ kann mit der Funktion <em>afex_plot<\/em> aus dem <em>afex<\/em> Paket eine sch\u00f6nere Grafik erzeugt werden, die auf GGPlot2 basiert und direkt das 95% Konfidenzintervall ausgiebt.<\/p>\n<div id=\"cb169\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb169-1\"><span class=\"fu\">afex_plot<\/span>(ANOVA1A, <span class=\"at\">x=<\/span><span class=\"st\">\"Gruppe\"<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-198-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Die Darstellung ist ein Fehlerbalken-Diagramm mit den Mittelwerten und Standardabweichungen der Gruppen, wobei die Mittelwerte durch die Punkte und die Standardabweichungen durch die Boxplots selbst dargestellt sind. Zu sehen sind ausserdem (in hellerem Grau) auch die Rohdaten.<\/p>\n<div class=\"vembedr\" style=\"margin: auto;\">\n<div><iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/-RmFv2u2JK4\" width=\"533\" height=\"300\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\" data-external=\"1\"><\/iframe><\/div>\n<\/div>\n<\/div>\n<div id=\"\u00fcbungsaufgabe\" class=\"section level2 hasAnchor\">\n<h1>\u00dcbung<\/h1>\n<p>Wir wollen die Wirksamkeit von Di\u00e4ten vergleichen. Wir haben ein Datenset (diet3.csv) von 78 Personen, die jeweils eine von 3 Di\u00e4ten durchlaufen haben. Wir haben das Gewicht vor der Di\u00e4t, das Gewicht nach der Di\u00e4t, die Variable \u201cweightlost\u201d, die Ihnen die Gewichtsabnahme (Zunahme) in Pfund angibt und einige Hintergrundinformationen.<\/p>\n<p>Vergleichen Sie die 3 Di\u00e4ten im Hinblick auf ihre Wirksamkeit (AV ist \u201cweightlost\u201d).<\/p>\n<p>Die L\u00f6sung zu dieser \u00dcbungsaufgabe gibt es im neuen Buch<a href=\"https:\/\/amzn.to\/3MLBUb8\"> Statistik mit R &amp; RStudio<\/a>.<\/p>\n<p><a href=\"https:\/\/amzn.to\/3MLBUb8\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-1822\" src=\"http:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3.png\" alt=\"\" width=\"900\" height=\"577\" srcset=\"https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3.png 900w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3-300x192.png 300w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3-768x492.png 768w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3-65x42.png 65w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3-225x144.png 225w, https:\/\/statistikgrundlagen.de\/ebook\/wp-content\/uploads\/sites\/2\/2023\/04\/rbuch_amz3-350x224.png 350w\" sizes=\"(max-width: 900px) 100vw, 900px\" \/><\/a><\/p>\n<\/div>\n<div id=\"\u00fcbungsaufgabe-1\" class=\"section level2 hasAnchor\">\n<h1>\u00dcbung<\/h1>\n<p>Wir wollen wissen, ob sich das Besucheraufkommen auf der Stuttgarter K\u00f6nigstrasse (Koenig_Mitte) signifikant zwischen den Wochentagen (Tag) unterscheidet.<\/p>\n<p>Hierzu haben wir im Kapitel \u201cGrafiken\u201d folgenden plot erzeugt:<br \/>\nDaten einlesen:<\/p>\n<div id=\"cb170\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb170-1\"><span class=\"fu\">library<\/span>(readxl)<\/span>\r\n<span id=\"cb170-2\">Passanten <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">read_excel<\/span>(<span class=\"st\">\"Passanten2019.xlsx\"<\/span>)<\/span><\/code><\/pre>\n<\/div>\n<p>Plot:<\/p>\n<div id=\"cb171\" class=\"sourceCode\">\n<pre class=\"sourceCode r\"><code class=\"sourceCode r\"><span id=\"cb171-1\">Passanten<span class=\"sc\">$<\/span>Tag <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">as.factor<\/span>(Passanten<span class=\"sc\">$<\/span>Tag)<\/span>\r\n<span id=\"cb171-2\">Passanten<span class=\"sc\">$<\/span>Tag <span class=\"ot\">&lt;-<\/span> <span class=\"fu\">ordered<\/span>(Passanten<span class=\"sc\">$<\/span>Tag,<span class=\"at\">levels=<\/span><span class=\"fu\">c<\/span>(<span class=\"st\">\"Mo\"<\/span>,<span class=\"st\">\"Di\"<\/span>,<span class=\"st\">\"Mi\"<\/span>,<span class=\"st\">\"Do\"<\/span>,<span class=\"st\">\"Fr\"<\/span>,<span class=\"st\">\"Sa\"<\/span>,<span class=\"st\">\"So\"<\/span>))<\/span>\r\n<span id=\"cb171-3\"><span class=\"fu\">plot<\/span>(Passanten<span class=\"sc\">$<\/span>Koenig_Mitte<span class=\"sc\">~<\/span>Passanten<span class=\"sc\">$<\/span>Tag)<\/span><\/code><\/pre>\n<\/div>\n<p><img decoding=\"async\" src=\"http:\/\/statistikgrundlagen.de\/_main_files\/figure-html\/unnamed-chunk-201-1.png\" width=\"672\" alt=\"image\" \/><\/p>\n<p>Vergleichen Sie die Wochentage, welche unterscheiden sich signifikant?<\/p>\n<p>Die L\u00f6sung zu dieser \u00dcbungsaufgabe gibt es im neuen Buch<a href=\"https:\/\/amzn.to\/3MLBUb8\"> Statistik mit R &amp; RStudio<\/a>.<\/p>\n<p>&nbsp;<\/p>\n<\/div>\n","protected":false},"author":1,"menu_order":5,"template":"","meta":{"pb_show_title":"on","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":1725,"_links":{"self":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1753"}],"collection":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":7,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1753\/revisions"}],"predecessor-version":[{"id":1844,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1753\/revisions\/1844"}],"part":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/parts\/1725"}],"metadata":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapters\/1753\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/media?parent=1753"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/pressbooks\/v2\/chapter-type?post=1753"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/contributor?post=1753"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/statistikgrundlagen.de\/ebook\/wp-json\/wp\/v2\/license?post=1753"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}