Statistik mit R & RStudio
Über dieses Buch
Wenn Sie sich für Datenanalyse und Statistik interessieren, kommen Sie nicht an R vorbei. In diesem Buch lernen Sie, wie Sie mit R Daten bearbeiten, statistische Analysen durchführen und Modelle erstellen können.
Mit praktischen Beispielen und klaren Erklärungen führt Sie dieses Buch Schritt für Schritt durch die grundlegenden Konzepte der R-Programmierung, einschließlich Datentypen, Funktionen und Datenvisualisierung. Sie lernen, wie man Daten in R einliest, Daten bereinigt und statistische Analysen, wie Hypothesentests oder Varianzanalysen, durchführt.
Installation von R und RStudio
R ist die Programmiersprache, RStudio ist die Oberfläche, die wir im folgenden für das Programmieren in R nutzen wollen. Sie können R auch ohne RStudio nutzen, es ist nur nicht so anschaulich und an vielen Stellen etwas umständlicher. Daher empfiehlt es sich zunächst R und dann RStudio zu installieren. Hier sind die Schritte zur Installation von R und RStudio auf einem Windows-Computer:
Installieren Sie R:
- Rufen Sie die Website des R-Projekts unter https://cran.r-project.org/ auf und laden Sie die neueste Version von R für Ihr Betriebssystem herunter.
Doppelklicken Sie auf die heruntergeladene Datei und folgen Sie den Installationsanweisungen. - Rufen Sie die RStudio-Website unter https://www.rstudio.com/products/rstudio/download/ auf und laden Sie die neueste Version von RStudio Desktop für Ihr Betriebssystem herunter.
- Doppelklicken Sie auf die heruntergeladene Datei und folgen Sie den Installationsanweisungen.
Starten Sie RStudio: - Nach der Installation starten Sie RStudio, indem Sie auf das Symbol auf Ihrem Desktop klicken oder in Ihrem Anwendungsmenü danach suchen.
Sobald RStudio geöffnet ist, sollten Sie im unteren linken Bereich ein Konsolenfenster und mehrere andere Fenster zum Bearbeiten und Anzeigen von R-Code sehen.
Das war’s! Sie sind nun bereit, R und RStudio für die Datenanalyse und statistische Berechnungen zu verwenden.
Pakete installieren
Sie haben jetzt eine funktionierende Variante von RStudio auf Ihrem Computer und dennoch werden Sie die meisten Funktionen, die wir in diesem Buch besprechen, noch nicht nutzen können. Der Grund dafür ist, dass diese sich in sogenannten Paketen verstecken, die zusätzlich installiert werden müssen. Pakete sind Sammlungen von Funktionen, Daten und Dokumentation, die die Basisfunktionalität von R erweitern. Es gibt Tausende von Paketen für R, die aus dem Comprehensive R Archive Network (CRAN) oder anderen Repositories heruntergeladen und installiert werden können. Im Folgenden werden die Schritte zur Installation von Paketen in RStudio beschrieben:
- Öffnen Sie RStudio und wählen Sie die Registerkarte „Pakete“ im unteren rechten Fensterbereich.
- Klicken Sie auf die Schaltfläche „Installieren“, um das Dialogfeld „Pakete installieren“ zu öffnen.
- Geben Sie im Feld „Pakete“ den Namen des Pakets ein, das Sie installieren möchten. Um zum Beispiel das Paket „tidyverse“ zu installieren, geben Sie „tidyverse“ in das Feld „Pakete“ ein.
- Klicken Sie auf die Schaltfläche „Installieren“, um den Installationsvorgang zu starten. RStudio lädt das Paket aus dem CRAN-Repository herunter und installiert es auf Ihrem Computer.
- Sobald die Installation abgeschlossen ist, können Sie das Paket mit der Funktion library() in Ihre R-Sitzung laden. Um zum Beispiel das Paket „tidyverse“ zu laden, geben Sie library(tidyverse) in das Konsolenfenster ein.
- Alternativ dazu können Sie Pakete in R mit der Funktion install.packages() im Konsolenfenster installieren. Um zum Beispiel das Paket „tidyverse“ zu installieren, geben Sie install.packages(„tidyverse“) in das Konsolenfenster ein.
Beachten Sie, dass einige Pakete zusätzliche Systemanforderungen oder Abhängigkeiten haben können, die installiert werden müssen, bevor das Paket verwendet werden kann. In solchen Fällen gibt RStudio eine Warnmeldung mit Anweisungen zur Installation der erforderlichen Abhängigkeiten aus.
Die wichtigsten Pakete die wir in diesem Buch nutzen werden sind: foreign, haven, ggplot2, psych, CTT, boot, car, ade4, gplots, Hmisc, leaflet, readxl, Magrittr, tidyverse, TeachingDemos, MBESS, MASS, BayesFactor, rgl, phia, ez, rockchalk, agricolae, pgirmess, expss, klaR, rrlda, effsize, rsquared.
Umgang mit diesem Buch und R
Im Folgenden werden neben einem kurzen Einführungstext zu der jeweiligen Funktion immer der R Code grau hinterlegt dargestellt werden und direkt danach der entsprechende R Output (also das was in der sogenannten Konsole in RStudio unten links angezeigt wird). Wenn Sie dies selbst in RStudio nachvollziehen und nachrechnen wollen, dann empfiehlt es sich den entsprechenden Code direkt von der Webseite dieses Buchs unter www.statistik-r.de zu kopieren. Dort finden Sie alle Codes aus diesem Buch, jedoch nicht die Lösungen zu den Übungsaufgaben.
Datensätze herunterladen
Alle Datensätze, die hier im Skript verwendet werden finden Sie unter folgendem Link. Laden Sie die .zip Datei herunter und kopieren Sie alle Datensätze in einen Ordner auf Ihrem Rechner. Diesen Ordner werden wir später als “Working Directory” festlegen. Alle Datensätze müssen dort abgelegt sein.
https://www.statistikgrundlagen.de/R-Kurs/Daten.zip
Los gehts:
Wenn Sie links oben auf „Inhalt“ klicken, sehen Sie alle Kapitel dieses Buchs, oder Sie starten rechts unten mit einem Klick auf „Weiter“ direkt in das erste Kapitel.