Was ist diese Seite?

Diese Seite ist ein stetig wachsendes Skript zu Data Science in R. Ich versuche alle Kapitel prinzipiell in 3 verschiedene Kategorien einzuteilen:

  1. R Anwendung: Erklärungen und Diskussionen zur Nutzung von R
  2. Auswertungen: Beispielhafte statistische Auswertungen von Datensätzen mit R
  3. Statistik: Weiterführende, aber vor allem anschauliche Erläuterungen zur Statistik

Die Kategorien finden sich oben. Die Kapitel innerhalb der Kategorien können sowohl dort, als auch weiter unten in einem tabellarischem Inhaltsverzeichnis aufgerufen werden.

Neben dieser Website, baue ich auch noch an einer zweiten namens *MMFAIR - Mixed Models for Agriculture in R".

Inhaltsverzeichnis

Wie gesagt wird diese Seite stetig um Kapitel erweitert. Aus diesem Grund gibt es streng genommen keine klare Reihenfolge in der die Kapitel gelesen werden sollten. Um dennoch das richtige zu finden, soll diese tabellarische Übersicht weiterhelfen.

R Anwendung

Erklärungen, Diskussionen und Verweise auf weiterführende Informationen zur Nutzung von R - teilweise ganz unabhängig von statistischen Analysen und eher im Bereich Datenverarbeitung usw. Wer wirklich noch überhaupt keine Erfahrung mit R hat, sollte wohl besser z.B. hier die absoluten Grundlagen lernen.

Kapitel Beschreibung Funktion
UseR 1 Import & Export von Daten read.table(), fread(), read_excel(), ggsave()
UseR 2 Effizientes Erstellen deskriptiver Statistiken summary(), table(), data.table()
UseR 3 Loops & Listen for(i in ...){...}, list(), list.files()
UseR 4 Ersellen von Feldplanabbildungen desplot()
UseR 5 Weitere Tipps dplyr %>%, %in%, p_load(), fct_reorder()

Auswertungen

Aufgrund der bisherigen Workshops liegt der Schwerpunkt der Beispielauswertungen momentan auf Daten/Versuchen aus dem Agrar- bzw. Biologiebereich. Viele Punkte sowohl in der statistischen Vorgehensweise, als auch der Umsetzung in R lassen sich aber einfach auf andere Bereiche übertragen.

Kapitel Behandlungseffekt Design Besonderheit Funktion
Bsp 1 1 Metrischer - cor(), lm()
Bsp 2 1 Metrischer - Ausreißer cor(), lm()
Bsp 3 1 Faktor CRD lm()
Bsp 4 1 Faktor RCBD lm()
Bsp 5 1 Faktor \(\alpha\)-lattice lmer()
Bsp 6 2 Faktoren RCBD lm()
Bsp 7 2 Faktoren split-plot lmer()
Bsp 8 1 Faktor Augmtended lmer()
Bsp 9 1 Faktor RCBD Messwiederholung gls()
Bsp 10 1 Faktor RCBD Prozentwerte glm()
Bsp 11 1 Faktor Lat. Quadrat Zählwerte glm()

Statistik Theorie

Pragmatische Erklärungen, Diskussionen und Verweise auf weiterführende Informationen zur statistischen Theorie.

Kapitel Beschreibung Funktion
Stat 1 Korrelation cor(), cor.test()
Stat 2 Regression lm()
Stat 3 Vergleich Versuchsdesigns -
Stat 4 ANOVA & Post Hoc Tests anova(), emmeans()
Stat 5 Adjustierte Mittelwerte emmeans()
Stat 6 p-Werte und Signifikanzen -
Stat 7 Behandlungsinteraktionen -
Stat 8 Gemischte Modelle -
Stat 9 Kovarianzstrukturen gls() & asreml()
Stat 10 Nicht-normalverteilte Daten glm()

Anderes

Weitere Quellen

Ich empfehle

Archiv für Beispieldatensätze

Beispieldatensätze/-codes für

  • den Kurs Gemischte Modelle in R (Nov 2018) gibt es hier
  • den Kurs Statistics with R: Introductory course (2016-2018) gibt es hier
 

Bei Fragen kannst du mir gerne schreiben!

schmidtpaul@hotmail.de