Die Statistiker:Innen machen das schon?!
Zum Ende des Jahres hin wollen wir uns noch einmal einem wahrscheinlich eher lästigen und plagenden Thema für die meisten unter Euch widmen:
Der Statistik und zwar genauer gesagt der deskriptiven Statistik.
An den grundlegenden Kenntnissen der Statistik kommt keiner von Euch Doktorand*innen vorbei. In diesem Blogbeitrag wollen wir Euch näher bringen, warum es essentiell ist, ein grundlegendes Verständnis der deskriptiven Statistik zu haben und Euch ein paar Impulse mit auf den Weg geben, die Euch das Leben diesbezüglich etwas erleichtern können.
Vereinfacht runtergebrochen befasst sich die deskriptive (oder auch beschreibende) Statistik mit den allgemeinen Kenngrößen/Merkmalen Eurer Stichprobe. Alles weitere wird in der explorativen und/ oder induktiven Statistik analysiert und ausgewertet. Ihr verschafft Euch also mittels der deskriptiven Statistik einen “ersten Eindruck” und bekommt einen groben Überblick über die Verteilung in Eurem Datensatz. Die Visualisierung der statistischen Charakteristika kann anhand von Grafiken, Tabellen und Diagrammen erfolgen.
Wichtig zu erwähnen ist, dass von der deskriptiven Statistik ausgehend keine allgemeingültigen Aussagen getroffen werden können, die repräsentativ für die Grundgesamtheit stehen. Dies erfolgt mit Hilfe der Interferenz Statistik.
Es ist unabdingbar, dass die deskriptive Auswertung vor allen weiteren Berechnungen stattfindet. Denn sie ist der wesentliche und grundlegende Bestandteil, auf den in den folgenden Analysen zurückgegriffen wird.
In der deskriptiven Statistik können qualitative und quantitative Variablen voneinander unterschieden werden.
Zu den qualitativen Variablen werden Merkmale wie das Geschlecht, die Blutgruppe oder das Vorhandensein eines spezifischen Markers im Blutserum gezählt. Diese sind stets diskret, was so viel bedeutet wie: die Variable kann abzählbar viele Ausprägungen annehmen und ist stets numerisch.
Beispiel: Schulnoten; Anzahl von Arztbesuchen, Anzahl der Würfelaugen
Quantitative Variablen hingegen beschreiben die Intensität des betrachteten Merkmals. Gemeint damit sind beispielsweise Parameter wie das Körpergewicht, das Alter oder die Körpertemperatur.
Ein weiterer wichtiger Bestandteil der deskriptiven Statistik ist die Darstellung von Häufigkeiten.
Dies bietet sich an, in einem tabellarischen Format oder einem Diagramm vorzunehmen. Somit könnt ihr Euch einen Überblick darüber verschaffen, wie häufig eine Merkmalsausprägung in dem jeweiligen analysierten Datensatz vorkommt.
Auch das Lagemaß wird zur deskriptiven Statistik hinzugezählt. Mithilfe des Lagemaßes können zentrale Tendenzen erkannt werden. Das Grundgerüst hierbei bilden die folgenden Parameter: Modus – Median – Mittelwert.
Alle drei sind sehr ähnlich und können häufig verwechselt werden. Damit ihr nicht Gefahr lauft, etwas zu verwechsel, speichert Euch gerne unseren Instagram Beitrag zu diesem Thema ab :).
Der Modus (auch Modalwert genannt) ist diejenige Variable in Eurer Stichprobe, die am häufigsten vorkommt. Der Modalwert ist stabil gegenüber Ausreißern und gibt das Maximum einer Verteilung an.
Für den Median (auch Zentralwert) werden die Messwerte einer Stichprobe in meist aufsteigender Reihenfolge geordnet. Durch den Median wird die Stichprobe in zwei identische Teile dividiert. Außerdem ist der Median stabil gegenüber Extremwerten und entspricht einem Prozentrang von 50.
Der Mittelwert oder auch Durchschnittswert/ arithmetisches Mittel eines Datensatzes entspricht dem Schwerpunkt einer Verteilung. Definitionsgemäß erfolgt eine Summierung aller Messwerte mit anschließender Division durch deren Anzahl.
Weitere Bestandteile der deskriptiven Statistik sind die Perenztile, die Range, die Varianz und die Standardabweichung. Welches statistische Programm ihr für Eure Auswertung verwendet (SPSS, R- Studio, Excel,…) ist Euch überlassen.
Für die deskriptive Statistik allein reicht jedoch meist Microsoft Excel aus. Ein guter Tipp für kleine Hindernisse ist es auch, sich immer mal wieder bei Youtube ein Video betreffend der Thematik anzusehen. Wer sich sein Leben so richtig erleichtern möchte, dem empfehlen wir den wirklich tollen Online-Kurs „Grundlagenkurs R“ von unserer Kooperationspartnerin für Statistik. hier erhältst du am Ende des Kurses als Ergebnis deine gesamte deskriptive Statistik und wundervolle Tabellen und Grafiken. Dazu erhältst du noch 30 Minuten Beratung on TOP!
Aber warum das ganze selber machen und nicht gleich an einen Statistiker abgeben?
Was bringt Euch der ganze Aufwand? … schließlich wollt Ihr ja keine Mathematiker sondern Mediziner werden?
Zu Beginn Eures Ergebnisteils stellt Ihr den Leser*innen Eure Daten anhand der deskriptiven Statistik vor. Somit wird für diesen ein Überblick zu Eurem untersuchten Datensatz verschafft. Auch im Kapitel Material und Methoden ist das Subkapitel “Statistische Methoden” ein fester Bestandteil.
Darüber hinaus zählt die grundlegende Kenntnis und das Verständnis statistischer Methoden zu den wissenschaftlichen Kernkompetenzen, die von Euch bei Eurer Doktorarbeit erwartet werden.
Berechnet Ihr also selbst die wesentlichen Parameter der deskriptiven Statistik, werdet Ihr Expert*in für Eure Daten – denn niemand sollte Eure Daten besser kennen als Ihr selbst.
Außerdem könnt Ihr somit für die Statistiker*innen bereits erste Schwerpunkte für die Auswertung festsetzen, die auch unter Berücksichtigung Eurer Hypothesen und aus medizinischer Sichtweise sinnvoll sind. Vertraut uns, es sind bereits “gruselige” Ergebnisse entstanden, wenn ein Statistiker ohne medizinisches Wissen die Auswertung, rein aus einer statistischen Perspektive heraus, durchgeführt hat. Denn diese sehen meistens nur die Zahlen in einer Tabelle vor sich und kennen keinen klinischen Hintergrund dazu.
Ihr werdet spätestens im Ergebnis und Diskussionsteil die Erleichterung spüren, wenn es darum geht, die berechneten Ergebnisse des Statistikers in einen medizinischen Kontext zu setzen. Dies fällt Euch dann um einiges leichter.
Alles, was über die deskriptive Statistik hinausgeht, kann natürlich auch gerne von Euch selbst berechnet werden (wenn ihr daran Spaß habt oder es zu Euren einvernehmlich ausgemachten Aufgaben zählt), ist aber nicht immer ein Muss.
Deshalb sprecht dies am Besten bereits während der Projektplanung oder im kontinuierlichen Austausch mit Eurem jeweiligen Betreuungsteam ab. Denn an manchen Universitäten stehen kostenlose Statistik-Beratungen zur Verfügung. Alternativ besteht natürlich jederzeit die Möglichkeit, eine externe statistische Unterstützung zu beauftragen.
In unserem Online-Kurs zeigen wir Euch, wie ihr mit Eurer Datensammlung am geschicktesten vorgeht, wie Ihr diese aufbewahrt und welche Vorbereitungen für die folgende Datenanalyse getroffen werden können. Durch diese kleinen Tipps und Tricks lässt sich eine Menge an Zeit bei der statistischen Auswertung einsparen. Außerdem zeigen wir Euch eine Möglichkeit zur übersichtlichen Darstellung von Diagrammen und Tabellen für Euer Manuskript.
Für alle höher greifenden statistischen Fragen können wir unsere Kooperationspartnerin Magdalene Ortmann wärmstens empfehlen. Sie hat sich auf die statistische Beratung und Betreuung von Medizinern spezialisiert und bietet den Vorteil, dass sie selbst im medizinischen Bereich tätig ist. Sie hat ein Grundverständnis für die meisten Eurer Fragen und kann diese vor einem medizinischen Hintergrund beantworten.
Wir hoffen, dass wir Euch mit diesem Blogbeitrag ein bisschen die Sorgen vor der deskriptiven Statistik nehmen konnten und freuen uns auf Eure Kommentare und Feedback per Mail oder über Social Media.
An dieser Stelle möchten wir uns auch für Eure Treue und Euer Vertrauen in uns bedanken. Wir freuen uns schon sehr, Euch weiterhin auch im Jahre 2023 mit Inhalten rund um Eure Promotion zu versorgen.
Habt eine schöne besinnliche und fröhliche Weihnachtszeit mit Euren Liebsten und kommt gesund ins neue Jahr 2023.
Eure Desiree und Laura
Hier geht es zum Online-Kurs