Bereit für die Datenauswertung?
Vielleicht hast du sogar schon einen Statistik Kurs in der Uni besucht und fühlst dich nicht mehr wie ein*e Anfänger*in auf dem Gebiet der Statistik. So ging es zumindest mir, als ich 2014 aus meinem ersten SPSS-Kurs kam, der sicherlich keinen Statistik Kurs ersetzte.
Endlich wusste ich, wie ich mit SPSS T-Tests durchführe und wie ich nominale von ordinalen Daten unterscheide. Jedoch ist die Anwendung statistischer Testverfahren nichts wert, wenn man nicht ausreichend weiß, unter welchen Bedingungen man diese anwenden kann.
Warum eine statistische Beratung vor Beginn der Analyse so wichtig ist, werde ich euch in meinem nächsten Blogbeitrag mit meiner Partnerin Dr. Magdalene Ortmann erklären. Heute geht es um die Vorbereitung deiner Daten.
Meine erste Frage, die ich meinen Coachees zu diesem Zeitpunkt immer stelle ist folgende:
„Wie hast du deine Daten gesammelt und wie weit bist du mit der Dateneingabe?“
Wenn du jetzt diese Frage liest, kannst du sie dir direkt einmal beantworten.
Bist du bereits so weit, dass du die Daten in einem System eingespeist hast, mit dem du auch deine statistischen Tests durchführen möchtest oder hast du eventuell deine Daten sogar noch nicht einmal vom Papier in den Computer gebracht?
Hierbei geht es generell um die Frage, wie du deine Daten, die du erhoben hast, aufbereiten möchtest.
Ich persönlich habe meine Daten in einer Excelmatrix gesammelt und dann nach SPSS transferiert.
Die Entscheidung, die Daten nicht direkt in SPSS einzugeben habe ich aufgrund der vielfältigen Funktionen von Excel getroffen. Excel bietet gerade für einfache Zwischenberechnungen, wie zum Beispiel automatische Summenscores oder Zählenwenn Funktionen die Möglichkeit, Befragungsergebnisse direkt zu berechnen.
Dabei empfand ich Excel als deutlich flexibler als SPSS, zumal sich SPSS nie automatisiert aktualisiert, wenn man eine Änderung an den berechneten Daten vornimmt. Außerdem habe ich in meiner Excelmatrix sogenannte „Dropdown“ Felder eingebaut, die Eingabefehler limitierten, indem sie nur spezielle Zellenwerte zuließen.
Gerne können wir uns hierzu einmal in unserer Facebook-Community austauschen. Ich würde mich über eure Erfahrungsberichte freuen.
Wie und wo du deine Primärdaten sammelst ist allerdings Geschmackssache, weshalb ich hier auch keine generelle Empfehlung abgeben möchte. Ich habe zum Beispiel auch gute Erfahrungen damit gemacht, Daten direkt in eine vorgefertigte Access Datenbank einzutragen und mir die Backends dann in eine Exceltabelle exportieren zu lassen.
Jedoch ist dies nicht unbedingt für die erste Datenauswertung zu empfehlen. Gerade wenn man die Datenbank nicht selbst erstellt hat, kann es häufig, durch Unkenntnis von Tabellenverknüpfungen, zu Dopplungen von Werten oder Fehlberechnungen beim Export kommen.
Ich empfehle daher eher eine einfache sowie nachvollziehbare Strategie, eure Daten einzugeben. Hierfür kann man eben wie bereits gesagt Systeme wie Excel oder SPSS uvm. Nutzen.
In meinem Online Kurs erkläre ich dir unter anderem, was du bei der Erstellung einer Exceldatenmatrix alles beachten solltest, womit ich zu meiner zweiten Frage komme, die ich meinen Coachees häufig stelle:
Welche Strategien hast du bei der Dateneingabe verwendet, um möglichst wenige Eingabefehler und damit mögliche fälschliche Ausreißer zu vermeiden?
Wenn du dir jetzt denkst, was will Désirée von mir, dann bist du nicht allein. Viele meiner Coachees denken in diesem Zuge zum ersten Mal darüber nach, ob sie Sicherheitsstufen, wie zum Beispiel die eben genannten Drop-Down Felder eingebaut haben, um eine möglichst fehlerfreie Dateneingabe gewährleisten zu können.
Wieso ist das so wichtig? Die Antwort liegt auf der Hand:
Du allein bist für die Korrektheit deiner Daten verantwortlich. Dabei geht es nicht nur darum, keine wissentlich gefälschten Daten (z.B. ausgedachte Daten) zu veröffentlichen, sondern auch unwissentlich verfälschte Zahlenwerte, z.B. durch Eingabefehler, so gering wie nur möglich zu halten!
Dies ist ein Grundsatz der guten wissenschaftlichen Praxis!
Ein weiterer wichtiger Grundsatz bei der Dateneingabe ist Transparenz.
Es lässt sich nicht vermeiden, dass insbesondere bei selbst ausgefüllten Fragebögen von Patient*innen, teilweise nicht ganz eindeutige Ergebnisse zu erkennen sind, bei denen man sich dann überlegen muss, wie man diese in seine Datenmatrix aufnimmt. Das kann passieren, es ist nur wichtig, dass du es zum Beispiel in einem entsprechenden Kommentarfeld in der Datenmatrix vermerkst. So kannst du nachweisen, dass du hier einen kritischen Blick angewendet hast und nichts beschönigst.
Mein Tipp an dieser Stelle: Besprich solche Unsicherheiten im Zweifel mit deiner Betreuung.
Wenn du nun also so weit bist, dass du all deine Primärdaten in eine Datenmatrix deiner Wahl eingetragen hast, solltest du, bevor du über mögliche statistische Berechnungen nachdenkst noch drei weitere Dinge beachten:
1. Überprüfe deine Variablen auf Ausreißer.
- SPSS hat zum Beispiel eine Funktion, die dir alle möglichen Ausreißer automatisch anzeigt. Bei Excel ist das durch spezielle Formeln etwas umständlicher ebenfalls möglich. So kannst du auch die letzten Eingabefehler noch einmal ausmerzen. Beutreile jedoch immer genau, ob es sich nicht tatsächlich um einen Ausreißer handeln könnte, wie zum Beispiel ein besonders erhöhter Entzündungswert o.ä.
- Bei Unsicherheiten ziehe lieber einmal mehr die Papierakte hinzu und überprüfe manuell deine Eingabe
- TIPP: Eine richtig professionelle Dateneingabe sollte immer einer Second Look Überprüfung durch eine zweite Person unterzogen werden. Dies ist jedoch bei Doktorarbeiten häufig nicht möglich. Bei Retrospektiven Analysen jedoch, solltest du Diejenige/Derjenige sein, der/die die Second Look Überprüfung macht, um den bestmöglichen Standard zu gewährleisten.
2. Sei dir darüber im Klaren, was du eigentlich mit deiner Analyse erreichen möchtest.
- Hier sind wir wieder bei meinem Lieblingsthema, der Vorbereitung und Planung. Das ist die halbe Miete, auch im Hinblick auf deine statistische Beratung.
- Hol deinen Projektplan und den Ethikantrag wieder hervor oder schaue in die Fließtexte, die du bereits während deiner Vorbereitung deiner Datenerhebung erstellt hast. In Modul 3 meines Online-Kurses erstellen wir gemeinsam viele dieser wichtigen Inhalte, die du nun anwenden kannst, um deine Datenanalyse zu planen.
- Stelle dir nun erneute die Fragen, wen du mit wem vergleichen willst, was das Ziel der Arbeit ist und wo deine Daten herkommen.
- Halte dir immer vor Augen, dass der/die Statistiker(in) zwar alle Tests der Welt berechnen kann, aber keinen Einblick in deine Materie hat. Das heißt, dass du genau wissen musst, worauf du mit deinen Daten hinaus möchtest, sonst nutzt die beste Statistik Beratung nichts.
- (Kolleg*innen wie Frau Dr. Ortmann, die selbst lange in der Forschung tätig waren, sind hier Ausnahmen, die dich auch bereits etwas früher abholen können und dir auch dabei zur Seite stehen. Es sollte jedoch sollte dein eigener Anspruch sein, zu wissen, was du eigentlich mit deiner Statistik erreichen möchtest.)
3. Überprüfe im besten Falle deine Daten noch auf Normalverteilung.
- Falls du deinen Statistik Kurs besucht haben solltest, was ich dir, trotz statistischer Beratung durch Fachpersonal, dringend ans Herz legen würde, bist du vermutlich in der Lage deine Daten auf Normalverteilung zu überprüfen.
- Nutze hierfür die verschiedenen Möglichkeiten in SPSS oder anderen Statistikprogrammen deiner Wahl
- Entscheide zuvor jedoch, welche Variablen deine Hauptvariablen sind, denn um diese geht es vorrangig.
- Meine Faustregel war immer: Je größer die Gruppengrößen (30 ist eine magische Grenze), desto sicherer kannst du dir sein, dass deine Daten nicht an eine Normalverteilung grenzen. Sowieso ist das ist der Medizin selten der Fall, weshalb es hierfür Mittel und Wege gibt. Ab einer Größe von 30 Proband:Innen kann man immer Tests für normalverteilte Daten wählen.
- Solltest du dich nicht dazu in der Lage fühlen vor der statistischen Beratung eine Aussage darüber treffen zu können, ist das überhaupt kein Problem, dafür gibt es Fachleute wie Dr. Magdalene Ortmann
Zum Schluss möchte ich noch einmal darauf hinweisen, dass es immer klug ist, so viel wie möglich während deines gesamten Promotionsprozesses schriftlich zu dokumentieren. Dies kannst du auch gesondert für die Planung deiner statistischen Auswertungen machen. Die folgende Abbildung zeigt ein Beispiel, wie ich mich immer auf die Statistik Beratung kurz und bündig vorbereite. Die Liste kann dann zusammen mit dem Profi beliebig erweitert werden.
Es geht bei dieser tabellarischen Dokumentation vor allem darum, dass du dir einen guten Überblick verschaffst und dich auf das Wesentliche fokussieren kannst. Hervorzuheben ist bei der schriftlichen Dokumentation auch das Signifikanzniveau. Dieses sollte niemals im Nachhinein noch einmal geändert werden, nur um signifikante Ergebnisse zu erhalten.
Dazu möchte ich euch jedoch in meinen nächsten Blogbeiträgen mehr berichten. Ich freue mich sehr, hierfür Dr. Magdalene Ortmann als Gastautorin begrüßen zu dürfen.
Ich hoffe ich konnte dir mit diesem Beitrag wieder einmal einen Wissenszuwachs verschaffen und dich auf dem Weg zu deiner erfolgreichen Promotion begleiten.
Solltest du eine intensivere Begleitung benötigen, kann ich dir meinen Online-Kurs „Step-by-Step zum Dr. med. – Promovieren leicht gemacht“ nur ans Herz legen. Hier führe ich dich Stück für Stück durch die organisatorischen Abläufe deiner medizinischen Promotion mit dem obersten Ziel, dir viel Zeit und Nerven zu sparen.
Wenn du eine individuelle Betreuung bei deiner Promotion benötigst biete ich dir wie immer die Möglichkeit an, ein 1:1 Coaching bei mir zu belegen. Alle Infos findest du auf meiner Homepage Startseite.
Wenn dir dieser Beitrag gefallen hat, dann hinterlasse mir gerne hier oder in den sozialen Netzwerken einen Kommentar und teile diesen Beitrag, damit so viele Medizindoktorand*innen wie nur möglich hiervon profitieren.
Ich wünsche dir viel Erfolg bei deiner Promotion
Eure Désirée
*Der Code ist limitiert vorhanden und nur einzeln anwendbar. Nicht kombinierbar mit dem regulären Studentenrabatt