Zusammenfassung
In der medizinischen Forschung werden Studien anhand von Stichproben durchgeführt, deren Ergebnisse man normalerweise verallgemeinern möchte auf die sog. „Grundgesamtheit“. Wie gut eine Studie verallgemeinert werden kann, hängt von ihrer „Repräsentativität“ und der „Güte“ (Objektivität, Reliabilität, Validität) der verwendeten Messmethoden ab. Die für das Verständnis notwendigen Grundbegriffe werden in diesem Kapitel vorgestellt.
Definitionen
- Merkmal („Variable“): Eigenschaft von Studienteilnehmenden, die gemessen wird
- Merkmalsträger: Person, bei der das Merkmal gemessen wird
- Merkmalsausprägung: Der gemessene Wert, den das Merkmal hat
- Grundgesamtheit: Alle Personen, über die man eine Aussage machen will
- Stichprobe: Teilmenge aus der Grundgesamtheit, die in einer Studie genutzt wird, um Rückschlüsse auf die Grundgesamtheit zu ziehen
- Stichprobenarten: Verschiedene Möglichkeiten der Gewinnung einer Stichprobe
- Bspw. Quotenstichprobe: Vorher festgelegte Prozentwerte für einzelne Teilgruppen
- Weitere Details siehe: Stichprobenarten
- Stichprobenarten: Verschiedene Möglichkeiten der Gewinnung einer Stichprobe
- Item: Fragen oder Einzelaufgaben innerhalb eines Tests
- Trennschärfe: Eignung der Items, zwischen Probanden mit hoher und niedriger Ausprägung des untersuchten Merkmals zu unterscheiden
- Voraussetzung für hohe Trennschärfe: Item wird von der Mehrheit der Merkmalsträger nicht gleich beantwortet
- Journal Impact Factor (JIF): Index, dessen Höhe den Einfluss wissenschaftlicher Fachzeitschriften im jeweiligen Fachbereich angibt
- Berechnung des JIF für einen Zweijahreszeitraum: Anzahl der Zitate des Bezugsjahres bezogen auf alle Publikationen der vorausgegangenen zwei Jahre geteilt durch die Anzahl aller Artikel der vorausgegangenen zwei Jahre
- Bedeutung: Kein Qualitätsmaß, sondern lediglich Ausmaß der Zitationen in anderen Publikationen im Verhältnis zur Gesamtzahl der Artikel
Repräsentativität
Erhobene Stichproben dienen dazu, Schätzungen über eine Grundgesamtheit vorzunehmen. Der Schluss von der Stichprobe auf die Grundgesamtheit ist jedoch nur möglich, wenn diese sich ähneln. Diese Ähnlichkeit wird über die Repräsentativität der Stichprobe beschrieben.
- Definition: Ähnlichkeit zwischen Stichprobe und Grundgesamtheit in der Zusammensetzung
- Erstellung einer repräsentativen Stichprobe: Auswahl der Studienteilnehmenden durch einen Zufallsgenerator („Zufallsstichprobe“)
- Beurteilung: Vergleich von Strukturmerkmalen zwischen Stichprobe und Grundgesamtheit
- Strukturmerkmale: Altersverteilung, Geschlechterverhältnis, BMI usw.
Eine hohe Repräsentativität ist Voraussetzung dafür, dass von einer Stichprobe auf die Grundgesamtheit geschlossen werden kann!
Wissenschaftliche Gütekriterien eines Messinstruments
In der Praxis sind viele Messmethoden unzuverlässig. Dabei können Fehler auf verschiedene Arten auftreten, bspw. durch unterschiedliche Untersucher, durch schlecht kalibrierte Geräte oder durch eine per se ungeeignete Messmethode. Um die Güte eines Messinstruments zu beurteilen, benutzt man definierte Kriterien.
Beispiel: Es soll beurteilt werden, ob eine Cholestase vorliegt.
- Messmethode: Sonografische Bestimmung des DHC-Durchmessers
- Frage: Wie gut eignet sich diese Messmethode, um eine Cholestase zu beurteilen?
Objektivität
- Definition: Unabhängigkeit von den Rahmenbedingungen
- Erklärung: Objektiv sind Messungen, deren Ergebnisse nicht vom Untersucher oder den Begleitumständen abhängen
- Beispiel: Hängt der gemessene DHC-Durchmesser vom Untersucher, von der Uhrzeit oder vom Untersuchungsraum ab?
Reliabilität
- Definition: Zuverlässigkeit, Freiheit von Messfehlern
- Erklärung: Reliabel sind Messungen, die unter gleichen Bedingungen gleiche Ergebnisse liefern
- Voraussetzung: Objektivität
- Bestimmung
- Test-Retest-Reliabilität: Mehrere Messungen an einer Person durch denselben Untersucher
- Hohe Reliabilität, wenn Messungen annähernd gleiche Ergebnisse liefern
- Beispiel: Wenn ein Arzt den gleichen Patienten zweimal sonografiert, sollte der gleiche DHC-Durchmesser gemessen werden
- Inter-Observer-Reliabilität: Mehrere Messungen an einer Person durch verschiedene Untersucher
- Hohe Reliabilität, wenn Messungen annähernd gleiche Ergebnisse liefern
- Beispiel: Ein Patient wird von zwei verschiedenen Ärzten geschallt. Bei einer reliablen Messung sollten beide den annähernd gleichen DHC-Durchmesser messen
- Test-Retest-Reliabilität: Mehrere Messungen an einer Person durch denselben Untersucher
Validität
- Definition: Gültigkeit, Eignung der Messmethode für die Fragestellung
- Erklärung: Valide sind Messungen, wenn die Fragestellung mit dem gemessenen Parameter tatsächlich beantwortet werden kann
- Voraussetzung: Objektivität und Reliabilität
- Beispiel: Ist ein großer DHC wirklich charakteristisch für eine Cholestase?
Nur valide Messungen sind in der Praxis anwendbar. Validität setzt Reliabilität und Objektivität voraus!
Validität einer Studie
Ähnlich wie bei einer Messung muss man sich auch bei einem Studienergebnis fragen, wie gut man die aus der Studie gezogenen Schlüsse wirklich auf die Studienteilnehmenden übertragen (interne Validität) und vor allem auf die Grundgesamtheit anwenden (externe Validität) kann.
Interne Validität
- Definition: Gültigkeit der Studienergebnisse für die Studienteilnehmenden
- Mögliche Kriterien für eine hohe interne Validität
- Eindeutiger kausaler Zusammenhang von Einflussgröße und Zielgröße kann angenommen werden
- Alle möglichen Störgrößen ausgeschaltet
- Studienbedingungen stark standardisiert
- Beispiel: Studien unter Laborbedingungen haben eine hohe interne Validität
Externe Validität
- Definition: Gültigkeit der Studienergebnisse für die Grundgesamtheit („Verallgemeinerbarkeit der Ergebnisse“)
- Voraussetzung: Hohe interne Validität
- Mögliche Kriterien für eine hohe externe Validität
- Repräsentativität
- Ergebnisse gut auf den Alltag übertragbar (Studie unter Alltagsbedingungen durchgeführt )
Die interne Validität einer Studie bezieht sich nur auf die Studienteilnehmenden, während die externe Validität die Übertragbarkeit auf die Grundgesamtheit (und damit die Praxis) bewertet. Die externe Validität setzt die interne voraus!