Ordinal daten sind alle Daten, die eingestuft oder geordnet werden können. Worin unterscheiden sie sich von anderen Datentypen?
Würden Sie sagen, dass Ihr Schmerzniveau beim Lesen dieses Blogbeitrags wie folgt ist:
- Eins bis drei: im schlimmsten Fall ein kleines Ärgernis
- Von vier bis sechs: eine echte Qual, durchzukommen
- Sieben bis zehn: eine öffentliche Belästigung in der Größenordnung von Kakerlaken oder Ratten?
Die obige Frage und ähnliche – die in Arztpraxen, Gallup-Umfragen und Mitarbeiter-Austrittsgesprächen bis ins Unendliche wiederholt werden – sind Beispiele für einen Datentyp , der allgemein als „ordinale“ Daten bezeichnet wird. (Warum „ordinal“ und nicht „rangiert“ oder einfach „geordnet“ so geblieben ist, ist vermutlich ein Nebenprodukt der Vorliebe der Akademiker für anachronistische Sprache, die an ein heiliges Mysterium grenzt.)
Was sind Ordinal daten?
Ordinal daten sind einfach das, was der Name vermuten lässt: geordnete oder geordnete Daten. Bei Ordinal daten ist jedoch der schwierige Teil der fehlende einheitliche Abstand zwischen den Rängen. Um dies etwas genauer zu verdeutlichen, wenden wir uns Stanley Smith Stevens und der von ihm entwickelten Messniveauskala zu .
Ebenen der Datenmessung
In einem Artikel aus dem Jahr 1946 in der Zeitschrift Science legte der Psychologe Stanley Stevens eine Hierarchie der vier Haupttypen von Daten dar, die Forscher sammeln: Nominal-, Ordinal-, Intervall- und Verhältnisdaten. Stevens basierte seine Bewertung jeder Ebene auf ihrer Messgenauigkeit. Hier sind die Unterschiede zwischen den einzelnen Messebenen und wie ordinale Daten in die Skala passen.
Nominale Daten
Nominaldaten sind ein qualitativer Datentyp, der zur Klassifizierung und Bezeichnung von Variablen verwendet wird und als der einfachste Datentyp auf Stevens’ Skala gilt. Alle Nominaldaten sind kategorisch (d. h. diese Daten können in Gruppen sortiert werden) und haben keine bestimmte Reihenfolge oder Hierarchie. Variablen wie Name, Augenfarbe und Nationalität sind Beispiele für Nominaldaten.
Ordinal daten
Ordinal daten sind ein qualitativer Datentyp, der Variablen in einer Rangfolge klassifiziert. Diese Art von Daten ist kategorisch und unterteilt Variablen in Gruppen basierend auf unterschiedlichen aufsteigenden oder absteigenden Hierarchien. Ordinal daten umfassen Variablen wie Bildungsniveau, wirtschaftlichen Status oder Grad der Kundenzufriedenheit.
Intervalldaten
Intervalldaten sind ein quantitativer Datentyp, der Variablen in einer Rangfolge auf einer Skala klassifiziert, mit gleichen Abständen (Intervallen) zwischen jeder Variable. Daten auf Intervallmessebene sind numerisch oder nur in Form von Zahlen. Temperatur in Grad, gruppierte Einkommensbereiche und SAT-Ergebnisse sind Beispiele für Intervalldaten.
Verhältnisdaten
Verhältnisdaten sind ein quantitativer, numerischer Datentyp, der Intervalldaten ähnelt, außer dass er das Konzept der echten Null erkennt. In einer Verhältnisskala kann der Wert „0“ nicht gemessen werden, da „0“ im Sinne einer echten Null nichts oder das Fehlen einer Variablen darstellt. Dies bedeutet auch, dass Verhältnisdaten keine negativen Werte enthalten können, da es keine numerische Null gibt, die auf der Skala weitergegeben werden kann. Verhältnisdaten können Messungen von Größe, Gewicht oder der Anzahl der Mitglieder eines Teams umfassen.
Ordinal daten im Vergleich zu Nominaldaten
Betrachtet man Stevens‘ vier Messniveaus, liegen nominale Daten am einen Ende der Skala. Um diese Informationen zu sammeln, mussten die Forscher lediglich etwas in eine vordefinierte Kategorie einordnen. Kategorien zeigten keine Reihenfolge außer der Zugehörigkeit basierend auf bestimmten Kriterien. Ob also jemand ein Demokrat, Republikaner oder unabhängiger Wähler ist oder ob ein Tier ein Fisch, Vogel, Säugetier, Reptil, Amphibium oder Insekt ist, sind beides Beispiele für nominale Daten.
Am anderen Ende der Stevens-Skala liegen Verhältnisdaten , die einen echten Nullpunkt, einen gleichmäßigen Abstand zwischen den Beobachtungseinheiten und eine Skala aufweisen, die auf jede Beobachtung anwendbar ist und von klein bis groß reicht. Temperatur in Kelvin, Einkommen, Lebensjahre und Geschwindigkeit sind Beispiele für Verhältnisskalendaten.
Ordinal daten liegen zwischen diesen beiden Extremen. Im Gegensatz zu ihren nominalen Verwandten haben ordinale Kategorien eine Rangstruktur. Andererseits müssen die Abstände zwischen den ordinalen Rängen im Gegensatz zu ihren Verwandten mit Verhältnisskala nicht gleich oder sogar zwischen den Rangstufen standardisiert sein.
Was ist ein Beispiel für ordinale Daten?
Um den Unterschied noch deutlicher zu machen, betrachten wir die Möglichkeiten, Schülern in einem Klassenzimmer Ranglisten zuzuweisen. Ein Lehrer (vermutlich ein großer) möchte die Schüler nach ihrer Körpergröße ordnen. Die Maßskala, sei es in Zoll, Fuß, Metern oder einer anderen Größe, ist für alle Schüler gleich und gleich kalibriert, sodass die Messungen direkt vergleichbar sind.
Ein anderer Lehrer (vermutlich ein fröhlicher) möchte die Schüler nach ihrer Zufriedenheit einstufen. Einige Schüler sind sicherlich glücklicher als andere. Es gibt jedoch keine standardisierte Skala, mit der die Zufriedenheit der Schüler gemessen werden kann. Anstelle einer standardisierten, kalibrierten Messung müssen sich Lehrer entweder auf die Selbstauskunft der Schüler über ein Umfrageinstrument verlassen oder auf externe Beobachter, die die Zufriedenheit der Schüler anhand einiger gemeinsamer Kriterien, d. h. einer Rubrik oder eines Formulars, beurteilen. Die damit verbundene Herausforderung besteht darin, dass der Unterschied zwischen „glücklich“ und „sehr glücklich“ eines Schülers radikal anders sein kann als bei einem anderen Schüler. Dieses Problem bleibt bestehen, unabhängig davon, wie die Daten erhoben werden.
Ordinal skalen führen zu anderen Arten statistischer Schlussfolgerungen als genauer gemessene Daten. Ordinal skalen machen prädiktive Schlussfolgerungen auch schwieriger. Aber es ist nicht unmöglich. Wenn genügend Rangdaten auf die gleiche Weise gesammelt werden können, können Forscher empirische Verteilungen der Häufigkeiten der Rangfolgen einzelner Personen konstruieren. Dies ermöglicht es Forschern, zusammenfassende Statistiken wie Mediane und Interquartilsbereiche in Ordinal skalendaten zu untersuchen. All dies ergibt sich aus der natürlichen Rangstruktur der Ordinal skala, auch wenn die Abstände zwischen den Rängen von Person zu Person unterschiedlich sein können. Die einfache Tatsache, dass Einheiten geordnet werden können, auch wenn die Reihenfolge von Person zu Person unterschiedlich ist, sorgt für genügend Struktur in den Daten, damit Forscher eine Reihe empirischer Methoden anwenden können, um statistische Regelmäßigkeiten zu ermitteln.
Wie werden Ordinal daten verwendet?
Da geordnete Daten entlang eines Kontinuums kategorisiert werden, können ihnen numerische Wahrscheinlichkeiten zugewiesen werden. Wenn Forscher zu Recht Verteilungsannahmen über diese Wahrscheinlichkeiten treffen können, können sie Wahrscheinlichkeitsschätzungen für ordinale Ergebnisse berechnen. Dies ist besonders wirkungsvoll, da Forscher Informationen aus präzise gemessenen Prädiktoren verwenden können, um abzuschätzen, wie wahrscheinlich ordinale Ergebnisse sein werden. Um zu verstehen, warum das so ist, kehren wir zum Rätsel der Klassenränge zurück.
Wenn Grund zur Annahme besteht , dass größere Menschen tendenziell glücklicher sind , können Messungen der Körpergröße von Schülern eine Grundlage für Wahrscheinlichkeitsschlüsse darüber liefern, wie glücklich Schüler sind. Wenn ein Schüler beispielsweise 1,5-mal so groß ist wie der Klassendurchschnitt, können Lehrer anhand der Häufigkeit der gemeldeten Glücksniveaus davon ausgehen, dass dieser Schüler im Vergleich zu anderen Schülern doppelt so wahrscheinlich „sehr glücklich“ ist, im Vergleich zu anderen Schülern viermal so wahrscheinlich „glücklich“ oder „sehr glücklich“ ist und so weiter.
Indem sie die Verbindung zwischen der Rangfolge der Zufriedenheitsniveaus der Schüler und ihrer Körpergröße ausnutzen, können Lehrer Bewegungen auf der besser messbaren Körpergrößenskala nutzen, um Bewegungen auf der nicht direkt messbaren (oder, um in die akademische Ausdrucksweise zurückzukehren, „latenten“) Skala der Zufriedenheit der Schüler zu entschlüsseln. Solange eine Korrelation zwischen Prädiktoren und einem ordinalen Ergebnis besteht und Forscher bereit sind, Annahmen darüber zu treffen (und diese zu begründen), welche Verteilung die ordinalen Ergebnisse wahrscheinlich aufweisen, können sie ordinale Ergebnisse probabilistisch vorhersagen.
Wie werden ordinale Daten erfasst?
Die größte Gefahr bei der Schätzung ordinaler Ergebnisse sind Messfehler, die durch die Datenerfassung entstehen. Die Erfassung ordinaler Daten ist stärker von Messfehlern betroffen als die Erfassung nominaler Daten, da nominale Daten einfacher zu erfassen sind. Die Kategorisierung von Elementen in Klassen ist einfacher als die Klassifizierung und Rangfolge von Elementen. So ist es beispielsweise einfacher, Automarken als Porsche, Ford, BMW oder Subaru zu identifizieren, als zu versuchen, sie auf der Grundlage der Verbraucherpräferenzen in eine Rangfolge zu bringen. Im Gegensatz zu Verhältnisdaten sind ordinale Daten außerdem aufgrund des Fehlens eines standardisierten, gleichmäßig verteilten Messkontinuums ungenau. Daher ist ein direkter Vergleich in Bezug auf ordinale Ergebnisse nicht möglich.
Aus diesen Gründen müssen Forscher Messfehler vermeiden, wenn sie Daten zu Rangfolgenergebnissen sammeln. Zu den Methoden, dies zu erreichen, gehört die Standardisierung sowohl der Fragen in den Umfragen als auch der Art und Weise, wie die Teilnehmer darauf antworten können. Veränderte Kategorien, vage Grenzwerte oder unklare Formulierungen können zu unregelmäßigen, wirren Antworten führen .
Die Wahrscheinlichkeit von Messfehlern steigt auch bei der Datenerfassung durch Zweit- oder Drittparteien. Sowohl Umfrageteilnehmer als auch Befragte können Fehlerquellen sein, ebenso wie unterschiedliche Beobachter, die für dasselbe Ergebnis völlig unterschiedliche Ergebnisse aufzeichnen. Außerdem werden prädiktive Schlussfolgerungen und statistische Schätzungen durch das Fehlen einer direkten Skala, die auf alle Messungen anwendbar ist, erschwert. Annahmen spielen bei der statistischen Untersuchung ordinaler Ergebnisse eine größere Rolle, und ungerechtfertigte, unausgesprochene oder nicht realisierte Annahmen, die Forscher über Daten treffen, können tückisch sein.
Wofür werden Ordinaldaten verwendet?
Ordinaldaten, wenn sie gut und konsistent erhoben werden, ermöglichen es Forschern, statistische Erkenntnisse zu einer Vielzahl von Themen zu gewinnen, die mit präziseren Formen wissenschaftlicher Messung nicht angegangen werden können. Wichtige Fragen zur allgemeinen Lebenszufriedenheit, zu subjektiven Interpretationen der Zufriedenheit im Beruf oder in der Familie, zu individuellen Schmerz- oder Depressionsgefühlen und vielen anderen können alle im großen Maßstab mithilfe ordinaler Ergebnisse behandelt werden. Das Verständnis von Ranginformationen und deren anschließende Verwendung zum Erstellen genauer statistischer Modelle – soweit Forscher dazu in der Lage sind – öffnet die Tür zu einem tieferen Verständnis des subjektiven, aber allgemeinen menschlichen Wohlbefindens freeware.
Häufig gestellte Fragen
Ordinal daten sind qualitative Daten, die in eine bestimmte Rangfolge oder Hierarchie kategorisiert sind.
Nominale Daten sind qualitative Daten, die nur auf der Grundlage beschreibender Merkmale kategorisiert werden. Diese Art von Daten hat keine Rangfolge oder Hierarchie.
Beispiele für ordinale Daten sind Bildungsniveau, wirtschaftlicher Status und Grad der Kundenzufriedenheit.