Was ist der z-score? | Data Basecamp (2025)

Was ist der z-score? | Data Basecamp (1)

Der z-Score, auch Standardwert genannt, ist ein Konzept aus der Statistik, das für die Datenanalyse und Hypothesentests genutzt wird. Er misst, wie viele Standardabweichungen eine einzelne Beobachtung oder ein Datenpunkt vom Mittelwert der Verteilung entfernt ist. Mithilfe des z-Scores können Ausreißer identifiziert werden und außerdem ein Verständnis für die Variabilität der Daten geschaffen werden. Diese Kennzahl wird in verschiedensten Anwendungen eingesetzt, wie beispielsweise in den Bereichen Finanzen, Technik oder Medizin.

Dieser Beitrag beschäftigt sich mit dem grundlegenden Konzept des z-Scores, der mathematischen Berechnung und den Vor- und Nachteilen der Verwendung.

Was ist der z-Score?

Der z-Score ist ein statistisches Maß, das auch als Standardwert bezeichnet wird und die Anzahl der Standardabweichungen eines Datenpunkts vom Mittelwert des Datensatzes angibt. Einfach gesprochen misst diese Kennzahl, wie weit ein Datenpunkt vom Mittelwert entfernt ist. Diese Kennzahl wird verwendet, um Daten zu standardisieren und Datensätze untereinander vergleichbar zu machen. Der Datenpunkt selbst ist dafür häufig nicht aussagekräftig genug.

Das wird an dem folgenden Beispiel aus der Schule besonders deutlich. Zwei Schülerinnen aus verschiedenen Klassen derselben Stufe haben ihre Klausurnote in Mathematik erhalten. Schülern A hat eine 2+ geschrieben, während Schülerin B die Klausur mit der Note 3- zurückerhalten hat. Schülerin A behauptet nun besser in Mathematik zu sein, da eine 2+ eine bessere Note sei als eine 3-. Schülerin B wiederum entgegnet, dass ihre Klausur besonders schwierig gewesen sei und sie deshalb die bessere Mathematikschülerin sei.

Was ist der z-score? | Data Basecamp (2)

Um diese Behauptung zu stützen,bringt sie an, dass die Klausur in ihrer Klasse eine Durchschnittsnote von 4,0 hatte, während der Durchschnitt in der Klasse von Schülerin A eine 2,0 gewesen sei. Somit habe sie deutlich besser als der Durchschnitt abgeschlossen, im Vergleich zu Schülerin A.Obwohl Schülerin B mit ihrer Aussage im Allgemeinen richtig liegt, muss für einen neutralen Vergleich nicht nur der Durchschnitt der Klasse, sondern auch die Standardabweichung berücksichtigt werden. Dafür kann sie den z-Score nutzen. Wie sich dieser berechnet, wird im nächsten Kapitel genauer erklärt.

Wie wird der z-Score berechnet?

Die Formel zur Berechnung des z-Scores ist relativ unkompliziert. Als erstes wird die Abweichung des Datenpunktes vom Mittelwert des Datensatzes berechnet. Um diese Differenz noch zu standardisieren und dadurch vergleichbar zu machen, wird sie anschließend durch die Standardabweichung geteilt. Als Formel ergibt sich somit:

\(\) \[z = \frac{(x – \mu)}{\sigma}\]

Wobei:

  • z ist der z-Score
  • x ist der Datenpunkt oder -wert
  • μ ist der Mittelwert des Datensatzes
  • σ ist die Standardabweichung des Datensatzes

Um den z-Score in der Praxis berechnen zu können, müssen die folgenden Schritte ausgeführt werden:

  1. Berechne den Mittelwert (μ) des Datensatzes: Hierfür wird das arithmetische Mittel genutzt. Es werden also alle Datenpunkte addiert und anschließend durch die Gesamtzahl der Datenpunkte geteilt.
  2. Berechne die Standardabweichung (σ) des Datensatzes: Die Standardabweichung misst die durchschnittliche Abweichung eines Datenpunkts vom Mittelwert. Dazu wird für jeden Datenpunkt die Differenz zum Mittelwert errechnet und anschließend quadriert. Diese quadrierten Differenzen werden anschließend zusammenaddiert und durch die Gesamtzahl der Datenpunkte geteilt. Abschließend muss noch die Quadratwurzel dieses Ergebnisses gebildet werden, damit der Wert wieder in derselben Einheit wie der Datensatz ist.
  3. Wähle einen bestimmten Datenpunkt: Der z-Score wird immer für einen bestimmten Datenpunkt und nicht für den kompletten Datensatz berechnet. Für eine Berechnung muss also ein bestimmter Punkt gewählt werden.
  4. Berechne die Differenz zwischen Mittelwert und dem Datenpunkt.
  5. Teile das Ergebnis durch die Standardabweichung (σ).

Ein positiver z-Score bedeutet, dass der gewählte Datenpunkt oberhalb des Mittelwerts liegt und ein negativer Wert, dass er unterhalb des Mittelwerts liegt. Umso größer der absolute Wert ist, umso stärker weicht der Datenpunkt vom Mittelwert ab. Durch diesen Wert kann die relative Position des Datenpunkts in der Verteilung bestimmt werden und es können die Datenpunkte zwischen verschiedenen Datensätzen verglichen werden, auch wenn sich deren absolute Skala in den Daten unterscheidet.

Wie ist der z-Score an der Standardisierung von Daten beteiligt?

Der z-Score ist ein statistisches Maß, das die Abweichung eines Datenpunktes vom Mittelwert misst, in Abhängigkeit von der Standardabweichung. Es kann für die Standardisierung von Daten genutzt werden, indem der komplette Datensatz von der zugrundeliegenden Skala abstrahiert wird und jeder Datenpunkt noch lediglich durch den dazugehörigen z-Score gemessen wird. Ansonsten können verschiedene Variablen Verzerrungen aufweisen, da sie Skalenunterschiede haben, also in verschiedenen Werten gemessen werden. Ein Datensatz der Haushaltseinkommenin einem Land beispielsweise hat eine absolut höhere Abweichung vom Mittelwert, da diese in Tausend Euro Schritten gemessen wird, als ein Datensatz über die Brotpreise in verschiedenen Städten.

Durch die Standardisierung mithilfe des z-Scores lassen sich Datensätze besser vergleichen und gegenüberstellen und außerdem können einfacher Muster und Beziehungen in den Daten erkannt werden. Zusätzlich dazu sind die z-Scores nützlich bei der Erkennung von Ausreißern oder anderen ungewöhnlichen Beobachtungen, die sehr weit vom Mittelwert entfernt liegen.

Welche Anwendungen hat der Score bei Hypothesentests und statistischen Schlussfolgerungen?

Der z-Score spielt eine wichtige Rolle in verschiedenen statistischen Tests. Vor allem in den folgenden Bereichen wird er eingesetzt:

  1. Hypothesentest: Das Ziel eines Hypothesentests ist es zu untersuchen, ob eine Hypothese signifikant von einer Normalverteilung abweicht oder nicht. Mithilfe des z-Scores kann berechnet werden, wie weit der Stichprobenmittelwert vom Mittelwert der Population, also der Normalverteilung abweicht. Dieser Wert kann dann mit einem kritischen Wert der Normalverteilung verglichen werden, um festzustellen, ob sich der Stichprobenwert signifikant vom Populationswert unterscheidet. Wenn dies nicht der Fall ist, wird die Hypothese angenommen.
  2. Konfidenzintervalle: Der z-Score wird außerdem zur Berechnung von Konfidenzintervallen verwendet. Durch diesen Wert eines Stichprobenmittelwerts kann der Wertebereich geschätzt werden, in den der Populationswert mit einer gewissen Wahrscheinlichkeit fällt.
  3. Erkennung von Ausreißern: Durch die Definition eines Schwellenwerts können einfach Ausreißer erkannt werden, indem der z-Score für jeden Datenpunkt berechnet wird. Daten, deren Werte außerhalb eines definierten Bereichs liegen können als Ausreißer klassifiziert werden.
  4. Normalitätstests: Der z-Score ermöglicht außerdem, dass geprüft werden kann, ob Daten einer Normalverteilung folgen. Mithilfe dieser Berechnung und der Veranschaulichung der Verteilung in einem Normalwahrscheinlichkeitsdiagramm kann beurteilt werden, ob eine Normalverteilung vorliegt.

Der z-Score bildet die Basis für viele statistische Anwendungen. Vor allem bei Hypothesentests und bei der Prüfung der Normalverteilung wird er eingesetzt.

Wie ist der z-Score zu interpretieren?

Der z-Score lässt sich relativ einfach interpretieren. Dazu werden zwei Größen betrachtet, zum einen das Vorzeichen und zum anderen der tatsächliche Wert. Ein positiver Wert bedeutet, dass der Datenpunkt oberhalb des Mittelwerts liegt, während ein negativer Wert aussagt, dass der Datenpunkt unterhalb des Mittelwerts liegt. Die Größe des z-Scores wiederum misst, wie weit der Datenpunkt vom Mittelwert entfernt liegt. Für eine bessere Vergleichbarkeit wird dies in Standardabweichungen und nicht in absoluten Zahlen gemessen.

Ein z-Score von 1 bedeutet somit, dass der Punkt oberhalb des Mittelwerts für den Datensatz liegt und außerdem eine Standardabweichung entfernt ist. Ein Wert von 2 kann genauso interpretiert werden. Dieser Datenpunkt ist also zwei Standardabweichungen oberhalb des Mittelwerts gelegen. Schließlich liegt ein Datenpunkt mit dem z-Score -1 unterhalb des Mittelwerts und zwar eine Standardabweichung entfernt.

Was sind die Vor- und Nachteile des Scores?

Der z-Score ist ein beliebtes Tool im Bereich der Statistik, das dazu genutzt wird, Daten aus verschiedenen Quellen zu standardisieren und damit Datensätze vergleichbar zu machen. Jedoch hat diese Kennzahl nicht nur Vorteile, sondern weist auch einige Grenzen. Deshalb befassen wir uns in diesem Abschnitt mit den Vor- und Nachteilen des z-Scores, sodass er je nach Anwendung effektiv eingesetzt werden kann.

Vorteile:

  • Der z-Score bietet ein einfaches und standardisiertes Maß, um beurteilen zu können, wie weit ein Datenpunkt vom Durchschnitt des Datensatzes entfernt liegt.
  • Dadurch ist sichergestellt, dass sich verschiedene Datensätze unabhängig und auf einer einheitlichen Skala vergleichen lassen.
  • Außerdem ist der z-Score eine sinnvolle Möglichkeit, um Ausreißer oder Extremwerte in einem Datensatz zu erkennen.
  • Diese Kennzahl kann in zahlreichen Anwendungen, wie beispielsweise bei Hypothesentests, verwendet werden, um statistische Schlussfolgerungen zu ziehen und zu entscheiden, ob eine Hypothese abgelehnt werden sollte.

Nachteile:

  • Der z-Score basiert auf einer Normalverteilung und setzt voraus, dass der Datensatz einer Normalverteilung folgt. In manchen Fällen kann diese Annahme nicht zutreffen.
  • Die Kennzahl basiert auf dem Durchschnitt, der durch Ausreißer beeinflusst werden kann. Dadurch wird auch der z-Score selbst indirekt von Ausreißern beeinflusst.
  • Bei kleinen Datensätzen muss man mit der Verwendung dieser Kennzahl vorsichtig sein, da möglicherweise die Verteilung nicht ausreichend etabliert ist und deshalb keine aussagekräftigen Werte zustande kommen.

Welche alternativen statistischen Maße können stattdessen verwendet oder kombiniert werden?

Je nach Anwendung kann der z-Score nicht das optimale Maß sein oder sollte für eine ausgewogene Analyse durch andere Kennzahlen ergänzt werden. Die beliebtesten Kennzahlen dafür sind:

  • T-Score: Dieser ist ein ähnliches Maß wie der z-Score, das genauso die Anzahl der Standardabweichungen zum Mittelwert misst. Er wird in der Regel für kleinere Stichproben genutzt, in denen der z-Score möglicherweise keine guten Ergebnisse liefert.
  • Perzentile: Die Perzentile sind eine Möglichkeit, Datenpunkte anhand ihrer relativen Position innerhalb der Verteilung einzustufen. Das 75. Perzentil beispielsweise umfasst alle Datenpunkte, die unter 75 % der Daten fallen.
  • Effektgrößen: Die Effektgrößen quantifizieren das Ausmaß, welches der Unterschied zwischen zwei Variablen angenommen hat. Diese finden Anwendung, um Ergebnisse zwischen Datensätzen mit unterschiedlichen Messgrößen oder Skalen zu vergleichen.
  • Konfidenzintervalle: Die Konfidenzintervalle geben einen Bereich an, in den der wahre Parameter der Population voraussichtlich fällt. Diese können verwendet werden, um Schätzungen zu bewerten und Ergebnisse von Studien zu vergleichen.

Der z-Score ist vor allem bei Hypothesentests ein weit verbreitetes Instrument. Er kann jedoch auch durch andere Kennzahlen ersetzt werden, um Datensätze zu vergleichen.

Das solltest Du mitnehmen

  • Der z-Score ist eine Kennzahl in der Statistik mit der bestimmt wird, wie weit ein Datenpunkt vom Mittelwert eines Datensatzes enfernt liegt. Diese Entfernung wird in Standardabweichungen gemessen.
  • Diese Kennzahl wird zur Standardisierung von Daten eingesetzt und außerdem können damit Datensätze in unterschiedlichen Skalen verglichen werden.
  • Zur Anwendung kommt dieses Maß häufig in Hypothesentests und bei statistischen Schlussfolgerungen. Vor allem dann, wenn der Populationswert und die Standardabweichung kann ist.
  • Der z-Score ist eine besonders einfache Kennzahl in der Berechnung und Interpretation. Jedoch hat er auch seine Nachteile, da er zum Beispiel sehr abhängig vom Populationsparameter ist und außerdem empfindlich gegenüber Ausßreißern.
  • Es können auch andere statistische Maße zum Einsatz kommen, wie beispielsweise der t-Score oder Konfidenzintervalle. Diese können entweder als Alternative oder in Verbindung mit dem z-Score genutzt werden.

Was ist der Varianzinflationsfaktor (VIF)?

Erfahren Sie, wie der Varianzinflationsfaktor (VIF) Multikollinearität in Regressionen erkennt, um eine bessere Datenanalyse zu ermöglichen.

Weiterlesen

Was ist die Dummy Variable Trap?

Entkommen Sie der Dummy Variable Trap: Erfahren Sie mehr über Dummy-Variablen, ihren Zweck und die Folgen der Falle.

Weiterlesen

Was ist das Bestimmtheitsmaß?

Einführung in das Bestimmtheitsmaß: Lernen Sie seine Bedeutung, Berechnung und Grenzen in der Regressionsanalyse kennen.

Weiterlesen

Was ist der Median?

Lernen Sie den Median und seine Bedeutung in der Datenanalyse kennen. Erkunden Sie seine Berechnung, Anwendungen und Grenzen.

Weiterlesen

Was ist das ARIMA Modell?

Beherrschen Sie Prognosen mit ARIMA-Modellen: Lernen Sie, Trends in Daten zu analysieren und vorherzusagen mit Python-Beispielen.

Weiterlesen

Was ist die Spieltheorie?

Entdecken Sie die Macht der Spieltheorie und ihre praktischen Anwendungen bei Verhandlungen und bei der Entscheidungsfindung.

Weiterlesen

Andere Beiträge zum Thema z-Score

Das Maß kann auch in Python mit einer Bibliothek wie SciPy berechnet werden. Die Dokumentation dazu findest Du hier.

Was ist der z-score? | Data Basecamp (2025)

FAQs

What is an acceptable z-score? ›

This means it comes down to preference when evaluating an investment or opportunity. For example, some investors use a z-score range of -3.0 to 3.0 because 99.7% of normally distributed data falls in this range, while others might use -1.5 to 1.5 because they prefer scores closer to the mean.

What does z-score tell you about a data set? ›

A z-score measures exactly how many standard deviations above or below the mean a data point is. Here are some important facts about z-scores: A positive z-score says the data point is above average. A negative z-score says the data point is below average.

What is an ideal z-score? ›

What Is a Good Z-Score? 0 is used as the mean and indicates average Z-scores. Any positive Z-score is a good, standard score. However, a larger Z-score of around 3 shows strong financial stability and would be considered above the standard score.

Is 2 a good z-score? ›

If the number of elements in the set is large, about 68% of the elements have a z-score between -1 and 1; about 95% have a z-score between -2 and 2 and about 99% have a z-score between -3 and 3.

Is it better to have a higher or lower z-score? ›

The greater a Z-score's absolute value, the more extraordinary is the data point's deviation from the mean. Z-scores help us compare values across multiple data sets by describing each value in the context of how much variation there is in its data set.

What is a good z-score cutoff? ›

The critical z-score values when using a 95 percent confidence level are -1.96 and +1.96 standard deviations.

What does a high z-score mean? ›

A score of 1 indicates that the data are one standard deviation from the mean, while a Z-score of -1 places the data one standard deviation below the mean. The higher the Z-score, the further from the norm the data can be considered to be.

What z-score is statistically significant? ›

Consequently, there is 0.025% of the samples in each tail, and the alpha has a critical value of 1.96 or -1.96. If the value of z is greater than 1.96 or less than -1.96, the null hypothesis is rejected.

What if the z-score is positive? ›

2. Z-scores can be positive or negative. A positive Z-score shows that your value lies above the mean, while a negative Z-score shows that your value lies below the mean. If I tell you your income has a Z-score of -0.8, you immediately know that your income is below average.

What is a healthy z-score? ›

Bone density Z-score chart
Z-scoreMeaning
0Bone density is the same as in others of the same age, sex, and body size.
-1Bone density is lower than in others of the same age, sex, and body size.
-2Doctors consider scores higher than this to be normal.
-2.5This score or lower indicates secondary osteoporosis.
1 more row

What is a weak z-score? ›

When a z-score is low, it means that the value of the observation or data point is relatively close to the mean of the distribution in which it occurs. Specifically, a z-score represents the number of standard deviations a particular observation is away from the mean of the distribution.

What z-score is considered abnormal? ›

If another data value displays a z score of -2, one can conclude that the data value is two standard deviations below the mean. Most values in any distribution have z scores ranging from -2 to +2. The values with z scores beyond this range are considered unusual or outliers.

Do z-scores matter? ›

The standard score (more commonly referred to as a z-score) is a very useful statistic because it (a) allows us to calculate the probability of a score occurring within our normal distribution and (b) enables us to compare two scores that are from different normal distributions.

What are bad z-scores? ›

What does a Z-score mean? If your Z-score is –2.0 or less, your bone mineral density is low. This score could mean that you have osteoporosis caused by medications or other diseases and conditions. If you are a premenopausal woman or a man younger than age 50, your bone mineral density test result will be a Z-score.

What is the z-score of normal? ›

A z-score of 0 indicates that the given point is identical to the mean. On the graph of the standard normal distribution, z = 0 is therefore the center of the curve. A positive z-value indicates that the point lies to the right of the mean, and a negative z-value indicates that the point lies left of the mean.

What is considered an abnormal z-score? ›

Answer and Explanation:

A standard normal curve, in general, is a bell-shaped curve. So, the scores that are lower than -1.96 or higher than 1.96 are considered as unusual z-scores.

What is a good z-score for an exam? ›

If the mean score is 50, then this likely represents a high score. However, if the average score is 90, then this score is technically below average. A Z-score of 1.25 however, gives us everything we need to know about the student's score in context, making it far more useful for decision making.

What is considered a big z-score? ›

A high z -score means a very low probability of data above this z -score. For example, the figure below shows the probability of z -score above 2.6 . Probability for this is 0.47% , which is less than half-percent. Note that if z -score rises further, area under the curve fall and probability reduces further.

What is a bad Z value? ›

2. Z-scores can be positive or negative. A positive Z-score shows that your value lies above the mean, while a negative Z-score shows that your value lies below the mean. If I tell you your income has a Z-score of -0.8, you immediately know that your income is below average.

Top Articles
Latest Posts
Recommended Articles
Article information

Author: Annamae Dooley

Last Updated:

Views: 6080

Rating: 4.4 / 5 (65 voted)

Reviews: 80% of readers found this page helpful

Author information

Name: Annamae Dooley

Birthday: 2001-07-26

Address: 9687 Tambra Meadow, Bradleyhaven, TN 53219

Phone: +9316045904039

Job: Future Coordinator

Hobby: Archery, Couponing, Poi, Kite flying, Knitting, Rappelling, Baseball

Introduction: My name is Annamae Dooley, I am a witty, quaint, lovely, clever, rich, sparkling, powerful person who loves writing and wants to share my knowledge and understanding with you.