In vielen alltäglichen Situationen arbeiten wir mit Durchschnittsangaben, die als sogenannte «Erwartungswerte»1 fungieren. Interessant dabei sind vor allem Abweichungen vom Erwartungswert.
Du möchtest beispielsweise wissen, welche Abweichung vom Erwartungswert generell einzukalkulieren ist? Dann musst du dafür zunächst einmal die Varianz berechnen.
Definition: Varianz
Die Varianz beschreibt die Verteilung bzw. Streuung von Beobachtungswerten um den Mittelwert aller Beobachtungen2.
Das Verb «variieren» bietet hierfür eine gute Eselsbrücke: Dies bedeutet «abweichen», «sich unterscheiden» oder «sich ändern».
Die Varianz zählt deshalb zu den sogenannten «Streuungsmaßen»3. Benötigt wird sie zur Einschätzung, wie weit die Messwerte eines Experiments vom Erwartungswert abweichen.
Varianz berechnen
Wir unterscheiden die Varianz von der Grundgesamtheit bzw. der sogenannten Stichprobenvarianz4. Erstere nimmt ein gesamtes Bild in den Blick. Letztere betrachtet lediglich einen Ausschnitt.
Die Stichprobe macht oft mehr Sinn. Als Beispiel sei die tatsächlich geleistete Arbeitszeit von allen in einem Unternehmen Beschäftigten genannt. Durch Faktoren wie Teil- und Vollzeitbeschäftigungen weichen die individuellen Arbeitszeiten extrem von dem Durchschnittswert aller Arbeitnehmer ab. Teil- und Vollzeitbeschäftigungen machen es aber wenig sinnvoll, die Varianz von der Gesamtheit zu nehmen.
Ein effektiverer Vergleich dagegen ist die tatsächlich geleistete Arbeitszeit von Beschäftigen, deren Verträge identische Arbeitszeiten vorschreiben.
Formel zur Berechnung der Varianz von der Gesamtheit
V = 1/N x Summe aus N-1 x (Xi – arithmetisches Mittel)
Dabei ist N die Anzahl der Beobachtungswerte im Rahmen einer Stichprobe.
Xi ist der Beobachtungswert.
In fünf Schritten zur Stichprobenvarianz
Diese fünf Schritte sind notwendig, um eine Stichprobenvarianz zu ermitteln5:
- Berechnung des Mittelwertes der Beobachtungswerte.
- Berechnung der Abweichung vom Mittelwert (dieser wird von den Beobachtungswerten abgezogen).
- Quadriere die Ergebnisse. Dies ist notwendig, da diese nicht negativ sein dürfen.
- Summiere die quadrierten Abweichungen.
- Nimm die Anzahl der Beobachtungen und subtrahiere 1. Du teilst das Ergebnis aus dem vorherigen Schritt durch diese Zahl und erhältst die Stichprobenvarianz.
Standardabweichung durch die Varianz ermitteln
Um zur Standardabweichung zu gelangen, müssen wir die Quadrierung aufheben.
Hierfür ziehen wir die Wurzel aus der Varianz.
So berechnest du die Varianz in Excel
Excel bietet zwei vorgegebene Formeln, um die Varianz und die Standardabweichung zu berechnen6. Um diese zu nutzen, müssen die Beobachtungswerte in eine Tabelle eingetragen werden.
Die Formel für die Varianz lautet schlicht: VARIANZ(A2:E2). Wer die Standardabweichung berechnen möchte, wählt STABW(A2:E2).
Häufig gestellte Fragen
Varianzen können nur für metrische Daten verwendet werden. Darunter sind numerische Werte (Zahlen) zu verstehen, die einem festen Intervall folgen.
Als Beispiel: Bei 1, 2 und 3 ist der Abstand zwischen den Werten stets gleich. Die Varianz ist stets als Maximalkorridor um den Erwartungswert zu interpretieren. Hier befinden sich alle gestreuten Ergebnisse.
Die Kovarianz beschreibt das Zusammenspiel von zwei zufällig gewählten Variablen. Was passiert mit der zweiten Unbekannten, wenn sich die erste ändert – und umgekehrt?
Um es am obigen Beispiel zu erklären: Wie verändert sich beispielsweise der Spritverbrauch bei einer höheren oder niedrigeren Geschwindigkeit.
Dieser Punkt bereitet häufig Verständnisprobleme. Bei einer Stichprobe wurde der Mittelwert erhoben. Ihr wurde also eine Information entzogen, weshalb ein Freiheitsgrad («Was kann N sein?») weniger zur Verfügung steht: Es sind nicht mehr alle Einzelwerte für N frei wählbar. Denn N ergibt sich jetzt zwangsläufig aus dem Mittelwert und den N-1-Werten.
Wieder soll das obige Beispiel des Spritverbrauchs der Verdeutlichung helfen: Wir haben eine feste Zahl von Beobachtungswerten, nämlich 5. Wir haben die zugehörigen Messungen zu einem Mittelwert gemacht, nämlich 6. Wir haben deshalb einen fiktiven Wert für N ermittelt, der zufälligerweise unter den Beobachtungswerten sein kann, aber nicht muss. Es kann also sein (und ist ziemlich wahrscheinlich), dass wir durch den Mittelwert einen sechsten Beobachtungswert konstruieren, den es aber gar nicht gibt. Um dies auszuschließen, korrigieren wir durch N-1.
Eine Varianzanalyse ist die Bezeichnung für die Berechnung der Varianz sowie der Standardabweichung aus vorgegebenen Werten. Dieser Begriff beschreibt also den gesamten Vorgang, den wir hier erläutert haben.
Ein t-Test dient der Ermittlung, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Versuchsgruppen gibt. Zusätzliche Proben können allerdings nicht hinzugefügt werden. Arbeitest du mit drei oder mehr Gruppen, ist die Varianzanalyse zu nutzen.
Quellen
1 Hochschule Karlsruhe: Eigenschaften des Erwartungswert-Operators. 2022 [online] https://www.eit.hs-karlsruhe.de/mesysto/teil-c-stochastische-signale/univariate-wahrscheinlichkeitstheorie/erwartungswerte-von-verteilungen/eigenschaften-des-erwartungswert-operators.html?type=1 (abgerufen am 18.01.2023)
2 Kloiber, Y.: Standardabweichung und Varianz mit Excel berechnen. 2020 [online] https://blog.hubspot.de/marketing/standardabweichung-excel (abgerufen am 18.01.2023)
3 DATAtab: Streuungsmaße. 2022 [online] https://datatab.de/tutorial/standardabweichung-varianz-spannweite (abgerufen am 18.01.2023)
4 Reinboth, C.: Grundlagen der Statistik: Dispersionsparameter – Varianz und Standardabweichung. 2016 [online] https://wissenschafts-thurm.de/grundlagen-der-statistik-dispersionsparameter-varianz-und-standardabweichung/ (abgerufen am 18.01.2023)
5 Math2Mind: Empirische Varianz – Stichprobenvarianz. 2022 [online] https://www.maths2mind.com/schluesselwoerter/empirische-varianz (abgerufen am 18.01.2023)
6 Moßmann, R.: Excel: Varianz und Standardabweichung berechnen. 2019 [online] https://praxistipps.chip.de/excel-varianz-und-standardabweichung-berechnen_28032 (abgerufen am 18.01.2023)