Lorenz-Kurve

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Verteilungskurve)
Zur Navigation springen Zur Suche springen
Anwendung der Lorenz-Kurve zur Veranschaulichung der Einkommensverteilung: Beispielsweise verfügen (in der durchgezogenen Kurve) die ärmsten 50 % der Haushalte über zirka 27 % des gesamten Einkommens; die ärmsten 80 % verfügen hier dementsprechend über etwa 60 % des Einkommens. Natürlich lässt sich daraus auch ablesen, dass die restlichen 40 % des Einkommens auf die reichsten 20 % der Haushalte entfallen. Die gestrichelte Kurve stellt eine noch ungleichere Einkommensverteilung dar. Hier verfügen die ärmeren 50 % nur über ca. 15 % des Einkommens.

Die Lorenz-Kurve (auch: Lorenzkurve) wurde 1905 vom US-amerikanischen Statistiker und Ökonomen Max Otto Lorenz (1876–1959) entwickelt. Sie stellt statistische Verteilungen grafisch dar und veranschaulicht dabei das Ausmaß an Disparität (Ungleichheit) beziehungsweise relativer Konzentration innerhalb der Verteilung. Deshalb wird sie auch als Disparitätskurve bezeichnet. Amtliche Statistiken nutzen die Lorenz-Kurve, um die Einkommensverteilung in einem Land zu verdeutlichen.[1] Grundlage dieser Berechnungen ist eine Liste der von links nach rechts aufsteigend sortierten Einzeleinkommen oder Einzelvermögen (siehe auch: Pen’s Parade).

Aufbau und Erläuterung

[Bearbeiten | Quelltext bearbeiten]

Die Lorenz-Kurve ist eine Funktion im Einheitsquadrat des 1. Quadranten. Sie stellt dar, welche Anteile der gesamten Merkmalssumme auf welche Anteile der Grundmenge mit Merkmalsträgern entfallen. So werden auf der -Achse (Abszisse) die Anteile an der Gesamtheit der Merkmalsträger (zum Beispiel Bevölkerung), auf der -Achse (Ordinate) die Anteile an der gesamten Merkmalssumme (beispielsweise Einkommen) abgetragen. Zunächst werden die Daten dafür aufsteigend sortiert – beginnend mit dem geringsten Anteil an der Merkmalssumme – und dann kumuliert (summiert). Dadurch entsteht der charakteristische „Bauch“ der Lorenz-Kurve unterhalb der Diagonalen, welcher das Maß der Ungleichverteilung wiedergibt. Jeder Punkt auf der Lorenz-Kurve steht für eine Aussage wie „die unteren 20 % aller Haushalte beziehen 10 % des Gesamteinkommens“ (siehe: Paretoprinzip). Eine perfekte Einkommensgleichverteilung wäre eine Einkommensverteilung, bei der alle Personen das gleiche Einkommen besitzen. In diesem Falle würden stets die unteren der Gesellschaft des Einkommens haben. Dies lässt sich anschaulich durch eine Gerade darstellen. Man nennt sie perfekte Gleichverteilungsgerade (line of perfect equality). Dagegen wäre die perfekte Ungleichverteilung eine Verteilung, bei der eine Person über das gesamte Einkommen verfügt und alle anderen Personen kein Einkommen beziehen. In diesem Fall wäre die Kurve für alle und bei . Diese Kurve wird als perfekte Ungleichverteilungsgerade (line of perfect inequality) bezeichnet.

Der Gini-Koeffizient ist der Anteil der Fläche zwischen der perfekten Gleichverteilungsgerade und der beobachteten Lorenz-Kurve an der Fläche unter der Gleichverteilungsgerade. Der Gini-Koeffizient ist damit eine Zahl zwischen 0 und 1, je höher er ist, desto ungleicher ist die Verteilung.

Die Lorenz-Kurve ist als abschnittsweise lineare Kurve (d. h. als Polygonzug) durch die Punkte definiert. Sind die Anteile an der Gesamtheit der Merkmalsträger und die Anteile an der gesamten Merkmalssumme, so sind die Koordinaten der Punkte für definiert mit:

und

Stetiger/Kontinuierlicher Fall

[Bearbeiten | Quelltext bearbeiten]

Die Lorenz-Kurve kann häufig durch eine Funktion dargestellt werden, wobei auf der Abszisse und auf der Ordinate abgetragen wird.

Für eine Population der Größe mit einer Folge von Werten , , die nach aufsteigender Reihenfolge indiziert werden , ist die Lorenz-Kurve die stetige, abschnittsweise lineare Funktion, die die Punkte (, ), verbindet, wobei , ist und für :

Dabei nennt man auch Lorenz-Asymmetrie-Koeffizient.

Für eine diskrete Wahrscheinlichkeitsfunktion seien , , die Punkte mit Non-/Nicht-Null-Wahrscheinlichkeiten nach steigender Reihenfolge indiziert . Die Lorenz-Kurve ist die stetige, abschnittsweise definierte, lineare Funktion, welche die Punkte (, ), , miteinander verbindet, wobei , ist und für gilt:

Für die Laplace-Verteilung, das heißt für alle , erhält man genau die oben genannten Formeln für und .

Für eine Wahrscheinlichkeitsdichtefunktion mit der kumulierten Wahrscheinlichkeitsverteilungsfunktion ist die Lorenz-Kurve definiert durch:

wobei μ der Erwartungswert der Verteilung ist. Für eine kumulierte Verteilungsfunktion mit der Umkehrfunktion ist die Lorenz-Kurve gegeben durch:

Die Umkehrfunktion könnte nicht existieren, da die kumulierte Verteilungsfunktion Sprungstellen (Unstetigkeitsstellen) oder Intervalle konstanter Werte aufweist. Die vorherige Gleichung behält ihre Gültigkeit, wenn man allgemeiner durch folgende Formel definiert:[2]

Gastwirths Definition

[Bearbeiten | Quelltext bearbeiten]

Betrachtet werde eine nichtnegative Zufallsvariable mit der dazugehörigen normierten Quantilsfunktion . Nach Joseph Lewis Gastwirth wird die Abbildung

als (stetige) Lorenz-Kurve von oder zur Verteilung von bezeichnet.[3][2]

Die Lorenz-Kurve hat folgende Eigenschaften:[4]

  • Sie beginnt stets im Koordinatenursprung und endet im Punkt .
  • Die Ableitung der Kurve ist monoton steigend, weshalb die Kurve selber konvex ist und unterhalb der Diagonalen liegt.
  • Die Lorenzkurve ist stetig auf dem offenen Intervall , im diskreten Fall sogar stückweise linear.

Die Lorenz-Kurve ist für einen Mittelwert der Wahrscheinlichkeitsverteilung von null oder unendlich nicht definiert.

Die Lorenz-Kurve für eine Wahrscheinlichkeitsverteilung ist eine stetige Funktion. Aber Lorenz-Kurven unstetiger Funktionen können als Grenzwert (Limes) der Lorenz-Kurven der Wahrscheinlichkeitsverteilungen formuliert werden – wie beispielsweise die perfekte Ungleichheitsgerade (line of perfect inequality).

Die Daten einer Lorenz-Kurve können durch den Gini-Koeffizienten und den Lorenz-Asymmetrie-Koeffizienten zusammengefasst werden.[5]

Die Lorenz-Kurve ist invariant unter positiver Skalierung. Falls eine Zufallsvariable ist, so besitzt die Zufallsvariable für jede positive Zahl die gleiche Lorenz-Kurve wie , wobei man unter der Lorenzkurve einer Zufallsvariablen natürlich diejenige der zugehörigen Verteilung versteht.

Die Lorenz-Kurve ist nicht invariant unter Translationen, das heißt unter einer konstanten Verschiebung der Werte. Ist eine Zufallsvariable mit einer Lorenz-Kurve und dem Mittel ist, dann erhält man für die Lorenz-Kurve der verschobenen Zufallsvariablen , wobei eine feste Konstante sei, folgende Formel:

Für eine kumulierte Verteilungsfunktion mit dem Mittelwert und der (verallgemeinerten) Umkehrfunktion gilt für jedes mit

  • Falls die Lorenz-Kurve differenzierbar ist, gilt:
  • Wenn die Lorenz-Kurve zweifach differenzierbar ist, dann existiert die Wahrscheinlichkeitsdichtefunktion in diesem Punkt und:
  • Falls stetig-differenzierbar ist, so ist die Tangente von parallel zur perfekten Gleichheitsgerade im Punkt . Dies ist auch der Punkt, in welchem die Gleichheitsdiskrepanz , der vertikale Abstand zwischen der Lorenz-Kurve und der perfekten Gleichheitsgerade, am größten ist. Die Größe der Diskrepanz ist gleich der Hälfte der relativen mittleren Abweichung:

Die Lorenz-Kurve einer Zufallsvariablen wird am Punkt gespiegelt, wenn man von zu übergeht, das heißt mit oben eingeführten Bezeichnungen:

Je gleichmäßiger die Merkmalssumme unter den Trägern verteilt ist, desto stärker nähert sich die Lorenz-Kurve der Diagonalen an. Im Extremfall der ökonomischen Gleichverteilung (statistische Einpunktverteilung) fällt sie mit ihr zusammen.

Im Falle größerer Disparität bewegt sich die Kurve nach unten in Richtung der Abszisse. Für den Extremfall der maximalen Ungleichverteilung (ein Merkmalsträger vereinigt die gesamte Merkmalssumme auf sich) verläuft die Lorenz-Kurve als Streckenzug auf der Abszisse bis und führt von dort zum Punkt .

Stetig und diskret klassierte Daten

[Bearbeiten | Quelltext bearbeiten]

Welche Form die Lorenz-Kurve genau annimmt, hängt davon ab, welcher Art die Daten des Merkmals sind. Grundsätzlich sind stetige Daten (siehe Beispielbild oben) von diskreten Daten zu unterscheiden. Im zweiten Fall ist die Lorenzkurve ein Streckenzug durch die Punkte .

Messung der relativen Konzentration (Disparität)

[Bearbeiten | Quelltext bearbeiten]

Die Lorenz-Kurve bietet eine grafische Möglichkeit, das Ausmaß an Disparität innerhalb einer Verteilung zu betrachten. Je stärker sich die Kurve nach unten wölbt, desto größer die Disparität (siehe Abschnitt Extremfälle). Für den Fall, dass sich zwei Lorenz-Kurven schneiden, lässt sich anhand der Grafik jedoch nicht mehr eindeutig bestimmen, welche die größere Disparität aufweist. Auch ist die Messung mittels Grafik zu ungenau. Präzise Werte liefern dafür die Maßzahlen Gini-Koeffizient und Variationskoeffizient. Der Gini-Koeffizient steht dabei in einem direkten Zusammenhang mit der Lorenz-Kurve: Er ist das Zweifache der Fläche zwischen Lorenz-Kurve und Diagonale im Einheitsquadrat.

Beispieltabelle für diskret klassierte Daten

[Bearbeiten | Quelltext bearbeiten]

Eine Datenerhebung habe für 5 Klassen, die mit einem Index benannt seien, die relativen Häufigkeiten (Anteil der Merkmalsträger der Klasse an der Gesamtheit der Merkmalsträger) und die Anteile der Merkmalssumme, die auf die Klasse entfallen, der unten stehenden Tabelle ergeben. Daraus ermitteln wir

  • kumulierte (relative Häufigkeit),
  • kumulierte (Disparität) .
Index Relative Häufigkeit Kumulierte relative Häufigkeit Disparität Kumulierte Disparität
1 0,2 0,2 0,00 0,00
2 0,4 0,6 0,05 0,05
3 0,1 0,7 0,15 0,20
4 0,1 0,8 0,30 0,50
5 0,2 1,0 0,50 1,00

Erläuterung:

Die Lorenz-Kurve entsteht, indem man auf der Abszisse, auf der Ordinate aufträgt und die Punkte durch einen Streckenzug verbindet.

Der Artikel zur Paretoverteilung enthält ein weiteres Beispiel für eine Lorenz-Kurve.

Lorenz-Dominanz

[Bearbeiten | Quelltext bearbeiten]

Mittels der Lorenz-Dominanz kann das Verhältnis unterschiedlicher Lorenz-Kurven beschrieben werden. Für alle ordnet der Vektor die zugehörigen Koordinaten in nicht-absteigender Reihenfolge: . Der Vektor Lorenz-dominiert den Vektor mit

sofern gilt: für alle und für mindestens ein .

Diese Form wird auch als starke Lorenz-Dominanz bezeichnet. Dementsprechend Lorenz-dominiert ein Vektor einen anderen Vektor , sobald die zugehörige Lorenz-Kurve nicht unterhalb sowie mindestens einmal oberhalb der Lorenz-Kurve liegt. Eine Kurzschreibweise ist: .[6]

Satz von Rothschild und Stiglitz

[Bearbeiten | Quelltext bearbeiten]

Gegeben seien zwei Verteilungen und mit . Die Lorenz-Kurve von liegt genau dann oberhalb der Lorenz-Kurve von , wenn für jede symmetrische und quasikonvexe Funktion gilt:

Folgerung: Wenn sich zwei Lorenz-Kurven schneiden, hängt es von der Wahl der jeweiligen symmetrischen und quasikonvexen Funktion ab, welche der beiden Kurven als die mit der größeren Ungleichheit zu bezeichnen ist.[7]

Als Disparitätsmaß (Maß der relativen Konzentration) lässt sich auch die Lorenz-Kurven-Länge anführen. Der Wertebereich ist für den Definitionsbereich gilt:

Diese lässt sich – wie der Name bereits vermuten lässt – von der diskreten Lorenz-Kurve ableiten, indem die Längen der Streckenabschnitte kumuliert werden. Für die Länge der diskreten Lorenz-Kurve gilt:

Dabei wird für jeden der Streckenabschnitte der euklidische Abstand für den Funktionsgraphen von verwendet.

Bei Gleichverteilung ist Bei absoluter Konzentration auf lediglich einen einzigen Merkmalswert ist

Stetig differenzierbarer Fall

[Bearbeiten | Quelltext bearbeiten]

Die Länge der stetig differenzierbaren Lorenz-Kurve zwischen den Punkten sowie berechnet sich aus der ersten Ableitung der Lorenz-Kurven-Funktion , wie folgt:

mit .

Wirtschaftswissenschaften

[Bearbeiten | Quelltext bearbeiten]

In der Ökonomie wird die Lorenz-Kurve zur grafischen Darstellung der kumulierten Verteilungsfunktion der empirischen Wahrscheinlichkeitsverteilung des Vermögens benutzt; sie ist ein Graph, der das Maß der Verteilung zeigt, die für die unteren der Werte angenommen wird. Häufig wird sie dazu verwendet, um eine Einkommensverteilung darzustellen, wobei für die unteren der Haushalte illustriert wird, wie groß der Anteil des Gesamteinkommens in ist, den sie besitzen.[8] Der Anteil der Haushalte wird auf der Abszisse abgetragen, der Anteil des Einkommens auf der Ordinate. Sie kann ebenfalls zur Darstellung der Einkommensverteilung verwandt werden. In diesem Sinne betrachten viele Ökonomen die Lorenz-Kurve als Maß sozialer Ungleichheit (soziales Ungleichheitsmaß). Sie wurde im Jahre 1905 von Max O. Lorenz zur Darstellung der Ungleichheit der Einkommensverteilung entwickelt.

Neben der Illustration der Einkommensverteilung wird die Lorenz-Kurve auch zur Darstellung von Marktmacht oder räumlichen Verteilungen verwendet (vergleiche: Segregation).

Eine weitere Anwendung findet die Lorenz-Kurve in der logistischen ABC-Analyse, bei der die Lorenz-Kurve die Verteilung der Güter verdeutlicht, geordnet nach Klassifizierungseigenschaft (beispielsweise Wert) und Verbrauchsmenge.

Die Lorenz-Kurve lässt sich auch für Geschäftsmodelle verwenden – beispielsweise in den Konsumentenfinanzen, um die reale Nichtzahlung bei Fälligkeit (Delinquenz) von der Konsumenten mit den schlechtesten vorhergesagten Risiko-/Kreditscores.

Das Konzept der Lorenz-Kurve ist hilfreich für die Beschreibung der Ungleichheit zwischen den Anzahlen an Individuen in der Ökologie[5] und in Forschungsstudien zur Biodiversität nutzt man es, indem man den kumulierten Anteilen an Tierarten die kumulierten Anteile an Individuen gegenüberstellt.[9]

Konzentration sowie Disparität

[Bearbeiten | Quelltext bearbeiten]

Die Disparität (Lorenz-Kurve) und (absolute) Konzentration (Konzentrationskurve) sind verwandte Maße, beschreiben aber unterschiedliche Dinge. Während die Lorenz-Kurve darstellt, welche Anteile der Merkmalssumme (Ordinate) auf welche Anteile an der Gruppe der Merkmalsträger (Abszisse) entfallen, stellt die Konzentrationskurve dar, welche Anteile der Merkmalssumme (Ordinate) auf welchen Merkmalsträger (Abszisse) entfallen. Das bedeutet, dass die Lorenz-Kurve Anteile mit Anteilen vergleicht, die Konzentrationskurve Anteile mit absoluten Zahlen (Abszisse). So können hohe Disparität und geringe Konzentration oder hohe Konzentration und geringe Disparität gleichzeitig auftreten. Folgendes Beispiel verdeutlicht die Frage:

Angenommen Unternehmen teilen sich einen Markt. In der Tabelle werden die Fälle von hoher und geringer Disparität bzw. Konzentration mit (fiktiven) absoluten Zahlen durchgespielt:

Disparität hoch Disparität gering
Konzentration hoch

Konzentration gering

  • Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
  • Josef Bleymüller, Günther Gehlert, Herbert Gülicher: Statistik für Wirtschaftswissenschaftler. WiSt-Studienkurs. 10. Aufl. Verlag Franz Vahlen, München 1996. ISBN 978-3-8006-2081-4 (3-8006-2081-2). 244 S.
  • Rodica Branzei, Dinko Dimitrov, Stef Tijs: Models in Cooperative Game Theory. Springer, Berlin u. a. 2008, ISBN 978-3-540-77953-7.
  • Jens Leth Hougaard: An Introduction to Allocation Rules. Springer, Berlin u. a. 2009, ISBN 978-3-642-01827-5.
  • David Müller: Investitionscontrolling: Entscheidungsfindung bei Investitionen II: Entscheidungstheorie. 3. Aufl. Springer Gabler, Berlin u. a. 2022, ISBN 3-658-36596-X.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. Duden: Lorenz-Kurve. In: Duden Wirtschaft von A bis Z: Grundlagenwissen für Schule und Studium, Beruf und Alltag. 4. Aufl. Bibliographisches Institut, Mannheim 2009 (Lizenzausgabe: Bundeszentrale für politische Bildung, Bonn)
  2. a b Thomas Augustin, Sebastian Petry: Wirtschafts- und Sozialstatistik (Memento des Originals vom 1. Februar 2012 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.statistik.lmu.de. (PDF-Datei; 216 kB), LMU, München 2010. S. 45 ff.
  3. Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
  4. Karl Mosler, Friedrich Schmid: Beschreibende Statistik und Wirtschaftsstatistik. Springer, Berlin/Heidelberg 2009, ISBN 978-3-642-01556-4.
  5. a b Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. 4. Aufl. Ecology, 2000. Bd. 81. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2 S. 1139–1142.
  6. Vgl. Branzei et al. 2008, S. 37; Hougaard 2009, S. 22–23; Müller 2022, S. 521–522.
  7. L. Egghe: Construction of concentration measures for General Lorenz curves using Riemann-Stieltjes integrals
  8. Arthur O’ Sullivan, Steven M. Sheffrin: Economics: Principles in action (Memento des Originals vom 20. Dezember 2016 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.savvas.com. Prentice Hall, Upper Saddle River (New Jersey 07458) 2003. ISBN 0-13-063085-3. S. 349 ff.
  9. Lieven Wittebolle et al.: Initial community evenness favours functionality under selective stress. 7238. Ausg. Nature, 2009. Bd. 458. S. 623–626. doi:10.1038/nature07840. PMID 19270679.