Verlustfunktion (Statistik)

Eine Verlustfunktion (engl. loss function) ist eine spezielle Funktion in der mathematischen Statistik und Teil eines statistischen Entscheidungsproblemes. Sie ordnet jeder Entscheidung in Form einer Punktschätzung, einer Bereichsschätzung oder eines Tests den Schaden zu, der durch eine vom wahren Parameter abweichende Entscheidung entsteht. Gemeinsam mit der Entscheidungsfunktion wird die Verlustfunktion zur Risikofunktion kombiniert, die den potentiellen Schaden bei Verwendung einer Entscheidungsfunktion angibt.

Definition

Gegeben sei ein statistisches Modell $(X,{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })$ und ein Entscheidungsraum $(\Omega ,\Sigma )$ . Dann heißt eine Funktion $L:\Theta \times \Omega \to [0,+\infty ]$ eine Verlustfunktion, wenn für jedes fixierte $\vartheta \in \Theta$ die Funktion $L(\vartheta ,\cdot )$ $\Sigma -{\mathcal {B}}([0,+\infty ])$ -messbar ist. Das L steht dabei für loss, englisch für Verlust.

Die Verlustfunktion gibt den Verlust bei Vorliegen des Parameters $\vartheta$ an, wenn man sich für $\omega \in \Omega$ entscheidet.

Klassische Verlustfunktionen

Gegeben sei die Parameterfunktion $g$ von der Parametermenge $\Theta$ in die Entscheidungsmenge $\Omega$ , also $g:\Theta \to \Omega$ und eine Norm $\Vert \cdot \Vert$ auf der Entscheidungsmenge. Meist ist $g(\vartheta )=\vartheta$ .

Eine typische Verlustfunktion ist dann

L_{r}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert ^{r}

für ein $r>0$ .

Im Rahmen der Probabilistischen Klassifikation können Scoring rules als Verlustfunktion eingesetzt werden.

Laplace-Verlust

Ist $r=1$ , also

L_{1}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert

,

so spricht man vom Laplace-Verlust.

Bei Wahl des Laplace-Verlusts die L-Unverfälschtheit zur Median-Unverfälschtheit und die Risikofunktion zum Mittleren betraglichen Fehler.

Gauß-Verlust

Ist $r=2$ , also

L_{2}(\vartheta ,\omega ):=\Vert \omega -g(\vartheta )\Vert ^{2}

,

so spricht man vom Gauß-Verlust.

Wählt man in der Schätztheorie den Gauß-Verlust, so vereinfacht sich die L-Unverfälschtheit zur Erwartungstreue und die Risikofunktion zum mittleren quadratischen Fehler.

0-1-Verlust

Eine weitere wichtige Verlustfunktion ist der sogenannte 0-1-Verlust. Er ist definiert als

L_{\varepsilon }(\vartheta ,\omega ):={\begin{cases}1&{\text{ falls }}\Vert \omega -g(\vartheta )\Vert >\varepsilon \\0&{\text{ falls }}\Vert \omega -g(\vartheta )\Vert \leq \varepsilon \end{cases}}

für ein $\varepsilon >0$ . Er bestraft alle Entscheidungen, die nahe genug an der „richtigen“ Entscheidung liegen, überhaupt nicht und alle, die einen gewissen Abstand zu ihr überschreiten, gleich stark. Im Rahmen von den mengenwertigen Bereichsschätzern wird der 0-1-Verlust dann auch definiert als

L(\vartheta ,\omega ):={\begin{cases}1&{\text{ falls }}g(\vartheta )\notin \omega \\0&{\text{ falls }}g(\vartheta )\in \omega \end{cases}}

,

da die Entscheidungen $\omega$ dann Mengen und keine einzelnen Werte mehr sind.

Neyman-Pearson-Verlustfunktion

Für statistische Tests verwendet man eine Abwandlung des 0-1-Verlustes, die sogenannten Neyman-Pearson-Verlustfunktion. Ist $\Theta =\Theta _{0}\cup \Theta _{1}$ eine Zerlegung des Parameterraumes in Hypothese $\Theta _{0}$ und Alternative $\Theta _{1}$ sowie $a_{0}$ die Entscheidung für die Hypothese und $a_{1}$ die Entscheidung für die Alternative, so wird die Verlustfunktion definiert durch

L(\vartheta ,a_{0})={\begin{cases}0&{\text{ falls }}\vartheta \in \Theta _{0}\\L_{1}&{\text{ falls }}\vartheta \in \Theta _{1}\end{cases}}

L(\vartheta ,a_{1})={\begin{cases}0&{\text{ falls }}\vartheta \in \Theta _{1}\\L_{0}&{\text{ falls }}\vartheta \in \Theta _{0}\end{cases}}

.

Dabei ist $L_{0},L_{1}>0$ . $L_{0}$ entspricht dann dem Verlust bei einem Fehler 1. Art, $L_{1}$ bei einem Fehler 2. Art.

Siehe auch

Literatur

Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.

Verlustfunktion (Statistik)

Inhaltsverzeichnis

Definition