Квантиль: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[отпатрулированная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
так на что нужен источник? Дальше же написано почему
м Ссылки: Project talk:Викификатор#Шаблон:Rq, replaced: {{rq|sources}} → {{подст:нет источников}}
 
(не показана 21 промежуточная версия 16 участников)
Строка 1: Строка 1:
'''Кванти́ль''' в [[математическая статистика|математической статистике]] — значение, которое заданная [[случайная величина]] не превышает с фиксированной [[вероятность]]ю. Если вероятность задана в процентах, то квантиль называется '''процентилем''' или '''перцентилем''' (см. [[#Процентиль|ниже]]).
'''Кванти́ль''' в [[математическая статистика|математической статистике]] — значение, которое заданная [[случайная величина]] не превышает с фиксированной [[вероятность]]ю. Если вероятность задана в [[процент]]ах, то квантиль называется '''процентилем''' или '''перцентилем''' (см. [[#Процентиль|ниже]]).


Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»<ref>{{Книга |заглавие=Руководство участкового педиатра |ссылка=https://books.google.com/books?id=10O1MFkbOekC&pg=PA44 |издательство=ГЭОТАР-Медиа |год=2008 |страницы=44 |страниц=354}}</ref> означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»<ref>{{Книга |заглавие=Руководство участкового педиатра |ссылка=https://books.google.com/books?id=10O1MFkbOekC&pg=PA44 |издательство=ГЭОТАР-Медиа |год=2008 |страницы=44 |страниц=354}}</ref> означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.


== Определение ==
== Определение ==
Рассмотрим [[вероятностное пространство]] <math>(\Omega,\;\mathcal{F},\;\mathbb{P})</math> и <math>\mathbb{P}^X</math> — [[вероятностная мера]], задающая [[Распределение вероятностей|распределение]] некоторой [[Случайная величина|случайной величины]] <math>X</math>. Пусть фиксировано <math>\alpha\in(0,\;1)</math>. Тогда <math>\alpha</math>-квантилем (или квантилем уровня <math>\alpha</math>) распределения <math>\mathbb{P}^X</math> называется [[число]] <math>x_\alpha\in\R</math>, такое что
Рассмотрим [[вероятностное пространство]] <math>(\Omega,\;\mathcal{F},\;\mathbb{P})</math> и <math>\mathbb{P}^X</math> — [[вероятностная мера]], задающая [[Распределение вероятностей|распределение]] некоторой [[Случайная величина|случайной величины]] <math>X</math>. Пусть фиксировано <math>\alpha\in(0,\;1)</math>. Тогда <math>\alpha</math>-квантилем (или квантилью уровня (порядка) <math>\alpha</math>) распределения <math>\mathbb{P}^X</math> называется [[число]] <math>x_\alpha\in\R</math> такое, что<ref>{{книга |автор={{автор||Фролов А. Н.}} |заглавие=Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО |место=СПб. |издательство=Лань |год=2021 |страниц=316 |страницы=189 |isbn=978-5-8114-8343-3 }}</ref>
: <math>\mathbb{P}(X \leqslant x_\alpha)\leqslant\alpha</math> ,
: <math>\mathbb{P}(X \leqslant x_\alpha) \geqslant \alpha,</math>
: <math>\mathbb{ P}(X \geqslant x_\alpha)\geqslant 1 -\alpha.</math>
: <math>\mathbb{P}(X \geqslant x_\alpha)\geqslant 1 - \alpha.</math>
В некоторых источниках (например, в англоязычной литературе) <math>k</math>-м <math>q</math>-квантилем называется квантиль уровня <math>k/q</math>, то есть <math>(k/q)</math>-квантиль в предыдущих обозначениях.
В некоторых источниках (например, в англоязычной литературе) <math>k</math>-м <math>q</math>-квантилем называется квантиль уровня <math>k/q</math>, то есть <math>(k/q)</math>-квантиль в предыдущих обозначениях.
Строка 12: Строка 12:
== Замечания ==
== Замечания ==
* Если [[Распределение вероятностей|распределение]] непрерывно, то <math>\alpha</math>-квантиль однозначно задаётся [[уравнение]]м
* Если [[Распределение вероятностей|распределение]] непрерывно, то <math>\alpha</math>-квантиль однозначно задаётся [[уравнение]]м
: <math>F_X(x_\alpha)=\alpha,</math>
:: <math>F_X(x_\alpha)=\alpha,</math>
где <math>F_X</math> — [[функция распределения]] <math>\mathbb{P}^X</math>.
: где <math>F_X</math> — [[функция распределения]] <math>\mathbb{P}^X</math>.
* Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении [[доверительный интервал|доверительных интервалов]] равенство:
* Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении [[доверительный интервал|доверительных интервалов]] равенство:
: <math>\mathbb{P}\left(x_{\frac{1-\alpha}{2}}\leqslant X\leqslant x_{\frac{1+\alpha}{2}}\right)=\alpha.</math>
:: <math>\mathbb{P}\left(x_{\frac{1-\alpha}{2}}\leqslant X\leqslant x_{\frac{1+\alpha}{2}}\right)=\alpha.</math>
* Для [[Эмпирическое распределение|эмпирического распределения]] <math>\alpha</math>-квантиль можно задать следующим способом:
* Для [[Эмпирическое распределение|эмпирического распределения]] <math>\alpha</math>-квантиль можно задать следующим способом:
# составляем вариационный ряд значений <math>V_0\leqslant V_1\leqslant\dots\leqslant V_{N-1}</math> (выборка имеет объём <math>N</math>), а также считаем, что <math>V_N=V_{N-1}</math> (это необходимо при вычислении 100% квантили по приводимым ниже формулам);
# составляем вариационный ряд значений <math>V_0\leqslant V_1\leqslant\dots\leqslant V_{N-1}</math> (выборка имеет объём <math>N</math>), а также считаем, что <math>V_N=V_{N-1}</math> (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
# находим величину <math>K=\lfloor\alpha\cdot(N-1)\rfloor</math>;
# находим величину <math>K=\lfloor\alpha\cdot(N-1)\rfloor</math>;
# сравниваем <math>K</math> и <math>\alpha\cdot N</math>:
# сравниваем <math>K</math> и <math>\alpha\cdot N</math>:
Строка 23: Строка 23:
:: б) если <math>K+1=\alpha N</math>, то полагаем <math>x_{\alpha}=(V_K+V_{K+1})/2</math>;
:: б) если <math>K+1=\alpha N</math>, то полагаем <math>x_{\alpha}=(V_K+V_{K+1})/2</math>;
:: в) если <math>K+1>\alpha N</math>, то полагаем <math>x_{\alpha}=V_K</math>.
:: в) если <math>K+1>\alpha N</math>, то полагаем <math>x_{\alpha}=V_K</math>.
Заданный таким образом <math>\alpha</math>-квантиль удовлетворяет приведенному выше определению.
: Заданный таким образом <math>\alpha</math>-квантиль удовлетворяет приведенному выше определению.


В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства <math>K+1=\alpha N</math> можно использовать приближённое сравнение <math>|K+1-\alpha N|<1/N</math> (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).
: В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства <math>K+1=\alpha N</math> можно использовать приближённое сравнение <math>|K+1-\alpha N|<1/N</math> (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).


== Медиана и квартили ==
== Медиана и квантили ==
[[Файл:Boxplot vs PDF.svg|thumb|Квантили нормального распределения]]
[[Файл:Boxplot vs PDF.svg|thumb|Квантили нормального распределения]]
{{main|Медиана (статистика)}}
{{main|Медиана (статистика)}}
Строка 38: Строка 38:
''Деци́ль'' характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.
''Деци́ль'' характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.


Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение<ref>{{книга|автор=Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А.|заглавие=Практикум по теории статистики|издание=3-е изд|место=М.|год=2011|издательство=Финансы и статистика|страницы=130—131|страниц=416|isbn=9785279032969}}.</ref>.
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение<ref>{{книга|автор=Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А.|заглавие=Практикум по теории статистики|издание=3-е изд|место=М.|год=2011|издательство=Финансы и статистика|страницы=130—131|страниц=416|isbn=9785279032969}}</ref>.


== Процентиль ==
== Процентиль ==
<math>p</math>-м '''проценти́лем''' называют квантиль уровня <math>\alpha = p/100</math>. Соответственно, медиана является 50-м процентилем, а первый и третий [[Квантиль#Медиана_и_квартили|квартиль]] — 25-м и 75-м процентилями соответственно.
<math>p</math>-м '''проценти́лем''' называют квантиль уровня <math>\alpha = p/100</math>. Соответственно, медиана является 50-м процентилем, а первый и третий [[Квантиль#Медиана и квартили|квартиль]] — 25-м и 75-м процентилями соответственно.


В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.
Строка 61: Строка 61:
| 50,00
| 50,00
|-
|-
| '''Квантиль (округлённый до тысячных)'''<ref>{{книга |автор={{автор|Большев, Логин Николаевич|Большев Л. Н.}}, {{автор|Смирнов, Николай Васильевич (математик)|Смирнов Н. В.}} |заглавие=Таблицы математической статистики |место=М. |издательство=[[Наука (издательство)|Наука]] |год=1983 |издание=3-е изд. |страниц=416 |страницы=136 }}</ref>
| '''Квантиль (округлённый до тысячных)'''
| 3,719
| 3,719
| 3,090
| 3,09
| 2,326
| 2,326
| 1,999
| 1,999
| 1,960
| 1,96
| 1,645
| 1,645
| 1,282
| 1,282
| 1,000
| 1
| 0,500
| 0
|}
|}


== См. также ==
== См. также ==
* [[Квантили нормального распределения]]
* [[Квантили распределения Стьюдента]]
* [[Квантили распределения Стьюдента]]
* [[Квантили распределения хи-квадрат]]
* [[Квантили распределения хи-квадрат]]
Строка 83: Строка 82:
== Примечания ==
== Примечания ==
{{Примечания}}
{{Примечания}}
{{rq|sources}}


== Ссылки ==
== Ссылки ==
{{Навигация}}
{{Навигация}}

*
{{ВС}}
{{ВС}}
{{Нет источников |дата=2024-10-20}}


[[Категория:Математическая статистика]]
[[Категория:Математическая статистика]]

Текущая версия от 04:45, 20 октября 2024

Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).

Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»[1] означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.

Определение

[править | править код]

Рассмотрим вероятностное пространство и  — вероятностная мера, задающая распределение некоторой случайной величины . Пусть фиксировано . Тогда -квантилем (или квантилью уровня (порядка) ) распределения называется число такое, что[2]

В некоторых источниках (например, в англоязычной литературе) -квантилем называется квантиль уровня , то есть -квантиль в предыдущих обозначениях.

где  — функция распределения .
  • Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
  1. составляем вариационный ряд значений (выборка имеет объём ), а также считаем, что (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
  2. находим величину ;
  3. сравниваем и :
a) если , то полагаем ;
б) если , то полагаем ;
в) если , то полагаем .
Заданный таким образом -квантиль удовлетворяет приведенному выше определению.
В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства можно использовать приближённое сравнение (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).

Медиана и квантили

[править | править код]
Квантили нормального распределения
  • 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
  • 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем;
  • 0,75-квантиль называется третьим (или верхним) кварти́лем.

Интеркварти́льным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.

Деци́ль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.

Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение[3].

Процентиль

[править | править код]

проценти́лем называют квантиль уровня . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.

В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.

Процентили также называются перцентилями или центилями.

Квантили стандартного нормального распределения

[править | править код]
Вероятность (уровень квантили), % 99,99 99,90 99,00 97,72 97,50 95,00 90,00 84,13 50,00
Квантиль (округлённый до тысячных)[4] 3,719 3,09 2,326 1,999 1,96 1,645 1,282 1 0

Примечания

[править | править код]
  1. Руководство участкового педиатра. — ГЭОТАР-Медиа, 2008. — С. 44. — 354 с.
  2. Фролов А. Н.. Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО. — СПб.: Лань, 2021. — С. 189. — 316 с. — ISBN 978-5-8114-8343-3.
  3. Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969.
  4. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — 3-е изд.. — М.: Наука, 1983. — С. 136. — 416 с.