Квантиль: различия между версиями
[отпатрулированная версия] | [отпатрулированная версия] |
Caenus (обсуждение | вклад) так на что нужен источник? Дальше же написано почему |
MBHbot (обсуждение | вклад) м →Ссылки: Project talk:Викификатор#Шаблон:Rq, replaced: {{rq|sources}} → {{подст:нет источников}} |
||
(не показана 21 промежуточная версия 16 участников) | |||
Строка 1: | Строка 1: | ||
'''Кванти́ль''' в [[математическая статистика|математической статистике]] — значение, которое заданная [[случайная величина]] не превышает с фиксированной [[вероятность]]ю. Если вероятность задана в |
'''Кванти́ль''' в [[математическая статистика|математической статистике]] — значение, которое заданная [[случайная величина]] не превышает с фиксированной [[вероятность]]ю. Если вероятность задана в [[процент]]ах, то квантиль называется '''процентилем''' или '''перцентилем''' (см. [[#Процентиль|ниже]]). |
||
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»<ref>{{Книга |заглавие=Руководство участкового педиатра |ссылка=https://books.google.com/books?id=10O1MFkbOekC&pg=PA44 |издательство=ГЭОТАР-Медиа |год=2008 |страницы=44 |страниц=354}}</ref> означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 |
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»<ref>{{Книга |заглавие=Руководство участкового педиатра |ссылка=https://books.google.com/books?id=10O1MFkbOekC&pg=PA44 |издательство=ГЭОТАР-Медиа |год=2008 |страницы=44 |страниц=354}}</ref> означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг. |
||
== Определение == |
== Определение == |
||
Рассмотрим [[вероятностное пространство]] <math>(\Omega,\;\mathcal{F},\;\mathbb{P})</math> и <math>\mathbb{P}^X</math> — [[вероятностная мера]], задающая [[Распределение вероятностей|распределение]] некоторой [[Случайная величина|случайной величины]] <math>X</math>. Пусть фиксировано <math>\alpha\in(0,\;1)</math>. Тогда <math>\alpha</math>-квантилем (или |
Рассмотрим [[вероятностное пространство]] <math>(\Omega,\;\mathcal{F},\;\mathbb{P})</math> и <math>\mathbb{P}^X</math> — [[вероятностная мера]], задающая [[Распределение вероятностей|распределение]] некоторой [[Случайная величина|случайной величины]] <math>X</math>. Пусть фиксировано <math>\alpha\in(0,\;1)</math>. Тогда <math>\alpha</math>-квантилем (или квантилью уровня (порядка) <math>\alpha</math>) распределения <math>\mathbb{P}^X</math> называется [[число]] <math>x_\alpha\in\R</math> такое, что<ref>{{книга |автор={{автор||Фролов А. Н.}} |заглавие=Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО |место=СПб. |издательство=Лань |год=2021 |страниц=316 |страницы=189 |isbn=978-5-8114-8343-3 }}</ref> |
||
: <math>\mathbb{P}(X \leqslant x_\alpha)\ |
: <math>\mathbb{P}(X \leqslant x_\alpha) \geqslant \alpha,</math> |
||
: <math>\mathbb{ |
: <math>\mathbb{P}(X \geqslant x_\alpha)\geqslant 1 - \alpha.</math> |
||
В некоторых источниках (например, в англоязычной литературе) <math>k</math>-м <math>q</math>-квантилем называется квантиль уровня <math>k/q</math>, то есть <math>(k/q)</math>-квантиль в предыдущих обозначениях. |
В некоторых источниках (например, в англоязычной литературе) <math>k</math>-м <math>q</math>-квантилем называется квантиль уровня <math>k/q</math>, то есть <math>(k/q)</math>-квантиль в предыдущих обозначениях. |
||
Строка 12: | Строка 12: | ||
== Замечания == |
== Замечания == |
||
* Если [[Распределение вероятностей|распределение]] непрерывно, то <math>\alpha</math>-квантиль однозначно задаётся [[уравнение]]м |
* Если [[Распределение вероятностей|распределение]] непрерывно, то <math>\alpha</math>-квантиль однозначно задаётся [[уравнение]]м |
||
: <math>F_X(x_\alpha)=\alpha,</math> |
:: <math>F_X(x_\alpha)=\alpha,</math> |
||
где <math>F_X</math> — [[функция распределения]] <math>\mathbb{P}^X</math>. |
: где <math>F_X</math> — [[функция распределения]] <math>\mathbb{P}^X</math>. |
||
* Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении [[доверительный интервал|доверительных интервалов]] равенство: |
* Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении [[доверительный интервал|доверительных интервалов]] равенство: |
||
: <math>\mathbb{P}\left(x_{\frac{1-\alpha}{2}}\leqslant X\leqslant x_{\frac{1+\alpha}{2}}\right)=\alpha.</math> |
:: <math>\mathbb{P}\left(x_{\frac{1-\alpha}{2}}\leqslant X\leqslant x_{\frac{1+\alpha}{2}}\right)=\alpha.</math> |
||
* Для [[Эмпирическое распределение|эмпирического распределения]] <math>\alpha</math>-квантиль можно задать следующим способом: |
* Для [[Эмпирическое распределение|эмпирического распределения]] <math>\alpha</math>-квантиль можно задать следующим способом: |
||
# составляем вариационный ряд значений <math>V_0\leqslant V_1\leqslant\dots\leqslant V_{N-1}</math> (выборка имеет объём <math>N</math>), а также считаем, что <math>V_N=V_{N-1}</math> (это необходимо при вычислении 100% квантили по приводимым ниже формулам); |
# составляем вариационный ряд значений <math>V_0\leqslant V_1\leqslant\dots\leqslant V_{N-1}</math> (выборка имеет объём <math>N</math>), а также считаем, что <math>V_N=V_{N-1}</math> (это необходимо при вычислении 100 % квантили по приводимым ниже формулам); |
||
# находим величину <math>K=\lfloor\alpha\cdot(N-1)\rfloor</math>; |
# находим величину <math>K=\lfloor\alpha\cdot(N-1)\rfloor</math>; |
||
# сравниваем <math>K</math> и <math>\alpha\cdot N</math>: |
# сравниваем <math>K</math> и <math>\alpha\cdot N</math>: |
||
Строка 23: | Строка 23: | ||
:: б) если <math>K+1=\alpha N</math>, то полагаем <math>x_{\alpha}=(V_K+V_{K+1})/2</math>; |
:: б) если <math>K+1=\alpha N</math>, то полагаем <math>x_{\alpha}=(V_K+V_{K+1})/2</math>; |
||
:: в) если <math>K+1>\alpha N</math>, то полагаем <math>x_{\alpha}=V_K</math>. |
:: в) если <math>K+1>\alpha N</math>, то полагаем <math>x_{\alpha}=V_K</math>. |
||
Заданный таким образом <math>\alpha</math>-квантиль удовлетворяет приведенному выше определению. |
: Заданный таким образом <math>\alpha</math>-квантиль удовлетворяет приведенному выше определению. |
||
В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства <math>K+1=\alpha N</math> можно использовать приближённое сравнение <math>|K+1-\alpha N|<1/N</math> (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных). |
: В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства <math>K+1=\alpha N</math> можно использовать приближённое сравнение <math>|K+1-\alpha N|<1/N</math> (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных). |
||
== Медиана и |
== Медиана и квантили == |
||
[[Файл:Boxplot vs PDF.svg|thumb|Квантили нормального распределения]] |
[[Файл:Boxplot vs PDF.svg|thumb|Квантили нормального распределения]] |
||
{{main|Медиана (статистика)}} |
{{main|Медиана (статистика)}} |
||
Строка 38: | Строка 38: | ||
''Деци́ль'' характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля. |
''Деци́ль'' характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля. |
||
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение<ref>{{книга|автор=Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А.|заглавие=Практикум по теории статистики|издание=3-е изд|место=М.|год=2011|издательство=Финансы и статистика|страницы=130—131|страниц=416|isbn=9785279032969}} |
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение<ref>{{книга|автор=Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А.|заглавие=Практикум по теории статистики|издание=3-е изд|место=М.|год=2011|издательство=Финансы и статистика|страницы=130—131|страниц=416|isbn=9785279032969}}</ref>. |
||
== Процентиль == |
== Процентиль == |
||
<math>p</math>-м '''проценти́лем''' называют квантиль уровня <math>\alpha = p/100</math>. Соответственно, медиана является 50-м процентилем, а первый и третий [[Квантиль# |
<math>p</math>-м '''проценти́лем''' называют квантиль уровня <math>\alpha = p/100</math>. Соответственно, медиана является 50-м процентилем, а первый и третий [[Квантиль#Медиана и квартили|квартиль]] — 25-м и 75-м процентилями соответственно. |
||
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная. |
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная. |
||
Строка 61: | Строка 61: | ||
| 50,00 |
| 50,00 |
||
|- |
|- |
||
| '''Квантиль (округлённый до тысячных)'''<ref>{{книга |автор={{автор|Большев, Логин Николаевич|Большев Л. Н.}}, {{автор|Смирнов, Николай Васильевич (математик)|Смирнов Н. В.}} |заглавие=Таблицы математической статистики |место=М. |издательство=[[Наука (издательство)|Наука]] |год=1983 |издание=3-е изд. |страниц=416 |страницы=136 }}</ref> |
|||
| '''Квантиль (округлённый до тысячных)''' |
|||
| 3,719 |
| 3,719 |
||
| 3, |
| 3,09 |
||
| 2,326 |
| 2,326 |
||
| 1,999 |
| 1,999 |
||
| 1, |
| 1,96 |
||
| 1,645 |
| 1,645 |
||
| 1,282 |
| 1,282 |
||
| 1 |
| 1 |
||
| 0 |
| 0 |
||
|} |
|} |
||
== См. также == |
== См. также == |
||
* [[Квантили нормального распределения]] |
|||
* [[Квантили распределения Стьюдента]] |
* [[Квантили распределения Стьюдента]] |
||
* [[Квантили распределения хи-квадрат]] |
* [[Квантили распределения хи-квадрат]] |
||
Строка 83: | Строка 82: | ||
== Примечания == |
== Примечания == |
||
{{Примечания}} |
{{Примечания}} |
||
{{rq|sources}} |
|||
== Ссылки == |
== Ссылки == |
||
{{Навигация}} |
{{Навигация}} |
||
* |
|||
{{ВС}} |
{{ВС}} |
||
{{Нет источников |дата=2024-10-20}} |
|||
[[Категория:Математическая статистика]] |
[[Категория:Математическая статистика]] |
Текущая версия от 04:45, 20 октября 2024
Кванти́ль в математической статистике — значение, которое заданная случайная величина не превышает с фиксированной вероятностью. Если вероятность задана в процентах, то квантиль называется процентилем или перцентилем (см. ниже).
Например, фраза «90-й процентиль массы тела у новорожденных мальчиков составляет 4 кг»[1] означает, что 90 % мальчиков рождаются с весом, меньшим либо равным 4 кг, а 10 % мальчиков рождаются с весом, большим либо равным 4 кг.
Определение
[править | править код]Рассмотрим вероятностное пространство и — вероятностная мера, задающая распределение некоторой случайной величины . Пусть фиксировано . Тогда -квантилем (или квантилью уровня (порядка) ) распределения называется число такое, что[2]
В некоторых источниках (например, в англоязычной литературе) -м -квантилем называется квантиль уровня , то есть -квантиль в предыдущих обозначениях.
Замечания
[править | править код]- Если распределение непрерывно, то -квантиль однозначно задаётся уравнением
- где — функция распределения .
- Очевидно, для непрерывных распределений справедливо следующее широко использующееся при построении доверительных интервалов равенство:
- Для эмпирического распределения -квантиль можно задать следующим способом:
- составляем вариационный ряд значений (выборка имеет объём ), а также считаем, что (это необходимо при вычислении 100 % квантили по приводимым ниже формулам);
- находим величину ;
- сравниваем и :
- a) если , то полагаем ;
- б) если , то полагаем ;
- в) если , то полагаем .
- Заданный таким образом -квантиль удовлетворяет приведенному выше определению.
- В некоторых случаях (при большом объёме выборки и эмпирическом распределении, близком к непрерывному) вместо равенства можно использовать приближённое сравнение (это позволит, например, квантиль уровня 1/3 представлять как 0,33…333 при компьютерной обработке данных).
Медиана и квантили
[править | править код]- 0,25-квантиль называется первым (или нижним) кварти́лем (от лат. quarta — четверть);
- 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым кварти́лем;
- 0,75-квантиль называется третьим (или верхним) кварти́лем.
Интеркварти́льным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями, то есть . Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Дециль
[править | править код]Деци́ль характеризует распределение величин совокупности, при котором девять значений дециля делят её на десять равных частей. Любая из этих десяти частей составляет 1/10 всей совокупности. Так, первый дециль отделяет 10 % наименьших величин, лежащих ниже дециля, от 90 % наибольших величин, лежащих выше дециля.
Так же, как в случае моды и медианы, у интервального вариационного ряда распределения каждый дециль (и квартиль) принадлежит определённому интервалу и имеет вполне определённое значение[3].
Процентиль
[править | править код]-м проценти́лем называют квантиль уровня . Соответственно, медиана является 50-м процентилем, а первый и третий квартиль — 25-м и 75-м процентилями соответственно.
В целом, понятия квантиль и процентиль взаимозаменяемы, так же, как и шкалы исчисления вероятностей — абсолютная и процентная.
Процентили также называются перцентилями или центилями.
Квантили стандартного нормального распределения
[править | править код]Вероятность (уровень квантили), % | 99,99 | 99,90 | 99,00 | 97,72 | 97,50 | 95,00 | 90,00 | 84,13 | 50,00 |
Квантиль (округлённый до тысячных)[4] | 3,719 | 3,09 | 2,326 | 1,999 | 1,96 | 1,645 | 1,282 | 1 | 0 |
См. также
[править | править код]- Квантили распределения Стьюдента
- Квантили распределения хи-квадрат
- Нормальное распределение
- Доверительный интервал
- Наукометрия
Примечания
[править | править код]- ↑ Руководство участкового педиатра. — ГЭОТАР-Медиа, 2008. — С. 44. — 354 с.
- ↑ Фролов А. Н.. Краткий курс теории вероятностей и математической статистики: учебное пособие для СПО. — СПб.: Лань, 2021. — С. 189. — 316 с. — ISBN 978-5-8114-8343-3.
- ↑ Шмойлова Р. А., Минашкин В. Г., Садовникова Н. А. Практикум по теории статистики. — 3-е изд. — М.: Финансы и статистика, 2011. — С. 130—131. — 416 с. — ISBN 9785279032969.
- ↑ Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — 3-е изд.. — М.: Наука, 1983. — С. 136. — 416 с.
Ссылки
[править | править код]В статье не хватает ссылок на источники (см. рекомендации по поиску). |