Нерівність Єнсена — зв'язує визначений інтегралопуклої функції та значення цієї функції від інтеграла. Вона була доведена данським математиком Йоганом Єнсеном у 1906 році.[1]
Враховуючи свою загальність, нерівність проявляється у багатьох формах залежно від контексту, деякі з яких представлені нижче.
У найпростішому випадку нерівність стверджує, що значення опуклого перетворення є меншим або дорівнює значенню отриманого після опуклого перетворення; це простий наслідок того, що обернене твердження вірне щодо перетворень увігнутих функцій.
Нерівність Єнсена узагальнює твердження, що січна опуклої функції лежить над графіком функції (нерівність Єнсена для двох точок): січна лінія утворюється ваговими середніми значеннями опуклої функції (для ),
у той час як графік функції є опуклою функцією зважених середніх значень
Класична форма нерівності Єнсена включає декілька чисел і вагових коефіцієнтів.
Нерівність можна сформулювати у досить загальному вигляді, використовуючи або мову теорії міри, або (що еквівалентно) теорії ймовірності.
У термінах теорії ймовірності нерівність можна узагальнити далі.
У аналізі функцій однієї змінної може знадобитися оцінка для
де та — невід'ємна функція, яка інтегровна за Лебегом.
У цьому випадку міра Лебега відрізка не обов'язково має дорівнювати одиниці.
Однак, за допомогою інтегрування з використанням заміни змінних, інтервал може бути відмасштабований так, що міра дорівнюватиме одиниці.
Тоді можна застосувати нерівність Єнсена і отримаємо[4]
Зауважимо, що рівність буде мати місце тоді і лише тоді, коли є лінійною функцією на деякій множині такій, що (це випливає з наведеного нижче інтегрального доведення).
Більш загально, нехай — дійсний топологічний векторний простір, — -значна інтегровна випадкова величина.
У цих загальних умовах інтегровний означає, що в просторі існує елемент , такий, що для будь-якого елемента із спряженого простору до простору : та .
Тоді для будь-якої вимірної опуклої функції та під--алгебри у -алгебрі :
Зокрема, якщо — опукла функція, то і стандартний вигляд нерівності Єнсена безпосередньо випливає, якщо додатково вважати функцію двічі диференційованою.
Нерівність Єнсена можна довести декількома способами, і нижче буде запропоновано три різні доведення, що відповідають вищезазначеним твердженням.
Однак перед тим як приступати до цих математичних доведень варто проаналізувати інтуїтивно зрозумілий графічний аргумент на основі ймовірнісного випадку, де є дійсним числом (див. рисунок).
Припускаючи гіпотетичний розподіл значень , можна одразу визначити положення математичного сподівання та його образу на графіку.
Враховуючи, що для опуклих відображень відповідний розподіл значень є зростаючим і розтягується при зростаючих значеннях , легко зрозуміти, що розподіл є ширшим в інтервалі, що відповідає і вужчим при для будь-якого . Зокрема, це також справедливо для .
Отже, на цьому рисунку математичне сподівання для завжди зміщуватиметься вгору по відношенню до положення . А
налогічне міркування справедливе, якщо розподіл охоплює спадну частину опуклої функції, або одночасно спадну і зростаючу його частини.
Це доводить нерівність, тобто
яка перетворюється у рівність, якщо не є строго опуклою функцією, наприклад, якщо вона є прямою, або, якщо має вироджений розподіл (тобто є константою).
Наведені нижче доведення формалізують це інтуїтивне поняття.
Якщо і — два довільні невід'ємні дійсні числа такі, що , то з опуклості випливає
Цю нерівність можна легко узагальнити: якщо — невід'ємні дійсні числа такі, що , тоді
для будь-яких .
Цю скінченну форму нерівності Єнсена можна довести за допомогою методу математичної індукції: за припущення опуклості твердження справедливе для . Припустимо, що воно справедливе і для деякого , потрібно довести нерівність для .
Щонайменше одне з є додатним і строго меншим 1, нехай ; тоді з означення опуклості:
Оскільки
то можна застосувати індукційні гіпотези до останнього члена в попередній формулі для того, щоб отримати результат, а саме кінцеву форму нерівності Єнсена.
Для того, щоб отримати загальну нерівність з цієї кінцевої форми, необхідно використовувати аргумент щільності.
Скінченну форму можна переписати як
Оскільки опуклі функції є неперервними, й опуклі комбінації дельта-функцій Дірака є слабкощільними
в множині ймовірнісних мір (що можна легко перевірити), то загальне твердження отримується легко за допомогою граничного переходу.
Нехай — дійснозначна -інтегровна функція у ймовірностному просторі , а — опукла дійснозначна функція.
Оскільки опукла, то для кожного дійсного значення маємо непусту множину субдиференціалів, які можна розглядати як лінії, що дотикаються до графіка функції в точці , але які знаходяться над графіком функції або нижче нього у всіх точках (опорні лінії графіка).
Тепер, якщо визначимо
то внаслідок існування субдиференціалів для опуклих функцій можемо вибрати та такі, що
для всіх дійсних і
Але тоді маємо, що
для всіх .
Оскільки маємо ймовірнісну міру, то інтеграл є монотонним з , так що
↑Jensen, J. L. W. V. (1906). Sur les fonctions convexes et les inegalites entre les valeurs moyennes. Acta Mathematica. 30 (1): 175—193. doi:10.1007/BF02418571.
↑Attention: In this generality additional assumptions on the convex function and/ or the topological vector space are needed, see Example (1.3) on p. 53 in Perlman, Michael D. (1974). Jensen's Inequality for a Convex Vector-Valued Function on an Infinite-Dimensional Space. Journal of Multivariate Analysis. 4 (1): 52—65. doi:10.1016/0047-259X(74)90005-0.