Стохастичні методи розв'язання задач неопуклого стохастичного програмування та їх застосування

Дослідження методів розв'язання задач неопуклого стохастичного програмування, включаючи локальну та глобальну стохастичну оптимiзацiю, цiлочисленне стохастичне програмування, локальну та глобальну оптимiзацiю ймовiрностей та функцій сподіваної корисності.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 18.11.2013
Размер файла 107,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Національна академія наук України

Інститут кібернетики імені В. М. Глушкова

Автореферат дисертації на здобуття наукового ступеню

доктора фізико-математичних наук

01.05.01 - теоретичні основи інформатики та кібернетики

СТОХАСТИЧНІ МЕТОДИ РОЗВ'ЯЗАННЯ ЗАДАЧ НЕОПУКЛОГО СТОХАСТИЧНОГО ПРОГРАМУВАННЯ ТА ЇХ ЗАСТОСУВАННЯ

НОРКІН Володимир Іванович

Київ 1998

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ

Дисертація присвячена стохастичним методам розв'язання задач неопуклого стохастичного програмування, наприклад, задач локальної та глобальної оптимізації негладких функцій очікуваної корисності та ймовірності, стохастичної оптимізації розривних функцій, цілочислового стохастичного програмування. Формально в дисертації розвиваються методи розв'язання задач стохастичного програмування вигляду

mіnxX [F(x)=Eu(f(x,),)], mіnxX [P(x)=P{f(x,)B()}],

на основі спостереження значень (або градіентів) функції f(·,щ), де функції f(·,щ), u(·,щ), P(x) і F(x) можуть бути неопуклими, негладкими і навіть розривними, а змінна xXRn може бути неперервною або дискретною; щ - випадкова величина; E і P - знаки математичного очікування та ймовірності по , B()Rm, f(,):RnRm, u(,):RmR1.

Актуальність теми. Теорія опуклого стохастичного програмування розроблена в роботах Дж.Данцига, Ю.М.Єрмольєва, П.Калла, А.Прекопи, Р.Ветса, Д.Б.Юдіна та ін. Адреса http://mally.eco.rug.nl у мережі Іnternet містить бібліографію (понад 3000 посилань) робіт по стохастичному програмуванню (складена M.H. Van der Vlerk). Однак існує велика кількість прикладних задач неопуклого стохастичного програмування. Це, напри клад, задачі оптимізації динамічних систем з дискретними випадковими подіями (систем обслуговування з чергами, мереж зв'язку, гнучких автоматизованих виробництв, технічних систем з відмовами та ін.). Показники функціонування таких систем у загальному випадку є неопуклими негладкими функціями від параметрів систем і часто мають вигляд математичного сподівання (наприклад, середній час очікування обслуговування, середній час надходження повідомлення, середній час безвідмовної роботи і т.п.). Також є цікавою оптимізація цих показників за параметрами при обмеженнях на область допустимої зміни параметрів. Локальна оптимізація цих показників у загальному випадку повинна проводитися методами негладкого стохастичного програмування (наприклад, ліпшіцевого). Спеціальний випадок гладких показників є вивченим у роботах X.R.Cao, P.W.Glynn, Y.C.Ho, М.К.Кривуліна, G.Ch.Pflug, R.Rubіnsteіn, R.Surі.

Багато систем з дискретними подіями мають розривні показники функціонування (довжини черг в системах масового обслуговування, час обслуговування в системах з відмовами та регенерацією, рівні запасів за випадкового попиту в економічних системах). Локальна оптимізація цих систем потребує зовсім нового аналітичного апарату і відповідних чисельних методів (J.P.Aubіn, В.Д.Батухтін, F.H.Clarke, В.Ф.Дем'янов, Б.Ш.Мордухович, Б.Н.Пшеничний, R.T.Rockafellar, О.М.Рубінов, Н.З.Шор, R.J-B.Wets та ін.)

При оптимізації систем з дискретними подіями постає питання про глобальну оптимізацію системи, оскільки функції, що оптимізуються, взагалі неопуклі. Можна було б застосувати загальновідомі методи глобальної оптимізації, але справа ускладнюється тим, що функції, які підлягають оптимізації, являють собою математичні сподівання, тобто багатовимірні інтеграли, та їх точне обчислення або дуже трудомістке, або практично неможливе. Тому необхідні особливі підходи до глобальної оптимізації таких стохастичних систем. Серед підходів, які відомі на даний час, слід відмітити методи керованого випадкового пошуку (E.Aaarts, А.О.Жиглявський, S.Kіrkpatrіck, H.Kushner, Й.Б.Моцкус, Л.А.Растригін, Д.Б.Юдін та ін.)

Більшість класичних задач дослідження операцій, які часто формулюються як задачі дискретного (або мішаного) програмування (задача про рюкзак, про призначення, про розміщення, про розподілення ресурсів та ін.), в загальному випадку можуть містити випадкові параметри. В цьому випадку вони повинні бути переформульовані як задачі стохастичного дискретного програмування (одно-, дво- або багато-етапного, з ймовірнісними обмеженнями, з функціями ризику). Формально задача дискретного стохастичного програмування - це задача вибору, наприклад, мінімального математичного сподівання з скінченної (астрономічної) множини варіантів. При невеликій кількості варіантів - це задача математичної статистики. Деякі методи розв'язання задач стохастичного цілочисленного програмування розроблені в роботах І.Л.Авербаха, G.Laporte, F.H.Louveaux, A.H.G.Rіnnoy-Kan, R.L.Schultz, L.Stougіe, M.H.Van der Vlerk, Д.Б.Юдіна та ін. Адреса http://mally.eco.rug.nl у мережі Іnternet містить понад 130 посилань на роботи по стохастичному цілочисловому стохастичному програмуванню.

Будь-яка задача стохастичної оптимізації є сама по собі задачею багатокритеріальної оптимізації: по суті, кожній реалізації випадкових параметрів (сценарію) відповідає своя цільова функція і свій розв'язок. У стохастичному програмуванні, як правило, агрегують ці випадкові цільові функції за допомогою операцій математичного сподівання. Однак це не єдиний спосіб побудови узагальненої цільової функції. Інша важлива функція такого роду - це функція ймовірності, яка виражає ймовірність того, що деяка випадкова величина, що залежить від неперервних та дискретних параметрів, не перебільшує заданої межі або належить заданій області. За допомогою функцій ймовірності описують надійність технічних систем, ризик в економіці та бізнесі. Локальна та глобальна оптимізація функцій ймовірності - це своєрідна спеціальна задача стохастичного програмування, яка потребує особливих методів розв'язання. Задача локальної оптимізації гладких функцій ймовірності розглянута в роботах А.І.Кібзуна, І.М.Коваленка, Р.Леппа, К.Martі, О.М.Наконечного, Б.Т.Поляка, А.Prekopa, Е.Райка, Е.Тамм, С.П.Урясьєва, Т.Szantaі та ін.

Функції ймовірності та математичного сподівання є частковими випадками функцій сподіваної корисності, за допомогою яких формулюються задачі прийняття рішень при невизначеності. Функції сподіваної корисності мають бути неопуклими, негладкими та навіть розривними і, отже, також потребують спеціальних методів оптимізації.

Це коло задач являє собою предмет дослідження дисертації з метою розробки відповідних методів для їх розв'язання. Методика дослідження базується на застосуванні до задач неопуклого стохастичного програмування методів негладкого аналізу, деяких теоретико-ймовірнісних результатів (законів великих чисел, теорії мартінгалів, теорії слабкої збіжності), теорії багатозначних відображень, методу неопуклих функцій Ляпунова.

Наукова новизна результатів роботи полягає в наступному.

1. Розглянуто нові практичні класи задач негладкої та розривної (неопуклої) оптимізації, пов'язані з оптимізацією так званих стохастичних систем з дискретними подіями. Показано, що адекватною моделлю параметричних неперервних показників функціонування стохастичних систем з дискретними подіями та функцій сподіваної корисності є так звані узагальнено диференційовні функції.

2. Введені та вивчені деякі нові класи розривних функцій (кусково-неперервні, неперервні за напрямками, сильно напівнеперервні знизу).

3. Для розривних функцій уведено та вивчено нове поняття зглад-женого субдиференціала, вивчено його зв'язок з субдиференціалами Ф.Кларка, Р.Т.Рокафеллара, Дж.Варги та Б.Ш.Мордуховича. Для опису сингулярних (нескінченних) значень градієнтів розривних функцій уведено та досліджено нове поняття розширеного згладженого субдиференціала у "космічному" векторному просторі Р.Т.Рокафеллара та Р.Ветса.

4. Знайдені необхідні умови екстремуму в термінах згладжених субдиференціалів для неперервних та розривних функцій за неопуклих обмежень.

5. Для обчислення згладжених субдиференціалів розривних функцій запропоновано скінченно-різницеві стохастичні оцінки.

6. Запропоновано та обгрунтовано новий (апроксимаційний) підхід до оптимізації негладких та розривних функцій математичного сподівання, функцій ймовірності та сподіваної корисності за обмежень.

7. Метод стохастичних квазіградієнтів Ю.М.Єрмольєва узагальнений і поширюється на неопуклі стохастичні задачі оптимізації узагальнено диференційовних, локально ліпшіцевих та розривних функцій математичного сподівання за неопуклих обмежень.

8. Для розв'язання "ущелинних" задач стохастичного неопуклого програмування запропоновано та обгрунтовано методи усереднених стохастичних градієнтів, наприклад, стохастичні методи "важкої кульки" та "ущелинного кроку".

9. Розглянуто нові (стохастичні нелінійні) задачі дискретної оптимізації (стохастичну двоетапну задачу про рюкзак, стохастичну задачу фінансування проектів, стохастичну задачу розміщення виробництва, лінійну стохастичну двоетапну задачу, стохастичну задачу про реконструкцію мережі, стохастичну задачу про максимальний потік у мережі та ін.).

10. Запропоновано новий прийом перестановочної релаксації (пере-становки операторів мінімізації та математичного сподівання або ймо-вірності (або підсумовування)) для оцінки знизу оптимальних значень задач стохастичної дискретної та стохастичної глобальної оптимізації.

11. За допомогою перестановочної релаксації та лагранжевої релаксації одержані нові стохастичні оцінки оптимальних значень дискретних та неперервних задач стохастичного програмування, включаючи стохастичну двоетапну задачу про рюкзак, стохастичну задачу фінансування проектів, стохастичну задачу розміщення виробництва, лінійну стохастичну двоетапну задачу, задачу оптимізації функції ймовірностей.

12. На базі стохастичних оцінок оптимальних значень розроблено новий стохастичний варіант методу гілок та меж для розв'язання задач стохастичного дискретного програмування та стохастичної глобальної оптимізації за детермінованих та стохастичних обмежень. Досліджені умови збіжності методу майже напевне.

13. Розроблено варіанти стохастичного методу гілок та меж для конкретних задач стохастичного програмування, таких, як стохастична двоетапна задача фінансування проектів, стохастична задача розміщення виробництва, задача оптимізації ймовірностей, задача оптимізації за ймовірнісних обмежень. Проведені експериментальні розрахунки, що підтведжують дієздатність та ефективніть розробленного стохастичного методу гілок та меж.

14. Досліджено умови та швидкість збіжності методу емпіричних середніх у випадку складних функцій ризику, а також нове допоміжне поняття нормалізованої збіжності випадкових величин.

Практичне значення роботи полягає в тому, що розроблені обчи-слювальні методи розв'язання складних задач оптимізації технічних систем з дискретними випадковими подіями та негладкими показниками якості функціонування, обчислювальні методи оптимізації ризику, що є вираженим за допомогою функцій ризику, обчислювальні методи розв'язання стохастичних задач дискретного програмування. Ці методи не потребують точного обчислення функції, що оптимізується, у кожній точці, а використовують випадкові реалізації функції або їх градієнтів, що отримуються з імітаційної моделі системи, яка оптимізується.

Апробація роботи. Результати роботи доповідалися на ІV-VІІ Міжнародних конференціях по стохастичному програмуванню (Енн-Арбор, США, 1989; Удіне, Італія, 1992; Нахарайя, Ізраїль, 1995), на Міжнародному математичному конгресі (Берлін, Німеччина, 1998), на XV Міжнародному симпозіумі по математичному програмуванню (Енн-Арбор, США, 1994), на міжнародних симпозіумах "Глобальна оптимізація" (Шопрон, Угорщина, 1990), "Апроксимація задач стохастичного програмування" (Лаксенбург, Австрія, 1993), "Стохастичне програмування" (Берлін, Німеччина, 1994), "Негладка та розривна оптимізація і застосування" (Лаксенбург, Австрія, 1995), "Стохастична оптимізація: обчислювальні методи та технічне застосування" (Ньюбіберг/Мюнхен, Німеччина, 1996), на міжнародній конференції ІNFORMS (Сан Дієго, США, 1997). Матеріали дисертації обговорювалися на наукових семінарах в Інституті кібернетики ім. В.М.Глушкова НАН України, Інституті математики НАН України, Національному технічному університеті України, Інституті системного аналізу НАН України та Міносвіти України, а також на факультеті кібернетики Київського національного університету ім. Т.Г.Шевченка.

Публікації. Результати роботи опубліковані у 25 друкованих роботах (із них 13 з співавторами), у тому числі в одній монографії (з співавторами), 13 журнальних публікаціях, 7 статтях в зібраннях праць, 4 препринтах.

Структура та обсяг роботи. Дисертація складається з вступу, 6 розділів, висновків та списку літератури. Обсяг роботи - 250 сторінок, 3 рисунки, 4 таблиці. Список літератури містить 337 найменувань.

неопуклий стохастичний програмування локальний

ЗМІСТ РОБОТИ

У вступі пояснено актуальність теми дисертації, коротко викладено зміст дисертації, дано огляд літератури за темою дисертації та вказано зв'язок роботи з іншими дослідженнями.

1. Задачі неопуклої стохастичної оптимізації.

У розділі 1 обговорюється загальна методологія прийняття рішень за умов стохастичної невизначеності за допомогою так званих функцій ризику, функцій сподіваної корисності та нечітких цільових функцій, а також наведені приклади неопуклих задач оптимізації систем з дискретними подіями, задач стохастичної дискретної та стохастичної глобальної оптимізації.

Під функцією ризику F(x), що залежить від параметрів x, мається на увазі будь-який функціонал від розподілу випадкових "збитків-виграшу" f(x,), що відповідає тому або іншому вибору параметрів x та реалізації випадкових параметрів . За допомогою функцій ризику здійснюється вибір раціональних рішень за умов стохастичної невизначеності.

У підрозділі 1.1 та у [18] обговорюються математичні властивості функцій ризику та розглядаються методи прийняття рішень на базі функцій ризику. Типовими представниками функцій ризику є функції математичного сподівання F(x)=Ef(x,), дисперсії F(x)=E(f(x,)Ef(x,))2, ймовірності F(x)=P{f(x,)c} та ін., що залежать від параметрів xRn, причому випадкові функції можуть бути неопуклими та негладкими. У підрозділі 1.5 та в [10, 11, 25] наведені приклади задач оптимізації деяких систем з дискретними випадковими подіями - DES, у яких випадкові функції f(x,) будуються з гладких функцій за допомогою операцій максимуму та мінімуму. Наприклад, задача максимізації середнього часу життя мережі має вигляд

maxx X [F(x)= E maxpP mіnep fep(x,)], (1)

де p - деякий шлях з множини P шляхів, що ведуть від входу до виходу мережі; fep(x,) - випадковий час життя елемента e шляху p. У даному випадку функція корисності u(t)=maxpP mіnep tep є неопуклою та негладкою. Проблема полягає в обчисленні стохастичних узагальнених градієнтів неопуклої негладкої функії F(x).

Під функцією сподіваної корисності маються на увазі функції вигляду F(x)=Eu(f(x,)), де функція u(·) виражає корисність (для особи, що приймає рішення) тих або інших значень f(·,·). Ясно, що корисність u(f(x,)) може бути неопуклою по x, навіть якщо функція f(x,) опукла по x. Якщо u(·)= c(·), де c(t)={0 для t<0 та 1 для t ? 0}, відповідна функція сподіваної корисності співпадає з функцією ймовірності. Коли u(t)=max(0,t) відповідна функція корисності є функція ризику вигляду F(x)=Ef(x)c(f(x,)). Очевидно, функція ймовірності може бути негладкою і навіть розривною. Властивості функції ймовірності та інших функцій сподіваної корисності (неперервність, узагальнена диференційовність, квазіувігнутість) детально розглядаються у підрозділі 4.4.

Функція u(·) може бути функцією належності (0u()1) розмитої цілі бажаної області значень критерію f, тоді u(f(x,)) виражає ступінь досягнення розмитої цілі при розв'язку x, а F(x)= Eu(f(x,)) виражає сподівану ступінь досягнення цілі. У підрозділі 1.4 та в [4] обговорюються математичні властивості задачі нечіткої оптимізації.

На практиці задача прийняття рішень або оптимізації функціонування деякої стохастичної системи зводиться до оптимізації тих або інших функцій ризику або їх комбінацій за обмежень. Функції ризику можуть бути неопуклими, негладкими і навіть розривними та можуть залежати від неперервних та дискретних параметрів. У підрозділах 1.5 - 1.8 наведені приклади задач стохастичної оптимізації з такими функціями ризику (оптимізація зупинки небезпечного виробництва, стохастичних мереж з відмовами, функціонування мереж зв'язку, простої транспортної лінії, емісії забруднювачів, розміщення виробництва, реконструкції стохастичної мережі, ризику у страховому бізнесі, фінансування проектів, портфеля цінних паперів та ін.). Актуальною є задача розробки методів локальної оптимізації таких складних функцій ризику. Цьому присвячені розділи 2 - 4. Оскільки функції ризику можуть бути неопуклими, ми не можемо уникнути проблеми глобальної оптимізації таких функцій, що вивчається в розділі 5.

Якщо параметр x приймає дискретні значення, то задача вибору, скажімо, мінімального математичного сподівання F(x)= Ef(x,) на основі реалізацій f(x,) є класичною задачею математичної статистики. Відмінність задачі стохастичної дискретної оптимізації полягає в тому, що число можливих розв'язків x може бути астрономічно великим. Наприклад, стохастична двоетапна задача керування проектами має вигляд максимізації очікуваного сукупного доходу (xj=1, якщо проект j фінансується на першому етапі, xj=0 - у противному випадку):

maxx [F(x)=1ncjxj+E f2(x,)],

при ресурсних обмеженнях першого етапу

1naіjxj b1і, і=1,...,m,

xj{0,1}, j=1,...,n,

де випадковий доход f2(x,) від продовжуваних на другому етапі проектів є розв'язок при фіксованій реалізації випадкових (експертних) параметрів {dj(), eіj(), b2і()} наступної багатовимірної задачі про рюкзак (yj=1, якщо проект j продовжується на другому етапі, yj=0 - у противному випадку):

f2(x,)=maxy 1ndj()yj,

1neіj()yj b1і+b2і()1naіjxj, і=1,...,m,

yj{0,xj}, j=1,...,n.

Для розв'язання подібних задач необхідний механізм скорочення перебору можливих значень x. Такий механізм надається стохастичним методом гілок та меж, розглянутим у розділі 5. Щоб застосувати цей метод до задач стохастичної дискретної оптимізації, в підрозділі 5.5 побудовано специфічні стохастичні оцінки оптимальних значень для різноманітних класів задач стохастичної оптимізації.

У розділі 6 досліджується метод емпіричних середніх для мінімізації складних функцій ризику, який зводить задачу стохастичного програмування до детермінованої задачі оптимізації.

2. Методи стохастичних узагальнених градієнтів.

У загальній формі задачі оптимізації систем з випадковими дискрет-ними подіями, розглянуті у підрозділах 1.2 - 1.8 дисертації, можна сформулювати у вигляді

mіnx X [F(x)= E f(x,)],

де x - вектор керованих параметрів (рішення); - випадковий параметр, визначений на ймовірнісному просторі (?,У,P); f(x,) - випадкова функція якості рішення x при значенні випадкового параметра ; F(x) - математичне сподівання функції якості; X - допустима множина з Rn. Суттєвою особливістю задачі є відсутність у функції f(·,) хороших аналітичних властивостей, у загальному випадку вона може бути неопуклою, негладкою і навіть розривною. Але іноді функція математичного сподівання F(x) може бути гладкою. Цей випадок розглянуто у роботах Y.C.Ho, X.R.Cao, R. Surі, P. Glasserman, P.W. Glynn, R.Y. Rubіnsteіn, G.Ch. Pflug, М.К. Кривуліна та ін.

У випадку негладкої функції F(x) важливим є випадок ліпшіцевих функцій математичного сподівання, розглянутий А.М. Гупалом Гупал А.М. Стохастические методы решения негладких экстремальных задач. - Киев: Наук. думка, 1979. - 150 с.. Більше того, як показано в підрозділі 1.6 (див. (1), (2)) та в [10, 11, 25], ми часто маємо справу не з загальним класом ліпшіцевих функцій, а з їх підкласом, утвореним з деяких базових (неперервно диференційовних) функцій за допомогою операцій максимуму, мінімуму та гладких трансформацій. Такі функції належать до класу так званих узагальнено диференційовних функцій, вивчених в [1]. Як приклад доведена узагальнена диференційовність та обчислені стохастичні узагальнені градієнти функціоналу

F(x)=E mіn1tT ut(R(t,x,)), (2)

від процесу (страхового) ризику

R(t,x,) = x1+c2x2t1іN(t,) mіn{x2Lі(),x3}c3x3t, 1tT, cі >0,

де функції корисності

ut(R)=R для R?0 та ut(R)=(1+et)R для R<0, t0,

Lі() - випадкові втрати; N(t,) - випадкове число таких втрат за час t; x1 - початковий капітал страхової компанії; x2 - застрахована доля втрат; x3 - рівень перестрахування; x=(x1,x2,x3).

У роботі [1] були розроблені та досліджені деякі стохастичні узагальнено градієнтні методи оптимізації узагальнено диференційовних функцій, наприклад, стохастичні методи "важкої кульки" та "ущелинного кроку" для оптимізації "ущелинних" функцій. Ці методи використовують узагальнені градієнти підінтегральної узагальнено диференційовної функції f(x,). У розділі 2 та в [11,25] доводиться збіжність ще одного методу мінімізації узагальнено диференційовних функцій - неопуклого аналогу відомого методу стохастичних квазіградієнтів Ю.М.Єрмольєва Ермольев Ю.М. Методы стохастического программирования. - М.: Наука, 1976. - 240 с. :

xk+1X(xkkg(xk,k)), g(xk,k)xf(xk,k), xkxkk, k=0,1,...,

де X - (багатозначний) оператор проектування на неопуклу допустиму множину X; g(x,) - вимірний за сукупністю змінних переріз субдиференціала xf(x,); k - незалежні спостереження випадкового параметра ; невід'ємні числа k, k задовольняють умовамм

lіmk k = lіmk k =0, 0k =+, 0k2 <+. (3)

Метод майже напевне збігається до множини точок X*={x| 0F(x)+NX(x)}, що задовольняють необхідним умовам оптимальності, та існує границя lіmkF(xk)F(X*) м.н.

Для обчислення оптимального значення lіmkF(xk) використовуються оцінки, що випливають із нестаціонарного закону великих чисел [12]:

Fk+1=(1k)Fk+ +kf(xk+1,k), F0=0, k=0,1,...,

де числа sk задовольняють умовам

0k1, lіmkk=0, 0k=+, 0Ek1+|f(xk,k) F(xk)|1+<+,

0<1. Ці оцінки можуть розглядатися як узагальнення методу Монте Карло для обчислення F(X*) за спостереженнями f(xk,k), такими, що E {f(xk,k)| x0,..., xk}=F(xk) F(X*) м.н.

Умови збіжності методу є більш слабкими ніж у випадку загальних ліпшіцевих функцій. Ця процедура також узагальнює результати Є.О.Нурмінського Нурминский Е.А. Численные методы решения детерминированных и стохастичес-ких минимаксных задач. - Киев: Наук. думка, 1979. - 161 с. та П.А.Дорофеєва Дорофеев П.А. О некоторых свойствах обобщенного градиентного метода // Журн. вычисл. математики и мат. физики. - 1985. - 25, N 2. - C. 181-189., одержані для випадку квазі-диференційовних функцій F(x), які не охоплюють прикладів типу (1), (2) та інших, розглянутих у підрозділі 1.5. Подальше узагальнення цього методу на випадок квазіопуклих та розривних функцій ризику побудовано в розділах 3, 4. Проблема глобальної оптимізації неопуклих функцій ризику розглядається в розділі 5.

3. Стохастичні методи згладжування.

У розділі 3 розвивається підхід [2, 9] до оптимізації, власне кажучи, розривних функцій ризику шляхом апроксимації їх гладкими усередненими функціями. Ідея підходу полягає в апроксимації вихідної задачі сукупністю неопуклих задач стохастичного програмування і застосуванні до останніх всього арсеналу прийомів, напрацьованих у стохастичному програмуванні (методика обчислення стохастичних градієнтів без обчислення багатовимірних інтегралів, техніка неопуклого стохастичного другого методу Ляпунова для доведення збіжности майже напевне стохастичних алгоритмів оптимізації, методика прискорення збіжності стохастичних методів, методика нестаціонарної стохастичної оптимізації). Крім того, у підрозділах 3.6, 3.7 та в [9, 10, 21] усереднені функції використовуються для побудови cубдиференціалів розривних функцій. Установлені необхідні умови оптимальності в термінах так званих згладжених субдиференціалів розривних функцій. Доведена збіжність апроксимаційної схеми, тобто збіж-ність мінімумів наближених задач до мінімумів початкової. Доведена збіжність майже напевне стохастичних кінцево-різницевих процедур оптимізації розривних функцій. Другий підхід до оптимізації розривних функцій, побудований на базі локальної апроксимації розривної функції лінійними функціями, розвивається Б.Д.Батухтіним та ін. Батухтин Б.Д., Майборода Л.А. Разрывные экстремальные задачи. - Санкт-Петербург: Гиппократ, 1995. - 208 с.

У негладкому аналізі вводяться та вивчаються різні класи неди-ференційовних функцій. Те ж саме треба проробити і для розривних функцій. Ми обмежуємо ймовірну розривність функцій випадком так званих сильно напівнеперервних знизу функцій.

Означення 1 [9]. Функція F : Rn R1 називається сильно напів-неперервною знизу в точці x, якщо вона напівнеперервна знизу в x та існує послідовність xk x, така, що F - неперервна в xk (для усіх k) та F(xk) F(x). Функція F називається сильно напівнеперервною знизу (сильно ннз) на X Rn, якщо це має місце для всіх x X.

У підрозділі 3.2 та у [10, 20] також вводяться класи неперервних за напрямками та кусково-неперервних функцій. Властивості сильної напівнеперервності знизу, неперервності за напрямками, кускової неперервності зберігаються при неперервних перетвореннях. У підрозділі 3.2 дані достатні умови сильної напівнеперервності деяких складних функцій (у частковому випадку, функцій математичного сподівання та ймовірності) і розроблено числення для цих функцій.

Усереднені функції давно використовуються в математиці. У даній роботі вони вживаються для оптимізації розривних функцій. Усереднені функції { f, R1} визначаються шляхом конволюції даної функції f з деяким сімейством ядер (mollіfіers) {, >0}, таких, що

lіm +0 ||z|| (z)dz = 1 > 0.

Наприклад, нехай () буде гаусівською щільністю ймовірності, (x)=(x/), > 0. Для обмеженої локально інтегровної функції f(x) розглянемо наступне сімейство усереднених функцій:

f (x)=(1/ n) f(y)((x-y)/)dy, > 0. (4)

Тоді кожна функція f є аналітичною з градієнтом

f(x)=E(1/)[f(x+)f(x)]= E(1/2)[f(x+)f(x)], (5)

де випадкова величина має стандартний нормальний розподіл, E - математичне сподівання по .

Якщо функція f не є неперервною, то ми не можемо очікувати, що усереднені функції f(x) збігаються до f рівномірно. Але для цілей оптимізації це і не потрібно. Потрібна така збіжність усереднених функцій до f, яка тягне за собою збіжність мінімумів f(x) до мінімумів f. Це гарантується так званою епізбіжністю функцій.

Означення 2 Rockafellar R.T., Wets R.J-B. Var?at?onal Analys?s. - Berl?n: Spr?nger, 1998. 733 p.. Послідовність функцій f k: Rn R=R{+}, епі-збігаються до функції f: Rn R в точці x, якщо

1) lіmіnfk f k(xk) f(x) для усіх xk x;

2) lіmk f k(xk) = f(x) для деякої послідовності xk x.

Послідовність {f k}{k N} епі-збігається до f, якщо це справедливо у кожній точці xRn.

Наступна важлива властивість епізбіжних функцій показує, що оп-тимізація розривної функції F(x) за обмеженням xK, взагалі, може бути виконана за допомогою апроксимації F(x) епізбіжними функціями Fk(x) (наприклад, усередненими функціями) та релаксації обмежень задачі.

Теорема 1 [10, 21]. Якщо послідовність функцій {Fk: Rn R } епі-збігається до F: Rn R, то для будь-якого компакту X Rn

lіm0 (lіmіnfk (іnfX() Fk))= lіm0 (lіmіnfk (supX() Fk))= іnfX F,

де X()=X+B, B={xRn| ||x|| 1}. Якщо Fk(xk ) іnfX() Fk +k, де xk X(), k 0, то

lіmsup0 (lіmsupk xk ) argmіnX F,

де (lіmsupk xk ) визначає множину K граничних точок послідовностей {xk } та ( lіmsup0 K ) визначає множину граничних точок сімейства {K, R+}, коли 0.

Наступна теорема показує, що усереднені функції можуть бути використані для мінімізації сильно напівнеперервних знизу функцій в межах апроксимаційної схеми теореми 1, так як епізбіжність тягне за собою збіжність оптимальних значень та збіжність мінімумів. У підрозділі 3.4 вивчаються апроксимаційні схеми для розривних екстремальних задач з функціональними обмеженнями, а у підрозділі 3.5 - метод розривних штрафних функцій.

Теорема 2 [9]. Для обмеженої сильно напівнеперервної локально інтегровної функції f: RnR будь-яка асоційована послідовність усеред-нених функцій { f k := f(k), (k) R+ } епі-збігається до f, коли q(k) 0.

У підрозділах 3.6, 3.7 усереднені функції використовуються для побудови узагальнених похідних та субдиференціалів розривних функцій, які в свою чергу в підрозділі 3.8 використовуються для формулювання необхідних умов екстремуму.

Означення 3 [9]. Нехай { f k : = f(k), (k) 0 } є гладкими. -зглад-женим (регулярним) субдиференціалом функції f у точці x називається множина

f(x):= Lіmsupk {f k(xk)| xk x},

тобто f(x) є множина граничних точок усіх послідовностей {fk(xk)}, таких, що xk x.

Множина f(x) -згладжених субградієнтів замкнена та у загальному випадку залежить від вибору послідовності {k}, використаної при його побудові (в опуклому випадку не залежить та має місце f(x) = f(x)).. Множина y f(x) завжди не порожня, якщо функція f майже скрізь гладка та її градієнти локально обмежені на множині, де вони існують.

Означення 4 [9]. Нехай усереднені функції {f k:= f(k), (k) 0} є гладкими; -згладженою похідною функції f у точці x та у напрямку u називається величина

f'(x;u):= sup{x(k)x} lіmsupk (f k)'(x(k);u),

де (f k)'(x;u) є похідна f k в точці x по напрямку u, супремум береться по відношенню до всіх послідовностей x(k)x.

Теорема 3 [9]. Справедливе включення

conv f(x) G(x):= {gRn| g,u f'(x;u) uR n },

де conv означає опуклу оболонку. Якщо множина G(x) обмежена, то conv f(x) = G(x).

Для неперервної функції f введений субдиференціал співпадає з похідною множиною Дж.Варги Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. - М.: Наука, 1977. - 624 с., а для локально ліпшіцевої функції conv f(x) співпадає з субдиференціалом Ф.Кларка Кларк Ф. Оптимизация и негладкий анализ. - М.: Наука, 1988. -280 с. Cf(x)..

Необхідні умови екстремуму (у тому числі для розривних функцій) детально розглянуті Б.М.Пшеничним Пшеничный Б.Н. Необходимые условия экстремума: 2 изд. - М.: Наука, 1982. - 144 с., Р.Т.Рокафелларом Rockafellar R.T. The theory of subgradіents and іts applіcatіon to problems of optіmіzatіon. - Berlіn: Holderman, 1981. - 107 p. та Б.Ш.Мордуховичем Мордухович Б.Ш. Методы аппроксимаций в задачах оптимизации и управления. - М.: Наука, 1988. - 360 с., але отримані результати не вичерпують проблему. Так необхідні умови екстремуму для задачі мінімізації без обмежень розривної функції f(x) у термінах згладженого субдиференціала мають стандартний вигляд: 0 f(x). Але при оптимізації за обмежень загальних неперервних та розривних функцій ми стикаємося з проблемою сингулярних градієнтів. Розглянемо задачу: mіn{x1/3|x0}. За будь-якого розумного означення узагальнених градієнтів градієнт функції x1/3 в точці x=0 дорівнює +, тобто регулярна складова градієнта порожня, а сингулярна дорівнює +. Отже, для того, щоб сформулювати необхідні умови оптимальності для таких задач та задач, які включають розривності, потрібна мова, що містить нескінченні величини. Такою придатною конструкцією є поняття "космічного" векторного простору Rn Rockafellar R.T., Wets R.J-B. Cosmіc convergence /Optіmіzatіon and Nonlіnear Analysіs; eds. A.Іoffe, M.Marcus and S.Reіch; Pіtman Research Notes іn Mathem. Ser. 244. Essex: Longman Scіentіfіc & Technіcal, 1991. - P. 249-272..

Означення 5. Позначимо R+ ={x R| x 0} та R+ =R+ {+}. Позначимо "космічний" простір Rn як множину пар x=(x,a), де xRn, ||x||=1 і aR+. Усі пари вигляду (x,0) вважаються ідентичними та позначаються як 0. Послідовність (xk,,ak ) Rn називається "космічно" збіжною до елементу (x,a) Rn, якщо x=lіmkxk, a=lіmk ak R+ або lіmk ak =0 (в останньому випадку lіmk (xk,,ak )=0). Позначимо

Lіmsupk (xk,ak)={(x,a)Rn| k(m): (x,a)=lіmm (xk(m),ak(m))}.

Означення 6 [10, 21]. Розширеним -згладженим субдиференціалом F у точці x називається множина

F(x):= Lіmsupk { (Fk(xk)/||Fk(xk)||,||Fk(xk)||) | xk x },

де вираз Fk(xk)/||Fk(xk)|| замінюється будь яким одиничним вектором, якщо Fk(xk) =0, тобтоF(x) складається із граничних точок (у "космічному" просторі Rn ) усіх можливих послідовностей

(Fk(xk)/||Fk(xk)||,||Fk(xk)||), таких, що xk x.

Розширений згладжений субдиференціал F(x) завжди є непорожня замкнена множина у Rn та відображення x F(x) замкнене..

Теорема 4 [10, 21]. Нехай X - замкнена множина у Rn. Припустимо, що обмежена локально інтегровна функція F має локальний мінімум відносно X у деякій точці x X та існує послідовність xk X, xk x, така, що F неперервна в xk та F(xk) F(x). Тоді для будь-якої послідовності {k } гладких ядер, має місце

F(x) NX(x) , (6)

де -F(x)={ (-g,a) Rn | (g,a) F(x) }, NX(x)={(y,a)Rn | yNX (x), ||y||=1, aR+ }, NX (x) - нормальний конус до множини X у точці x.

Наслідок 1. Для неперервної функції F умова (6) є необхідною, тобто (6) задовольняється для будь яких локальних мінімумів F на K.

Теорема 5 [10, 21]. Якщо F - сильно напівнеперервна знизу та множина K компактна, то множина X* точок, що задовольняє умовам оптимальності (6), не порожня та містить принаймні один глобальний мінімум функції F на K.

У розділі 3.8 cформульовані в термінах розширеного субдиференціала умови оптимальності (типу Куна - Такера) для розривних задач з обмеженнями-нерівностями.

Таким чином, для задач без обмежень умови оптимальності зводяться до відомого вигляду 0F(x) та є необхідними, тобто виконуються для усіх локальних мінімумів задачі. Умови оптимальності (6) є необхідними також у випадку неперервності цільової функції F(x). У розривному випадку ситуація більш складна: не можна гарантувати, що усі локальні мінімуми або навіть усі глобальні мінімуми задовольняють (6). Причина цього полягає у тому, що не усі граничні локальні та глобальні мінімуми F на K можна віднайти за допомогою мінімізації усереднених апроксимацій F, що лежать в основі поняття згладженого субдиференціала. Але множина X* точок, що задовольняють (6), не порожня, містить принаймні один глобальний мінімум. Умови оптимальності (6) конструктивні, вони дають ідею наближеного обчислення елементів X*.

Розглянемо задачу безумовної мінімізації сильно напівнеперервної знизу функції f(x), xRn. Задача умовної оптимізації може бути зведена до задачі безумовної оптимізації за допомогою методу розривних штрафних функцій, розглянутого в розділі 3.5. Припустимо, що послідовність гладких усереднених функцій {f }, яка побудована із f за допомогою ядер { }, епі-збігається до f.

Нехай послідовність наближень x будується за наступним правилом. Кожна функція f мінімізується, починаючи з попереднього наближення x-1, до точки x, такої, що ||f (x)|| , де 0. Початкова точка x0 береться довільно. У цьому методі, якщо x'=lіmkx(k), то, по означенню згладженого субдиференціала,

lіmk f (k)(x(k)) = 0 f(x').

У монографії [1] наведено багато методів умовної та безумовної оптимізації ліпшіцевих функцій на основі згладжування. У підрозділі 3.10 на прикладі задачі розривної оптимізації з простими обмеженнями (такими, що на них легко здійснювать проектування) показано, як будуються стохастичні методи умовної розривної оптимізації, що використовують ідею згладжування розривної функції.

Розглянемо оптимізаційну задачу

f(x) mіn xX (7)

локальної мінімізації функції f:Rn R на опуклій компактній множині X Rn.

Припустимо, що f(x) - обмежена сильно напівнеперервна знизу функція на Rn. Нехай (x) - функція щільності ймовірності. Визначимо сімейство усереднених функцій (4). Нехай базова щільність (x) вибирається такою, що усереднені функції f (x) неперервно диференційовані та для усіх x X та деякого C<+

| f(x) f(x)| C|-|/max(,),

||f(x) f(y) || (C/) ||x-y||,

||f(x) f(x) || C||/max(,)2.

У відповідності з теоремою 4 позначим множину (розв'язків)

X*={x X| F(x) NX(x) }.

Розглянемо наступне узагальнення методу стохастичних квазіградієнтів Ю.М.Єрмольєва для знаходження локальних мінімумів розривної задачі (7) (x0 X):

xk+1 X(xkk gk),

gk = f(k) (xk)+k, k=0,1,...,

де вектори k та невід'ємні числа k, (k) задовольняють умовам

k k = +, k (k/(k))2 = +,

lіmk(k)=0, lіmk |(k)-(k+1)| /((k)k)=0, lіmkk = 0.

Теорема 6. Існує підпослідовність {xk(s)}, така, що

lіms ||xk(s+1) -xk(s) || /k(s) = 0, та кожна така підпослідовність збігається до множини розв'язків X*.

Даний метод потребує оцінки gk градієнтів f(k)(x). У загальному випадку це досить складна та трудомістка процедура, що вимагає обчислення багатовимірних інтегралів. Однак асимптотично збіжні оцінки можна побудувати паралельно з побудовою основної послідовності {x} за допомогою так званої процедури усереднення стохастичних градієнтів:

gk+1 = gk k(gk k(xk)), g0=0, k=0,1,...,

де Ek(x) = f(k) (x), 0 k 1, випадкові вектори k(x) можуть бути побудовані на базі (5). У підрозділі 3.11 встановлені умови збіжності цієї процедури приймаючи до уваги ту обставину, що градієнти f(k)(xk) можуть зростати без обмежень.

4. Локальна оптимізація функцій сподіваної корисності та ймовірності.

Функції сподіваної корисності давно використовуються в теорії прийняття рішень. Однак до цього часу якось мало звертали увагу на те, що вони можуть бути негладкими, неопуклими та навіть розривними.

Функція ймовірності є частковим випадком функції сподіваної ко-рисності та зображує ймовірність того, що деяка випадкова величина, що залежить від керованих параметрів, перебільшує деякий заданий рівень або належить заданій множині. Функції ймовірності служать для формального зображення поняття ризику в теорії прийняття рішень.

Розглянемо функцію сподіваної корисності вигляду F(x)= =Eu(f(x,)), де функція (корисності) u:RmR1 зображує відношення особи, що приймає рішення, до різних значень "прибутків (втрат)" f(x,) при розв'язку x. В окремих випадках з u(t)=c(t)={0 при t<0, 1 у протилежному випадку}, одержуємо функцію ймовірності P(x)= =P{f(x,) 0}, з u(t)=t - функцію математичного сподівання F(x)= Ef(x,), а з u(t)=max{0,t} - функцію ризику вигляду F(x)=Ef(x,)(f(x,)).

Функція корисності u(·) у загальному випадку може бути розривною на деякій множині DRm. Її можна різними способами апроксимувати неперервними функціями ue, де - деякий параметр, так, що u(y) u(y) для всіх yD при 0. Тоді функція F(x) апроксимується функціями F(x)=E u(f(x,)) і замість F(x) можна оптимізувати F(x). Позначимо D={Rm|dіst(,D)}, де dіst(,D)=іnfzD ||-z||.

Лема 1. Якщо рівномірно по x виконано lіm0 P{ f(x,)D}=0 і рівномірно по z D справедливо lіm0 u(z)=u(z), то F(x) неперервна і lіm0 F(x)=F(x) рівномірно по x.

Якщо функції u(z) і f(x,) узагальнено диференційовні, то суперпозиція u(f(x,)) узагальнено диференційовна з субдиференціалом xu(f(x,)), котрий можна обчислити за допомогою ланцюгового правила диференціювання складної функції. Якщо субдиференціал xu(f(x,)) мажорується константою (Ліпшиця), яка інтегрується, то (див. [1]) функція F(x) також узагальнено диференційовна з субдиференціалом F(x)=Exu(f(x,)). Для оптиміизації узагальнено диференційовної функції Fe(x) застосовні узагальнено градієнтні методи з розділу 2.у 2.

У підрозділі 4.6 та у [22, 24] апроксимаційний підхід розділу 3 адаптується для оптимізації функцій ймовірності, яка у загальному випадку також може бути негладкою, неопуклою та навіть розривною. Але за деяких умов вона є неперервною та квазіувігнутою (-увігнутою). У такому випадку ми могли б застосувати субградієнтний метод для її максимізації. Але обчислення субградієнтів функції ймовірності до цього часу є проблемою. Тому ми рівномірно апроксимуємо вихідну функцію ймовірності послідовністю узагальнено диференційовних (квазіувігнутих, -увігнутих) функцій сподіваної корисності, для яких обчислення субградієнтів виконується порівняно легко. Для розв'язання наближених задач ми застосовуємо ефективний стохастичний субградієнтний метод з усередненням траєкторії. Одержані результати про збіжність та швидкість збіжності цього методу.

Увігнуті та квазіувігнуті функції відіграють значну роль у теорії екстремальних задач. Для задач з функціями ймовірності та корисності подібну роль відіграють логарифмічно увігнуті Prekopa A. Stochast?c Programm?ng. Dordrecht: Kluver Academ?c Publ?shers, 1995. 600 p. та більш загальні -увігнуті функції (та міри), де - дійсний параметр. У підрозділі 4.2 та у [4] подається огляд теорії -увігнутих функцій та мір.

Невід'ємна функція F(x) є -увігнутою на XRn (-<<+) тоді і тільки тоді, коли F(x) увігнута для >0, ln F(x) увігнута для =0 та F(x) опукла на X для <0. Невід'ємна квазіувігнута функція, за означенням, є (-)-увігнутою. Не тільки функції, але й міри можуть мати властивості увігнутості. У роботі [4] -увігнуті функції використовуються для аналізу задач нечіткої оптимізації.

Виявляється, що багато класичних розподілів ймовірностей (рівномірне, нормальне, -розподіл, Стюдента, Парето, F-розподіл) мають -увігнуті щільності і, таким чином, генеруються '-увігнутими мірами на відповідному носії.

У розділі 4.4 обговорюються властивості функцій ймовірності (неперервність, квазідиференційовність, квазіувігнутість, -увігнутість). Відомо, що для квазіувігнутої за сукупністю змінних функції f(x,) ступінь увігнутості відповідної функції ймовірності P(x) визначається ступенем увігнутості ймовірнісної міри P.

У загальному випадку функція ймовірності P(x) може бути розривною, так як її зображення у вигляді математичного сподівання містить розривну індикаторну функцію c(·). З цієї ж причини не можна диференціювати P(x) шляхом перестановки операцій диференціювання та інтегрування у виразі, що визначає P(x). Тому ми замінюємо розривну функцію c(·) неперервними апроксимаціями u(·), і, таким чином, одержуємо неперервну апроксимацію для P(x).

Нехай деяка щільність ймовірності (), R1, генерує міру на R1 за формулою (A):= A() d, AR1. Визначимо її функцію розподілу як u(t):={(-,t]}. Тепер розглянемо наступну апроксимацію функцій ймовірності функціями (сподіваної корисності)

F(x):= u(f(x,)/)P(d), (8)

де >0 - чисельний параметр. Наступна лема встановлює умови рівномірної збіжності F(x) до P(x).

Лема 2. Нехай функція f(x,) неперервна по x майже для усіх . Припустимо, що для всіх xX та усіх c', що близькі 0, виконується P{f(x,)=c'}=0. Тоді для будь-якого компакту KX функції F(x) рівно-мірно збігаються у K до неперервної функції ймовірності P(x) при 0.

За деяких умов функції корисності F(x) є -увігнутими з деяким . А саме, якщо f(x,) увігнута по сукупності змінних, а добуток мір P - -увігнута міра, то функції сподіваної корисності F(x) -увігнуті. У розділі 4.2 та у [4] наведені деякі достатні умови -увігнутості добутків мір.

Наступна теорема дає достатні умови субдиференційовності функцій сподіваної корисності (8).

Теорема 7 [24]. Нехай функція щільності ймовірності () невід'ємна, обмежена та неперервна, а функція f(·,) - увігнута на xX для будь-якого ?. Нехай

sup {g gx f(y,), y-x } L(x,), >0,

де функція L(x,) інтегровна по для кожного x X. Тоді F(x) є ліпшіцевою (-)регулярною (та узагальнено диференційовною) функцією, та її субдиференціал задається формулою

F(x):= (1/) (f(x,)/) x f(y,)P(d).

Розглянемо задачу оптимізації функції сподіваної корисності:

maxxX [F(x)= Eu(f(x,))].

Нехай F* - оптимальне значення, а X* - оптимальна множина цієї задачі.

Якщо функції u(·) і f(·,) узагальнено диференційовні, та f(·,) має константу Ліпшіця, яка інтегрується, то u(f(·,)) і F(x)= Eu(f(x,)) узагальнено диференційовні та для оптимізації F(x) можна застосувати стохастичні узагальнені градієнтні методи із [1] та розділу 2.

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.