Теоретичні основи для реалізації розділу "Елементи функціонального аналізу та диференціальне числення функцій багатьох змінних" курсу математичного аналізу за допомогою комп’ютерних технологій

Елементи функціонального аналізу, приклади метричних просторів. Поняття диференційованої функції, необхідні умови диференційованості. Розробка електронного посібника "Елементи функціонального аналізу та диференціальне числення функцій багатьох змінних".

Рубрика Педагогика
Вид дипломная работа
Язык украинский
Дата добавления 15.09.2017
Размер файла 2,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

.

Це означає, що похідна за напрямком існує і виконується рівність (5.1).

Теорему доведено.

Нехай функція U=f(x,y,z) диференційовна в точці М000,z0). Тоді за теоремою 5.1, в цій точці існує похідна функції за будь-яким напрямком. Часто виникає питання: за яким напрямком ця похідна буде найбільша?

Розглянемо два вектори: одиничний вектор , який визначає напрямок, і , який називається градієнтом функції f(x,y,z) в точці М0(x0,y0,z0), тут - орти. Скалярний добуток (,gradf(x0,y0,z0)) цих векторів, дорівнює:

.

Порівнявши з формулою (5.1) ми бачимо

(5.3).

З іншого боку

(5.4),

де - кут між цими векторами. Так, як , то з формул (5.3), (5.4), одержимо:

(5.5).

Права частина (а значить і ліва), якщо f(x0,y0,z0)0, набуває найбільшого значення при =0. Таким чином, якщо , , одночасно не дорівнюють нулю, то найбільшого значення похідна за напрямком набуває в напрямі градієнта даної функції. Похідна в цьому напрямі дорівнює:

.

Врахувавши, що дорівнює швидкості зміни функції в напрямі, який визначається вектором , то можна сказати, що якщо градієнт функції в точці М0 не дорівнює нулю, то він напрямлений в бік найбільшого зростання функції.

Розділ 3. Частинні похідні і диференціали вищих порядків

§ 1. Частинні похідні вищих порядків

Нехай функція U=f(x1,…,xn) визначена в області D і в кожній точці існує частинна похідна по змінній хі. Тоді ця частинна похідна є функцією змінних х1,...,хп, яка визначена в цій області. Може трапитись, що ця функція в точці має частинну похідну по змінній хк. Тоді цю частинну похідну називають частинною похідною другого порядку або другою частинною похідною функції U=f(x1,…,xn) в точці М0 спочатку по змінній хi, а потім по змінній хк і позначають так: . При цьому, якщо іk, то частинну похідну називають змішаною частинною похідною.

Аналогічно вводяться частинні похідні третього, четвертого і т. д. порядків.

Нехай в області D існує частинна похідна (m=1) порядку по змінних і ця частинна похідна в точці М01(0),...,хп(0)) має частинну похідну по змінній . Тоді цю частинну похідну називають частинною похідною m-го порядку або m-тою частинною похідною функції U=f(x1,…,xn)в точці М0 по змінних . Співвідношення, яке визначає цю частинну похідну записують так:

.

Якщо не всі індекси і1, і2,...,іт співпадають між собою, то частинна похідна називається змішаною.

Розглянемо приклад. Знайти частинні похідні другого порядку функції . Отримаємо

; ; ; ; ; .

§ 2. Достатні умови незалежності змішаних частинних похідних від порядку диференціювання.

В вище наведеному прикладі змішані похідні ; функції були рівні. Наступний приклад показує, що це не завжди так.

Нехай .

Тоді ;

Розглянемо достатні умови незалежності змішаних частинних похідних від порядку диференціювання.

Означення 2.1. Функція U=f(x1,…,xn), називається т раз диференційовною в точці М01(0),...,хп(0)) , якщо всі частинні похідні (т-1)-го порядку є функціями диференційовними в цій точці .

Теорема 2.1. Для того, щоб функція U=f(x1,…,xn) була т раз диференційовною в точці М01(0),...,хп(0)) достатньо, щоб її частинні похідні т-го порядку були визначені в деякому околі точки М0 і були неперервними функціями в цій точці.

Справедливість цього твердження слідує з теореми про достатню умову диференційовності функції.

Теорема 2.2. (про рівність змішаних похідних другого порядку). Якщо функція U=f(x,у) двічі диференційовна в точці М00, у0), то .

Доведення. Так як функція U=f(x;y) двічі диференційовна в точці М0, то частинні похідні f /x(x;y) і f /y(x;y) визначені в деякому околі точки М0.

Розглянемо вираз

=f(x0+h, y0+h)-f(x0+h, y0)-f(x0, y0+h)+f(x0;y0), (2.1),

де h - довільне число, таке, що точка М00+h, y0+h) міститься у вище вказаному околі. Переписавши у вигляді

=(f(x0+h, y0+h))-f(x0+h, y0))-(f(x0, y0+h)-f(x0;y0)),

помічаємо, що це є приростом функції (х)=f(x, y0+h)-f(x, y0) в точці х0. Тобто

=0)=0+h)-0) (2.2).

Оскільки функція (х) на х0, х0+h задовільняє умові теореми Лагранжа, то

=0+1,h)h=(fx(x0+1h,y0+h)-fx(x0+1h,y0))h=(fx(x0+1h,y0+h)-fx(x0,y0)-(fx(x0+1h,y0)-fx(x0,y0)))h (2.3).

де 0<1<1. Так, як fx(x,y)- диференційовна в точці М0, то

fx(x0+1h,y0+h)-fx(x0,y0)=fxx(x0,y0) 1h+fxy(x0,y0)h+1(h) 1h+2(h)h, (2.4).

fx(x0+1h,y0)-fx(x0,y0)=fxx(x0,y0) h+3(h) 1h, (2.5)

при цьому 1(h), 2(h),3(h) прямують до нуля, коли h0.

Підставивши (2.4) і (2.5) в (2.3), одержимо:

=((fxx(x0,y0)1h+fxy(x0,y0)h+1(h)1h+2(h)h)-((fxx(x0,y0)1h+3(h) 1h))h=(fxy(x0,y0)+1(h) 1+2(h)-3(h) 1)h2=(fxy(x0,y0)+1(h))h2 , (2.6),

де 1(h)=1(h)1+2(h)+3(h)1.

Переписавши у наступному вигляді

=(f(x0+h,y0+h)-f(x0,y0+h))-(f(x0,y0+h)-f(x0,y0)),

бачимо, що є приростом функції (y)=f(x0+h,y)-f(x0,y) в точці у0. Застосувавши теорему Лагранжа і врахувавши диференційовність fy(x,y) в точці М0, ми отримаємо наступне представлення для ,

=(fyx(x0,y0)+2(h))h2 (2.7),

при цьому 2()0, коли h0.

Прирівнявши праві частини рівностей (2.6) і (2.7) і скоротивши на h2, отримаємо:

fxy(x0,y0)+1(h)=fyx(x0,y0)+2(h) (2.8).

Перейшовши до границі, коли h0, отримаємо:fxy(x0,y0)=fyx(x0,y0). Теорема доведена.

Наступна теорема теж дає достатні умови рівності змішаних похідних другого порядку.

Теорема 2.3. Нехай в деякому околі точки М000) функція U=f(x,y) має частинні похідні fx, fy, fxy, fyx. Якщо fxy і fyx неперервні в М0, то fxy(x0,y0)=fyx(x0,y0).

Доведення. Розглянемо =f(x0+h, y0+h)-f(x0+h, y0)-f(x0, y0+h)+f(x0;y0). Замітимо, що =0), де (х)=f(x, y0+h)-f(x, y0). Застосувавши теорему Лагранжа до (х), отримаємо:

=(fx(x0+1h,y0+h)-fx(x0+1h,y0)), де 0<1<1.

Застосувавши теорему Лагранжа до функції t(y)=fx(x0+1h,y) на відрізку у00+h, одержимо

=fxy(x0+1h,y0+2h)h2, 0<2<1.

Внаслідок неперервності fxy(x,y) в точці 00), маємо

=(fxy(x0,y0)+1(h))h2 (2.9),

де 1(h)0, коли h0. Представивши у вигляді =(у), де (у)=f(x0+h,y)-

-f(x0,y), аналогічно одержуємо

=(fyx(x0;y0)+2(h))h2 (2.10),

де 2(h)0, коли h0. Прирівнявши праві частини рівностей (2.9) і (2.10), скоротивши на h2 і перейшовши до границі, коли h прямує до нуля, отримаємо fxy(x0;y0)=fyx(x0;y0).

Теорема 2.4. Якщо U=f(x0;…;xn) m разів диференційовна в точці М0, то змішана частинна похідна, в цій точці, не залежить від порядку повторного диференціювання.

Доведення. Очевидно, достатньо довести незалежність значень давільної т-тої змішаної похідної від порядку проведення двох послідовних диференціювань. Тобто достатньо довести рівність:

(2.11).

Розглянемо функцію . Ця функція є диференційовною функцією від змінних, тому внаслідок теореми 2.2. маємо:

.

Звідси і слідує рівність (2.11). Теорему доведено.

§ 3. Диференціали вищих порядків

Нехай маємо функцію U=f(x1,…,xn), яка диференційовна в деякій області D. Тоді в кожній точці цієї області існує диференціал , який є функцією від змінних х1,...хп.

Припустимо, що в точці М01(0),...,хп(0)) наша функція двічі диференційовна. Тоді диференціал від диференціала 1-го порядку, називається другим диференціалом або диференціалом 2-го порядку і позначається d2U=d(dU).

Нехай х1,...хп- незалежні аргументи, тоді

.

Врахувавши, що змішана частинна похідна не залежить від порядку диференціювання, одержимо:

Введемо символ . Тоді dU можна записати у вигляді ;

.

Аналогічно під диференціалом 3-го порядку будемо розуміти d(d2U). Якщо хі незалежні аргументи, то міркуючи аналогічно можна одержати, що

.

Аналогічно вводиться диференціал k-го порядку функції U і символічна форма його буде такою:

.

При цьому піднесення символа до степеня k виконується аналогічно, як піднесення многочлена до цього степеня.

Коли ми розглядали диференціал 1-го порядку, то його форма не залежала від того чи хі незалежні змінні, чи є функціями від інших змінних.

Подивимось, чи зберігається форма диференціала, для вищих порядків. Для простоти, розглянемо функцію 2-х змінних.

Нехай U=f(x;y) і при цьому х і у є функціями від інших змінних. Тоді

d2U=d(dU)=d(fxdx+fydy)=d(fxdx)+d(fydy)=dxd(fx)+fxd(dx)+dyd(fy)+fyd(dy)=.

Як бачимо, тут появилося два доданки, яких не було в диференціалі 2-го порядку, коли х і у незалежні змінні. Отже, диференціал 2-го, а значить і вищих порядків, не має властивості інваріантності форми, якою володіє диференціал 1-го порядку.

Проте, легко бачити, що якщо хі лінійно залежать від змінних t1,…,tk, то диференціали d2x1=d2x2=…=d2xn=0 і при цьому форма диференціала зберігається. В цьому випадку можна записати:

.

§ 4. Формула Тейлора для функцій багатьох змінних

Як відомо, для функції U=F(t) (п+1) раз диференційовної в околі точки t0, має місце рівність:

,

де 0<<1.

Запишемо дещо по-іншому цю формулу. Нехай t-t0=t, тоді:

F(t)-F(t0)=F(t0)

(4.1)

Дивлячись на цей вигляд формули Тейлора, неважко догадатись, що її можна перенести і на функції багатьох змінних.

Теорема 4.1(Формула Тейлора для функції багатьох змінних)

Нехай функція U=F(x1;x2;…;xk) (n+1) раз диференційовна в деякому околі точки М01(0),....,хк(0)), тоді справедлива рівність:

, (4.1)

де і точка N(х1,...,хк) належить заданому околу. В диференціалах, які стоять справа, dxi=xi=xi-xi(0), останній доданок цієї формули, називається залишковим членом формули Тейлора у формі Лагранжа.

Доведення. Для простоти викладу доведемо цю формулу для функції двох змінних.

Нехай функція U=F(x1;x2), яка (п+1) разів диференційовна в околі точки М01(0);x2(0)).

Візьмемо точку М11(0)+х1;x2(0)+x2). Проведемо через точки М0 і М1 пряму, рівняння якої буде: ;

Звідки ; .

При цьому, якщо t0;1, то М(х1;x2) пробіжить відрізок М0М1.

Розглядатимемо функцію U=F(x1;x2) лише в точках відрізка М0М1. На цьому відрізку ця функція є функцією однієї змінної t: U=F(x1(0)+tx1;x2(0)+tx2)=f(t). З того, що х1, і х2 є лінійними функціями від t і задана функція (п+1) разів диференційовна в околі точки М0 слідує, що ця складна функція по t є (п+1) раз диференційовною в околі точки t0=0. Тоді з формули (4.1), одержуємо:

(4.2).

Замітимо, що в нашому випадку

f(0)=F(x1(0)+x1;x2(0)+x2)-F(x1(0);x2(0))=f(1)-f(0)=

Оскільки, як ми встановили вище, диференціали вищих порядків мають властивість інваріантності форми, якщо змінні лінійно залежать від інших аргументів, (від t), то всі інші доданки формули (4.2) матимуть вигляд

; k=1,2,…n

,

де NМ0;M1. Врахувавши це все, і, підставивши у формулу (4.2), ми одержимо формулу Тейлора, де в точці N, буде деяка точка на М01. Теорему доведено.

Дана формула Тейлора дозволить нам в наступних параграфах вирішувати проблеми екстремумів функцій багатьох змінних.

Розділ 4. Неявні функції

§ 1. Існування неявної функції однієї змінної

Розглянемо криву х22=1, це є коло.

Зрозуміло, що якщо точка М0 належить колу і не належить його горизонтальному діаметру, то завжди можна знайти окіл точки такий, що в ньому дане рівняння задає єдину функцію у від х, що визначена на проекції цієї дуги на вісь ОХ, тобто х, що належить проекції у(х):х2+у(х)2=1. Будемо казати, що рівняння х22=1 задає неявну функцію у від х.

Нехай функція F(x;y) визначена на множині ЕR2 і Х - проекція цієї множини на вісь ОХ.

Будемо говорити, що рівняння F(x;y)=0, задає у, як функцію від х, у=f(х) на множині Х, якщо хХ існує пара (х;f(x))Е, яка задовільняє рівняння F(x;y)=0, тобто F(x;f(x))=0 є тотожністю на множині Х.

В нашому прикладі , .

Ми бачимо, що в околі точки М0 це рівняння задаває єдину функцію у(х), щоб знайти її явне вираження, ми розв'язали наше рівняння відносно у. Та це вдасться зробити не завжди. Одже виникає така задача: як маючи певні властивості функції F, прогнозувати існування цієї неявно заданої функції, а також, які властивості повинна мати F, щоб ця неявно задана функція була, наприклад, неперервною чи диференційовною.

Зауважимо, що навіть на нашому простому прикладі видно, що якщо ми візьмемо т. М0(1,0), то такої єдиної визначеної функції, як вище вже не буде. Якщо ми спроектуємо будь-який окіл цієї точки М0 на ОХ, то помітимо, що на інтервалі, що належить проекції цього околу, рівняння кола задає безліч функцій у(х).

Теорема 1.1. Нехай:

1) функція F(x;y) неперервна разом із своїми частинними похідними Fx і Fy в деякому уколі т. М000);

2) Fy в точці (x0;y0) не дорівнює нулю;

3) F(x0;y0)=0.

Тоді в деякому прямокутнику П={(x;y) x0-1<x<x0+1, y0-2<y<y0+2}, рівняння F(x;y)=0 задаватиме єдину функцію у=f(x), яка задовільняє наступним умовам:

1) ця функція буде неперервною на інтервалі (х0-1;x0+1);

2) на цьому інтервалі існує f(x), яка буде неперервною.

Доведення. Нехай . З умов 1,2 теореми випливає, що деякий окіл т. М0, такий, що для всіх точок М, з цього околу, F(x;y) буде диференційовною і Fy(x;y)>0

Впишемо в цей окіл замкнений прямокутник з центром в точці М0 , сторони якого паралельні до координатних осей. Проведемо через т.М0 відрізок в прямокутнику паралельний до ОУ, розглянемо функцію Fy(x;y). В точках відрізка АВ вона матиме вигляд Fy(x0;y) (вона є похідною від функції F(x0;y) по змінній у). Оскільки Fy(x0;y)>0 і y0-2yy0+2, то функція F(x0;y) є монотонно зростаючою на сегменті [y0-2; y0+2].Звідси і з того, що F(x0, y0)=0 одержуємо, що F(x0, y0-2)<0, F(x0;y0+)>0 тобто, інакше кажучи, F(A)<0, F(B)>0. Так, як функція F(x,y) є неперервна в точці А і в точці В (тому що обидві ці точки належать околу де вона є неперервною), то існують окіл точки А і окіл точки В такі, що в межах першого F(x;y)<0, а другого F(x;y)>0. Не зменшуючи загальності, можна вважати, що радіуси цих околів рівні. Якщо радіус цього околу 1 , то із вище сказаного слідує, що для будь-якого х, який належить (х0-1, х0+1), F(x,y0-2)<0, a F(x,y0+2)>0.

Візьмемо будь-яке х, яке належить (х0-10+1) і проведемо через це х пряму, перпендикулярну до ОХ. Оскільки точка А лежить на відрізку А1А2, а в кожній точці цього відрізка F(x;y)<0, то F(A)<0. Аналогічно F(B)>0.

Розглянемо функцію F(x;y) на відрізку АВ. На цьому відрізку вона є функцією однієї змінної у (бо тут х зафіксоване). При цьому вона буде неперервною на [y0-2;y0+2] і строго зростаючою. Оскільки в лівому кінці інтервала вона приймає від'ємне значення, а в правому - додатнє, то із всього сказаного вище випливає (за теоремою Больцано-Коші), існування єдиного у із інтервала (y0-2;y0+2) такого, що F(x;y)=0.

Таким чином ми встановили, що на інтервалі (х0-10+1) існує єдина функція y=f(x) така, що F(x,f(x))=0 на цьому інтервалі.

Покажемо, що функция f(x) неперервна на інтервалі (х0-10+1). Нехай х(х0-10+1). Дамо х приріст х. Тоді функція одержить приріст y.

Точки (x;y) і (х+х;y+y), де y=f(x), y+y=f(x+y) задовільняють рівнянню F(x;y)=0. Таким чином

F(x;y)=F(х+х;y+y)-F(x;y)=0.

Використовуючи теорему Лагранжа, одержимо:

0=F(х+х;y+y)-F(x;y)=(F(х+х;y+y)-F(x;y+y))+(F(x;y+y)-F(x;y))=

=Fx(x+x;y+y)x+Fy(x;y+1y)y,

де 0<<1, 0<1<1. Так, як Fy?0, то

(1.1).

Оскільки Fx і Fy неперервні у замкнутому прямокутнику і Fy >0, то існують М>0 і т>0 такі, що Fx ?M і Fy>m.

Таким чином . Звідси маємо . Якщо х0, то y0, а це і означає, що f(x) неперервна в точці х.

Покажемо, що існує похідна f(x) для будь-якого х(х0-10+1). Нехай х(х0-10+1). Надамо х приріст х. Тоді функция одержить приріст у. Якщо х0 то і у0. При цьому , де 0<<1, 0<1<1. Враховуючи, що Fx і Fу неперервні і Fу?0, перейшовши до границі, коли х0, одержимо:

.

А це і означає, що похідна в точці х існує і

.

Крім цього, як випливає з останньої формули,є неперервна на інтервалі (х0-;x0+) тому, що чисельник і знаменник останньої рівності є композиція неперервних функцій і і у=f(x). Теорему доведено.

§ 2. Існування неявної функції багатьох змінних

У цьому параграфі ми розглянемо узагальнення вище доведеної теореми для випадку функції двох змінних.

Теорема 2.1 Нехай М000,z0)R3 і F(x,y,z) такі, що

1) F(x0,y0,z0)=0;

2) в деякому околі точки М0, функція F(x,y,z) і Fx; Fy;Fz неперервні;

3) Fz(x0,y0,z0)0.

Тоді в деякому паралелепіпеді П={x,y,z: x0-1<x<x0+1, y0-2<y<y0-2,

z0-3<z<z0+3} рівняння F(x,y,z) визначатиме єдину функцію z=F(x,y), яка буде визначена в прямокутнику П1={(х,у): x0-1<x<x0+1, y0-2<y<y0-2}, яка буде неперервно диференційовною в цьому прямокутнику.

Частинні похідні будуть обчислюватися за формулами:

;

Аналогічна теорема має місце для випадку функції від більше ніж 3-х змінних.

§ 3. Існування неявної функції, яка задається системою рівнянь

Іноді буває, що неявні функції задаються системою рівнянь. При цьому має місце така теорема.

Теорема 3.1 Нехай маємо таку систему:

(3.1)

і- точка, координати якої задовільняють кожному рівнянню системи (3.1).

Тоді, якщо:

1) в деякому околі точки М0, існують всі часткові похідні першого порядку функцій F1,…,Fm,при чому частинні похідні , де ; , будуть неперервні в точці М0;

2) величина, яка називається якобіяном і позначається

відмінна від нуля в точці М0, то існують додатні числа 1>0, 2>0,…,m>0 та окіл точки такий, що в ньому існує єдиний набір функцій:

U1=1(x1,…,xn)

U2=2(x1,…,xn)

………………..

Um=2(x1,…,xn),

які є розв'язками системи (3.1). В межах цього околу матимуть місце нерівності:

Кожна з функцій і є неперервною в цьому околі точки М0 та диференційовною в ньому.

В зв'язку з цією теоремою виникає питання, а як же знайти частинні похідні від функцій і, які одержалися в попередній теоремі. Адже із формулювання зрозуміло, що теорема стверджує тільки існування тих функцій і не дає можливості їх явно задати. Отже, як знайти їх частинні похідні?

Для цього продиференціюємо кожне із рівнянь системи (3.1) по змінній х1. Зважаючи на те, що хі - незалежні змінні, а Ui - функції від х1...хп, матимемо:

……………………………………………

Ми одержимо систему m лінійних рівнянь відносно т невідомих . Головний визначник цієї системи це є якобіян, взятий в точці М0, який за умовою теореми не дорівнює нулю.

Розв'язавши цю систему, ми знайдемо

Для того, щоб знайти частинні похідні по інших змінних зробимо те саме.

Розділ 5. Екстремуми функцій

§ 1. Поняття екстремума функцій багатьох змінних

Нехай функція U=f(x1,x2,…,xn) задана на множині ЕRп.

Означення 1.1 Будемо говорити, що в точці функція має максимум, якщо існує окіл цієї точки такий, що для будь-яких точок М із цього околу, які належать множині Е, виконується нерівність: f(M)?f(M0).

Означення 1.2 Будемо говорити, що в точці функція має мінімум, якщо існує окіл цієї точки такий, що для будь-яких точок М із цього околу, які належать множині Е, виконується нерівність: f(M)?f(M0).

Як і в одномірному випадку точки максимуму та мінімуму функції називають точками екстремуму.

Теорема 1.1. (Необхідні умови існування екстремуму).

Нехай функція U=f(x1,…xn), яка задана в області D, має в точці екстремум. Якщо в цій точці існують всі її частинні похідні 1-го порядку, то всі вони дорівнюють нулю: .

Доведення. Нехай дана функція в даній точці має максимум. Тоді функція , як функція від однієї змінної по х1має в точці х01 теж максимум, причому похідна в цій точці дорівнює частинній похідній . Оскільки функція має похідну в цій точці і ця точка є для неї точкою максимуму, то за відомою теоремою з одномірного аналізу її похідна, а отже і , аналогічно і з всіма іншими частинними похідними.

Аналогічно доводиться теорема, коли функція має мінімум.

Теорему доведено.

Означення 1.3 Точку М0, в якій всі частинні похідні функцій , або не існують, називають критичною точкою цієї функції.

Точки в яких всі частинні похідні 1-го порядку дорівнюють нулю, називають ще й стаціонарними.

Таким чином, щоб функція мала екстремум в даній точці необхідно, щоб ця точка була критичною. Наступний приклад показує, що це не є достатньою умовою.

Розглянемo функцію z=xy. Точка (0,0) тут є критичною, але в ній екстремуму немає. Бо який би ми окіл не взяли, в ньому існують точки в яких значення функції більші від значень функції в точці (0,0) та існують точки, в яких значення функції менші.

§ 2. Деякі відомості з теорії квадратичних форм

В цьому параграфі ми розглянемо деякі питання теорії квадратичних форм, які нам будуть потрібні надалі.

Означення 2.1 Функція

, аіk=сonst, (2.1),

яка залежить від змінних h1, h2,…, hn, називається квадратичною формою від вказаних змінних.

Означення 2.2 Квадратична форма називається додатньо визначеною (від'ємно визначеною), якщо при будь-яких значеннях h1, h2,…, hn, одночасно не рівних нулю, вона набуває додатніх (від'ємних) значень.

Додатньо визначені та від'ємно визначені форми називаються знаковизначеними.

Означення 2.3 Квадратична форма називається знакозмінною, якщо вона приймає як додатні так і від'ємні значення.

Означення 2.4 Квадратична форма називається квазізнаковизначеною, якщо вона приймає лише недодатні або лише невід'ємні значення, але при цьому вона дорівнює нулю при деяких h1, h2,…, hn, які одночасно не дорівнюють нулю.

Сформулюємо критерій Сільвестера знаковизначеності квадратичних форм.

Симетричну матрицю будемо називати матрицею квадратичної форми (2.1). Визначники А111, ,..., називаються головними мінорами матриці А квадратичної форми.

Теорема 2.1 Для того, щоб квадратична форма (2.1) була додатньо визначеною необхідно і достатньо, щоб виконувалися нерівності:

А1>0, A2>0,…, An>0 (2.2).

Для того, щоб квадратична форма була від'ємно визначеною необхідно і достатньо, щоб знаки головних мінорів А1, А2,..., Ап чергувалися, причому А1>0.

Очевидно диференціал другого порядку функції U=f(x1, x2,…,xn) в точці М0(0)1,...,х(0)п) є квадратичною формою змінних х1, х2,...,хп.

Для формулювання достатніх умов існування екстремуму функції багатьох змінних використовуються квадратичні форми.

§ 3. Достатні умови існування екстремуму

Розглянемо достатні умови існування екстремуму.

Теорема 3.1 Нехай функція U=f(x1, x2,…, xn) має в деякому околі стаціонарної точки М0 частинні похідні до 2-го порядку включно, причому вони неперервні в точці М0. Тоді, якщо в точці М0 диференціал 2-го порядку цієї функції є знаковизначеною квадратичною формою, то в цій точці функція має екстремум: максимум, якщо ця форма від'ємно визначена та мінімум, якщо-додатньо визначена. Якщо диференціал 2-го порядку в цій точці є знакозмінною квадратичною формою, то екстремуму в точці М0 немає.

Доведення. З умови теореми маємо, що наша функція двічі диференційовна в деякому околі точки М0. Тому для будь-якої точки М з цього околу за формулою Тейлора матимемо, що

,

при цьому , N - проміжна точка з координатами N=(x(0)1+1x1; x(0)2+2x2,…, x(0)n+nxn), де 0<1<1,…,0<n<1.

,

де , коли (х1,...,хп)(0,...,0).

Нехай тоді

.

Розглянемо поведінку множника в другому доданку при 2: коли (х1,...,хп)(0,...0).

Таким чином , де ()0, коли 0.

Отже ми тільки що довели, що для будь-якої точки М справедлива рівність:

(3.1).

Перетворимо перший доданок останньої рівності:

=,

де , hi1 і h12+…+hn2=1.

Звідси і з (3.1) будемо мати:

(3.2).

Нехай диференціал 2-го порядку в точці М0 є додатньо визначеною квадратичною формою. Оскільки диференціал 2-го порядку в точці М0 дорівнює добутку першого доданка справа в (3.2) без множника , то цей доданок теж є додатньо визначеною квадратичною формою заданою на одиничній сфері простору Rn. Оскільки ця квадратична форма є функцією неперервною на цій точці, а сфера Rn є компактом (бо вона замкнена і обмежена) то за теоремою Вейєрштрасса на цій сфері знайдеться точка (h1(0),…,hn(0)) в якій ця квадратична форма приймає найменше значення . Оскільки форма додатньо визначена, то 0. Отже перший доданок справа в (3.2) завжди більший або рівний /2. Оскільки ()0 коли 0 то знайдеться 1>0: 1 матимемо: ()</4.

Візьмемо . Тоді будемо мати

.

Отже ми довели, що U(M)>U(M0) для будь-якої точки М з 1-околу точки М0, а це означає, що в точці М0 функція має мінімум (для максимуму доведення аналогічне).

Розглянемо доведення 2-ї частини теореми. Для цього зробимо кілька зауважень відносно квадратичної форми.

Якщо Ф(t1,…,tn) деяка знакозмінна квадратична форма, то можна підібрати дві точки h=(h1,…,hn), h=(h1,…,hn) такі, що hi1; hi1, ; h1 2+…+hn 2=1; h1 2+…+hn 2=1 і Ф(h)>0, Ф(h)<0. Дійсно, оскільки Ф знакозмінна квадратична форма, то знайдуться дві точки t=(t1,…,tn), t=(t1,..,tn): Ф(t)>0, Ф(t)<0. Покладемо

, ,

ми одержимо h і h такі, що задовольняють умови і ;.

Візьмемо довільне >0. Нехай h=(h1,…,hn) така точка на одиничній сфері, що . Візьмемо точку таку, що , а значить . Тоді

.

Оскільки ()0, коли 0, а перший доданок є додатнім і не залежить від , то можна підібрати настільки малим, що вираз в дужках зберігатиме знак першого доданка. Тобто ми в як завгодно малому околі точки М0, знайшли точку М, таку що U(M)-U(M0)>0. Провівши аналогічні дослідження для U(M)-U(M0), ми отримаємо, що в як завгодно малому околі точки М0 знайдеться точка М , значення функції в якій менше за значення в точці М0. Отже в точці М0 функція не має екстремуму. Теорему доведено.

Часто виникає потреба дослідити на екстремум функцію двох змінних. Розглянемо цей випадок.

Теорема 3.2 (Достатні умови існування екстремуму для функції 2-х змінних). Нехай функція U=f(x;y) має частинні похідні другого порядку в деякому околі стаціонарної точки М0, які неперервні в цій точці. Нехай а11=fxx(M0); а22=fyy(M0); а12=fxy(M0) і 0)=а11а22122. Якщо 0)>0, то в точці М0 функція U має екстремум, а саме мінімум, коли а11>0 і максимум, коли а11<0. Якщо 0)<0 то екстремуму в точці М0 дана функція немає.

Доведення. Перша частина теореми слідує з теореми 3.1 і критерію Сільвестера знаковизначеності квадратичної форми, бо А1=а11, А2=а11а22122. Тому, якщо М0>0, то d2U є знаковизначеною квадратичною формою, а саме, якщо а11>0 додатньо визначеною і при а11<0 - від'ємно визначеною. А значить, якщо а11>0 функція має мінімум, а при а11<0 - максимум.

Розглянемо випадок коли 0)<0. На основі доведеного в теоремі 3.1, квадратичну форму диференціала в точці М0 можна записати у вигляді: Ф=(a11h12+2a12h1h2+a22h22), де h12+h22=1. Покажемо, що в цьому випадку квадратична форма 2-го диференціала в точці М0 є знакозмінною. Для цього достатньо знайти дві точки h=(h1,h2), h=(h1,h2) на одиничному колі такі, що в одній із них форма Ф буде додатньою, а в іншій - від'ємною величиною.

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.