Ana içerik
Çok Değişkenli Kalkülüs
Konu: Çok Değişkenli Kalkülüs > Ünite 3
Ders 4: Çok Değişkenli Fonksiyonlarda Optimizasyon (Makaleler)İkinci kısmi türev testinin ardındaki mantık
İkinci kısmi türevin neden işe yaradığını görmek isteyenler için, burada bir ispatı ele alacağım.
Arka plan
Son makalede, ikinci kısmi türev testinin ifadesini verdim, ama neden doğru olduğuna dair zayıf bir açıklama yaptım. Bu makale matematiğe daha derin dalmak isteyenler içindir, ama sadece ikinci türev testini uygulamak isterseniz, kesinlikle şart değildir.
Neye ulaşıyoruz
- Çok değişkenli bir fonksiyonun bir eyer noktasının yerel bir minimum/maksimum olup olmadığını test etmek için, fonksiyonun o noktadaki ikinci dereceden kestirimine bakın. Bu ikinci dereceden kestirimin maksimumu/minimumu olup olmadığını analiz etmek daha kolaydır.
- İki değişkenli fonksiyonlar için, bu aşağıdaki gibi bir ifadeyi incelemek anlamına gelir:Bunlar ikinci dereceden formlar olarak bilinir. İkinci dereceden bir formun daima pozitif veya daima negatif olmasını belirleyen kural, ikinci kısmi türev testi için de geçerlidir.
İkinci dereceden yakınsama için tek değişkenli durum
Öncelikle, tek değişkenli ikinci türev testinin işe yaramasının arkasındaki biçimsel mantığın üzerinde durmak istiyorum. Biçimsel derken, içbükeylik kavramını daha iyi kavramaktan bahsediyorum.
Tek değişkenli analizde, herhangi bir fonksiyonu ve herhangi bir girdisi için olduğunda, ikinci türev testi böyle gözükür:
ise, 'nin 'da yerel maksimumu vardır- Eğer
ise, 'nin 'da yerel maksimumu vardır - Eğer
ise, 'nin 'da bir maksimumu, bir minimumu veya bir büküm noktası olduğunu sadece ikinci türev belirleyemez.
Testin neden işe yaradığını anlamak için, fonksiyonu kestirmeye ikinci dereceden bir terime kadar bir taylor polinomu ile yakınsamayla başlayın, buna ikinci dereceden kestirim de denir.
Dikkat ederseniz, tüm olası 'ler için 'dır çünkü kareler hep pozitiftir. Bu basit bilgi, bilmek istediğimiz her şeyi bize verir! Neden?
Buna göre, olduğunda, yakınsamayı şöyle okuyabiliriz:
Böylece, yakınsamamızın yerel bir minimumudur. Aslında, mutlak bir minimumdur, ama biz sadece yerel bir minimum olması bilgisiyle ilgileniyoruz. Bir fonksiyonun ikinci dereceden yakınsamasının yakınsama noktasında yerel bir minimumu varsa, fonksiyonun kendisinin de burada yerel minimumu vardır. Bununla ilgili daha fazlasını son bölümde söyleyeceğim, ama şimdilik fonksiyon ve yakınsaması yakınsama noktası etrafında birbirine "sarıldığı" için sezgi açık olmalıdır.
Benzer şekilde, ise, bu yakınsamayı şöyle okuyabiliriz
Bu durumda, yakınsamaların 'da yerel bir maksimumu bulunur, bu da fonksiyonun orada yerel bir maksimumu olduğunu belirtir.
Bundan ne çıkarırız:
İki değişkenli durum, görsel ısınma
Şimdi iki girdisi ve bir çıktısı olan bir fonksiyonunu düşünün ve bir stabil nokta yani her iki kısmi türevinin de olduğu bir nokta bulun,
bunu daha kısa olarak şöyle yazarız
Bunun bir yerel maksimum veya bir yerel minimum olduğunu veya ikisi de olmadığını belirlemek için, bunun ikinci dereceden kestirimine bakarız. Yapmak istediğimizin ön gösterimiyle başlayalım:
- Eğer bu noktadaki ikinci dereceden kestirim bir içbükey paraboloid ise,
'nin kritik noktasında bir yerel minimumu olacaktır. - Eğer ikinci dereceden kestirim bir dışbükey paraboloid ise,
burada bir yerel maksimuma sahip olacaktır: - Eğer ikinci dereceden kestirim eyer şekline sahipse,
'nin maksimumu veya minimumu yoktur, ancak bir eyer noktası vardır. - Eğer ikinci dereceden kestirim bir yönde veya tüm yönlerde düz ise,
hakkında sonuçlara varmak için yeterli bilgimiz yoktur.
İkinci dereceden yakınsamanın analizi
Gradyanın sıfır olduğu noktalarla ilgilendiğimiz için, gradyan teriminden kurtulabiliriz:
Bunu iki-değişkenli terime açmak için, Hesyan terimi açalım,
(Not: Eğer bu kestirim veya gösterimlerden herhangi birisi aklınıza takılıyor ise veya konuyu bilmiyorsanız, ikinci dereceden kestirimler konulu makaleyi okumanızı öneririz).
Tek değişkenli durumda gösterdiğim gibi, bu kestirimin ikinci dereceden teriminin daima pozitif veya daima negatif olup olmadığını incelemek istiyoruz.
Şu anda, bu terimi yazmak çok uzun sürer, ama özünü damıtmak için aşağıdaki formdaki ifadeleri inceleyebiliriz:
Bu ifadelere fiyakalı bir şekilde "ikinci dereceden formlar" denir.
- "İkinci dereceden" sözcüğü, terimlerin ikinci dereceden olduğunu, yani iki değişkenin çarpımıyla ilgili olduğunu belirtir.
- Burada "form" sözcüğü hep beni şaşırtmıştır ve ikinci dereceden form fikrinin kulağa olduğundan daha karmaşık gelmesine neden olur. Matematikçiler tüm terimlerin
. mertebeden olduğunu ve ifadeyi karıştıran doğrusal veya sabit terimler olmadığını vurgulamak için "ikinci dereceden ifade" yerine "ikinci dereceden form" derler. "Sadece ikinci dereceden ifade" çok daha makul ve anlaşılabilir olurdu.
İkinci dereceden formların daha yüksek boyutlara genelleştirilmesini basitleştirmek için, bunları bir simetrik matrisine göre yazarız
İşte önemli soru:
- Sadece
, ve sabitlerini analiz ederek, ifadesinin daima pozitif veya daima negatif olduğunu veya bunların ikisi de olmadığını nasıl söyleyebiliriz?
İkinci dereceden formların analizi
Eğer yerine bir sabit değeri koyarsak, ikinci dereceden tek değişkenli bir fonksiyon elde ederiz:
Bu fonksiyonun grafiği bir paraboldur ve eksenini sadece ikinci dereceden fonksiyon gerçel köklere sahip olduğunda geçecektir.
Diğer durumlarda, 'nın işaretine bağlı olarak, tamamen pozitif veya tamamen negatif kalır.
Köklerinin gerçel veya karmaşık olduğunu görmek için, bu ifadeye ikinci dereceden denklem formülünü uygulayabiliriz.
- Baş terim
'dır. - Doğrusal terim
'dır. - Sabit terim
'dir.
Kuadratik formülü uygularsak, böyle gözükür:
Eğer ise, ikinci dereceden ifadenin 'da çift kökü vardır yani parabol bu noktada eksenine değer. Diğer durumlarda, bu köklerin gerçel olup olmadığı sadece ifadesinin işaretine bağlıdır.
- Eğer
ise gerçel kökler vardır, buna göre grafiği eksenini keser. - Diğer durumda, eğer
ise gerçel kökler yoktur, buna göre grafiği ya tamamen pozitif ya tamamen negatif kalır.
Örneğin, şu durumu düşünün
Bu durumda, 'dır, buna göre grafiği daima eksenini keser. Aşağıda değerinin yavaşça değişmesine izin verdiğimizde bu grafiğin ne şekilde değiştiğini gösteren bir video bulunmaktadır.
Bu, grafiğinin hem pozitif, hem de negatif olduğu bilgisiyle örtüşür.
Buna ek olarak, şu duruma bakın
Şimdi, . Bu, grafiğinin eksenini hiç kesmediği anlamını taşır, ancak eğer sabiti sıfır olursa eksene değer. Aşağıda sabiti değiştikçe grafiğin ne şekilde değiştiğini gösteren bir video bulunmaktadır:
Bu, çok değişkenli fonksiyonunun hep pozitif olmasıyla örtüşür.
İkinci dereceden formların işareti için kural
Adeta ikinci dereceden formüle aşina öğrencilerin aklını karıştırmak ister gibi, ikinci dereceden formlara ilişkin kurallar genelde yerine 'ye göre betimlenir. Biri diğerinin negatifi olduğundan, ve derken değiştirmeniz gerekir. Matematikçilerin 'yi tercih etmesinin nedeni, bunun ikinci dereceden formu betimleyen matrisin determinantı olmasıdır:
Hatırlatalım, matris kullanıldığında ikinci dereceden form böyle gözükür:
Bu kuralı önceki bölümde bulduğumuz şeyle birleştirirsek, ikinci dereceden formun işareti için kuralı şöyle yazarız:
- Eğer
ise, ikinci dereceden form hem pozitif hem negatif değerler alabilir ve sadece 'da sıfırdır. - Eğer
ise, 'nın işaretine bağlı olarak form ya daima pozitif ya da daima negatif olacaktır, ancak her iki durumda da sadece 'da 'a eşittir.- Eğer
ise form hep pozitiftir, onun için formun mutlak minimum noktasıdır.
- Eğer
ise form hep negatiftir, onun için formun mutlak maksimum noktasıdır.
- Eğer
- Eğer
ise, form gene daima pozitif veya daima negatif olacaktır, ancak şimdi 'dan başka değerlerde de 'a eşit olması mümkündür
Bazı terimler:
Eğer ve yerine ve koyarsanız, karşılıklı özellikler pozitif yarı-kesin ve negatif yarı-kesin olur.
Bunu 'ye uygulama
Başladığımız yere tekrar bakalım ve ikinci dereceden kestirimimizi tekrar yazalım:
Tek değişkenli durumda olduğu gibi, ikinci dereceden kestiriminin 'da yerel bir maksimumu (veya minimumu) olduğunda, bu, 'nin bu noktada yerel bir maksimumu (veya minimumu) olduğu anlamına gelir. Bunun anlamı, ikinci dereceden bir formun işaretini doğrudan dönüştürerek, ikinci türev testini elde edebiliriz:
- Eğer
ise, 'nin 'da bir minimumu veya maksimumu yoktur, ancak bir eyer noktası bulunmaktadır. - Eğer
ise, bu durumda kesinlikle 'da bir maksimuma veya minimuma sahiptir ve bunlardan hangisi olduğunu bulmak için 'ın işaretine bakmalıyız.- Eğer
ise, bir yerel minimuma sahiptir.
- Eğer
ise, bir yerel maksimuma sahiptir.
ise, sadece ikinci türevler 'nin yerel minimumu veya maksimumu olup olmadığını belirtmez.
Şimdiki araçlarımızda eksiklik var
Burada sunulan her şey, neredeyse tam bir ispatı oluşturur, son bir adım hariç.
Sezgisel olarak, ikinci dereceden bir kestirim belirli bir şekilde eğrildiğinde ve kıvrıldığında, fonksiyonun da kestirim noktası yakınında aynı şekilde eğrilmesi ve kıvrılması mantıklıdır. Ama bunu sezginin ötesinde nasıl biçimsel olarak ifade ederiz?
Ne yazık ki, bunu burada yapmayacağız. Türevlerle ilgili ispatlı savlarda bulunmak, türevin teorik omurgası olan reel analiz gerektirir.
Ayrıca, bunun ikiden fazla girdili fonksiyonlar için nasıl genelleştirilebileceğini merak ediyor olabilirsiniz. Birden çok değişkenli ikinci dereceden formlarla ilgili bir kavram vardır, ama böyle formların ne zaman hep pozitif veya hep negatif olduğuyla ilgili kuralı ifade etmek, lineer cebirden çeşitli fikirleri kullanır.
Özet
- Çok değişkenli bir fonksiyonun bir eyer noktasının yerel bir minimum/maksimum olup olmadığını test etmek için, fonksiyonun o noktadaki ikinci dereceden kestirimine bakın. Bu ikinci dereceden kestirimin maksimumu/minimumu olup olmadığını analiz etmek daha kolaydır.
- İki değişkenli fonksiyonlar için, bu aşağıdaki gibi bir ifadeyi incelemek anlamına gelir:Bunlar ikinci dereceden formlar olarak bilinir. İkinci dereceden bir formun daima pozitif veya daima negatif olmasını belirleyen kural, ikinci kısmi türev testi için de geçerlidir.
Tartışmaya katılmak ister misiniz?
Henüz gönderi yok.