Ana içerik
Çok Değişkenli Kalkülüs
Konu: Çok Değişkenli Kalkülüs > Ünite 3
Ders 4: Çok Değişkenli Fonksiyonlarda Optimizasyon (Makaleler)Maksimumlar, minimumlar, ve eyer noktaları
Çok değişkenli fonksiyonlarda yerel maksimum ve yerel minimumun nasıl gözüktüğünü öğrenin.
Neye ulaşıyoruz
- Sezgisel olarak, grafikler cinsinden düşündüğünüzde, çok değişkenli fonksiyonların yerel maksimumları -tek değişkenli fonksiyonlardaki gibi- tepelerdir.
- Çok değişkenli bir fonksiyonun bir maksimum noktasındaki gradyanı sıfır vektörü olacaktır; bu, grafiğin düz bir teğet düzlemi olmasıyla eşleşir.
- Biçimsel olarak konuşursak, yerel bir maksimum noktası girdi uzayında bu noktanın yakınındaki diğer tüm girdilerin çok değişkenli
fonksiyonuna koyulduğunda daha küçük değerler ürettiği bir noktadır.
Daha yüksek boyutlarda optimize etme
Analizin en önemli uygulamalarından biri, bir fonksiyonun maksimumunu veya minimumunu koklama yeteneğidir.
- Belki kendinizi bir şirketi yönetirken bulursunuz, ve çalışan maaşları, hammadde maliyetleri, vb. gibi birkaç sayıda parametreye göre kaç para kazanmayı beklediğinizi modelleyen bir fonksiyon buldunuz, ve gelirinizi maksimize eden doğru kaynak birleşimini bulmak istiyorsunuz.
- Belki bir araba tasarlıyorsunuz, daha aerodinamik yapmayı umuyorsunuz, ve toplam rüzgar direncini arabanızın şeklini tanımlayan birçok parametrenin fonksiyonu olarak modelleyen bir fonksiyon buldunuz, ve toplam direnci minimize eden şekli bulmak istiyorsunuz.
- Makineyle öğrenme ve yapay zekada, bir bilgisayarın bir şeyi "öğrenme" yolu, yaygın olarak programcının belirlediği gibi "maliyet fonksiyonu"nu minimize etmektir.
Görsel olarak yerel maksimumlar ve minimumlar
Grafiğini çizebileceğimiz çok değişkenli fonksiyonları düşünmekle başlayalım: İki boyutlu girdisi ve skaler çıktısı olanlar, örneğin şunun gibi:
Bu fonksiyonu seçmemin nedeni, pek çok güzel tepeye ve zirveye sahip olması. Bu zirvelerden her birisine yerel maksimum adını veriyoruz, çoğulu ise yerel maksimumlar.
- Girdi uzayında (bu durumda
düzlemi demektir) bir zirvenin altındaki noktasına yerel bir maksimum noktası denir. - Bir fonksiyonun yerel bir maksimum noktasındaki çıktısı, ki bunu bu noktanın üstünde grafiğin yüksekliği olarak görselleştirebilirsiniz, yerel maksimumun kendisidir.
"Yerel" sözcüğü bunları fonksiyonun ulaşabileceği tek en büyük değer olan "mutlak maksimum"undan ayırt etmek için kullanılır. Eğer bir dağın zirvesindeyseniz bu bir yerel maksimumdur; ancak bahsettiğimiz Everest dağı ise, bu bir mutlak maksimumdur.
Yerel maksimum noktasının biçimsel tanımını size bu makalenin sonunda vereceğim. Sezgisel olarak, bu, girdi uzayında herhangi bir yönde küçük bir adım atmanın fonksiyonun değerini sadece azalttığı noktadır.
Benzer şekilde, grafiğin bir noktada ters bir zirvesi varsa, fonksiyonun değerinde düzlemindeki bu noktanın üstünde/altında yerel bir minimum noktası olduğunu söyleriz ve fonksiyonun bu noktadaki değeri yerel bir minimumdur. Sezgisel olarak, bunlar herhangi bir yönde adım atmanın sadece fonksiyonun değerini artırabileceği noktalardır.
Tek değişkende stabil noktalar (tekrar)
Tek değişkenli analizden yerel maksimum/minimum fikirlerini hatırlayabilirsiniz, burada bu türden birçok problem görüyordunuz:
Kavram kontrolü: Hangi değeri için fonksiyonu en büyüktür? Maksimum değer nedir?
Genel olarak, bir fonksiyonunun yerel maksimumları ve minimumları olan yerdeki girdi değerlerine bakılarak belirlenir. Bunun nedeni, fonksiyon sürekli ve türevli olduğu sürece, zirvelerin ve vadilerin düzleşeceğidir; çünkü yerel bir maksimum veya minimumdaki teğet doğrunun eğimi 'dır.
Böyle bir noktasının çeşitli isimleri vardır:
- Stabil nokta
- Kritik nokta
- Sıfır türevli nokta
Bunların hepsinin anlamı aynıdır:
Ve siürekli ama türevsizse, yerel bir maksimum şöyle görünebilir:
İki durumda da, bu maksimum noktalardaki teğet doğrulardan bahsetmek, aslında mantıklı değildir, öyle değil mi?
Ancak, sürekli ve türevli olduğunda bile, bu türevin olması için yeterli değildir, çünkü bu dönüm noktalarında da ortaya çıkar:
Bu, stabil noktalar bulmanın maksimumu aramaya iyi bir başlangıç olduğunu anlamına gelir, ama işin sonu değildir.
İki değişkende kararlı noktalar
Çok değişkenli fonksiyonlar için hikaye çok benzerlik gösterir. Fonksiyon sürekli ve türevli olduğunda, yerel bir maksimum veya minimum noktada tüm kısmi türevler olacaktır.
Bir fonksiyonun grafiğine göre, bunun anlamı, teğet düzleminin yerel maksimum veya minimumda düz olacağıdır. Örneğin, burada birçok yerel ekstremumu ve her birinde düz teğet düzlemi olan bir grafik bulabilirsiniz:
Bir noktada tüm kısmi türevlerin sıfır olduğunu söylemek, o noktadaki gradyanın sıfır vektörü olduğunu söylemekle aynıdır:
İnsanlar genelde bunu daha toplu olarak şöyle yazar:
Kural, kalın değişkenlerin vektörleri göstermesidir. Yani , girdi değerlerinin bir vektörüdür ve tamamen sıfırlı vektördür.
Böyle bir girdisine tek değişkenli durumda olduğu gibi, aynı çeşitli isimler verilir:
- Stabil nokta
- Durağan nokta
- Kritik nokta
"Stabil" ve "durağan" sözcükleriyle ilgili bu düşünce, bu girdinin yanında biraz hareket dersek, fonksiyonun değerinin önemli derecede değişmeyeceğidir. "Kritik" sözcüğü bana biraz fazla dramatik geliyor, sanki fonksiyon bu noktaların yakınında ölüyormuş gibi.
Tek değişkenli fonksiyonlarda olduğu gibi, bir noktanın yerel maksimum veya minimum olduğunu garanti etmek için eğimin sıfır olması yeterli değildir. Birincisi, hala dönüm noktasına benzer bir şeyiniz olabilir:
Ama, çok değişkenli fonksiyonlara özgü tamamen yeni bir olasılık da vardır.
Eyer noktaları
- Bu noktada kısmi türevlerin ikisi de
'dır:
Bu nedenle, bir stabil noktadır.
- Bu nokta etrafında
yönünde hareket ettiğinizde, fonksiyon gibi gözükür. Tek değişkenli fonksiyonunun 'da bir yerel minimumu vardır. - Bu nokta etrafında
yönünde hareket ettiğinizde, fonksiyon gibi gözükür. Tek değişkenli fonksiyonunun 'da bir yerel maksimumu vardır.
Kısacası, ve yönleri bu girdinin maksimum veya minimum nokta olması konusunda fikir ayrılığına düşerler. Böylece, bir stabil nokta olsa ve dönüm noktası olmasa da, yerel bir maksimum veya yerel bir minimum olamaz!
Burada grafiğin uzayda döndüğü bir video bulabilirsiniz:
Matematikçiler de öyle düşünmüştü ve bir şey için iyi bir isme karar vermekte nadir anlardan birini yaşadılar: Eyer noktaları. Tanıma göre, bunlar fonksiyonun bir yönde yerel maksimumu, ama başka bir yönde yerel minimumu olduğu noktalardır.
Maksimumluk/minimumluğu test etme
"Tamam,"
dediğinizi duyuyorum,
"buna göre eğiminolması yeterli değildir, çünkü dönüm noktası veya eyer noktası olabilir. Ancak, bir stabil noktanın yerel bir maksimum mu yoksa minimum mu olduğunu nasıl anlayabiliriz?"
Sorduğunuza sevindim! Bu ikinci kısmi türev testiyle ilgili sonraki makalenin konusudur. Şimdilik, yerel maksimumun biçimsel bir tanımıyla bitirelim.
Biçimsel tanım
Sanırım bunu daha önce söyledim, ancak biçimsel tanımları öğrenmenin nedeni, sezgisel matematiksel fikirlerin matematiğin biçimsel diliyle nasıl kesin olarak yakalandığını görmektir. Şeffaf düşünmek için iyi bir yöntemdir, ve sezginin gerçekten farklı olduğu durumları anlamaya da yardımcı olabilir.
Bir yerel maksimumu tanımlarken, girdimiz için vektör notasyonu kullanabilir, bunu olarak yazabiliriz.
Yerel maksimumun biçimsel tanımı: Bir skaler değerli fonksiyonunun 'da yerel maksimumu olması için, aşağıdaki ifadeyi doğru kılan, bir pozitif sayısı (bunu yarıçap olarak düşünebiliriz) olmalıdır:
Bu biraz fazla gibi görünüyor, onun için ayıralım:
" " demek, değişkeninin maksimum nokta 'dan uzaklıkta olduğu anlamına gelmektedir. iki boyutlu olduğunda, bu 'in merkezi noktasında olan yarıçaplı merkezin içinde olduğunu söylemekle aynıdır.
Daha genel olarak, eğer boyutluysa, olan tüm , yarıçapı ve merkezi olan boyutlu bir top oluşturur.
Sonra bu tanımı matematik dilinden Türkçe'ye daha çok benzeyen bir şeye şöyle çevirebiliriz:
- Girdi uzayında
noktası etrafında küçük bir (top-şeklinde) bölgedeki noktalar için değerleri en yüksek 'da elde ediliyorsa, 'nin bir maksimum noktasıdır.
Anlayışınızı sınayın: Bir yerel minimumun biçimsel tanımını yazın, ve yazdıkça, her bir bileşenin anlamını düşünün. (Üstteki tanımdan sözcükleri kopyalama dürtüsüne karşı koyun.)
Özet
- Sezgisel olarak, grafikler cinsinden düşündüğünüzde, çok değişkenli fonksiyonların yerel maksimumları -tek değişkenli fonksiyonlardaki gibi- tepelerdir.
- Çok değişkenli bir fonksiyonun bir maksimum noktasındaki gradyanı sıfır vektörü olacaktır; bu, grafiğin düz bir teğet düzlemi olmasıyla eşleşir.
- Biçimsel olarak konuşursak, yerel bir maksimum noktası girdi uzayında bu noktanın yakınındaki diğer tüm girdilerin çok değişkenli
fonksiyonuna koyulduğunda daha küçük değerler ürettiği bir noktadır.
Tartışmaya katılmak ister misiniz?
Henüz gönderi yok.