If you're seeing this message, it means we're having trouble loading external resources on our website.

Bağlandığınız bilgisayar bir web filtresi kullanıyorsa, *.kastatic.org ve *.kasandbox.org adreslerinin engellerini kaldırmayı unutmayın.

Ana içerik

Maksimumlar, minimumlar, ve eyer noktaları

Çok değişkenli fonksiyonlarda yerel maksimum ve yerel minimumun nasıl gözüktüğünü öğrenin.

Neye ulaşıyoruz

  • Sezgisel olarak, grafikler cinsinden düşündüğünüzde, çok değişkenli fonksiyonların yerel maksimumları -tek değişkenli fonksiyonlardaki gibi- tepelerdir.
  • Çok değişkenli bir fonksiyonun bir maksimum noktasındaki gradyanı sıfır vektörü olacaktır; bu, grafiğin düz bir teğet düzlemi olmasıyla eşleşir.
  • Biçimsel olarak konuşursak, yerel bir maksimum noktası girdi uzayında bu noktanın yakınındaki diğer tüm girdilerin çok değişkenli f fonksiyonuna koyulduğunda daha küçük değerler ürettiği bir noktadır.

Daha yüksek boyutlarda optimize etme

Analizin en önemli uygulamalarından biri, bir fonksiyonun maksimumunu veya minimumunu koklama yeteneğidir.
  • Belki kendinizi bir şirketi yönetirken bulursunuz, ve çalışan maaşları, hammadde maliyetleri, vb. gibi birkaç sayıda parametreye göre kaç para kazanmayı beklediğinizi modelleyen bir fonksiyon buldunuz, ve gelirinizi maksimize eden doğru kaynak birleşimini bulmak istiyorsunuz.
  • Belki bir araba tasarlıyorsunuz, daha aerodinamik yapmayı umuyorsunuz, ve toplam rüzgar direncini arabanızın şeklini tanımlayan birçok parametrenin fonksiyonu olarak modelleyen bir fonksiyon buldunuz, ve toplam direnci minimize eden şekli bulmak istiyorsunuz.
  • Makineyle öğrenme ve yapay zekada, bir bilgisayarın bir şeyi "öğrenme" yolu, yaygın olarak programcının belirlediği gibi "maliyet fonksiyonu"nu minimize etmektir.

Görsel olarak yerel maksimumlar ve minimumlar

Grafiğini çizebileceğimiz çok değişkenli fonksiyonları düşünmekle başlayalım: İki boyutlu girdisi ve skaler çıktısı olanlar, örneğin şunun gibi:
f(x,y)=cos(x)cos(y)ex2y2
Bu fonksiyonu seçmemin nedeni, pek çok güzel tepeye ve zirveye sahip olması. Bu zirvelerden her birisine yerel maksimum adını veriyoruz, çoğulu ise yerel maksimumlar.
Zirveler
  • Girdi uzayında (bu durumda xy düzlemi demektir) bir zirvenin altındaki (x0,y0) noktasına yerel bir maksimum noktası denir.
  • Bir fonksiyonun yerel bir maksimum noktasındaki çıktısı, ki bunu bu noktanın üstünde grafiğin yüksekliği olarak görselleştirebilirsiniz, yerel maksimumun kendisidir.
"Yerel" sözcüğü bunları fonksiyonun ulaşabileceği tek en büyük değer olan "mutlak maksimum"undan ayırt etmek için kullanılır. Eğer bir dağın zirvesindeyseniz bu bir yerel maksimumdur; ancak bahsettiğimiz Everest dağı ise, bu bir mutlak maksimumdur.
Yerel maksimum noktasının biçimsel tanımını size bu makalenin sonunda vereceğim. Sezgisel olarak, bu, girdi uzayında herhangi bir yönde küçük bir adım atmanın fonksiyonun değerini sadece azalttığı noktadır.
Benzer şekilde, grafiğin bir noktada ters bir zirvesi varsa, fonksiyonun (x,y) değerinde xy düzlemindeki bu noktanın üstünde/altında yerel bir minimum noktası olduğunu söyleriz ve fonksiyonun bu noktadaki değeri yerel bir minimumdur. Sezgisel olarak, bunlar herhangi bir yönde adım atmanın sadece fonksiyonun değerini artırabileceği noktalardır.
Vadiler

Tek değişkende stabil noktalar (tekrar)

Yerel ekstremumlardaki teğet doğruların eğimi 0'dır
Yerel ekstremumlardaki teğet doğruların eğimi 0'dır
Tek değişkenli analizden yerel maksimum/minimum fikirlerini hatırlayabilirsiniz, burada bu türden birçok problem görüyordunuz:
Kavram kontrolü: Hangi x değeri için f(x)=(x2)2+5 fonksiyonu en büyüktür? Maksimum değer nedir?
x=
f'nin maksimum değeri,

Genel olarak, bir f fonksiyonunun yerel maksimumları ve minimumları f(a)=0 olan yerdeki a girdi değerlerine bakılarak belirlenir. Bunun nedeni, fonksiyon sürekli ve türevli olduğu sürece, zirvelerin ve vadilerin düzleşeceğidir; çünkü yerel bir maksimum veya minimumdaki teğet doğrunun eğimi 0'dır.
Böyle bir a noktasının çeşitli isimleri vardır:
  • Stabil nokta
  • Kritik nokta
  • Sıfır türevli nokta
Bunların hepsinin anlamı aynıdır: f(a)=0
f'nin sürekli ve türevli olma zorunluluğu önemlidir, ama sürekli olmasa da, yalnız bir süreksizlik noktası da yerel maksimum olabilir:
Ve f siürekli ama türevsizse, yerel bir maksimum şöyle görünebilir:
İki durumda da, bu maksimum noktalardaki teğet doğrulardan bahsetmek, aslında mantıklı değildir, öyle değil mi?
Ancak, f sürekli ve türevli olduğunda bile, bu türevin 0 olması için yeterli değildir, çünkü bu dönüm noktalarında da ortaya çıkar:
Dönüm noktasındaki teğet doğru
Bu, stabil noktalar bulmanın maksimumu aramaya iyi bir başlangıç olduğunu anlamına gelir, ama işin sonu değildir.

İki değişkende kararlı noktalar

Çok değişkenli fonksiyonlar için hikaye çok benzerlik gösterir. Fonksiyon sürekli ve türevli olduğunda, yerel bir maksimum veya minimum noktada tüm kısmi türevler 0 olacaktır.
fx(x0,y0,)x’e göre kısmi=0fy(x0,y0,)y’ye göre kısmi=0
Bir fonksiyonun grafiğine göre, bunun anlamı, teğet düzleminin yerel maksimum veya minimumda düz olacağıdır. Örneğin, burada birçok yerel ekstremumu ve her birinde düz teğet düzlemi olan bir grafik bulabilirsiniz:
Khan Akademi video wrapper
Bir noktada tüm kısmi türevlerin sıfır olduğunu söylemek, o noktadaki gradyanın sıfır vektörü olduğunu söylemekle aynıdır:
f(x0,y0,)=[fx(x0,y0,)fy(x0,y0,)]=[00]
İnsanlar genelde bunu daha toplu olarak şöyle yazar:
f(x0)=0
Kural, kalın değişkenlerin vektörleri göstermesidir. Yani x0, (x0,y0,) girdi değerlerinin bir vektörüdür ve 0 tamamen sıfırlı vektördür.
Böyle bir x0 girdisine tek değişkenli durumda olduğu gibi, aynı çeşitli isimler verilir:
  • Stabil nokta
  • Durağan nokta
  • Kritik nokta
"Stabil" ve "durağan" sözcükleriyle ilgili bu düşünce, bu girdinin yanında biraz hareket dersek, fonksiyonun değerinin önemli derecede değişmeyeceğidir. "Kritik" sözcüğü bana biraz fazla dramatik geliyor, sanki fonksiyon bu noktaların yakınında ölüyormuş gibi.
Tek değişkenli fonksiyonlarda olduğu gibi, bir noktanın yerel maksimum veya minimum olduğunu garanti etmek için eğimin sıfır olması yeterli değildir. Birincisi, hala dönüm noktasına benzer bir şeyiniz olabilir:
3d dönüm noktası
Ama, çok değişkenli fonksiyonlara özgü tamamen yeni bir olasılık da vardır.

Eyer noktaları

f(x,y)=x2y2 fonksiyonunu düşünün. (0,0) noktası etrafında neler olduğuna ilişkin bazı gözlemler yapalım.
  • Bu noktada kısmi türevlerin ikisi de 0'dır:
x(x2y2)=2x2(0)=0y(x2y2)=2y2(0)=0
Bu nedenle, (0,0) bir stabil noktadır.
  • Bu nokta etrafında x yönünde hareket ettiğinizde, fonksiyon f(x,0)=x202=x2 gibi gözükür. Tek değişkenli f(x)=x2 fonksiyonunun x=0'da bir yerel minimumu vardır.
  • Bu nokta etrafında y yönünde hareket ettiğinizde, fonksiyon f(0,y)=02y2=y2 gibi gözükür. Tek değişkenli f(y)=y2 fonksiyonunun x=0'da bir yerel maksimumu vardır.
Kısacası, x ve y yönleri bu girdinin maksimum veya minimum nokta olması konusunda fikir ayrılığına düşerler. Böylece, (0,0) bir stabil nokta olsa ve dönüm noktası olmasa da, yerel bir maksimum veya yerel bir minimum olamaz!
Burada grafiğin uzayda döndüğü bir video bulabilirsiniz:
Khan Akademi video wrapper
(0,0,0) etrafındali bölge gerçekten bir atın eyerinin şekline benzemiyor mu?
Gerçek eyer.
Matematikçiler de öyle düşünmüştü ve bir şey için iyi bir isme karar vermekte nadir anlardan birini yaşadılar: Eyer noktaları. Tanıma göre, bunlar fonksiyonun bir yönde yerel maksimumu, ama başka bir yönde yerel minimumu olduğu noktalardır.

Maksimumluk/minimumluğu test etme

"Tamam,"
dediğinizi duyuyorum,
"buna göre eğimin 0 olması yeterli değildir, çünkü dönüm noktası veya eyer noktası olabilir. Ancak, bir stabil noktanın yerel bir maksimum mu yoksa minimum mu olduğunu nasıl anlayabiliriz?"
Sorduğunuza sevindim! Bu ikinci kısmi türev testiyle ilgili sonraki makalenin konusudur. Şimdilik, yerel maksimumun biçimsel bir tanımıyla bitirelim.

Biçimsel tanım

Sanırım bunu daha önce söyledim, ancak biçimsel tanımları öğrenmenin nedeni, sezgisel matematiksel fikirlerin matematiğin biçimsel diliyle nasıl kesin olarak yakalandığını görmektir. Şeffaf düşünmek için iyi bir yöntemdir, ve sezginin gerçekten farklı olduğu durumları anlamaya da yardımcı olabilir.
Bir yerel maksimumu tanımlarken, girdimiz için vektör notasyonu kullanabilir, bunu x olarak yazabiliriz.
Yerel maksimumun biçimsel tanımı: Bir skaler değerli f fonksiyonunun x0'da yerel maksimumu olması için, aşağıdaki ifadeyi doğru kılan, bir r>0 pozitif sayısı (bunu yarıçap olarak düşünebiliriz) olmalıdır:
f(x)f(x0)for all x such that ||xx0||<r
Bu biraz fazla gibi görünüyor, onun için ayıralım:
"||xx0||<r" demek, x değişkeninin maksimum nokta x0'dan r uzaklıkta olduğu anlamına gelmektedir. x iki boyutlu olduğunda, bu x'in merkezi x0 noktasında olan r yarıçaplı merkezin içinde olduğunu söylemekle aynıdır.
||xx0||<r açıklayan şema
Daha genel olarak, eğer x n boyutluysa, ||xx0||<r olan tüm x, yarıçapı r ve merkezi x0 olan n boyutlu bir top oluşturur.
3d top
Sonra bu tanımı matematik dilinden Türkçe'ye daha çok benzeyen bir şeye şöyle çevirebiliriz:
  • Girdi uzayında x0 noktası etrafında küçük bir (top-şeklinde) bölgedeki noktalar için f değerleri en yüksek x0'da elde ediliyorsa, x0 f'nin bir maksimum noktasıdır.
Anlayışınızı sınayın: Bir yerel minimumun biçimsel tanımını yazın, ve yazdıkça, her bir bileşenin anlamını düşünün. (Üstteki tanımdan sözcükleri kopyalama dürtüsüne karşı koyun.)

Özet

  • Sezgisel olarak, grafikler cinsinden düşündüğünüzde, çok değişkenli fonksiyonların yerel maksimumları -tek değişkenli fonksiyonlardaki gibi- tepelerdir.
  • Çok değişkenli bir fonksiyonun bir maksimum noktasındaki gradyanı sıfır vektörü olacaktır; bu, grafiğin düz bir teğet düzlemi olmasıyla eşleşir.
  • Biçimsel olarak konuşursak, yerel bir maksimum noktası girdi uzayında bu noktanın yakınındaki diğer tüm girdilerin çok değişkenli f fonksiyonuna koyulduğunda daha küçük değerler ürettiği bir noktadır.

Tartışmaya katılmak ister misiniz?

Henüz gönderi yok.
İngilizce biliyor musunuz? Khan Academy'nin İngilizce sitesinde neler olduğunu görmek için buraya tıklayın.