If you're seeing this message, it means we're having trouble loading external resources on our website.

Bağlandığınız bilgisayar bir web filtresi kullanıyorsa, *.kastatic.org ve *.kasandbox.org adreslerinin engellerini kaldırmayı unutmayın.

Ana içerik

İkinci kısmi türev testinin ardındaki mantık

İkinci kısmi türevin neden işe yaradığını görmek isteyenler için, burada bir ispatı ele alacağım.

Arka plan

Son makalede, ikinci kısmi türev testinin ifadesini verdim, ama neden doğru olduğuna dair zayıf bir açıklama yaptım. Bu makale matematiğe daha derin dalmak isteyenler içindir, ama sadece ikinci türev testini uygulamak isterseniz, kesinlikle şart değildir.

Neye ulaşıyoruz

  • Çok değişkenli bir fonksiyonun bir eyer noktasının yerel bir minimum/maksimum olup olmadığını test etmek için, fonksiyonun o noktadaki ikinci dereceden kestirimine bakın. Bu ikinci dereceden kestirimin maksimumu/minimumu olup olmadığını analiz etmek daha kolaydır.
  • İki değişkenli fonksiyonlar için, bu aşağıdaki gibi bir ifadeyi incelemek anlamına gelir:
    ax2+2bxy+cy2
    Bunlar ikinci dereceden formlar olarak bilinir. İkinci dereceden bir formun daima pozitif veya daima negatif olmasını belirleyen kural, ikinci kısmi türev testi için de geçerlidir.

İkinci dereceden yakınsama için tek değişkenli durum

Öncelikle, tek değişkenli ikinci türev testinin işe yaramasının arkasındaki biçimsel mantığın üzerinde durmak istiyorum. Biçimsel derken, içbükeylik kavramını daha iyi kavramaktan bahsediyorum.
Tek değişkenli analizde, herhangi bir f fonksiyonu ve herhangi bir a girdisi için f(a)=0 olduğunda, ikinci türev testi böyle gözükür:
  • f(a)<0 ise, f'nin a'da yerel maksimumu vardır
  • Eğer f(a)>0 ise, f'nin a'da yerel maksimumu vardır
  • Eğer f(a)=0 ise, f'nin a'da bir maksimumu, bir minimumu veya bir büküm noktası olduğunu sadece ikinci türev belirleyemez.
Testin neden işe yaradığını anlamak için, fonksiyonu kestirmeye ikinci dereceden bir terime kadar bir taylor polinomu ile yakınsamayla başlayın, buna ikinci dereceden kestirim de denir.
f(x)f(a)+f(a)(xa)+12f(a)(xa)2
f(a)=0 olduğundan, bu ikinci dereceden yakınsama şöyle sadeleşir:
f(a)+12f(a)(xa)2
Yerel minimumda ikinci dereceden yakınsama.
Yerel minimumda ikinci dereceden yakınsama.
Dikkat ederseniz, tüm olası x'ler için (xa)2>0'dır çünkü kareler hep pozitiftir. Bu basit bilgi, bilmek istediğimiz her şeyi bize verir! Neden?
Buna göre, f(a)>0 olduğunda, yakınsamayı şöyle okuyabiliriz:
f(a)+12f(a)(xa)2Bu tüm x değerleri için 0’dırve sadece x=a olduğunda 0’a eşittir
Böylece, a yakınsamamızın yerel bir minimumudur. Aslında, mutlak bir minimumdur, ama biz sadece yerel bir minimum olması bilgisiyle ilgileniyoruz. Bir fonksiyonun ikinci dereceden yakınsamasının yakınsama noktasında yerel bir minimumu varsa, fonksiyonun kendisinin de burada yerel minimumu vardır. Bununla ilgili daha fazlasını son bölümde söyleyeceğim, ama şimdilik fonksiyon ve yakınsaması yakınsama noktası a etrafında birbirine "sarıldığı" için sezgi açık olmalıdır.
Yerel maksimumda ikinci dereceden yakınsama
Yerel maksimumda ikinci dereceden yakınsama
Benzer şekilde, f(a)<0 ise, bu yakınsamayı şöyle okuyabiliriz
f(a)+12f(a)(xa)2Bu tüm x değerleri için 0’dırve sadece x=a olduğunda 0’a eşittir
Bu durumda, yakınsamaların x=a'da yerel bir maksimumu bulunur, bu da fonksiyonun orada yerel bir maksimumu olduğunu belirtir.
Dönüm noktasında ikinci dereceden yakınsama düzdür.
Dönüm noktasında ikinci dereceden yakınsama düzdür.
f(a)=0 olduğunda, ikinci dereceden kestirimimiz daima f(a) sabitine eşittir, yani fonksiyonumuz sadece ikinci türevle analiz edilebilmek için çok düzdür.
Bundan ne çıkarırız:
f(a)=0 olduğunda, f'nin a'da bir yerel maksimumu veya bir yerel minimumu olduğunu incelemek, 12f(a)(xa)2 Taylor kestiriminin ikinci dereceden teriminin daima pozitif veya daima negatif olmasıyla bağlantılıdır.

İki değişkenli durum, görsel ısınma

Şimdi iki girdisi ve bir çıktısı olan bir f(x,y) fonksiyonunu düşünün ve bir stabil nokta yani her iki kısmi türevinin de 0 olduğu bir nokta bulun,
fx(x0,y0)=0fy(x0,y0)=0
bunu daha kısa olarak şöyle yazarız
f(x0,y0)=0Sıfır vektörü
Teğet düzlem
f(x0,y0)=0 (x0,y0)'daki teğet düzlemin düz olduğunu belirtir.
Bunun bir yerel maksimum veya bir yerel minimum olduğunu veya ikisi de olmadığını belirlemek için, bunun ikinci dereceden kestirimine bakarız. Yapmak istediğimizin ön gösterimiyle başlayalım:
  • Eğer bu noktadaki ikinci dereceden kestirim bir içbükey paraboloid ise, f'nin (x0,y0) kritik noktasında bir yerel minimumu olacaktır.
    Yerel min
  • Eğer ikinci dereceden kestirim bir dışbükey paraboloid ise, f burada bir yerel maksimuma sahip olacaktır:
    Yerel maks
  • Eğer ikinci dereceden kestirim eyer şekline sahipse, f'nin maksimumu veya minimumu yoktur, ancak bir eyer noktası vardır.
    Eyer noktası
  • Eğer ikinci dereceden kestirim bir yönde veya tüm yönlerde düz ise, f hakkında sonuçlara varmak için yeterli bilgimiz yoktur.
    İkinci dereceden yakınsama bir yönde düzdür.
    İkinci dereceden yakınsama sabittir.

İkinci dereceden yakınsamanın analizi

f'nin ikinci dereceden kestirim formülü şöyledir:
Qf(x)=f(x0)Sabit+f(x0)(xx0)Doğrusal terim+12(xx0)THf(x0)(xx0)İkinci dereceden terim
Gradyanın sıfır olduğu noktalarla ilgilendiğimiz için, gradyan teriminden kurtulabiliriz:
Qf(x)=f(x0)+12(xx0)THf(x0)(xx0)
Bunu iki-değişkenli terime açmak için, Hesyan terimi açalım,
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
(Not: Eğer bu kestirim veya gösterimlerden herhangi birisi aklınıza takılıyor ise veya konuyu bilmiyorsanız, ikinci dereceden kestirimler konulu makaleyi okumanızı öneririz).
Tek değişkenli durumda gösterdiğim gibi, bu kestirimin ikinci dereceden teriminin daima pozitif veya daima negatif olup olmadığını incelemek istiyoruz.
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2}Daima 0 mıdır?Daima 0 mıdır?İkisi de olabilir mi?
Şu anda, bu terimi yazmak çok uzun sürer, ama özünü damıtmak için aşağıdaki formdaki ifadeleri inceleyebiliriz:
ax2+2bxy+cy2
Bu ifadelere fiyakalı bir şekilde "ikinci dereceden formlar" denir.
  • "İkinci dereceden" sözcüğü, terimlerin ikinci dereceden olduğunu, yani iki değişkenin çarpımıyla ilgili olduğunu belirtir.
  • Burada "form" sözcüğü hep beni şaşırtmıştır ve ikinci dereceden form fikrinin kulağa olduğundan daha karmaşık gelmesine neden olur. Matematikçiler tüm terimlerin 2. mertebeden olduğunu ve ifadeyi karıştıran doğrusal veya sabit terimler olmadığını vurgulamak için "ikinci dereceden ifade" yerine "ikinci dereceden form" derler. "Sadece ikinci dereceden ifade" çok daha makul ve anlaşılabilir olurdu.
İkinci dereceden formların daha yüksek boyutlara genelleştirilmesini basitleştirmek için, bunları bir M simetrik matrisine göre yazarız
xMx=[xy][abbc][xy]
İşte önemli soru:
  • Sadece a, b ve c sabitlerini analiz ederek, ax2+2bxy+cy2 ifadesinin daima pozitif veya daima negatif olduğunu veya bunların ikisi de olmadığını nasıl söyleyebiliriz?

İkinci dereceden formların analizi

Eğer y yerine bir y0 sabit değeri koyarsak, ikinci dereceden tek değişkenli bir fonksiyon elde ederiz:
ax2+2bxy0+c(y0)2
Bu fonksiyonun grafiği bir paraboldur ve x eksenini sadece ikinci dereceden fonksiyon gerçel köklere sahip olduğunda geçecektir.
İki gerçel köklü ikinci dereceden bir ifade hem pozitif, hem de negatiftir.
İki gerçel köklü ikinci dereceden bir ifade hem pozitif, hem de negatiftir.
Diğer durumlarda, a'nın işaretine bağlı olarak, tamamen pozitif veya tamamen negatif kalır.
İki gerçel köklü ikinci dereceden bir ifade pozitif veya negatif olabilir.
İki gerçel köklü ikinci dereceden bir ifade pozitif veya negatif olabilir.
Köklerinin gerçel veya karmaşık olduğunu görmek için, bu ifadeye ikinci dereceden denklem formülünü uygulayabiliriz.
ax2+2bxy0+c(y0)2
  • Baş terim a'dır.
  • Doğrusal terim 2by0'dır.
  • Sabit terim cy02'dir.
Kuadratik formülü uygularsak, böyle gözükür:
2by0±(2by0)24acy022a2by0±2y0b2ac2ay0(b±b2aca)
Eğer y0=0 ise, ikinci dereceden ifadenin x=0'da çift kökü vardır yani parabol bu noktada x eksenine değer. Diğer durumlarda, bu köklerin gerçel olup olmadığı sadece b2ac ifadesinin işaretine bağlıdır.
  • Eğer b2ac0 ise gerçel kökler vardır, buna göre ax2+2bxy0+c(y0)2 grafiği x eksenini keser.
  • Diğer durumda, eğer b2ac<0 ise gerçel kökler yoktur, buna göre ax2+2bxy0+c(y0)2 grafiği ya tamamen pozitif ya tamamen negatif kalır.
Örneğin, şu durumu düşünün
  • a=1
  • b=3
  • c=5
Bu durumda, b2ac=32(1)(5)=4>0'dır, buna göre f(x)=x2+6xy0+5y02 grafiği daima x eksenini keser. Aşağıda y0 değerinin yavaşça değişmesine izin verdiğimizde bu grafiğin ne şekilde değiştiğini gösteren bir video bulunmaktadır.
Khan Akademi video wrapper
Bu, f(x,y)=x2+6xy+5y2 grafiğinin hem pozitif, hem de negatif olduğu bilgisiyle örtüşür.
Khan Akademi video wrapper
Buna ek olarak, şu duruma bakın
  • a=2
  • b=2
  • c=3
Şimdi, b2ac=22(2)(3)=2<0. Bu, f(x)=2x2+4xy0+3y02 grafiğinin x eksenini hiç kesmediği anlamını taşır, ancak eğer y0 sabiti sıfır olursa eksene değer. Aşağıda y0 sabiti değiştikçe grafiğin ne şekilde değiştiğini gösteren bir video bulunmaktadır:
Khan Akademi video wrapper
Bu, f(x,y)=2x2+4xy+3y3 çok değişkenli fonksiyonunun hep pozitif olmasıyla örtüşür.
Khan Akademi video wrapper

İkinci dereceden formların işareti için kural

Adeta ikinci dereceden formüle aşina öğrencilerin aklını karıştırmak ister gibi, ikinci dereceden formlara ilişkin kurallar genelde b2ac yerine acb2'ye göre betimlenir. Biri diğerinin negatifi olduğundan, 0 ve 0 derken değiştirmeniz gerekir. Matematikçilerin acb2'yi tercih etmesinin nedeni, bunun ikinci dereceden formu betimleyen matrisin determinantı olmasıdır:
det([abbc])=acb2
Hatırlatalım, matris kullanıldığında ikinci dereceden form böyle gözükür:
ax2+2bxy+cy2=[xy][abbc][xy]
Bu kuralı önceki bölümde bulduğumuz şeyle birleştirirsek, ikinci dereceden formun işareti için kuralı şöyle yazarız:
  • Eğer acb2<0 ise, ikinci dereceden form hem pozitif hem negatif değerler alabilir ve sadece (x,y)=(0,0)'da sıfırdır.
  • Eğer acb2>0 ise, a'nın işaretine bağlı olarak form ya daima pozitif ya da daima negatif olacaktır, ancak her iki durumda da sadece (x,y)=(0,0)'da 0'a eşittir.
    • Eğer a>0 ise form hep pozitiftir, onun için (0,0) formun mutlak minimum noktasıdır.
    • Eğer a<0 ise form hep negatiftir, onun için (0,0) formun mutlak maksimum noktasıdır.
  • Eğer acb2=0 ise, form gene daima pozitif veya daima negatif olacaktır, ancak şimdi (x,y)=(0,0)'dan başka değerlerde de 0'a eşit olması mümkündür

Bazı terimler:

(x,y)=(0,0) hariç tüm (x,y) için ax2+2bxy+cy2>0 olduğunda, hem ikinci dereceden form hem bununla bağlantılı matris kesin pozitif kabul edilir.
(x,y)=(0,0) dışında tüm (x,y) için ax2+2bxy+cy2<0 olduğunda, ikisi de negatif kesin olur.
Eğer > ve < yerine ve koyarsanız, karşılıklı özellikler pozitif yarı-kesin ve negatif yarı-kesin olur.

Bunu Qf'ye uygulama

Başladığımız yere tekrar bakalım ve ikinci dereceden kestirimimizi tekrar yazalım:
Qf(x,y)=f(x0,y0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
Qf'nin ikinci dereceden kısmı, sadece x ve y yerine (xx0) ile (yy0) cinsinden yazılır, o zaman ikinci dereceden formların işareti kuralının (0,0) noktasına değindiği her yerde, bunu (x0,y0) noktasına uygularız.
Tek değişkenli durumda olduğu gibi, Qf ikinci dereceden kestiriminin (x0,y0)'da yerel bir maksimumu (veya minimumu) olduğunda, bu, f'nin bu noktada yerel bir maksimumu (veya minimumu) olduğu anlamına gelir. Bunun anlamı, ikinci dereceden bir formun işaretini doğrudan dönüştürerek, ikinci türev testini elde edebiliriz:
f(x0,y0)=0 olduğunu varsayın, bu durumda
  • Eğer fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2<0 ise, f'nin (x0,y0)'da bir minimumu veya maksimumu yoktur, ancak bir eyer noktası bulunmaktadır.
    Eyer noktası
  • Eğer fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2>0 ise, bu durumda f kesinlikle (x0,y0)'da bir maksimuma veya minimuma sahiptir ve bunlardan hangisi olduğunu bulmak için fxx(x0,y0)'ın işaretine bakmalıyız.
    • Eğer fxx(x0,y0)>0 ise, f bir yerel minimuma sahiptir.
      Yerel min
    • Eğer fxx(x0,y0)<0 ise, f bir yerel maksimuma sahiptir.
      Yerel maks
  • fxx(x0,y0)fyy(x0,y0)(fxy(x0,y0))2=0 ise, sadece ikinci türevler f'nin yerel minimumu veya maksimumu olup olmadığını belirtmez.

Şimdiki araçlarımızda eksiklik var

Burada sunulan her şey, neredeyse tam bir ispatı oluşturur, son bir adım hariç.
Sezgisel olarak, ikinci dereceden bir kestirim belirli bir şekilde eğrildiğinde ve kıvrıldığında, fonksiyonun da kestirim noktası yakınında aynı şekilde eğrilmesi ve kıvrılması mantıklıdır. Ama bunu sezginin ötesinde nasıl biçimsel olarak ifade ederiz?
Ne yazık ki, bunu burada yapmayacağız. Türevlerle ilgili ispatlı savlarda bulunmak, türevin teorik omurgası olan reel analiz gerektirir.
Ayrıca, bunun ikiden fazla girdili fonksiyonlar için nasıl genelleştirilebileceğini merak ediyor olabilirsiniz. Birden çok değişkenli ikinci dereceden formlarla ilgili bir kavram vardır, ama böyle formların ne zaman hep pozitif veya hep negatif olduğuyla ilgili kuralı ifade etmek, lineer cebirden çeşitli fikirleri kullanır.

Özet

  • Çok değişkenli bir fonksiyonun bir eyer noktasının yerel bir minimum/maksimum olup olmadığını test etmek için, fonksiyonun o noktadaki ikinci dereceden kestirimine bakın. Bu ikinci dereceden kestirimin maksimumu/minimumu olup olmadığını analiz etmek daha kolaydır.
  • İki değişkenli fonksiyonlar için, bu aşağıdaki gibi bir ifadeyi incelemek anlamına gelir:
    ax2+2bxy+cy2
    Bunlar ikinci dereceden formlar olarak bilinir. İkinci dereceden bir formun daima pozitif veya daima negatif olmasını belirleyen kural, ikinci kısmi türev testi için de geçerlidir.

Tartışmaya katılmak ister misiniz?

Henüz gönderi yok.
İngilizce biliyor musunuz? Khan Academy'nin İngilizce sitesinde neler olduğunu görmek için buraya tıklayın.