If you're seeing this message, it means we're having trouble loading external resources on our website.

Bağlandığınız bilgisayar bir web filtresi kullanıyorsa, *.kastatic.org ve *.kasandbox.org adreslerinin engellerini kaldırmayı unutmayın.

Ana içerik

İkinci dereceden kestirim

İkinci dereceden kestirimler yerel doğrusallaştırma kavramını genişletir ve bir fonksiyonun daha yakın bir kestirimini verir.

Neye ulaşıyoruz

Yerel doğrusallaştırmada olduğu gibi hedef, potansiyel olarak karmaşık bir çok değişkenli f fonksiyonuna, x0 vektörü olarak yazacağım bir girdinin yakınında yakınsamaktır. İkinci dereceden bir kestirim, ikinci kısmi türevlerin sağladığı bilgiyi kullanarak, bunu yerel doğrusallaştırmadan daha iyi yapar.
Vektör olmayan form
f'nin girdisinin iki boyutlu olduğu özel durumda ve bir (x0,y0) noktasının yakınında kestirirken, aşağıda ikinci dereceden kestirimin sonunda böyle gözükeceğini göreceksiniz:
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2
Vektör formu:
Bunun genel formu, herhangi bir tür çok boyutlu girdisi olan skaler değerli bir f fonksiyonu için, bu kestirim şöyle gözükür:
Qf(x)=f(x0)Sabit+f(x0)(xx0)Doğrusal terim+12(xx0)THf(x0)(xx0)İkinci dereceden terim
Biraz karmaşık gözüktüğünü biliyorum, ancak parça parça çözeceğiz. her terimin kısa bir özeti böyledir:
  • f çok boyutlu bir girdisi ve skaler bir çıktısı olan bir fonksiyondur.
  • f(x0), f'nin x0'da değeri bulunan gradyanıdır.
  • Hf(x0) f'nin x0'da değeri bulunan Hessian matrisidir.
  • x0 vektörü, yakınında kestirdiğimiz belirli bir girdidir.
  • x vektörü girdi değişkenini temsil eder.
  • Kestirim fonksiyonu Qf'nin değeri, f'nin x0'daki değeriyle aynıdır, bu noktada tüm kısmi türevlerinin değerleri f'ninkilerle aynıdır ve bu noktada ikinci kısmi türevlerinin değerleri f'ninkilerle aynıdır.

Sıkılaşan kestirimler

Diyelim ki, size iki girdi ve bir çıktılı bir f(x,y) fonksiyonu verildi, şöyle ki
f(x,y)=sin(x)cos(y)
Khan Akademi video wrapper
Hedef belirli bir (x0,y0) noktası yakınında f(x,y)'ye yakınsayan daha basit bir fonksiyon bulmaktır. Örneğin,
(x0,y0)=(π3,π6)

Sıfır dereceden kestirme

En saf kestirim f'nin (x0,y0)'daki değerine her yerde eşit olan bir sabit fonksiyon olur. Buna "0.-mertebeden kestirim" deriz.
Örneğimizde:
C(x,y)=sin(π3)cos(π6)=(32)32=34
Soyut olarak yazıldığında:
C(x,y)=f(x0,y0)Sabit fonksiyon
Grafiksel olarak:
Bu kestirim fonksiyonunun grafiği, C(x,y), fonksiyonumuzun grafiğinden (x0,y0,f(x0,y0)) noktasından geçen düz bir düzlemdir. Aşağıda (x0,y0) noktasını çevirdikçe, kestirimin nasıl değiştiğini gösteren bir video bulabilirsiniz.
Khan Akademi video wrapper
f grafiği maviyle çizilmiştir, kestirimin grafiği beyazdır, ve (x0,y0,f(x0,y0)) noktası kırmızı bir nokta olarak gösterilmiştir.

Birinci dereceden kestirme

Sabit fonksiyon sıfırıncı mertebeden kestirim pek iyi değildir. f(x,y)'ye (x0,y0) noktasında eşit olması garantidir, ama hepsi bu kadar. Bunun bir adım daha iyisi, yerel doğrusallaştırma kullanmaktır, buna aynı zamanda "Birinci mertebeden kestirim" de denir.
Örneğimizde:
Lf(x,y)=34+34(xπ3)+34(yπ6)
Soyut olarak yazıldığında:
Lf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)
Burada fx ve fy f'nin kısmi türevlerini belirtir.
Grafiksel olarak:
Bir yerel doğrusallaştırmanın grafiği, f'nin grafiğine (x0,y0,f(x0,y0)) noktasında teğet olan bir düzlemdir. (x0,y0) noktası etrafında hareket ettikçe, bu kestirmenin nasıl değiştiğini gösteren bir videoyu burada bulabilirsiniz:
Khan Akademi video wrapper

İkinci dereceden kestirme

Daha da iyisi ikinci dereceden bir kestirimdir, buna aynı zamanda "ikinci mertebeden kestirim" de denir.
Bu makalenin geri kalanı, böyle kestirimlerin analitik formunu bulma ve anlamaya adanmıştır; ama dalmadan önce, böyle kestirimlerin grafiksel olarak neye benzediğine bakalım. Bu kestirimleri (x0,y0,f(x0,y0)) noktasında grafiği sarıyormuş gibi düşünebilirsiniz.
Khan Akademi video wrapper

"İkinci dereceden" iki değişkenin çarpımı anlamına gelir

Tek değişkenli fonksiyonlarda "ikinci dereceden" ifadesi, x2 teriminde olduğu gibi değişkenin karesinin alındığı durumu kasteder. Birden çok değişkenle, "ikinci dereceden" sadece x2 ve y2 gibi kareli terimleri belirtmez, xy gibi iki ayrı değişkenin çarpımını içeren terimleri de kapsar.
Genelde, birkaç şeyin çarpımı olan 3x2y3 gibi bir terimin "mertebesi", o terimde çarpılan toplam değişken sayısıdır. Bu durumda, mertebe 5 olacaktır: İki x, üç y ve sabitin önemi yoktur.

İkinci dereceden fonksiyonların grafikleri

İkinci dereceden fonksiyonları düşünmenin bir yolu, bükeyliklerini düşünmektir, bu da hareket ettiğiniz yöne bağlı olabilir.
Fonksiyonda dışbükeylik varsa, f(x,y)=x2+y2'de olduğu gibi, grafik şuna benzer:
Paraboloid
Üç boyutlu bir parabol olan bu şekil, paraboloid olarak adlandırılır.
Eğer fonksiyon bir yönde içbükeyse ve başka bir yönde doğrusalsa, grafik uzayda sürüklenen ve yüzey çizen bir parabolik eğriye benzer. Örneğin, f(x,y)=x2+y durumunda bu ortaya çıkar:
Uzayda sürüklenen parabol
Son olarak, bir yönde giderken grafik içbükey ve başka bir yönde giderken dışbükeyse, f(x,y)=x2y2'de olduğu gibi, grafik biraz eyere benzer. Böyle bir grafik, bunun gibi gözükür:
Khan Akademi video wrapper

Yerel doğrusallaştırma tarifini hatırlatma

f fonksiyonunun (x0,y0) noktası yakınında ikinci dereceden kestirimini yazmak için, yerel doğrusallaştırmadan hareket ederiz:
Lf(x,y)=f(x0,y0)Sabit terim+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)Doğrusal terimler
Yerel doğrusallaştırma bulmanın tarifini hatırlayalım, çünkü bu süreç ikinci dereceden kestirimlerle benzerlik gösterir.
  • f(x0,y0), sabitiyle başlayın ki, en azından kestirimimiz f ile (x0,y0) noktasında eşleşsin.
  • fx(x0,y0)(xx0) ve fy(x0,y0)(yy0) doğrusal terimlerini ekleyin.
  • Kestirimimizin (x0,y0) noktasında f ile aynı kısmi türevlere sahip olduğunu garantilemek için, fx(x0,y0) ve fy(x0,y0) sabitlerini kullanın.
  • Sadece x ve y yerine (xx0) ve (yy0) terimlerini kullanın ki, kestirimimizin (x0,y0) noktasında f(x0,y0)'a eşit olmasını bozmayalım.

İkinci dereceden kestirimi bulma

İkinci dereceden yaklaşım için (xx0)2, (xx0)(yy0) ve (yy0)2 ikinci dereceden terimleri toplarız ve şimdilik katsayılarını birazdan çözeceğimiz a, b ve c sabitleri olarak yazarız:
Qf(x,y)=f(x0,y0)0 parçayı düzenleyin+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)1 parçayı düzenleyin+a(xx0)2+b(xx0)(yy0)+c(yy0)2İkinci dereceden parça
Yerel doğrusallaştırmanın (x0,y0)'da f ile aynı kısmi türevlere sahip olmasını sağladığımız gibi, ikinci dereceden kestirimimizin bu noktada f ile aynı ikinci mertebeden kısmi türevlere sahip olmasını istiyoruz.
Yukarıda Qf'yi yazmamızla ilgili güzel şey, ikinci kısmi türevin 2Qfx2 sadece a(xx0)2 terimine bağlı olmasıdır.
  • Bunu deneyin! Üstteki Qf(x,y) ifadesinde her terimin x'e göre ikinci kısmi türevini alın ve a(xx0)2 terimi hariç hepsinin sıfıra gittiğinin farkına varın.
Bunu gerçekten denediniz mi? Ciddiyim, bunun nedenini düşünmek için bir dakikanızı ayırın. Qf'nin neden ifade edildiği şekilde ifade edildiğini anlamaya gerçekten yardımcı olur.
Bu bilgi güzeldir çünkü bu kocaman ifadenin ikinci kısmi türevini almak yerine, bunu şu şekilde görebilirsiniz:
2Qfx2(x,y)=(Birkaç 0)+2x2a(xx0)2+(daha çok 0)=x2a(xx0)=2a
Hedefimiz bunun (x0,y0) noktasında fxx(x,y) ile eşleşmesi olduğundan, a'yı böyle bulabilirsiniz:
a=12fxx(x0,y0)
Kendinizi sınayın: Benzer bir mantık kullanarak b ve c sabitlerinin ne olması gerektiğini bulun.
Şimdi son ikinci dereceden kestirimimizi, altı teriminin hepsi f'nin (x0,y0)'daki davranışını taklit edecek şekilde yazabiliriz:
Qf(x,y)=f(x0,y0)+fx(x0,y0)(xx0)+fy(x0,y0)(yy0)+12fxx(x0,y0)(xx0)2+fxy(x0,y0)(xx0)(yy0)+12fyy(x0,y0)(yy0)2

Örnek: sin(x)cos(y)'nin kestirimi

Bu canavarı iş başında görmek için, bunu giriş bölümündeki fonksiyonda deneyelim.

Problem: İkinci dereceden kestirimini bulunuz
f(x,y)=sin(x)cos(y)
(x,y)=(π3,π6) noktası etrafında.

Çözüm:
Gerekli tüm bilgiyi toplamak için, f(x,y)=sin(x)cos(y)'in ve tüm kısmi türevlerinin ve tümikinci kısmi türevlerinin (π3,π6) noktasındaki değerini bulmanız gerekir.
f(π3,π6)=

fx(x,y)=
fx(π3,π6)=

fy(x,y)=
fy(π3,π6)=

fxx(x,y)=
fxx(π3,π6)=

fxy(x,y)=
fxy(π3,π6)=

fyy(x,y)=
fyy(π3,π6)=

Az kaldı! Son adım olarak, bu değerleri ikinci dereceden kestirim formülüne uygulayın.
Buna göre, örneğin ikinci dereceden kestirimlerin animasyonunu üretmek için, grafik yazılımına koymak zorunda olduğum fomül buydu.
Khan Akademi video wrapper

Hesyanla vektör notasyonu

İkinci dereceden kestirim ifadesinin uzun olduğunu söylemeye gerek yok. Şimdi f'nin üç girdisi, x, y ve z olduğunu hayal edin. Bunun nasıl olduğunu prensip olarak hayal edebilirsiniz, fz, fxz, fzz, vb. içeren terimlerin toplamı; yani 3 kısmi türevin ve 9 ikinci kısmi türevin tümü. Ancak bu tam bir kabus olurdu!
Şimdi 100 girdili bir fonksiyonun ikinci dereceden kestirimini bulan bir program yazdığınızı düşünün. Delilik!
Aslında bu kadar da kötü olması gerekmez. Prensip olarak bu kadar karmaşık olan bir şey, notasyonda da o kadar karmaşık olmamalıdır. Elbette ikinci dereceden kestirimler biraz karmaşıktır, ama saçma değillerdir.
Vektörler ve matrisleri, özellikle f'nin gradyan ve Hessianını kullanarak Qf ikinci dereceden kestirimini şöyle yazabiliriz:
Qf(x)=f(x0)Sabit+f(x0)(xx0)Doğrusal terim+12(xx0)THf(x0)(xx0)İkinci dereceden terim
Bunu analiz edelim:
  • Koyu x girdi değişken(ler) ini bir vektör olarak gösterir,
    x=[xy]
Ayrıca, x0 girdi uzayında belirli bir vektördür. Eğer bunun iki bileşeni varsa, bu Qf formülü daha önce türettiğimizi yazmanın sadece farklı bir yoludur, ama başka herhangi bir boyutta bir vektörü de temsil edebilir.
  • f(x0)(xx0) iç çarpımı fx(x0)(xx0), fy(x0)(yy0), vb. formunda tüm terimlerin toplamı olarak açılır. Bu yerel doğrusallaştırmanın vektör notasyonuna benzer değilse, görmek için 2 boyut durumunda yapın!
  • (xx0)T ifadesinde üstteki küçük T, ''devrik'' anlamını taşır. Yani, aşağıdaki gibi gözüken başlangıç vektörü (xx0)'ı alırsınız:
    (xx0)=[xx0yy0]
Sonra bunu çevirerek böyle bir şey elde edersiniz:
(xx0)T=[xx0yy0]
  • Hf(x0) f'nin Hessian'ıdır.
  • (xx0)THf(x0)(xx0) ifadesi, eğer daha önce buna benzer bir şeye rastlamadıysanız karmaşık görünebilir. İkinci dereceden terimleri bu şekilde ifade etme, vektör-analizi ve vektör cebirinde aslında çok yaygındır, onun için böyle ifadeleri hayatınızda en az birkaç kere açmak önemlidir. Örneğin, neye benzediğini görmek için, x'in iki boyutlu olduğu durumu açmayı deneyin.
    Bunu üstte türettiğimiz vektörlü olmayan formülün ikinci dereceden kısmının tam olarak 2 katı olarak bulmalısınız.

Ne anlamı var?

Gerçekte, ikinci dereceden bir kestirimi elle hesaplamak gerçekten zordur, ve az yanlışla bunu başarmak çok düzenli kalmayı gerektirir. Uygulamada, insanlar üstteki örnekteki gibi ikinci dereceden bir yaklaşımı nadiren yapar, ama bunun nasıl işe yaradığını bilmek en azından iki geniş nedenden dolayı yararlıdır:
  • Hesaplama: İkinci dereceden bir yaklaşımı hiç yazmanız gerekmese de, bir gün belirli bir fonksiyona uygulaması için bir bilgisayarı programlamanız gerekebilir. Veya başka birinin programına güveniyorsanız, bazı durumlarda kestirimin neden ve nasıl işe yaramadığını analiz etmeniz gerekebilir.
  • Teori: İkinci mertebeden bir yaklaşıma kaynak olmak, bir noktanın yakınındaki genel fonksiyonların davranışını mantığa oturtmamıza yardımcı olur. Bu, ileride noktanın yerel maksimum veya minimum olmasını bulurken faydalı olacaktır.

Tartışmaya katılmak ister misiniz?

Henüz gönderi yok.
İngilizce biliyor musunuz? Khan Academy'nin İngilizce sitesinde neler olduğunu görmek için buraya tıklayın.