Yönlü türev için olan formüle daha kapsamlı bir bakışın yanı sıra, gradyanın neden en dik çıkışın eğimini verdiğiyle ilgili bir açıklama.

Arka plan:

Bu makale yönlü türev ve formülüyle ilgili daha derin anlayış geliştirmek isteyenler içindir.

Yönlü türevin tanımı

Biçimsel bir tanıma önem vermenizin birkaç nedeni olabilir. Her zaman olduğu gibi, yeni bir kavramın biçimsel tanımını gerçekten anlamak, neler olduğunun netleşmesini sağlayabilir. Ancak sanırım bundan daha önemli olan, böyle bir kavramın ne zaman uygulanabildiğini ve uygulanamadığını anlamanız için size güven vermesidir.
İlk olarak, kısmi türevin -örneğin xx'e göre- biçimsel tanımını hatırlayalım:
fx(x0,y0)=limh0f(x0+h,y0)f(x0,y0)h \dfrac{\partial f}{\blueE{\partial x}}(x_0, y_0) = \lim_{h \to 0} \dfrac{f(x_0 \blueE{+ h}, y_0) - f(x_0, y_0)}{\blueE{h}}
fx\dfrac{\partial f}{\partial x} okumanın biçimsel olmayan yoluyla sağ tarafı okumanın biçimsel yolu arasındaki ilişki aşağıdaki gibidir:
SimgeBiçimsel olmayan anlayışBiçimsel anlayış
x\partial xxx yönünde minik bir itme.00'a giden sınırlandıran bir hh değişkeni ve fonksiyonun girdisinin ilk bileşenine eklenecek.
f\partial fİtmeden sonra ff'nin çıktısındaki sonuç değişim.f(x0+h,y0)f(x_0 + h, y_0) ile f(x0,y0)f(x_0, y_0) arasındaki fark, h0h \to 0 alınmış.
Bunun yerine bunu vektör notasyonuyla yazabilir, (x0,y0)(x_0, y_0) girdi noktasını iki boyutlu bir vektör olarak görebilirdik
x0=[x0y0]\begin{aligned} \quad \textbf{x}_0 = \left[ \begin{array}{c} x_0 \\ y_0 \\ \end{array} \right] \end{aligned}
Burada x0\textbf{x}_0 vektörlüğünü vurgulamak için kalın yazılmıştır. Tüm girdi için başka bir harf yerine kalın x\textbf{x} kullanmak, xx harfi girdinin birinci bileşenini kalın olmayan şekilde gösterdiği için biraz akıl karıştırıcı gelebilir. Ancak kural budur, biz de bunu uygulayacağız.
"İtilmiş girdiyi (x0+h,y0)(x_0 + h, y_0) olarak yazmak yerine, x0+hi^\textbf{x}_0 + h \hat{\textbf{i}} olarak yazıyoruz, burada i^\hat{\textbf{i}} xx-yönündeki birim vektördür:
fx(x0)=limh0f(x0+hi^)f(x0)h\begin{aligned} \quad \dfrac{\partial f}{\partial x}(\textbf{x}_0) = \lim_{h \to 0} \dfrac{f(\textbf{x}_0 + h \hat{\textbf{i}}) - f(\textbf{x}_0)}{h} \end{aligned}
Bu notasyonda, xx'e göre kısmi türevi herhangi bir v\vec{\textbf{v}} vektörü boyunca yönlü türevle genelleştirmek çok daha kolaydır:
vf(x0)=limh0f(x0+hv)f(x0)h \blueE{ \nabla_\redD{\vec{\textbf{v}}}f(\textbf{x}_0) = \lim_{h \to 0} \dfrac{f(\textbf{x}_0 + h\redD{\vec{\textbf{v}}}) - f(\textbf{x}_0)}{h} }
Bu durumda, hvh \vec{\textbf{v}}'yi girdiye sınırlandıran bir değişken h0h \to 0 için toplayarak v\vec{\textbf{v}} yönünde minik bir itme fikrini biçimselleştiririz.

Tanımla hesaplama arasında bağlantı arama

Yönlü türevin hesaplanması, f\nabla f'nin gradyanıyla v\vec{\textbf{v}} vektörü arasında bir iç çarpımı içerir. Örneğin, iki boyutta bu şöyle görünecektir:
Burada v1\blueE{v_1} ve v2\greenE{v_2}, v\vec{\textbf{v}}'nün bileşenleridir.
v=[v1v2]\begin{aligned} \vec{\textbf{v}} = \left[ \begin{array}{c} \blueE{v_1} \\ \greenE{v_2} \\ \end{array} \right] \end{aligned}
Merkezdeki soru şudur, bu formülün üstteki tanımla ilgisi nedir?

İtmeyi ayrıştırma

vf\nabla_\textbf{v} f hesaplaması, v\textbf{v} yönünde minik bir adımı xx ve yy bileşenlerine ayırmak için bir yol gibi görülebilir.
Özellikle, aşağıdaki prosedürü gözünüzde canlandırabilirsiniz:
  1. Bir (x0,y0)(x_0, y_0) noktasından başlayın.
  2. hh olarak minicik bir değer seçin.
  3. x0x_0'a hv1h\blueE{v_1} ekleyin, bu (x0+hv1,y0)(x_0 + h\blueE{v_1}, y_0) noktasına atlamak anlamına gelir. Kısmi türevlerle ilgili bilgimize göre, bu fonksiyonun çıktısını yaklaşık şu kadar değiştirecektir:
    hv1(fx(x0,y0))\begin{aligned} h\blueE{v_1} \left(\dfrac{\partial f}{\partial x}(x_0, y_0) \right) \end{aligned}
  4. Şimdi bizi (x0+hv1,y0+hv2)(x_0 +h\blueE{v_1}, y_0 + h\greenE{v_2}) noktasına getirmek için hv2h\greenE{v_2}'yi y0y_0'la toplayın. ff'de ortaya çıkan değişim yaklaşık olarak,
    hv2(fy(x0+hv1,y0))\begin{aligned} h\greenE{v_2}\left( \dfrac{\partial f}{\partial y}(x_0 + h\blueE{v_1}, y_0) \right) \end{aligned}
33 ve 44. adımların sonuçlarını topladığımızda, (x0,y0)(x_0, y_0) girdisinden (x0+hv1,y0+hv2)(x_0 +h\blueE{v_1}, y_0 + h\greenE{v_2}) girdisine hareket ettiğimizde fonksiyonun toplam değişimi yaklaşık şöyle olur:
hv1(fx(x0,y0))+hv2(fy(x0+hv1,y0))\begin{aligned} \quad h\blueE{v_1} \left(\dfrac{\partial f}{\partial x}(x_0, y_0) \right) + h\greenE{v_2}\left( \dfrac{\partial f}{\partial y}(x_0 \redD{+ h\blueE{v_1}}, y_0) \right) \end{aligned}
Bu yönlü türevin ifadesine çok yakındır, burada ff'deki hvh \vec{\textbf{v}} adıma göre değişimin yaklaşık şöyle olması beklenir
Bununla birlikte, bu adım-adım savımızdan biraz farklıdır, burada yy'ye göre kısmi türev (x0,y0)(x_0, y_0) noktasında değil, (x0+hv1,y0)(x_0 + h\blueE{v_1}, y_0) noktasında alınır.
Şanslıyız ki, hh'nin çok çok küçük değerlerini ele alıyoruz. Aslında, daha teknik olmak gerekirse, h0h \to 0 iken limitten bahsediyor olmalıyız. Bu nedenle, (x0+hv1,y0)(x_0 + h\blueE{v_1}, y_0)'da fy\dfrac{\partial f}{\partial y}'yi hesaplamak; bunu (x0,y0)(x_0, y_0)'da hesaplamakla neredeyse aynı olacaktır. Ayrıca, hh 00'a yaklaşırken, bunlar arasındaki fark da sıfıra yaklaşır, ancak ff'nin sürekli olduğunu varsaymalıyız.

Gradyan neden en dik çıkış yönünde bulunur?

Yönlü türevleri öğrendiğimize göre, artık gradyanın yönünün neden en dik tırmanış yönü olduğunu anlayabiliriz.
Özellikle, söz konusu soru şudur.
Kurulum:
  • ff f(x,y)=x2+y2f(x, y) = x^2 + y^2 gibi skaler değerli çok değişkenli bir fonksiyon olsun.
  • (x0,y0)(x_0, y_0) belirli bir girdi noktası olsun
  • Tüm olası yönleri ele alın, örneğin ff'nin girdi uzayındaki tüm u^\hat{\textbf{u}} birim vektörlerini.
Soru (biçimsel olmayan): (x0,y0)(x_0, y_0)'dan başlarsak, ff'nin çıktısının en hızlı artması için hangi yönde yürümeliyiz?
Soru (biçimse): Hangi u^\hat{\textbf{u}} birim vektörü u^\hat{\textbf{u}} boyunca yönlü türevi maksimize eder:
u^f(x0,y0)=u^f(x0,y0)Bu miktarı maksimum yapın\begin{aligned} \nabla_{\hat{\textbf{u}}} f(x_0, y_0) = \underbrace{\hat{\textbf{u}} \cdot \nabla f(x_0, y_0)}_{ \text{Bu miktarı maksimum yapın} } \end{aligned}
Ünlü üçgen eşitsizliği, bunun f(x0,y0)\nabla f(x_0, y_0) yönünde birim vektörle maksimize edileceğini belirtir.
Dikkat ederseniz, gradyanın en dik çıkış yönünü işaret etmesi, tüm yönlü türevlerin f\nabla f ile iç çarpım almayı gerektirmesi şeklindeki temel olgunun sonucudur.
Yükleniyor