皇冠彩票导航网址
  • 首页
  • 皇冠彩票导航网址介绍
  • 产品展示
  • 新闻动态
  • 新闻动态你的位置:皇冠彩票导航网址 > 新闻动态 > 梯度到底是什么,梯度的数学原理和性质详解
    梯度到底是什么,梯度的数学原理和性质详解
    发布日期:2025-04-12 19:00    点击次数:159

    大家好,今天要讲的内容是,梯度的数学原理和性质。

    在梯度下降算法中,我们需要让函数的自变量,沿着函数梯度的反方向运动:

    图片

    使函数值以最快的速度减小,从而找到目标函数的极小值。

    可是,为什么自变量沿着梯度的反方向运动,函数值就一定减小的最快呢?

    这就是我们要详细讨论的问题。

    1.什么是梯度向量

    梯度,英文是gradient,它是多元函数全部偏导数所构成的向量。

    我们使用倒三角符号▽,nabla,表示某个函数的梯度:

    图片

    例如,二元函数f、三元函数g和n元函数L;

    它们的梯度向量,就是函数对其自变量,求偏导后,所组成的向量。

    我们以f(x, y) = x^2 + y^2为例,说明梯度的计算过程:

    图片

    首先,分别求出f关于x和y的偏导数,结果分别是2x和2y。

    将这两个偏导数组合,就得到了f的梯度向量(2x, 2y)。

    它可以表示,f(x, y)在任意点(x, y)上的变化方向和速率。

    那么如何理解这个梯度向量,(2x, 2y)呢?

    首先,需要明确,梯度向量是在函数输入空间中定义的:

    图片

    例如,函数f(x, y)的输入空间,对应了灰色的xoy平面。

    梯度向量(2x, 2y)在xoy中:

    图片

    为了理解向量(2x, 2y),有3个步骤:

    图片

    1.随意取函数上的一点P(1, 1, 2),标记为红色;

    2.将P点向灰色的x-o-y平面投影,投影点标记为蓝色;

    3.从蓝色点出发,画出向量(2, 2),使用黑色箭头表示。

    这个黑色箭头,就是点P(1, 1, 2)的梯度向量,它在平面x-o-y上。

    将观察的角度,调整为俯视:

    图片

    可以进一步观察这个黑色的梯度向量。

    2.为什么沿梯度方向运动

    思考下面这个问题:

    已知二元函数,f(x, y)=x^2+y^2,

    在函数上有一个红色的点P:

    图片

    从点P出发,沿着哪个方向运动,能使函数f(x, y)增大或减小的最快呢?

    函数上点的运动,就是修改函数自变量的取值,函数值会随之变化。

    例如,将P点向xoy平面投影,投影点标记为P’。

    P’就表示了函数的自变量的取值,它可以在平面xoy上运动。

    对于P’的运动方向,我们使用黑色箭头标记。

    将函数图像调整为俯视角度:

    图片

    可以更好的观察到,点的运动方向。

    将函数图像调整为平视角度:

    图片

    可以更好的观察函数值的变化大小。

    例如,函数上的一点P,其自变量取值为x=1,y=1:

    图片

    让该点向右运动一个单位,那么可以将自变量x从1修改为2,到达P’。

    此时P’的坐标是(2, 1, 5)。

    我们可以发现,运动后函数值从2增大到了5。

    3.梯度的性质

    对于函数上的某一点:

    如果沿着函数梯度的正方向运动,函数值增加的最快。

    如果沿着函数梯度的反方向运动,函数值减小的最快。

    例如,对于输入点(1, 1):

    图片

    如果让它沿着正梯度(2, 2)运动,函数值增加的最快;

    如果让它沿着负梯度(-2,-2)运动,函数值减少的最快。

    下面以点P(1, 1, 2)为例:

    图片

    让其向不同的方向运动相同的长度,观察函数值的变化。

    进而说明沿着梯度方向运动,函数值会变化的最快。

    首先将函数图像调整为俯视角度:

    图片

    可以看到P点的自变量取值是(1, 1)。

    设置3个向量,(-1, 0)、(1, 0)和(2, 2),代表自变量x和y的变化方向:

    图片

    它们分别表示向左运动,向右运动和沿梯度方向运动。

    从P点沿着(-1, 0)、(1, 0)和(2, 2)这三个方向,运动1个单位,可以到达A、B、C三个点:

    图片

    比较A、B、C这三个点的函数值,相比P点的函数值变化,就可以看出沿着哪个方向运动,函数值变化的最快。

    具体来说,从点P(1, 1),按照向量(-1, 0)的方向,移动1个单位,到达A点(0,1)。

    A点处的函数值为f(0, 1)=0^2+1^2=1。

    图片

    我们会发现,A点函数值相比P点函数值减小了1。

    这里从侧面,观察图像上点的运动,可以更容易的看出函数值的变化。

    从点P(1, 1),按照向量(1, 0)的方向,移动1个单位,会到达B点(2, 1)。

    图片

    B点处的函数值是:

    f(2, 1)=2^2+1^2=5,f(2, 1)比P点f(1, 1)增加了3。

    最后按照梯度的方向(2, 2),移动1个单位,大约会到达C点。

    这里需要注意,需要将梯度转换为单位向量,进行计算。

    C点的坐标:

    大概在(1.707,1.707)这个位置,1.707是1+的近似值。

    此时函数值为1.707^2 + 1.707^2 = 5.828,

    比f(1, 1)增加了3.828,是增加的最多的。

    因此,从这个例子中可以看到,同样是移动单位1的长度,

    如果函数上的某个点,沿着该点的梯度方向移动,函数增长的最为迅猛。

    相应的,如果沿着梯度的反方向运动,函数值减小的最快。

    图片

    这就是为什么,梯度下降算法,要沿着梯度的反方向,修改自变量的取值。

    那么到这里,梯度的数学原理和性质,就讲完了。感谢大家的观看,我们下节课再会。

    本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。

    上一篇:没有了

    下一篇:没有了

    Powered by 皇冠彩票导航网址 @2013-2022 RSS地图 HTML地图

    Powered by365建站