西湖大学 强化学习06 随机近似与随机梯度下降On this page06 随机近似与随机梯度下降06 随机近似与随机梯度下降 平均数计算 简单地计算Σi=1Nxi/N\Sigma_{i=1}^N x_i / NΣi=1Nxi/N可以得到精确的平均数;但是这种方式只有样本全部到达才能进行。可以采用迭代式的方式计算平均数。 wk−1=1k−1Σi=1k−1xiwk=wk−1−1k(wk−1−xk)\begin{gather*} w_{k - 1} = \frac{1}{k - 1}\Sigma_{i=1}^{k-1}x_i \\ w_k = w_{k - 1} - \frac{1}{k}(w_{k-1} - x_k) \end{gather*}wk−1=k−11Σi=1k−1xiwk=wk−1−k1(wk−1−xk) 事实上,这种算法就是一种随机近似算法,同时也是随机梯度下降算法。 随机近似与Robbins-Monro 算法