noprop

NoProp:无需反向传播,基于去噪原理非全局梯度传播神经网络训练

反向传播算法自四十年前问世以来一直作为深度学习的基石,然而仍然面临两项关键技术挑战:首先由于必须存储中间激活值用于梯度计算,导致内存消耗显著;其次其本质上的顺序计算特性严重限制了模型在分布式多GPU环境下的并行扩展能力。近期牛津大学、Mila研究所与Googl

传播 神经网络 去噪 noprop 去噪原理 2025-04-28 09:49  5