improves

粗度SELF-CONSISTENCY IMPROVES

思维链提示与预训练的大型语言模型相结合,在复杂推理任务中取得了令人鼓舞的成果。在本文中,我们提出了一种新的解码策略--自我一致性,以取代思维链提示中使用的天真贪婪解码。它首先对不同的推理路径进行采样,而不是只选择贪婪的推理路径,然后通过将采样的推理路径边缘化来

推理 解码器 prompt ri improves 2025-04-22 01:25  3