Openai-o1后续前沿进展非全面总结
先研究下OpenAI's o1 Model的推理范式都有哪些。《A Comparative Study on Reasoning Patterns of OpenAI's o1 Model》(https://arxiv.org/pdf/2410.13639)研
先研究下OpenAI's o1 Model的推理范式都有哪些。《A Comparative Study on Reasoning Patterns of OpenAI's o1 Model》(https://arxiv.org/pdf/2410.13639)研
针对大语言模型的推理任务,近日,Meta田渊栋团队提出了一个新的范式:连续思维链,对比传统的CoT,性能更强,效率更高。
另一个是还是回归到RAG上,最近同名的RAG框架很多,例如fastRAG(https://github.com/IntelLabs/fastRAG.git,朴素rag的一个模块化)和FastRAG(https://arxiv.org/html/2411.137
思维链(CoT)已被证明可以在许多任务(如多步骤推理)上显著提升大模型的性能。然而,在哪些情况下,CoT 会系统性地降低大模型的性能,这仍然是一个有待进一步讨论的问题。
近日,在 OpenAI 计划长达十二天的"Shipmas"的前两天发布中,满血版 o1 系列以及强化微调技术 RFT(Reinforcement Fine-Tuning)面世。