lora训练

攻克大模型训练难题!360实现全网首个开源强化学习LoRA训练方案

在大模型的训练中,强化学习算法一直是提升模型性能的关键。然而,其面临着计算资源要求高、训练速度慢等问题,让普通企业机构望而却步。面对行业共性难题,近日,在360数字安全集团冰刃实验室主导下,打造出“轻量化、高性能”的AI训练方案:RL-LoRA,在保持模型泛化

训练 模型 开源 lora lora训练 2025-06-04 16:15  3