万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2 长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。 视频 模型 开源 轻量级 轻量级超长 2025-06-03 14:10 4