书生大模型科技成就发布！上海人工智能实验室：迈向通用人工智能

摘要：步入AI时代，以大模型为代表的通用人工智能正迎来突破性进展，逐渐成为推动新质生产力发展的核心引擎。近年来，多模态大模型作为人工智能领域的核心技术之一，已成为各大科研机构和企业的重点布局方向。

步入AI时代，以大模型为代表的通用人工智能正迎来突破性进展，逐渐成为推动新质生产力发展的核心引擎。近年来，多模态大模型作为人工智能领域的核心技术之一，已成为各大科研机构和企业的重点布局方向。

2024 年 12 月 18 日，重大科技成就发布会于北京国家科技传播中心举办，上海人工智能实验室现场发布书生大模型科技成就。作为项目推介人，上海人工智能实验室主任、首席科学家周伯文表示，上海人工智能实验室致力于打造自主可控的开源大模型体系，基于“通专融合”的路径探索通用人工智能的未来。

让 AI 成为人类的 Intern，迈向通用人工智能

继 2021 年 10 月发布以来，书生通用大模型体系历经从单一视觉模型到多模态大模型、通用大模型体系，再到通专融合大模型体系的成长历程。同时开源了全链条的工具体系，包括书生·万卷、MinerU 等数据工具，InternEvo、XTuner 等预训练和微调工具，以及 LMDeploy 模型推理部署框架和 Open Compass 大模型评测体系。在整个链条环节上，部分开源工具目前已经达到了开源社区的最优水平和最好性能。此外，书生通用大模型体系和国内外比较优秀的开源项目、开源生态进行兼容和融合，可支持国内外各种各样的训练框架、推理框架以及应用工具等等。

会上，上海人工智能实验室青年科学家陈恺特别介绍了书生·浦语 2.5 谱系、书生·万象多模态大模型 InternVL2.5 以及强推理模型书生 InternThinker。

书生·浦语 2.5 谱系

作为一个对标 GPT 系列的大语言模型，书生·浦语 2.5 谱系覆盖了从 1.8B、7B、20B 到 102B 的跨量级模型尺寸，可满足不同的应用需求，其中 1.8B 到 20B 都是开源的。除了基础语言模型之外，书生·浦语衍生出一系列多模态创作模型，包括 InternLM-XComposer（灵笔）、InternLM-Math（数学）、InternLM-WQX（文曲星）。

陈恺谈到，书生·浦语有三个主要特点：首先，推理能力领先。和同量级的开源模型相比，它在众多推理榜单和实际使用的推理体验上都有非常出色的表现；其次，是社区首批支持了 100 万字上下文的开源模型，百万字长文的理解和精确处理性能均处于开源模型前列。另外，它还具备基于自主规划和搜索解决复杂问题的能力，针对复杂问题撰写专业回答，效率可提升 60 倍。

书生·万象多模态大模型 InternVL2.5

书生·万象多模态大模型 InternVL2.5 采用渐进式的训练策略来减少整体的训练资源消耗，同时也支持多种多样的输入模态和输出的格式。作为首个在 MMMU 验证集上突破 70% 的开源多模态大模型，书生·万象 2.5 成为了继 OpenAI o1 后第一个 MMMU性能突破 70% 的模型。会上，陈恺特别以复杂的金融图表分析为例，展示了书生·万象 2.5 的演示 Demo。模型可以通过非常复杂的专业知识提取里面的内容，进行分析以及里面各种数据的处理和计算。

强推理模型——书生 InternThinker

自 11 月起，上海人工智能实验室开放了强推理模型书生 InternThinker 试用体验。该模型具备长思维能力，并能在推理过程中进行自我反思和纠正，从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。陈恺提到，实验室研发团队设计了一系列“元动作”来引导模型解决问题的过程，如对问题的理解、知识回忆、规划、执行、反思、总结等，使得 InternThinker 能够以更加接近人类学习的方式高效提升能力，在面对复杂任务时，会动态地选择“元动作”，再进一步展开相关动作的具体思维过程。

会上，陈恺特别介绍了 InternThinker 的两个技能特点。其一，基于通、专模型协作合成高密度数据。InternThinker 独创性地采用了基于通专融合的技术路线生产所需数据，采用多种通用模型和专业模型的协作流程，模型和数据交替迭代，达到协同增强的效果。其二，构建大规模沙盒环境，在交互中获得反馈信号。InternThinker 针对专业任务构建了大规模的沙盒环境，为可形式化验证的推理任务提供反馈信号，通过自动化专家模型、人机协同策略生成等方法，构建了超过50种不同逻辑思维方式的推理任务思考过程。

赋能新型工业化，培养大模型新锐人才

“书生通用大模型体系不仅仅面向学术领域，我们也非常关注它在产业当中的应用。”据陈恺介绍，如今书生通用大模型体系已经和许多重点企业开展合作。比如辅助中远海运重工做落地的智能体应用、利用书生·浦语作为振华重工核心业务的智能体驱动模型。此外，上海钢联采用书生通用大模型体系做数字智能助手，在垂直领域做定制化微调。“可以看到，书生大模型在很多国计民生重点行业领域都得到了比较好的应用。”

同时，上海人工智能实验室也非常重视大模型在开源社区的交流以及反馈。团队通过书生大模型进行大模型人才培养和科普，目前已经举办四期大模型实战营，累计吸引超 2 万名学员报名，来自国内 800+ 高校的学生及 3000+ 企事业单位员工，线上课程学习 20 万人/次。实战营通过其优质的课程、实战内容和配套的答疑、辅导，让学员真正可以从无基础或少量基础学习大模型全套开发、使用流程。陈恺介绍，目前已收到若干企业、高校希望在开设线下课程的需求，如字节跳动、中核集团、阿里巴巴、商飞等知名企业。

AGI 是新质生产力的重要引擎，是“生产力的生产力”。陈恺表示，上海人工智能实验室将积极推动以通用人工智能的发展，以场景应用为牵引，促进大模型与制造业深度融合，助力人工智能创新生态的构建。

来源：CSDN一点号

标签：模型人工智能书生

本文地址：https://news.43u.com.cn/a/300920.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!