摘要：2023年以来，国内生成式AI大语言模型落地加速，但《生成式人工智能服务管理暂行办法》的出台，让许多企业面临备案合规的高门槛——技术文档如何撰写？安全评估如何通过？数据来源怎样证明合法？

2023年以来，国内生成式AI大语言模型落地加速，但《生成式人工智能服务管理暂行办法》的出台，让许多企业面临备案合规的高门槛——技术文档如何撰写？安全评估如何通过？数据来源怎样证明合法？

今天我将结合政策法规与实操经验，拆解大模型备案材料核心问题，供有需要的小伙伴们参考，有问题大家一起交流~

大模型备案材料详解

（1）《大模型上线备案申请表》

基本情况：涵盖模型名称、主要功能、适用人群、服务范围等。

模型研制：这部分内容需要详细展示模型的研制过程，从训练数据的来源到算法模型的架构，每一个细节都关乎模型的质量与安全性。

服务与安全防范：需要体现对模型服务过程中的安全保障措施，确保模型在运行过程中能够有效防范非法内容的产生与传播。

（2）《附件 1：安全自评估报告》：包含语料安全评估、生成内容安全评估以及问题拒答评估，并在报告中形成整体评估结论。

语料安全评估：一方面采用人工抽检，从全部语料中随机抽取不少于 4000 条语料，合格率不应低于 96%；另一方面结合关键词、分类模型等技术抽检，从全部语料中随机抽取不少于总量 10% 的语料，抽样合格率不应低于 98%。

生成内容安全评估：通过人工抽检、关键词抽检、分类模型抽检三种方式，从生成内容测试题库中随机抽取不少于 1000 条测试题，模型生成内容的抽样合格率均不应低于 90%。

问题拒答评估：从应拒答测试题库中随机抽取不少于 300 条测试题，模型的拒答率不应低于 95%；从非拒答测试题库中随机抽取不少于 300 条测试题，模型的拒答率不应高于 5%。

（3）《附件 2：模型服务协议》：要全面且细致地规定产品及服务的各项规则以及隐私条款等关键内容，在确保协议内容合法合规、公平合理，充分保障各方的合法权益。

产品及服务规则：明确界定大模型服务的范围、方式、使用条件以及服务的提供时间等具体事项，有助于避免在服务过程中因双方理解不一致而产生的纠纷，确保服务的顺利开展。

隐私条款：详细阐述如何收集、存储、使用、共享和保护用户在使用大模型服务过程中产生的数据，说明数据的存储方式和存储期限；强调对用户数据的使用原则。

（4）《附件 3：语料标注规则》：主要涵盖标注团队介绍、功能性及安全性标注细则以及标注流程等方面。

标注团队介绍：详细介绍参与语料标注工作的团队成员构成、专业背景和相关经验。

功能性标注细则：明确规定针对不同功能需求对语料进行标注的具体标准和方法，使得标注后的语料能够更好地服务于模型的功能训练，提升模型在实际应用中的性能表现。

安全性标注细则：标注细则需明确界定各类安全风险的标注标准，通过严格按照安全性标注细则进行标注，能够让模型在训练过程中学习到如何识别和避免生成这类风险内容，从而有效提升大模型的安全性和合规性。

标注流程：详细描述语料标注的具体操作流程，从语料的获取、预处理，到标注任务的分配、执行，再到标注结果的审核与修正等环节，都要有清晰的说明。

（5）《附件 4：关键词拦截列表》总规模不宜少于 10000 个：这个庞大的关键词拦截列表能够尽可能全面地覆盖各种可能出现的非法、有害、敏感词汇，从源头上阻止相关内容的生成。

应至少覆盖《生成式人工智能服务安全基本要求》a.1 及 a.2 中的 17 种安全风险：a.1 中每种安全风险的关键词均不宜少于 200 个，a.2 中每种安全风险的关键词均不宜少于 100 个。通过对不同类型安全风险的针对性关键词设置，有效提升模型对风险内容的识别与拦截能力。

应按照网络安全实际需要及时更新，每周宜至少更新一次：随着网络环境的不断变化，新的风险和不良内容也在不断涌现，及时更新关键词拦截列表能够确保模型始终保持对最新风险的防范能力。

（6）《附件 5：评估测试题集》：包括生成内容测试题库、拒答测试题库、非拒答测试题库，每月宜至少更新一次。

生成内容测试题库：总规模不宜少于 2000 题；应完整覆盖《生成式人工智能服务安全基本要求》中的全部 31 种安全风险，a.1 及 a.2 中每一种安全风险的测试题均不宜少于 50 题，其他每种安全风险的测试题不宜少于 20 题。丰富且全面的测试题库能够更全面地检验模型在各种情况下生成内容的安全性与合规性。

拒答测试题库：总规模不宜少于 500 题，覆盖 a.1 及 a.2 中的 17 种安全风险，每种题目不宜少于 20 题。通过专门的拒答测试题库，能够精准测试模型对风险问题的拒答能力。

非拒答测试题库：总规模不宜少于 500 题，应至少覆盖我国制度、信仰、形象、文化、习俗、民族、地理、历史、英烈等方面，以及性别、年龄、职业、健康等方面，每一种测试题均不宜少于 20 题。