讯飞星火大模型上线隐式水印，AI内容安全再升级

摘要：9月1日，《人工智能生成合成内容标识办法》发布生效，明确要求服务提供者对生成合成内容添加标识，任何组织和个人不得删除、篡改、伪造、隐匿AI生成合成内容的标识，这也是国家层面对AI生成内容监管的关键举措。

随着大模型的发展与普及，AI生成内容随处可见。一方面，生成式AI实现了效率提升、灵感激发，但同时也带来了严重的虚假信息传播、深度伪造、恶意输出等问题。

9月1日，《人工智能生成合成内容标识办法》发布生效，明确要求服务提供者对生成合成内容添加标识，任何组织和个人不得删除、篡改、伪造、隐匿AI生成合成内容的标识，这也是国家层面对AI生成内容监管的关键举措。

近日，科大讯飞联合中国科学技术大学网络空间安全学院、安徽星盾智能科技有限公司共同研发了新一代生成式文本隐式水印技术，并正式上线星火大模型水印版，以实际行动积极响应政策号召，为AI生成内容安全规范传播再筑防线。

《人工智能生成合成内容标识办法》要求所有AI生成内容都要“亮明身份”，同时还指出AI生成内容标识包含显式标识和隐式标识，鼓励服务提供者在生成合成内容中添加数字水印等形式隐式标识。

显式标识方面，星火大模型在上线之初就对生成内容附上了相关标识，此后对水印标识进行持续迭代，在不影响用户体验的同时，对大模型生成的文字、图片等各类内容给出更加明确的AI生成提醒。

讯飞星火大模型生成内容的显式标识

隐式标识方面，科大讯飞与合作团队研发推出的新一代生成式文本隐式水印技术，能够通过动态调整词元选择概率，在不影响生成文本质量的前提下，将水印信息编码进文本结构，相当于给生成文本中的每个词都加上了独一无二的“隐形指纹”，即使被改写、删减也无法抹除；同时，科大讯飞也配套研发了水印检测系统，能够精准识别隐式水印、判断AI生成内容来源。