首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一文读懂!生成式 AI 服务安全新国标:从技术要求到合规落地

一文读懂!生成式 AI 服务安全新国标:从技术要求到合规落地

原创
作者头像
老赵聊算法、大模型备案
发布2025-07-03 15:36:29
发布2025-07-03 15:36:29
6760
举报

2025 年 6 月 30 日,国家标准 GB/T 45654-2025《网络安全技术 生成式人工智能服务安全基本要求》正式发布,作为《生成式人工智能服务管理暂行办法》的核心配套标准,它为 AI 服务提供者、监管部门及第三方评估机构提供了全面的安全技术指南。对于正在进行算法与模型备案的从业者而言,这份标准既是合规红线,更是技术优化的指南针。

为什么需要这份新国标?—— 从管理到技术的落地桥梁

近年来,生成式 AI 技术飞速发展,但训练数据侵权、模型输出有害内容、个人信息泄露等风险频发。为解决这些问题,《生成式人工智能服务管理暂行办法》从制度层面提出了监管框架,而本次发布的 GB/T 45654-2025 则进一步将制度要求转化为可落地的技术规范。2025年6月30日,国家网信办也发布了国家互联网信息办公室涉企行政检查事项清单,对于互联网新技术新应用进行一年两次安全评估和检查服务。

jxh152637
jxh152637

中国电子技术标准化研究院联合 40 家单位共同研制的这份标准,聚焦训练数据安全、模型安全、安全措施三大核心领域,不仅明确了 “不能做什么”,更细化了 “应该怎么做”。无论是 ChatGPT 类对话产品、AI 绘画工具,还是行业垂直领域的生成式服务,其安全合规都将以这份标准为技术依据。

jxh152637
jxh152637
jxh152637
jxh152637
jxh152637
jxh152637

核心要求拆解:从数据到模型的全链路安全

一、训练数据安全:源头把控,全流程可追溯

训练数据是生成式 AI 的 “食材”,其安全性直接决定了服务质量。标准从三个维度构建了数据安全防线:

  • 数据来源安全:强调 “来源可溯、授权合规”。例如,使用开源数据需严格遵循开源协议,自采数据要记录采集时间、对象等全量信息,商业数据需经过多层审核,用户输入信息用于训练时必须获得明确授权。

jxh152637
jxh152637
  • 数据内容管理:要求建立 “过滤机制 + 知识产权保护 + 个人信息保护” 三位一体的管理体系。训练数据必须经过过滤,剔除违法、歧视性等有害内容;同时需明确知识产权负责人,建立投诉举报渠道,在服务协议中清晰告知用户数据使用规则。

jxh152637
jxh152637
  • 数据标注安全:创新性地将标注数据分为 “功能性” 和 “安全性” 两类。功能性标注(如优化生成效果)可抽样人工审核,而安全性标注(如识别敏感内容)则需全量人工审核,且标注人员需通过安全培训与考核,标注数据需隔离存储以防泄露。

jxh152637
jxh152637

二、模型安全:输出可控,迭代可管

模型作为生成式 AI 的 “引擎”,其安全性决定了服务的可靠性。标准提出了全生命周期安全要求:

  • 训练与输出安全:训练过程中需持续监测漏洞与 “后门”,提升生成内容的安全性、准确性和可靠性。例如,对于涉及国家安全、社会公共利益的问题,模型需具备明确的 “拒答” 能力,且所有生成内容必须添加可识别的标识(如 “由 AI 生成”)。
  • 动态监测与更新:要求服务提供者建立常态化监测机制,实时跟踪输入内容与输出结果。模型更新或升级前,必须开展安全评估,制定应急方案,避免因迭代引入新风险。
  • 环境隔离:训练环境与推理环境(即用户交互的服务环境)必须物理或逻辑隔离,防止训练数据泄露或推理过程被恶意干扰。

jxh152637
jxh152637

三、安全措施:从服务设计到应急响应的全场景覆盖

标准不仅关注技术本身,更延伸到服务全流程的安全保障:

  • 服务透明度:需显著公开服务范围、局限性及个人信息处理规则。例如,一个 AI 写作工具需明确告知用户 “无法生成法律文书” 等适用边界。
  • 特定场景保护:针对未成年人等特殊群体,要求设置专属保护措施,如内容过滤强度升级、使用时长限制等。
  • 应急与投诉机制:必须提供便捷的投诉举报渠道,明确处理时限(标准建议不超过 48 小时),同时建立数据备份与快速恢复策略,保障业务连续性。

jxh152637
jxh152637

​编辑合规落地:从评估到备案的实践路径

对于需要进行模型备案的企业而言,标准的发布意味着备案流程有了更清晰的技术标尺:

  • 评估方法:标准提供了可操作的证实手段,例如通过关键词库检测生成内容安全性,用专用测试题库验证模型拒答能力,对训练数据进行抽样安全评估等。
  • 与监管衔接:结合国家互联网信息办公室的涉企行政检查要求,未来备案审核、日常监管将重点核查标准中明确的 “数据来源合规性”“模型输出安全性”“应急机制有效性” 等指标,不合规者可能面临备案驳回或服务暂停。

jxh152637
jxh152637

GB/T 45654-2025 的实施,标志着我国生成式 AI 监管进入 “技术化、精细化” 阶段。对于从业者而言,理解并落实这些要求不仅是合规义务,更是提升产品竞争力的关键 —— 安全可控的 AI 服务才能获得用户信任,实现长远发展。

作为AI应用企业,建议从现在开始:

  1. 对照标准梳理现有数据链路与模型架构,查漏补缺;
  2. 建立安全评估常态化机制,将合规要求嵌入产品迭代流程;
  3. 关注监管部门后续发布的配套解读,确保技术方案与备案要求同步更新。
  4. 自查自纠,自觉履行算法(大模型)备案登记手续。

注:创作不易,请误搬运!!!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 为什么需要这份新国标?—— 从管理到技术的落地桥梁
  • 核心要求拆解:从数据到模型的全链路安全
    • 一、训练数据安全:源头把控,全流程可追溯
    • 二、模型安全:输出可控,迭代可管
    • 三、安全措施:从服务设计到应急响应的全场景覆盖
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档