上线前(Gate 0/1/2) □ G0 需求关:场景是否在13类内;是否“辅助型”定位与不强制使用声明。 □ G1 数据关:数据分级分域、来源台账、脱敏与水印、可追溯与最小化。 □ G2 算法关:基础模型与服务备案材料、安全评估报告、评测与红蓝对抗记录。 □ 工程关:RAG/知识库权威来源清单、输出标识、人审与风控联动流程、日志与审计策略、攻防规则(注入/越权/消耗)。 运行中(SLA/KPI) □ 可用性:P95响应时延、系统可用性、峰值QPS/并发。 □ 准确性:问答正确率、检索Top-k、事实自洽率、无答案率。 □ 安全性:越狱/注入检出率、违规召回率、误杀率、对抗样本拦截率。 □ 合规性:内容审核覆盖率、标识合规率、日志审计及时率、事件处置时效。 |