深度合成服务算法备案 · 附件
落实算法安全主体责任基本情况
算法主体:SCIDraw 运营公司__公司全称__(待填)
文档版本 v0.1 · 编制日期 2026-06-17
服务名称:SCIDraw(科研绘图与 AI 辅助生成平台,域名 www.scidraw.cn)
适用算法:基于已备案大模型(GLM-5.1 / MiniMax-M2.5)的深度合成与生成式 AI 应用服务
一、算法安全专职机构
为切实履行算法安全主体责任,SCIDraw 运营公司组建算法安全与合规委员会(下称"算法安全委员会"),作为公司级算法安全专职机构,对平台算法研发、上线、运行、下线全周期的安全工作负总体责任。委员会直接向法定代表人汇报,独立于产品研发与商业运营条线,确保监督独立性。
1.1 组织架构
| 机构 / 岗位 | 主要职责 | 人员配置 |
| 算法安全委员会(决策层) |
算法安全战略制定、重大算法上线审批、重大安全事件决策、对外监管对接总负责 |
主任 1 人(由法定代表人或其授权高管担任),委员 3–5 人(涵盖技术、法务、运营、内容) |
| 算法安全组(执行核心) |
日常算法安全审查、Prompt/输出敏感词词表维护、自评估报告编写、与备案机关日常沟通 |
专职 2 人(算法工程师 + 安全工程师),兼职 1 人 |
| 内容审核组 |
用户举报受理、AI 生成内容抽检、违规作品下架、内容安全趋势分析 |
专职 1 人 + 兼职 1 人(客服联动) |
| 数据合规组 |
个人信息保护影响评估、数据出境与上游 API 数据流转合规、用户权利响应(查询/更正/删除) |
兼职 1 人(法务背景)+ 外部法律顾问支持 |
| 应急响应组 |
7×24 值班轮值、安全事件分级响应、监管报送、用户通告 |
运维 1 人(值班)+ 各组负责人联动 |
1.2 算法安全负责人基本信息
| 姓名 | __负责人姓名__(待主体确认) |
| 职务 | 算法安全与合规委员会主任 / 首席安全官 |
| 联系方式 | 邮箱 __安全负责人邮箱__ 电话 __联系电话__ |
| 主要职责 | 算法安全总体把关、重大算法上线最终审批、对外监管沟通与报送、年度自评估报告署名人 |
| 任职要求 | 本科以上学历、5 年以上互联网或信息安全从业经验、熟悉《算法推荐管理规定》《生成式 AI 服务管理暂行办法》《个保法》《数据安全法》、无违法犯罪记录 |
1.3 算法安全工作人员任职要求
- 学历与专业:算法安全组、内容审核组成员须计算机、信息安全、法学或相关专业本科以上学历;数据合规组须有法律职业资格或法务从业经验。
- 从业经验:核心岗位须 2 年以上互联网产品安全、内容安全或数据合规相关经验。
- 背景核查:入职前完成无犯罪记录核查、征信核查;签订《算法安全保密协议》与《竞业限制协议》。
- 持续培训:每年参加不少于 16 学时的算法安全、内容安全、个保法等相关培训并留存记录。
1.4 算法安全技术保障措施
- 输入侧防护:Prompt 敏感词过滤中间件(17 类约 150 词,覆盖政治、暴恐、色情、邪教、毒品、谣言、歧视、未成年人保护等),词表以 Base64 编码存储规避反编译探测;支持归一化拆字降级匹配。
- 输出侧复检:所有 AI 出口(生图 description / SVG、实验方案 JSON、PPT 大纲)落地前过
auditOutput() 复检,命中即拦截并写审计日志。
- SVG 消毒:AI 生成的 SVG 经白名单 tag 过滤(剥离
<script>、<foreignObject>、on* 事件属性、<defs> 内危险子元素),杜绝 XSS 与 fabric.js 解析异常。
- 协议化渲染(核心护城河):AI 仅输出 5 类 JSON 操作指令(smiles / latex / line / rawsvg / chart),由平台原生 renderer 渲染,规避 AI 直接产出不可控 SVG / 位图。这是 SCIDraw 区别于通用 AI 工具的关键安全技术。
- 双模型熔断:主链路 GLM-5.1(智谱)故障时自动切换 MiniMax-M2.5;任一厂商备案被撤,30 分钟内可下线该链路。
- 审计留存:
ai_operation_logs 表完整记录每次 AI 调用的 prompt、模型、输出、用户 ID、IP、耗时、命中规则,留存 180 天以上。
- 数字版权证书 + AI 透明度元数据:每张 AI 辅助生成的导出图自动嵌入
ai_generated / ai_model / ai_prompt 元数据(PNG tEXt / JPG XMP / PDF 注释 / SVG metadata),并签发 RSA-2048 内容指纹证书,公开校验页 /cert/<cert_id>。
- 访问控制:管理后台仅
is_admin = true 用户可访问;敏感操作(用户封禁、内容下架、词表修改)二次确认 + 全量审计。
- 数据加密:传输层全站 HTTPS;存储层 MySQL 由阿里云 RDS 提供透明加密;密码 bcrypt 哈希存储。
- 备份与容灾:阿里云 RDS 每日自动快照 + binlog(RPO ≤ 1 小时);应用服务器 PM2 集群模式(多实例负载均衡)。
二、算法安全管理制度建设
SCIDraw 依据国家相关法律法规及政策要求,结合平台作为"调用已备案大模型的应用服务方"实际定位,制定以下算法安全管理制度。所有制度文件经算法安全委员会审议通过后生效,至少每年评估修订一次。
(一)算法安全自评估制度
1. 制度设计考虑
参照《互联网信息服务算法推荐管理规定》第二十三条至第二十五条及《生成式人工智能服务管理暂行办法》第十四条,SCIDraw 建立覆盖算法全生命周期的自评估制度,核心定位是"事前预防 + 事中监测 + 事后改进"闭环。
- 触发场景:① 新算法功能上线前;② 已上线算法发生重大变更(模型供应商切换、Prompt 策略调整、词表大改、新增 cap 类型等);③ 重大安全事件后;④ 监管要求;⑤ 例行年度评估。
- 评估范围:算法机理、数据来源与数据处理、模型供应链合规、内容安全、用户权益保护(含未成年人)、透明度、应急能力、科技伦理。
- 评估流程:算法安全组起草 → 内容审核组与数据合规组联合会签 → 算法安全委员会评审 → 形成评估报告(含整改清单)→ 整改跟踪闭环 → 必要时报属地网信办。
2. 合理性、完备性与可落地性论证
- 合理性:自评估以 SCIDraw 实际业务(科研绘图辅助生成、不直接面向未成年人、用户群体以高校与科研院所为主)为基础,避免"机械套用通用模板"。
- 完备性:覆盖《算法推荐管理规定》要求的全部评估维度;通过 R1(输入侧)、R2(输出侧)、R3(模型供应链)三大主轴分别建立独立证据链,互为印证。
- 可落地性:每项评估发现的问题对应 R 编号(R1–R6),明确优先级、负责人、整改期限、验收标准;现行 v0.5 自评估报告显示 P0 项(R1/R2)已全闭环,P1 项(R3/R5)路径已确定并完成草拟。
3. 制度执行保障
- 算法安全组专人维护自评估模板与历史版本(git 版本化管理);
- 每季度召开一次算法安全评审会,复盘评估发现与整改进度;
- 自评估结果纳入团队 OKR 与绩效考核;
- 外部法律顾问每年至少一次独立复核。
(二)算法安全监测制度
SCIDraw 算法安全监测覆盖信息安全、数据安全、用户个人信息安全、算法自身安全四大维度,每维度均从制度建设与技术保障措施两方面落地。
1. 信息安全监测
覆盖算法推荐服务中的信息内容安全、信息源安全等。
- 制度建设:
- 《AI 生成内容安全规范》明确 17 类禁止内容与处置流程;
- 用户举报受理 SOP:邮件 / 客服 / 平台内反馈三通道,24 小时内首次响应、72 小时内处置闭环;
- 内容抽检制度:每日由内容审核组随机抽检 20 张 AI 生成作品,违规率异常时启动专项排查。
- 技术保障措施:
- 输入侧敏感词过滤中间件(17 类约 150 词,Base64 编码存储);
- 输出侧
auditOutput() 复检,命中即拦截;
- SVG tag 白名单消毒;
- 5 类 cap 协议化渲染,AI 输出受控;
- R4 整改项(备案后优化):接入第三方内容安全 API(阿里云绿网 / 网易易盾)+ PII(手机号 / 邮箱 / 身份证 / 银行卡)拦截扩充。
2. 数据安全监测
覆盖算法服务开发与上线后的数据安全。
- 制度建设:
- 《数据分类分级管理办法》将数据分为:公开数据、内部数据、用户个人信息、敏感凭证 4 级;
- 《数据库访问审计办法》规定仅生产环境应用服务器可通过内网访问 RDS,禁止人工直连;
- 《数据出境合规指引》:用户 prompt 与 AI 输出经 GLM / MiniMax 国内端点处理,不出境。
- 技术保障措施:
- 阿里云 RDS 透明加密 + 每日快照 + binlog(RPO ≤ 1 小时);
- 全站 HTTPS;密码 bcrypt 哈希;
- 敏感字段(如微信 openid、邮箱)列级加密;
- API 访问日志 + 数据库审计日志保留 180 天以上;
- 异常查询监控:单 IP 高频拉取、异常 JOIN 模式触发告警。
3. 用户个人信息安全监测
覆盖算法服务开发与上线后的用户个人信息安全。
- 制度建设:
- 《SCIDraw 用户协议 v1.1》第 3 章、第 6 章公示个人信息处理目的、方式、范围、留存期限;
- 《用户权利响应 SOP》保障查阅、复制、更正、删除、注销、撤回同意 6 项权利,15 个工作日内响应;
- 《未成年人保护特别条款》:未满 14 岁需监护人同意,平台不主动收集未成年人个人信息。
- 技术保障措施:
- 注册流程最小化收集(邮箱 + 可选昵称),无强制实名;
- 个人信息字段(真实姓名、手机号、机构)独立加密存储;
- R4 PII 拦截扩充:禁止用户在 AI prompt 中输入手机号 / 邮箱 / 身份证 / 银行卡,命中即拦截并提示;
- 账号注销后 30 日内硬删除个人信息(保留必要审计日志依法留存);
- 用户行为埋点脱敏:日志中 IP 截断最后一段,User-Agent 仅保留浏览器族。
4. 算法安全监测
覆盖算法应用过程中自身的安全(算法漏洞、被恶意利用等)。
- 制度建设:
- 《算法变更评审办法》:Prompt 策略、词表、cap 类型、模型供应商切换须算法安全组评审 + 灰度发布;
- 《漏洞响应办法》:内部发现 / 白帽反馈 / 用户举报三渠道,按 CVSS 分级处置(Critical 24h、High 72h、Medium 7d);
- 《Prompt 注入防范指引》:用户输入与系统 Prompt 严格分隔,输出结构化校验。
- 技术保障措施:
- 协议化 JSON ops 输出(5 cap),LLM 输出受 schema 约束,自由文本仅
description 字段且经复检;
- JSON 修复工具
jsonRepair.js(作用域栈精确回退)防止 LLM 截断输出导致服务异常;
- 双模型熔断:主备链路实时切换,单厂商故障不影响整体可用性;
- 5 类 cap 各自独立 renderer,单 cap 故障降级不影响其他 cap;
- 每季度一次渗透测试(覆盖 OWASP Top 10 + Prompt 注入专项)。
(三)算法安全事件应急处理制度
1. 应急组织
| 角色 | 职责 | 联系人 |
| 总指挥(算法安全负责人) | 事件定级、对外沟通、关键决策 | __负责人姓名 / 24h 电话__ |
| 算法工程师 | 模型 / API 故障排查、熔断切换、Prompt 复盘 | __算法组值班__ |
| 运维 | 服务器、网络、数据库、备份恢复 | __运维值班__ |
| 法务 / 合规 | 监管报送、用户通告、证据保全 | __法务联系人__ |
| 内容审核 | 违规内容下架、关联作品复查 | __审核值班__ |
2. 事件分级
| 级别 | 判定标准 | 响应时限 | 决策权 |
| 特别重大 | 大规模违规内容外溢 / 监管通报 / 用户数据大规模泄露 | 30 分钟内响应、2 小时内首报网信办 | 法定代表人 + 算法安全负责人 |
| 重大 | 单点违规内容传播 / 模型供应商备案被撤 / 中等规模数据异常 | 1 小时内响应、24 小时内报网信办 | 算法安全负责人 |
| 较大 | 局部服务异常 / 单用户投诉违规 | 2 小时内响应、内部闭环 | 算法安全组组长 |
| 一般 | 性能波动、轻微告警 | 4 小时内响应 | 值班工程师 |
3. 典型场景处置流程
- 场景 1:大模型供应商内容安全事件(厂商备案被撤 / API 出现违规输出)— ① 立即切换备用供应商;② 暂停相关功能;③ 24 小时内向属地网信办报告;④ 用户公告;⑤ 复查近 30 天调用日志。
- 场景 2:用户举报生成违规内容 — ① 2 小时内下架相关作品;② 复查 prompt 日志定位根因;③ 强化敏感词;④ 必要时报网信办;⑤ 同类作品全量复查。
- 场景 3:数据库 / AI 服务宕机 — ① 自动切换备用;② 30 分钟内响应;③ RPO ≤ 1 小时(binlog 恢复);④ 影响时长超 1 小时启动用户通告。
- 场景 4:用户数据泄露 — ① 立即封禁可疑 IP;② 强制重置受影响账号;③ 72 小时内按《个保法》报网信办、告知用户;④ 留存证据链配合监管调查。
- 场景 5:算法漏洞被恶意利用(如 Prompt 注入绕过敏感词)— ① 立即下线受影响接口;② 修复并回归测试后灰度恢复;③ 同类 cap 全面复查。
4. 演练计划
- 每季度组织 1 次技术演练(大模型切换 + 数据库故障切换);
- 每半年组织 1 次内容安全事件桌面推演;
- 演练记录归档保留 3 年;首次桌面演练计划于 2026 年 8 月(对应 R6 整改项)。
(四)算法违法违规处置制度
1. 数据使用违规
- 情形:未授权访问用户数据、超范围使用个人信息、违反分类分级原则、数据未脱敏用于测试等。
- 处置:① 立即停止违规行为并留存证据;② 内部责任员工按情节严重程度给予警告 / 扣绩效 / 解除劳动合同;③ 涉嫌违法犯罪移交司法;④ 受影响用户依《个保法》告知并补救。
2. 信息安全违规
- 情形:发布或传播违法信息、未及时处置违规内容、未按要求留存日志、瞒报或漏报安全事件。
- 处置:① 违规内容立即下架;② 内容审核流程复盘与改进;③ 责任员工追责;④ 监管要求时主动报告并配合处置。
3. 用户权益保护违规
- 情形:未保障用户查阅 / 复制 / 更正 / 删除 / 注销权利、强制同意、暗模式诱导、未成年人保护失职、未提供关闭算法推荐选项(如适用)。
- 处置:① 立即整改违规流程;② 受影响用户补偿或赔礼道歉;③ 流程修订并全员培训;④ 监管要求时报告。
4. 算法安全违规(全周期)
- 算法设计阶段:未做安全评估、未明确风险点 → 退回设计阶段重做。
- 算法开发阶段:未按设计实现防护、引入未授权依赖 → 暂停开发、代码审查、责任人警告。
- 算法测试阶段:未覆盖安全用例、未做对抗测试 → 测试用例补齐后重测。
- 算法上线阶段:未经算法安全委员会审批擅自上线 → 立即下线、追责责任人。
- 算法运行阶段:监测机制失效、未及时响应告警、瞒报事件 → 责任人警告直至解除合同,监管要求时报告。
5. 用户侧违规处置
针对用户利用 SCIDraw 实施违规行为(详见《用户协议 v1.1》第 5 章"学术诚信特别条款"与第 4 章"用户行为规范"):
- 轻度违规(如生成轻微不当内容):内容下架 + 警告;
- 中度违规(多次违反、规避敏感词):封禁 AI 功能 7–30 天;
- 重度违规(学术不端辅助、违法信息传播):永久封禁账号、依法报监管机关。
(五)其他制度
- 《科技伦理审查制度》:对涉及人体试验、医学诊断建议、心理干预等高风险场景的算法功能,立项前由数据合规组联合外部顾问开展伦理审查;SCIDraw 现行业务(科研绘图辅助)属低风险,已声明不涉及医学诊断与决策。
- 《算法备案信息更新办法》:算法主体信息、模型供应商、负责人、应急联系人变更时,30 日内通过备案系统更新。
- 《第三方供应商管理办法》:模型供应商准入须核验备案号、ToS、隐私政策、安全资质(ISO 27001 / 等保);至少每年复核一次。
- 《员工培训与考核制度》:入职算法安全培训 + 年度复训 + 案例分享会。
- 《文档与版本管理规范》:所有合规文档 git 版本化管理,发布前由算法安全委员会审议。
三、附件
以下现行规章制度文件作为本文附件,供监管机关备查:
| 编号 | 文件名称 | 版本 | 位置 |
| 附件 1 | SCIDraw 算法安全自评估报告 | v0.5(2026-06-17) | 在线 HTML / Word |
| 附件 2 | SCIDraw 用户协议与 AI 透明度声明 | v1.1(待法务定稿) | 在线 HTML |
| 附件 3 | Prompt 敏感词过滤中间件源码与词表 | v0.2 | backend/src/utils/contentFilter.js(词表 Base64 编码) |
| 附件 4 | AI 输出复检与 SVG 消毒实现 | v0.3 | backend/src/utils/contentFilter.js#auditOutput |
| 附件 5 | AI 协议化渲染 5 cap 规范 | v1.0 | frontend/src/lib/protocol/ |
| 附件 6 | AI 操作审计日志说明(ai_operation_logs 表) | v1.0 | 保留 180 天以上 |
| 附件 7 | 数字版权证书 + AI 透明度元数据方案 | Phase 1(2026-06-16 上线) | 公钥 /.well-known/scidraw-cert-pub.pem;校验页 /cert/<cert_id> |
| 附件 8 | 《AI 生成内容安全规范》 | 待制定 | 计划于备案后 3 个月内独立成文 |
| 附件 9 | 《数据分类分级管理办法》 | 待制定 | 计划于备案后 3 个月内独立成文 |
| 附件 10 | 《科技伦理审查制度》 | 待制定 | 计划于备案后 6 个月内独立成文 |
占位符与待办说明
- 所有 __xxx__ 标记的内容须由 SCIDraw 运营公司主体确认后填报(公司全称、注册地址、负责人姓名、联系方式、备案号等)。
- 附件 8–10 标"待制定"的三项独立规章为备案后完善承诺项,将在备案通过后 3–6 个月内独立成文并报送。
- R4(第三方内容安全 API 接入 + PII 拦截扩充)、R6(应急演练)已列入备案后优化承诺函。
- 本文件 v0.1 由 SCIDraw 算法安全组起草,待算法安全委员会审议 + 法务终审后盖章定稿。
填报单位(盖章) __公司全称__(待填)
算法安全负责人(签字) __负责人姓名__(待填)
填报日期 2026 年 月 日