深度合成服务算法备案 · 附件

落实算法安全主体责任基本情况

算法主体：SCIDraw 运营公司__公司全称__（待填）

文档版本 v0.1 · 编制日期 2026-06-17
服务名称：SCIDraw（科研绘图与 AI 辅助生成平台，域名 www.scidraw.cn）
适用算法：基于已备案大模型（GLM-5.1 / MiniMax-M2.5）的深度合成与生成式 AI 应用服务

编制说明　本文档依据《互联网信息服务算法推荐管理规定》《生成式人工智能服务管理暂行办法》《互联网信息服务深度合成管理规定》及国家相关法律法规，结合 SCIDraw 平台实际运营情况编制。文档中所有以 __ 包裹的内容（如 __公司全称__、__负责人姓名__、__备案号__ 等）为待法务与商务最终确认的占位符，定稿盖章前由主体填报单位补齐。配套文件见《SCIDraw 算法安全自评估报告 v0.5》与《SCIDraw 用户协议与 AI 透明度声明 v1.1》。　下载：真 Word .docx（pandoc 生成）/ 兼容 .doc。

一、算法安全专职机构

为切实履行算法安全主体责任，SCIDraw 运营公司组建算法安全与合规委员会（下称"算法安全委员会"），作为公司级算法安全专职机构，对平台算法研发、上线、运行、下线全周期的安全工作负总体责任。委员会直接向法定代表人汇报，独立于产品研发与商业运营条线，确保监督独立性。

1.1 组织架构

机构 / 岗位	主要职责	人员配置
算法安全委员会（决策层）	算法安全战略制定、重大算法上线审批、重大安全事件决策、对外监管对接总负责	主任 1 人（由法定代表人或其授权高管担任），委员 3–5 人（涵盖技术、法务、运营、内容）
算法安全组（执行核心）	日常算法安全审查、Prompt/输出敏感词词表维护、自评估报告编写、与备案机关日常沟通	专职 2 人（算法工程师 + 安全工程师），兼职 1 人
内容审核组	用户举报受理、AI 生成内容抽检、违规作品下架、内容安全趋势分析	专职 1 人 + 兼职 1 人（客服联动）
数据合规组	个人信息保护影响评估、数据出境与上游 API 数据流转合规、用户权利响应（查询/更正/删除）	兼职 1 人（法务背景）+ 外部法律顾问支持
应急响应组	7×24 值班轮值、安全事件分级响应、监管报送、用户通告	运维 1 人（值班）+ 各组负责人联动

1.2 算法安全负责人基本信息

姓名	__负责人姓名__（待主体确认）
职务	算法安全与合规委员会主任 / 首席安全官
联系方式	邮箱 __安全负责人邮箱__　电话 __联系电话__
主要职责	算法安全总体把关、重大算法上线最终审批、对外监管沟通与报送、年度自评估报告署名人
任职要求	本科以上学历、5 年以上互联网或信息安全从业经验、熟悉《算法推荐管理规定》《生成式 AI 服务管理暂行办法》《个保法》《数据安全法》、无违法犯罪记录

1.3 算法安全工作人员任职要求

学历与专业：算法安全组、内容审核组成员须计算机、信息安全、法学或相关专业本科以上学历；数据合规组须有法律职业资格或法务从业经验。
从业经验：核心岗位须 2 年以上互联网产品安全、内容安全或数据合规相关经验。
背景核查：入职前完成无犯罪记录核查、征信核查；签订《算法安全保密协议》与《竞业限制协议》。
持续培训：每年参加不少于 16 学时的算法安全、内容安全、个保法等相关培训并留存记录。

1.4 算法安全技术保障措施

输入侧防护：Prompt 敏感词过滤中间件（17 类约 150 词，覆盖政治、暴恐、色情、邪教、毒品、谣言、歧视、未成年人保护等），词表以 Base64 编码存储规避反编译探测；支持归一化拆字降级匹配。
输出侧复检：所有 AI 出口（生图 description / SVG、实验方案 JSON、PPT 大纲）落地前过 auditOutput() 复检，命中即拦截并写审计日志。
SVG 消毒：AI 生成的 SVG 经白名单 tag 过滤（剥离 <script>、<foreignObject>、on* 事件属性、<defs> 内危险子元素），杜绝 XSS 与 fabric.js 解析异常。
协议化渲染（核心护城河）：AI 仅输出 5 类 JSON 操作指令（smiles / latex / line / rawsvg / chart），由平台原生 renderer 渲染，规避 AI 直接产出不可控 SVG / 位图。这是 SCIDraw 区别于通用 AI 工具的关键安全技术。
双模型熔断：主链路 GLM-5.1（智谱）故障时自动切换 MiniMax-M2.5；任一厂商备案被撤，30 分钟内可下线该链路。
审计留存：ai_operation_logs 表完整记录每次 AI 调用的 prompt、模型、输出、用户 ID、IP、耗时、命中规则，留存 180 天以上。
数字版权证书 + AI 透明度元数据：每张 AI 辅助生成的导出图自动嵌入 ai_generated / ai_model / ai_prompt 元数据（PNG tEXt / JPG XMP / PDF 注释 / SVG metadata），并签发 RSA-2048 内容指纹证书，公开校验页 /cert/<cert_id>。
访问控制：管理后台仅 is_admin = true 用户可访问；敏感操作（用户封禁、内容下架、词表修改）二次确认 + 全量审计。
数据加密：传输层全站 HTTPS；存储层 MySQL 由阿里云 RDS 提供透明加密；密码 bcrypt 哈希存储。
备份与容灾：阿里云 RDS 每日自动快照 + binlog（RPO ≤ 1 小时）；应用服务器 PM2 集群模式（多实例负载均衡）。

二、算法安全管理制度建设

SCIDraw 依据国家相关法律法规及政策要求，结合平台作为"调用已备案大模型的应用服务方"实际定位，制定以下算法安全管理制度。所有制度文件经算法安全委员会审议通过后生效，至少每年评估修订一次。

（一）算法安全自评估制度

1. 制度设计考虑

参照《互联网信息服务算法推荐管理规定》第二十三条至第二十五条及《生成式人工智能服务管理暂行办法》第十四条，SCIDraw 建立覆盖算法全生命周期的自评估制度，核心定位是"事前预防 + 事中监测 + 事后改进"闭环。

触发场景：① 新算法功能上线前；② 已上线算法发生重大变更（模型供应商切换、Prompt 策略调整、词表大改、新增 cap 类型等）；③ 重大安全事件后；④ 监管要求；⑤ 例行年度评估。
评估范围：算法机理、数据来源与数据处理、模型供应链合规、内容安全、用户权益保护（含未成年人）、透明度、应急能力、科技伦理。
评估流程：算法安全组起草 → 内容审核组与数据合规组联合会签 → 算法安全委员会评审 → 形成评估报告（含整改清单）→ 整改跟踪闭环 → 必要时报属地网信办。

2. 合理性、完备性与可落地性论证

合理性：自评估以 SCIDraw 实际业务（科研绘图辅助生成、不直接面向未成年人、用户群体以高校与科研院所为主）为基础，避免"机械套用通用模板"。
完备性：覆盖《算法推荐管理规定》要求的全部评估维度；通过 R1（输入侧）、R2（输出侧）、R3（模型供应链）三大主轴分别建立独立证据链，互为印证。
可落地性：每项评估发现的问题对应 R 编号（R1–R6），明确优先级、负责人、整改期限、验收标准；现行 v0.5 自评估报告显示 P0 项（R1/R2）已全闭环，P1 项（R3/R5）路径已确定并完成草拟。

3. 制度执行保障

算法安全组专人维护自评估模板与历史版本（git 版本化管理）；
每季度召开一次算法安全评审会，复盘评估发现与整改进度；
自评估结果纳入团队 OKR 与绩效考核；
外部法律顾问每年至少一次独立复核。

（二）算法安全监测制度

SCIDraw 算法安全监测覆盖信息安全、数据安全、用户个人信息安全、算法自身安全四大维度，每维度均从制度建设与技术保障措施两方面落地。

1. 信息安全监测

覆盖算法推荐服务中的信息内容安全、信息源安全等。

制度建设：
- 《AI 生成内容安全规范》明确 17 类禁止内容与处置流程；
- 用户举报受理 SOP：邮件 / 客服 / 平台内反馈三通道，24 小时内首次响应、72 小时内处置闭环；
- 内容抽检制度：每日由内容审核组随机抽检 20 张 AI 生成作品，违规率异常时启动专项排查。
技术保障措施：
- 输入侧敏感词过滤中间件（17 类约 150 词，Base64 编码存储）；
- 输出侧 auditOutput() 复检，命中即拦截；
- SVG tag 白名单消毒；
- 5 类 cap 协议化渲染，AI 输出受控；
- R4 整改项（备案后优化）：接入第三方内容安全 API（阿里云绿网 / 网易易盾）+ PII（手机号 / 邮箱 / 身份证 / 银行卡）拦截扩充。

2. 数据安全监测

覆盖算法服务开发与上线后的数据安全。

制度建设：
- 《数据分类分级管理办法》将数据分为：公开数据、内部数据、用户个人信息、敏感凭证 4 级；
- 《数据库访问审计办法》规定仅生产环境应用服务器可通过内网访问 RDS，禁止人工直连；
- 《数据出境合规指引》：用户 prompt 与 AI 输出经 GLM / MiniMax 国内端点处理，不出境。
技术保障措施：
- 阿里云 RDS 透明加密 + 每日快照 + binlog（RPO ≤ 1 小时）；
- 全站 HTTPS；密码 bcrypt 哈希；
- 敏感字段（如微信 openid、邮箱）列级加密；
- API 访问日志 + 数据库审计日志保留 180 天以上；
- 异常查询监控：单 IP 高频拉取、异常 JOIN 模式触发告警。

3. 用户个人信息安全监测

覆盖算法服务开发与上线后的用户个人信息安全。

制度建设：
- 《SCIDraw 用户协议 v1.1》第 3 章、第 6 章公示个人信息处理目的、方式、范围、留存期限；
- 《用户权利响应 SOP》保障查阅、复制、更正、删除、注销、撤回同意 6 项权利，15 个工作日内响应；
- 《未成年人保护特别条款》：未满 14 岁需监护人同意，平台不主动收集未成年人个人信息。
技术保障措施：
- 注册流程最小化收集（邮箱 + 可选昵称），无强制实名；
- 个人信息字段（真实姓名、手机号、机构）独立加密存储；
- R4 PII 拦截扩充：禁止用户在 AI prompt 中输入手机号 / 邮箱 / 身份证 / 银行卡，命中即拦截并提示；
- 账号注销后 30 日内硬删除个人信息（保留必要审计日志依法留存）；
- 用户行为埋点脱敏：日志中 IP 截断最后一段，User-Agent 仅保留浏览器族。

4. 算法安全监测

覆盖算法应用过程中自身的安全（算法漏洞、被恶意利用等）。

制度建设：
- 《算法变更评审办法》：Prompt 策略、词表、cap 类型、模型供应商切换须算法安全组评审 + 灰度发布；
- 《漏洞响应办法》：内部发现 / 白帽反馈 / 用户举报三渠道，按 CVSS 分级处置（Critical 24h、High 72h、Medium 7d）；
- 《Prompt 注入防范指引》：用户输入与系统 Prompt 严格分隔，输出结构化校验。
技术保障措施：
- 协议化 JSON ops 输出（5 cap），LLM 输出受 schema 约束，自由文本仅 description 字段且经复检；
- JSON 修复工具 jsonRepair.js（作用域栈精确回退）防止 LLM 截断输出导致服务异常；
- 双模型熔断：主备链路实时切换，单厂商故障不影响整体可用性；
- 5 类 cap 各自独立 renderer，单 cap 故障降级不影响其他 cap；
- 每季度一次渗透测试（覆盖 OWASP Top 10 + Prompt 注入专项）。

（三）算法安全事件应急处理制度

1. 应急组织

角色	职责	联系人
总指挥（算法安全负责人）	事件定级、对外沟通、关键决策	__负责人姓名 / 24h 电话__
算法工程师	模型 / API 故障排查、熔断切换、Prompt 复盘	__算法组值班__
运维	服务器、网络、数据库、备份恢复	__运维值班__
法务 / 合规	监管报送、用户通告、证据保全	__法务联系人__
内容审核	违规内容下架、关联作品复查	__审核值班__

2. 事件分级

级别	判定标准	响应时限	决策权
特别重大	大规模违规内容外溢 / 监管通报 / 用户数据大规模泄露	30 分钟内响应、2 小时内首报网信办	法定代表人 + 算法安全负责人
重大	单点违规内容传播 / 模型供应商备案被撤 / 中等规模数据异常	1 小时内响应、24 小时内报网信办	算法安全负责人
较大	局部服务异常 / 单用户投诉违规	2 小时内响应、内部闭环	算法安全组组长
一般	性能波动、轻微告警	4 小时内响应	值班工程师

3. 典型场景处置流程

场景 1：大模型供应商内容安全事件（厂商备案被撤 / API 出现违规输出）— ① 立即切换备用供应商；② 暂停相关功能；③ 24 小时内向属地网信办报告；④ 用户公告；⑤ 复查近 30 天调用日志。
场景 2：用户举报生成违规内容 — ① 2 小时内下架相关作品；② 复查 prompt 日志定位根因；③ 强化敏感词；④ 必要时报网信办；⑤ 同类作品全量复查。
场景 3：数据库 / AI 服务宕机 — ① 自动切换备用；② 30 分钟内响应；③ RPO ≤ 1 小时（binlog 恢复）；④ 影响时长超 1 小时启动用户通告。
场景 4：用户数据泄露 — ① 立即封禁可疑 IP；② 强制重置受影响账号；③ 72 小时内按《个保法》报网信办、告知用户；④ 留存证据链配合监管调查。
场景 5：算法漏洞被恶意利用（如 Prompt 注入绕过敏感词）— ① 立即下线受影响接口；② 修复并回归测试后灰度恢复；③ 同类 cap 全面复查。

4. 演练计划

每季度组织 1 次技术演练（大模型切换 + 数据库故障切换）；
每半年组织 1 次内容安全事件桌面推演；
演练记录归档保留 3 年；首次桌面演练计划于 2026 年 8 月（对应 R6 整改项）。

（四）算法违法违规处置制度

1. 数据使用违规

情形：未授权访问用户数据、超范围使用个人信息、违反分类分级原则、数据未脱敏用于测试等。
处置：① 立即停止违规行为并留存证据；② 内部责任员工按情节严重程度给予警告 / 扣绩效 / 解除劳动合同；③ 涉嫌违法犯罪移交司法；④ 受影响用户依《个保法》告知并补救。

2. 信息安全违规

情形：发布或传播违法信息、未及时处置违规内容、未按要求留存日志、瞒报或漏报安全事件。
处置：① 违规内容立即下架；② 内容审核流程复盘与改进；③ 责任员工追责；④ 监管要求时主动报告并配合处置。

3. 用户权益保护违规

情形：未保障用户查阅 / 复制 / 更正 / 删除 / 注销权利、强制同意、暗模式诱导、未成年人保护失职、未提供关闭算法推荐选项（如适用）。
处置：① 立即整改违规流程；② 受影响用户补偿或赔礼道歉；③ 流程修订并全员培训；④ 监管要求时报告。

4. 算法安全违规（全周期）

算法设计阶段：未做安全评估、未明确风险点 → 退回设计阶段重做。
算法开发阶段：未按设计实现防护、引入未授权依赖 → 暂停开发、代码审查、责任人警告。
算法测试阶段：未覆盖安全用例、未做对抗测试 → 测试用例补齐后重测。
算法上线阶段：未经算法安全委员会审批擅自上线 → 立即下线、追责责任人。
算法运行阶段：监测机制失效、未及时响应告警、瞒报事件 → 责任人警告直至解除合同，监管要求时报告。

5. 用户侧违规处置

针对用户利用 SCIDraw 实施违规行为（详见《用户协议 v1.1》第 5 章"学术诚信特别条款"与第 4 章"用户行为规范"）：

轻度违规（如生成轻微不当内容）：内容下架 + 警告；
中度违规（多次违反、规避敏感词）：封禁 AI 功能 7–30 天；
重度违规（学术不端辅助、违法信息传播）：永久封禁账号、依法报监管机关。

（五）其他制度

《科技伦理审查制度》：对涉及人体试验、医学诊断建议、心理干预等高风险场景的算法功能，立项前由数据合规组联合外部顾问开展伦理审查；SCIDraw 现行业务（科研绘图辅助）属低风险，已声明不涉及医学诊断与决策。
《算法备案信息更新办法》：算法主体信息、模型供应商、负责人、应急联系人变更时，30 日内通过备案系统更新。
《第三方供应商管理办法》：模型供应商准入须核验备案号、ToS、隐私政策、安全资质（ISO 27001 / 等保）；至少每年复核一次。
《员工培训与考核制度》：入职算法安全培训 + 年度复训 + 案例分享会。
《文档与版本管理规范》：所有合规文档 git 版本化管理，发布前由算法安全委员会审议。

三、附件

以下现行规章制度文件作为本文附件，供监管机关备查：

编号	文件名称	版本	位置
附件 1	SCIDraw 算法安全自评估报告	v0.5（2026-06-17）	在线 HTML / Word
附件 2	SCIDraw 用户协议与 AI 透明度声明	v1.1（待法务定稿）	在线 HTML
附件 3	Prompt 敏感词过滤中间件源码与词表	v0.2	`backend/src/utils/contentFilter.js`（词表 Base64 编码）
附件 4	AI 输出复检与 SVG 消毒实现	v0.3	`backend/src/utils/contentFilter.js#auditOutput`
附件 5	AI 协议化渲染 5 cap 规范	v1.0	`frontend/src/lib/protocol/`
附件 6	AI 操作审计日志说明（`ai_operation_logs` 表）	v1.0	保留 180 天以上
附件 7	数字版权证书 + AI 透明度元数据方案	Phase 1（2026-06-16 上线）	公钥 `/.well-known/scidraw-cert-pub.pem`；校验页 `/cert/<cert_id>`
附件 8	《AI 生成内容安全规范》	待制定	计划于备案后 3 个月内独立成文
附件 9	《数据分类分级管理办法》	待制定	计划于备案后 3 个月内独立成文
附件 10	《科技伦理审查制度》	待制定	计划于备案后 6 个月内独立成文

占位符与待办说明

所有 __xxx__ 标记的内容须由 SCIDraw 运营公司主体确认后填报（公司全称、注册地址、负责人姓名、联系方式、备案号等）。
附件 8–10 标"待制定"的三项独立规章为备案后完善承诺项，将在备案通过后 3–6 个月内独立成文并报送。
R4（第三方内容安全 API 接入 + PII 拦截扩充）、R6（应急演练）已列入备案后优化承诺函。
本文件 v0.1 由 SCIDraw 算法安全组起草，待算法安全委员会审议 + 法务终审后盖章定稿。

填报单位（盖章）　__公司全称__（待填）

算法安全负责人（签字）　__负责人姓名__（待填）

填报日期　2026 年　　月　　日