生成式人工智能服务上线前监管材料先后顺序该怎么排

创建：2026-06-08 更新：2026-06-08 吕箐翎律师

微信公众号数据合规

这是一篇微信公众号稿件。为便于检索、归档与阅读，收录于“公开发声”。

第一层先确认是不是面向公众的生成式人工智能服务

先看风险：企业把训练后的 AI 能力接到公众可用的产品、客服、内容工具或拟人化互动界面时，材料顺序不能只按“模型能不能上线”来排。更稳妥的做法，是先判断服务形态，再把训练数据、算法推荐、深度合成、生成合成内容标识、拟人化互动和数据出境材料分层放好。吕箐翎律师在处理这类材料核查时，通常会先问一个很具体的问题：用户最终看到的是内部工具，还是面向公众提供的互联网信息服务？这个答案会直接改变材料清单的优先级。

第一层先确认是不是面向公众的生成式人工智能服务

第一不要急着写一份总括性的“AI 合规说明”。如果服务只是企业内部测试，材料重点通常还停留在训练数据来源、知识产权授权、个人信息处理和供应商边界。但一旦产品要向公众提供生成式人工智能服务，就不能只保留“数据来源说明”和“模型效果说明”。EvidencePack 中的《生成式人工智能服务管理暂行办法》支持的核查重点包括训练数据来源合法性、知识产权、不含个人信息或取得同意、标注质量和数据处理记录等。

这一层材料至少要回答四个问题：训练数据从哪里来，是否涉及受保护作品、商业秘密或个人信息，标注质量如何控制，数据处理活动有没有可回溯记录。企业常见误区是把这些内容放在产品说明书之后，等到备案、安全评估或合作方尽调时再补。对合规审查来说，数据来源和处理记录不是附录，而是后续判断生成式服务、算法服务和跨境流动风险的底稿。底稿不清，后面的所有说明都会变成口径承诺。

第二层区分算法推荐、深度合成和普通生成输出

关键不是所有 AI 功能都套同一份材料，而是看产品实际提供了什么服务。《互联网信息服务算法推荐管理规定》支撑推荐排序、个性化推送、检索过滤、调度决策等场景下的备案、用户权益保护和算法治理判断。如果 AI 服务把内容、商品、用户线索或问答结果按用户画像、行为或规则做排序分发，算法推荐材料就要提前进入清单。

《互联网信息服务深度合成管理规定》支撑深度合成服务的安全评估、备案、标识、数据与模型安全、个人权益保护等判断。企业如果提供的是图像、音视频、虚拟形象、语音或其他深度合成能力，就不能只写“生成内容由 AI 生成”。材料里应当单独说明合成能力边界、标识安排、数据和模型安全措施，以及个人权益保护处理路径。两类规则可能同时相关，但不能混成一句“我们有 AI 合规制度”。排序时可以先列服务功能，再把算法推荐、深度合成和普通生成输出分别打勾，避免遗漏。

第三层把生成合成内容标识放在输出侧检查

很多团队会先做训练数据授权，再做算法或服务备案，却把标识问题留给产品界面最后处理。这个顺序风险较高。EvidencePack 中的《人工智能生成合成内容标识办法》用于支撑 AI 生成合成内容的显式标识、隐式标识、服务提供者和内容传播平台义务判断。它关注的是用户和传播链条能否识别生成合成内容，而不只是企业内部是否知道内容来自模型。

因此，输出侧材料至少要能说明：哪些内容属于生成或合成内容，显式标识放在哪里，隐式标识如何与内容生产和传播流程配合，平台或合作方需要接收什么字段。这里不宜只写“页面会提示 AI 生成”。如果服务同时涉及深度合成，标识材料还要和深度合成规则下的标识、安全和权益保护安排对应起来，避免一个界面提示承担所有合规说明。比较实用的做法，是把输出样式、标识位置、传播字段和用户提示放在同一组材料里，让产品、技术和法务看到同一条链路。

第四层拟人化互动要提前看七月十五日节点

拟人化互动不是普通客服话术的同义词。EvidencePack 中的《人工智能拟人化互动服务管理暂行办法》已公布，并以 2026 年 7 月 15 日为施行节点；它用于提示情感陪伴、虚拟角色、拟人化互动等服务在上线或改造时预留数据安全、个人信息保护、未成年人保护、风险提示和服务边界要求。

如果产品计划把 AI 包装成虚拟角色、陪伴对象、拟人客服或持续互动形象，材料顺序要前移。先确认服务边界、风险提示、未成年人保护和个人信息处理，再决定文案、角色设定和交互脚本。否则，企业容易在上线后发现角色设定、数据留存、用户提示和投诉处置都要重做。对正在规划新版产品的团队，七月十五日不是宣传节点，而是材料准备和产品改造的时间边界。已经上线的功能也应当把拟人化特征单独列出来，判断是否需要补充风险提示和服务边界说明。

第五层跨境模型和数据流动不能只问服务器在哪里

如果企业使用境外模型 API、让境外供应商远程访问境内数据、把训练数据或用户输入传给境外服务，材料清单还要加入数据跨境流动核查。EvidencePack 中的《促进和规范数据跨境流动规定》用于支撑使用境外模型 API、跨境传输训练数据、远程访问境内数据或向境外供应商提供个人信息、重要数据时的数据出境路径判断。

这一层要和前面的训练数据、个人信息和服务边界连起来看。不是只问服务器部署在境内还是境外，而是问谁能访问数据、访问什么数据、是否包含个人信息或重要数据、境外供应商是否参与处理、用户输入和生成结果是否形成新的传输链路。材料上可以先形成一张数据流向说明，再决定是否需要进一步做出境路径判断。只把境外模型写成“技术供应商”并不能解决数据流向问题，尤其是用户输入、日志、反馈数据和训练数据可能分属不同处理链条。

第六层推荐的材料排序

比较稳妥的顺序是：先做服务形态判断，再做训练数据和知识产权来源核查；随后根据产品功能判断是否触发生成式人工智能服务、算法推荐、深度合成或拟人化互动规则；再把生成合成内容标识放进输出侧材料；最后检查境外模型、境外供应商和远程访问带来的数据跨境问题。这个顺序不是为了把材料做厚，而是为了让每一份材料都能回答一个具体问题。

服务形态说明回答“这个 AI 到底给谁用”；训练数据说明回答“模型能力从哪里来”；算法、深度合成和拟人化互动说明回答“产品提供了哪类互联网信息服务”；标识材料回答“用户和传播链条能否识别生成合成内容”；数据流向说明回答“数据是否跨境或被境外主体访问”。企业如果先做一份笼统的“AI 合规承诺”，反而很难回答监管、合作方或内部风控真正会问的细节。

第七层材料包可以按责任人拆开

落地时不要只按法律名称建文件夹。更可执行的材料包可以按责任人拆成五组：产品负责人提供服务形态、用户范围和功能边界；技术负责人提供训练数据、标注、模型调用、日志和输出链路；法务或合规负责人整理知识产权、个人信息、生成式服务、算法推荐、深度合成和拟人化互动规则对应关系；运营负责人确认用户提示、投诉处置和未成年人保护安排；供应商管理负责人说明境外模型 API、远程访问和数据传输安排。

这样拆分的价值在于，任何一个材料缺口都能回到具体责任人，而不是停在“合规待补”。对于准备上线、改版或接入第三方模型的企业，这种排序比一次性写长报告更容易暴露问题：数据来源不清，先回到训练数据底稿；输出标识不清，先回到界面和传播字段；拟人化互动边界不清，先回到角色设定和用户提示；跨境路径不清，先回到数据流向和供应商访问范围。

收口：这是一份排序表，不是上线承诺

以上内容只作为一般法律信息和材料整理参考，不构成针对具体项目的法律意见，也不能替代正式咨询或专项审查。具体项目仍要结合服务对象、功能形态、数据来源、用户范围、供应商安排和上线时间判断。后续可以继续关注 AI 服务上线材料、数据来源核查和生成合成内容标识的拆解。

第一层先确认是不是面向公众的生成式人工智能服务

第二层区分算法推荐、深度合成和普通生成输出

第三层把生成合成内容标识放在输出侧检查

第四层拟人化互动要提前看七月十五日节点

第五层跨境模型和数据流动不能只问服务器在哪里

第六层推荐的材料排序

第七层材料包可以按责任人拆开

收口：这是一份排序表，不是上线承诺

参考资料