生成式人工智能服务上线前监管材料先后顺序该怎么排
这是一篇微信公众号稿件。为便于检索、归档与阅读,收录于“公开发声”。
第一层先确认是不是面向公众的生成式人工智能服务
先看风险:企业把训练后的 AI 能力接到公众可用的产品、客服、内容工具或拟人化互动界面时,材料顺序不能只按“模型能不能上线”来排。更稳妥的做法,是先判断服务形态,再把训练数据、算法推荐、深度合成、生成合成内容标识、拟人化互动和数据出境材料分层放好。吕箐翎律师在处理这类材料核查时,通常会先问一个很具体的问题:用户最终看到的是内部工具,还是面向公众提供的互联网信息服务?这个答案会直接改变材料清单的优先级。
第一层先确认是不是面向公众的生成式人工智能服务
第一不要急着写一份总括性的“AI 合规说明”。如果服务只是企业内部测试,材料重点通常还停留在训练数据来源、知识产权授权、个人信息处理和供应商边界。但一旦产品要向公众提供生成式人工智能服务,就不能只保留“数据来源说明”和“模型效果说明”。EvidencePack 中的《生成式人工智能服务管理暂行办法》支持的核查重点包括训练数据来源合法性、知识产权、不含个人信息或取得同意、标注质量和数据处理记录等。
这一层材料至少要回答四个问题:训练数据从哪里来,是否涉及受保护作品、商业秘密或个人信息,标注质量如何控制,数据处理活动有没有可回溯记录。企业常见误区是把这些内容放在产品说明书之后,等到备案、安全评估或合作方尽调时再补。对合规审查来说,数据来源和处理记录不是附录,而是后续判断生成式服务、算法服务和跨境流动风险的底稿。底稿不清,后面的所有说明都会变成口径承诺。
第二层区分算法推荐、深度合成和普通生成输出
关键不是所有 AI 功能都套同一份材料,而是看产品实际提供了什么服务。《互联网信息服务算法推荐管理规定》支撑推荐排序、个性化推送、检索过滤、调度决策等场景下的备案、用户权益保护和算法治理判断。如果 AI 服务把内容、商品、用户线索或问答结果按用户画像、行为或规则做排序分发,算法推荐材料就要提前进入清单。
《互联网信息服务深度合成管理规定》支撑深度合成服务的安全评估、备案、标识、数据与模型安全、个人权益保护等判断。企业如果提供的是图像、音视频、虚拟形象、语音或其他深度合成能力,就不能只写“生成内容由 AI 生成”。材料里应当单独说明合成能力边界、标识安排、数据和模型安全措施,以及个人权益保护处理路径。两类规则可能同时相关,但不能混成一句“我们有 AI 合规制度”。排序时可以先列服务功能,再把算法推荐、深度合成和普通生成输出分别打勾,避免遗漏。
第三层把生成合成内容标识放在输出侧检查
很多团队会先做训练数据授权,再做算法或服务备案,却把标识问题留给产品界面最后处理。这个顺序风险较高。EvidencePack 中的《人工智能生成合成内容标识办法》用于支撑 AI 生成合成内容的显式标识、隐式标识、服务提供者和内容传播平台义务判断。它关注的是用户和传播链条能否识别生成合成内容,而不只是企业内部是否知道内容来自模型。
因此,输出侧材料至少要能说明:哪些内容属于生成或合成内容,显式标识放在哪里,隐式标识如何与内容生产和传播流程配合,平台或合作方需要接收什么字段。这里不宜只写“页面会提示 AI 生成”。如果服务同时涉及深度合成,标识材料还要和深度合成规则下的标识、安全和权益保护安排对应起来,避免一个界面提示承担所有合规说明。比较实用的做法,是把输出样式、标识位置、传播字段和用户提示放在同一组材料里,让产品、技术和法务看到同一条链路。
第四层拟人化互动要提前看七月十五日节点
拟人化互动不是普通客服话术的同义词。EvidencePack 中的《人工智能拟人化互动服务管理暂行办法》已公布,并以 2026 年 7 月 15 日为施行节点;它用于提示情感陪伴、虚拟角色、拟人化互动等服务在上线或改造时预留数据安全、个人信息保护、未成年人保护、风险提示和服务边界要求。
如果产品计划把 AI 包装成虚拟角色、陪伴对象、拟人客服或持续互动形象,材料顺序要前移。先确认服务边界、风险提示、未成年人保护和个人信息处理,再决定文案、角色设定和交互脚本。否则,企业容易在上线后发现角色设定、数据留存、用户提示和投诉处置都要重做。对正在规划新版产品的团队,七月十五日不是宣传节点,而是材料准备和产品改造的时间边界。已经上线的功能也应当把拟人化特征单独列出来,判断是否需要补充风险提示和服务边界说明。
第五层跨境模型和数据流动不能只问服务器在哪里
如果企业使用境外模型 API、让境外供应商远程访问境内数据、把训练数据或用户输入传给境外服务,材料清单还要加入数据跨境流动核查。EvidencePack 中的《促进和规范数据跨境流动规定》用于支撑使用境外模型 API、跨境传输训练数据、远程访问境内数据或向境外供应商提供个人信息、重要数据时的数据出境路径判断。
这一层要和前面的训练数据、个人信息和服务边界连起来看。不是只问服务器部署在境内还是境外,而是问谁能访问数据、访问什么数据、是否包含个人信息或重要数据、境外供应商是否参与处理、用户输入和生成结果是否形成新的传输链路。材料上可以先形成一张数据流向说明,再决定是否需要进一步做出境路径判断。只把境外模型写成“技术供应商”并不能解决数据流向问题,尤其是用户输入、日志、反馈数据和训练数据可能分属不同处理链条。
第六层推荐的材料排序
比较稳妥的顺序是:先做服务形态判断,再做训练数据和知识产权来源核查;随后根据产品功能判断是否触发生成式人工智能服务、算法推荐、深度合成或拟人化互动规则;再把生成合成内容标识放进输出侧材料;最后检查境外模型、境外供应商和远程访问带来的数据跨境问题。这个顺序不是为了把材料做厚,而是为了让每一份材料都能回答一个具体问题。
服务形态说明回答“这个 AI 到底给谁用”;训练数据说明回答“模型能力从哪里来”;算法、深度合成和拟人化互动说明回答“产品提供了哪类互联网信息服务”;标识材料回答“用户和传播链条能否识别生成合成内容”;数据流向说明回答“数据是否跨境或被境外主体访问”。企业如果先做一份笼统的“AI 合规承诺”,反而很难回答监管、合作方或内部风控真正会问的细节。
第七层材料包可以按责任人拆开
落地时不要只按法律名称建文件夹。更可执行的材料包可以按责任人拆成五组:产品负责人提供服务形态、用户范围和功能边界;技术负责人提供训练数据、标注、模型调用、日志和输出链路;法务或合规负责人整理知识产权、个人信息、生成式服务、算法推荐、深度合成和拟人化互动规则对应关系;运营负责人确认用户提示、投诉处置和未成年人保护安排;供应商管理负责人说明境外模型 API、远程访问和数据传输安排。
这样拆分的价值在于,任何一个材料缺口都能回到具体责任人,而不是停在“合规待补”。对于准备上线、改版或接入第三方模型的企业,这种排序比一次性写长报告更容易暴露问题:数据来源不清,先回到训练数据底稿;输出标识不清,先回到界面和传播字段;拟人化互动边界不清,先回到角色设定和用户提示;跨境路径不清,先回到数据流向和供应商访问范围。
收口:这是一份排序表,不是上线承诺
以上内容只作为一般法律信息和材料整理参考,不构成针对具体项目的法律意见,也不能替代正式咨询或专项审查。具体项目仍要结合服务对象、功能形态、数据来源、用户范围、供应商安排和上线时间判断。后续可以继续关注 AI 服务上线材料、数据来源核查和生成合成内容标识的拆解。
参考资料
- [1] 《生成式人工智能服务管理暂行办法》
- [2] 《互联网信息服务算法推荐管理规定》
- [3] 《互联网信息服务深度合成管理规定》
- [4] 《人工智能生成合成内容标识办法》
- [5] 《人工智能拟人化互动服务管理暂行办法》
- [6] 《促进和规范数据跨境流动规定》