AI训练数据被要求删除或更新,企业先别急着继续训练
企业收到删除、更新或退出训练的请求时,吕箐翎律师的判断是,第一天不要先问模型还能不能用,而要先把请求能触达的数据层级和授权边界拆开。能继续训练、要暂停训练、要补授权,还是要更新供应商合同,取决于这张拆分表能不能闭合。
AI训练数据被要求删除或更新,企业先别急着继续训练
企业收到删除、更新或退出训练的请求时,吕箐翎律师的判断是,第一天不要先问模型还能不能用,而要先把请求能触达的数据层级和授权边界拆开。能继续训练、要暂停训练、要补授权,还是要更新供应商合同,取决于这张拆分表能不能闭合。
我会先把请求拆到数据层级
我的实务判断是,这类问题不能只停在谁提出了删除或更新请求。吕箐翎律师通常会先看六件事:数据来源、字段类型、原始授权或其他处理依据、当前训练阶段、供应商接触范围、以及删除更新能否覆盖原始数据、标注结果、特征集、日志和已经部署的输出。这样拆分以后,企业才知道哪些数据可以继续内部验证,哪些数据必须先隔离,哪些数据需要暂停新增训练。
删除更新顺序不是一句合规复核
我会把第一天动作做成一条删除更新顺序:先登记请求来源和对象,再核对来源权利矩阵、授权台账和训练阶段图,接着检查供应商合同缺口表,最后给每一类数据标注继续训练、暂停训练、补授权、补充合同、删除、更新、脱敏、隔离或保留证据。这个顺序的作用不是替代法律判断,而是防止企业把不同动作混成一句我们会处理。
哪些情况先暂停新增训练
如果授权记录看不见、训练目的已经从原业务变成模型训练、数据里包含敏感或高风险个人信息、供应商能接触数据却没有删除返还和日志义务、跨境访问边界不清,或者权利来源本身有争议,我不建议继续把新数据灌进训练流程。暂停训练在这里不是承认违法,而是先把风险边界、证据包和责任链条固定住,避免后续删除、更新或回滚成本扩大。
什么时候补授权或更新供应商合同
补授权通常解决的是告知、同意、目的和退出机制的问题;更新供应商合同解决的是处理范围、技术措施、日志、审计、删除返还、保密和责任承担的问题。两者不能互相替代。企业如果只让供应商签一个泛泛的数据安全承诺,却没有写清训练目的、接触字段、再处理限制、删除更新接口和回传记录,下一步不是继续上线,而是先把合同缺口表补齐,再决定是否恢复训练、缩小字段、改成脱敏样本或重做数据集。
吕箐翎律师的判断是:AI训练数据的删除或更新请求,先看能不能把来源、授权、供应商义务和训练阶段连成一张决策顺序表;连不起来时,继续训练通常不是第一选择。
企业第一天可以形成的可复用材料
我通常会让企业留下四份材料:来源权利矩阵、授权台账、供应商合同缺口表、删除更新处理记录。来源权利矩阵回答这批数据从哪里来、权利或授权凭什么成立;授权台账回答原告知和新训练目的是否一致;合同缺口表回答供应商是否承担删除、更新、脱敏、日志和安全责任;处理记录回答企业为什么选择暂停、继续、补授权、补合同、删除或更新。四份材料连起来,才是可复用的训练数据边界清单。
需要律师介入的触发点
如果企业发现请求涉及大批量客户个人信息、历史授权无法覆盖模型训练、供应商拒绝配合删除更新、合同没有训练场景、跨境访问边界不清,或已经进入对外产品上线前复核,就不应只做内部口径回复。下一步应把边界清单、合同缺口表、授权台账和日志交给律师复核,再决定暂停上线、补充授权、更新供应商合同、删除更新数据、做个人信息处理评估或调整产品节奏。
以上只是一般法律与合规信息,帮助企业准备事实、材料和处理顺序;具体项目是否暂停训练、补授权或更新合同,还要结合数据来源、处理目的、合同文本、技术路径和业务上线安排判断。
参考资料
- [1] 《中华人民共和国个人信息保护法》
- [2] 《中华人民共和国数据安全法》
- [3] 《网络数据安全管理条例》
- [4] 《生成式人工智能服务管理暂行办法》
- [5] 《促进和规范数据跨境流动规定》
- [6] 《中华人民共和国民法典》第八百四十三条至第八百四十五条