程序员诉微软等:“Copilot”案的回顾与更新

摘要:Github和OpenAI合作开发AI编程助手“GitHub Copilot”并于2022年6月开启付费服务。Copilot基于OpenAI开发并授权给微软的Codex AI,通过理解自然语言提示和现有的代码,辅助软件开发者编写代码。

Github和OpenAI合作开发AI编程助手“GitHub Copilot”并于2022年6月开启付费服务。Copilot基于OpenAI开发并授权给微软的Codex AI,通过理解自然语言提示和现有的代码,辅助软件开发者编写代码。

2022年11月,匿名原告在加州北区联邦法院对微软、Github和OpenAI提起集体诉讼(版权相关),主张三被告涉嫌使用托管在Github平台的开源软件代码训练Codex模型,并在Copilot代码辅助服务中提供建议代码但并未按照法律规定、许可证条款约定提供适当的来源标注。

原告认为被告违反数字千年版权法案(DMCA)、兰哈姆法案、不公平竞争法、加州消费者隐私法案(CCPA)等多项法律,同时涉及合同违约、侵权干扰合同关系、欺诈、疏忽等多项行为。

来源标注方面,原告提出以下两项主张:

被告在训练和运营AI产品时,未经许可移除或更改版权管理信息(CMI),并分发未经授权的版权材料,违反DMCA第1202条规定;

基于DMCA的索赔预估高达90亿美元,原告提出的CMI法定赔偿金额估算方式是:假设每个用户在使用Copilot过程中,每次获得侵权输出均三次违反CMI规则(即在分发许可材料时未满足归属、版权通知、许可条款要求);以及,进一步假设每位用户在Copilot使用期限内至少进行过一次违反CMI规则的输出,则Github与OpenAI的违规次数将高达360万次(微软2022年6月报告显示Copilot有120万用户);即使基于最低法定赔偿金额2500美元(CMI法定赔偿金额范围是每次2500-25000美元不等),赔偿总额也高达90亿美元。

被告严重违反了开源许可证协议,这些开源许可证协议都明确要求保留原作者署名且原作者依然拥有开源软件的版权,被告显然违反了署名要求相关条款,而且,被告还通过不当使用Copilot创建与原告形成竞争的衍生作品,非法干扰了原告和集体诉讼成员的商业利益;

原告方还提出:

被诉行为导致消费者混淆、误解或错误地认为原告和集体诉讼成员的许可材料与Copilot有关联、联系或合作,构成欺诈和反向假冒;被告通过从版权材料中删除归属信息、著作权通知和许可条款,并将其作为Copilot的输出重新销售,从而获取利润或其他利益,构成不当得利;被告侵权、干扰合同关系、反向假冒等行为造成原告和集体诉讼成员的经济损失,构成不正当竞争;被告还存在违反GitHub隐私政策和服务条款、违反加州消费者隐私法案(CCPA)、疏忽处理个人数据等行为;各被告共谋通过Copilot产品进行版权侵权、违反协议等非法行为,构成民事共谋。

被告提出驳回动议后,法院在2023年5月11日部分批准、部分拒绝:

原告关于违反DMCA第1202(a)条和1202(b)(2)条、合同关系中的侵权干扰、欺诈、虚假原产地标识、不当得利、不公平竞争、违反GitHub隐私政策和服务条款、违反CCPA以及疏忽的指控被驳回,并允许修改;原告关于民事共谋和声明性救济的指控被驳回,且不得上诉。

法院认为原告基于州法提出的侵权干扰、不当得利、不公平竞争和疏忽指控主张了版权法第106节保护的专有权等同的权利,应优先适用版权法,因此驳回相关州法索赔;由于民事共谋在加州民法下不是单独的诉讼因由,相关主张也被驳回。

DMCA违反和协议违反相关问题上:

法院认为原告未能说明Copilot的输出与原告作品相似,且诉状内容不足以指控被告实施了移除、更改CMI的行为,原告根据DMCA第1202(b)条提出的指控应予驳回。鉴于无法认定被诉违反DMCA的行为已经或将给原告造成经济损失,相关不正当竞争主张也被驳回,但允许原告修改主张后重新提交。违反开源许可协议和合同违约相关主张方面,法院认为原告已经充分确定了被告涉嫌违反的合同义务,可以继续审理。

原告修改诉状后的指控主要涉及违反DMCA、违反开源许可证协议、违反Github政策(隐私声明、服务条款等)三大类指控,相应提出以下救济请求:

因被告剥夺了原告识别和控制其受版权保护作品的复制和/或分发,未遵守开源许可证条款,原告请求获得禁令救济:1)禁止被告违反DMCA;2)扣押被告保管或使用的参与了违反DMCA的设备或产品。因被告存在以下违反开源许可证协议的行为:1)被告输出原告代码却未提供许可材料的源代码;2)未标注来源;3)未包含版权声明;4)没有确定适用于作品的许可和/或包括其文本,请求法院判令被告赔偿原告损失(包括间接损失、被告因此取得的不当得利)。Github政策包含“向 [GitHub] 授予许可.......不授予 GitHub 出售您的内容的权利”及“‘我们不会出售您的个人信息’’不出售个人数据’’我们不会以金钱或其他代价出售您的个人数据’”等内容,因被告违反上述内容创造了Copilot使用原告提供的代码与原告竞争,请求法院判令被告赔偿原告损失(包括直接损失、间接损失、因被告违反该政策而可获得的赔偿)。

被告提出驳回动议后,法院在2024年6月24日裁定部分批准、部分拒绝,因裁定密封发布,看不到详细内容。从后续诉讼文件看,焦点问题还是DMCA相关决定。

在是否违反DMCA的问题上:被告在法院裁定前曾对Copilot产品进行技术调整,即增加“查重”相关功能,用户打开“反复制”安全开关,就可以“检测和抑制”与Github上找到的开源代码匹配的Copilot建议。原告曾提出如果用户关闭Copilot的“反复制”安全开关,就可进行非法代码复制,但没有获得法院支持。法院认为原告还是未能说明输出结果与其代码相似,且观察结果显示Copilot“在良性情况下很少直接提供其记住的代码,大多数原样照搬只发生在用户提示模型使用与训练数据非常相似的长代码片段的情况下”,因此无法认定微软的系统剽窃他人成果。

目前最新的进展是:

原告针对其依据DMCA第1202(b)条提出的指控和不当得利指控,申请进行中间上诉。法院在2024年9月27日发布了关于允许中间上诉和等待上诉期间暂停诉讼的命令,作出这样的决定是因为法院认为第九巡回上诉法院的决定可能会提供“实质性改变本案法院决定”的重要指导。此外,原告在2024年7月18日自愿无条件地撤回针对被告OpenAI Investment LLC的所有诉讼请求,但这并不意味着OpenAI已从本案全身而退,因为完整的OpenAI被诉主体包括OpenAI, Inc.、OpenAI, L.P.、OpenAI OpCo, L.L.C.等诸多关联公司。案件仍在继续进行中。

明天看一下起诉的具体情况。

参考:

2022年11月3日 DOE 1 v. GitHub, Inc. (4:22-cv-06823) District Court, N.D. California

2022年11月15日 Doe 3 v. GitHub, Inc. (4:22-cv-07074) District Court, N.D. California

来源:YunfangW

相关推荐