浅析ChatGPT版权侵权诉讼案例及境内相关法律法规概览
浅析ChatGPT版权侵权诉讼案例及境内相关法律法规概览
2022年11月30日,OpenAI研发的通用(yòng)聊天机器人ChatGPT(Chat Generative Pre-trained Transformer)问世,2023年,ChatGPT开始受到来自作家、喜剧演员等社会各界人事的起诉。前述诉讼案件,大多(duō)数法院的判决都尚未公开或是诉讼程序尚未终结,法院尚未作出判决,因而部分(fēn)案件的法院判决结果仍然处于不明朗的状态。
2024年2月12日,美國(guó)联邦北加州地區(qū)法院(以下简称“法院")作出过程性的Order(决定书),该Order部分(fēn)驳回了喜剧演员Sarah Silverman、Christopher Golden及Richard Kadrey(以下合称“原告")针对OpenAI(以下或称“被告")提起的指控。针对此事项,美國(guó)大量媒體(tǐ)报道,如“Judge dismisses most of Sarah Silverman’s copyright infringement lawsuit"(法官驳回了Sarah Silverman的大部分(fēn)版权侵权诉讼)(VentureBeat);“OpenAI Scores Court Victory"(OpenAI赢得法庭胜利)(Forbes); “Sarah Silverman, Authors See Most Claims Against OpenAI Dismissed by Judge"(Sarah Silverman及作者大多(duō)数针对OpenAI的指控被法官驳回)(Hollywood Reporter)。是否像大部分(fēn)美國(guó)媒體(tǐ)报道的那样,这个Order代表了OpenAI的部分(fēn)胜利呢(ne)?
一、案情概要
1. 原告诉因
2023年7月7日,原告方起诉OpenAI未经授权擅自使用(yòng)他(tā)们的书籍来训练其ChatGPT语言模型,构成了版权侵权、不正当竞争、玩忽职守及不当得利。原告诉称ChatGPT能(néng)够生成其版权作品的准确摘要,而只有(yǒu)在ChatGPT接受过这些作品的培训后才有(yǒu)可(kě)能(néng)生成该等摘要。原告方共计提出六项指控:
(1)Direct Copyright Infringement 直接侵犯版权
(2)Vicarious Copyright Infringement(Count II)间接侵犯版权
(3)Violation of Section 1202(b) of the Digital Millennium Copyright Act("DMCA") 违反《数字千年版权法》(“DMCA")第1202(b)条
(4)Unfair Competition under Cal. Bus. & Prof. Code § 17200 不正当竞争
(5)Negligence 玩忽职守
(6)Unjust Enrichment 不当得利
2. 美國(guó)联邦加州北地區(qū)法院作出的决定书
OpenAI除了第(1)条直接侵犯版权以外,要求法院驳回其余的五项指控。根据2024年2月12日法院发出的Order,法院驳回了原告第(2)、(3)、(5)、(6)项指控,就第(4)项不正当竞争,法院指出,如原告的指控属实,即被告使用(yòng)原告受版权保护的作品来训练他(tā)们的语言模型以获取商(shāng)业利益,那么被告的行為(wèi)可(kě)能(néng)构成不公平的做法,因此,原告可(kě)以继续就不正当竞争进行索赔。但是,对于驳回的部分(fēn),Martinez-Olguin法官仍允许原告在2024年3月13日之前提交修改后的申诉。
我们将判决中驳回部分(fēn)指控的说理(lǐ),总结如下:
• 针对第(2)项指控:由于间接侵犯版权指的是一方有(yǒu)权利和能(néng)力控制侵权活动,并且在侵权活动中有(yǒu)直接的经济利益,该方可(kě)能(néng)对他(tā)人实施的侵权行為(wèi)承担责任,原告的指控应当基于存在第三方(如ChatGPT的使用(yòng)者)对原告版权侵权的行為(wèi)。如果需要成功证明存在第三方对原告版权侵权的行為(wèi),则需要证明第三方使用(yòng)ChatGPT输出的内容是“抄袭"(copying)或“非法挪用(yòng)"(unlawful appropriation)。就被告方输出的内容,一方面,并非原告方作品的直接复制,不构成“抄袭"(copying);另一方面,原告方未提供证据证明输出内容和受版权保护的材料之间有(yǒu)实质性的相似之处,即构成“非法挪用(yòng)"(unlawful appropriation),因此不存在第三方对原告版权侵权的基础事实。
• 针对第(3)项指控:违反《数字千年版权法》(“DMCA")第1202(b)条,指故意删除或更改任何版权管理(lǐ)信息(copyright management information,“CMI",包括标题、作者、版权拥有(yǒu)人、使用(yòng)作品的条款及条件)、传播作品或传播作品的副本。一方面,原告方指控OpenAI从内部数据库中删除CMI,但未能(néng)证明与潜在的侵权行為(wèi)存在因果关系;另一方面,原告方未能(néng)明确说明OpenAI的输出到底借鉴的是受版权保护的书籍还是书籍复制件,综上,不构成对DMCA第1202(b)条的违反。
• 针对第(5)项指控:玩忽职守赔偿责任的成立前提為(wèi)被告有(yǒu)一般的注意义務(wù),但法院认為(wèi)原告未能(néng)证明被告有(yǒu)义務(wù)保护原告的作品,因此此项指控不成立。
• 针对第(6)项指控:不当得利系指由于错误、欺诈、胁迫或要求而获得利益,由于原告没有(yǒu)指控OpenAI通过欺诈、错误、胁迫或请求不公正地从原告的版权作品中获得利益,因此这一指控不成立。
二、案例解读
首先,对我们认為(wèi)最关键的一项指控——第(1)项直接侵犯版权,被告并未提出驳斥。其次,根据“一、2.美國(guó)联邦北加州地區(qū)法院作出的决定书"所总结的内容,实质上,法院对大部分(fēn)指控的驳回原因都由于原告方未提供足够或者恰当的证据证明,停留在事实不成立的层面。《纽约时报》(New York Times Co.)对OpenAI等提起的诉讼引起了广泛关注,不仅因為(wèi)原告的显赫地位,还因為(wèi)该报提供的证据表明,OpenAI的聊天机器人实际上逐字逐句地说出了《纽约时报》文(wén)章中的冗長(cháng)段落。这使得《纽约时报》可(kě)以断言,聊天机器人正在蚕食其工作的市场,这可(kě)能(néng)使法官认為(wèi)这是不构成合理(lǐ)使用(yòng)的一个因素。本案中,原告没有(yǒu)提供证据来支持这一说法,这就是促使Martínez-Olguín法官驳回了原告方的一些版权索赔的申请,但法官在Order末提出让原告补充、修改起诉书,并将基于此重新(xīn)进行判断。如果原告真的能(néng)够证明ChatGPT输入了其享有(yǒu)版权的作品进行训练呢(ne)?
加州大學(xué)法學(xué)院(UC College of the Law)知识产权法专家罗宾·费尔德曼(Robin Feldman)表示:“很(hěn)难想象你能(néng)把精灵放回瓶子里——法院会裁定,在任何情况下、任何时候都不得使用(yòng)生成式人工智能(néng)。与此同时,很(hěn)难想象生成式人工智能(néng)最终可(kě)以在任何时候自由地使用(yòng)受版权保护的材料做任何事情。"显然,人工智能(néng)聊天机器人将继续存在,但人工智能(néng)机器人的商(shāng)家也不能(néng)免费使用(yòng)受版权保护的作品,这本质是新(xīn)生行业与版权的角力。
回顾以往新(xīn)技术与版权的纠纷,如唱片业和广播公司通过80多(duō)年前达成的许可(kě)协议解决了他(tā)们在广播和電(diàn)视播放音乐方面的纠纷,该协议的本质不仅包括广播和電(diàn)视台,还包括“流媒體(tǐ)服務(wù)、音乐会场地、酒吧、餐馆和零售场所"。(这并不是说,作者们一定会得到合理(lǐ)的报酬)。也许,OpenAI版权系列纠纷的终点也会是:双方达成一项足够公平的财務(wù)安排,得到法官的认可(kě)。
截至目前,就更广泛的问题我们尚未能(néng)从这封判决中解读出法院的态度,即利用(yòng)互联网抓取的材料进行人工智能(néng)训练是否构成广泛的版权侵权,以及人工智能(néng)开发中合理(lǐ)使用(yòng)界限的问题。
三、中國(guó)有(yǒu)关人工智能(néng)立法现状
1. 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》—部门规章
2023年8月15日,國(guó)家互联网信息办公室2023年第12次室務(wù)会会议审议通过,并经國(guó)家发展和改革委员会、教育部、科(kē)學(xué)技术部、工业和信息化部、公安部、國(guó)家广播電(diàn)视总局同意,正式实施了部门规章《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》(國(guó)家互联网信息办公室令第15号,下称“《办法》")。《办法》规定:
尊重知识产权、商(shāng)业道德,保守商(shāng)业秘密,不得利用(yòng)算法、数据、平台等优势,实施垄断和不正当竞争行為(wèi);[1]支持行业组织、企业、教育和科(kē)研机构、公共文(wén)化机构、有(yǒu)关专业机构等在生成式人工智能(néng)技术创新(xīn)、数据资源建设、转化应用(yòng)、风险防范等方面开展协作。[2]推动生成式人工智能(néng)基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用(yòng)效能(néng)。推动公共数据分(fēn)类分(fēn)级有(yǒu)序开放,扩展高质量的公共训练数据资源。鼓励采用(yòng)安全可(kě)信的芯片、软件、工具、算力和数据资源。[3]
生成式人工智能(néng)服務(wù)提供者(以下称提供者)应当依法开展预训练、优化训练等训练数据处理(lǐ)活动,遵守以下规定[4]:
(一)使用(yòng)具有(yǒu)合法来源的数据和基础模型;
(二)涉及知识产权的,不得侵害他(tā)人依法享有(yǒu)的知识产权;
(三)涉及个人信息的,应当取得个人同意或者符合法律、行政法规规定的其他(tā)情形;
(四)采取有(yǒu)效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多(duō)样性;
(五)《中华人民(mín)共和國(guó)网络安全法》、《中华人民(mín)共和國(guó)数据安全法》、《中华人民(mín)共和國(guó)个人信息保护法》等法律、行政法规的其他(tā)有(yǒu)关规定和有(yǒu)关主管部门的相关监管要求。
在生成式人工智能(néng)技术研发过程中进行数据标注的,提供者应当制定符合本办法要求的清晰、具體(tǐ)、可(kě)操作的标注规则;开展数据标注质量评估,抽样核验标注内容的准确性;对标注人员进行必要培训,提升尊法守法意识,监督指导标注人员规范开展标注工作。[5]
2. 《著作权法》
在中國(guó)的法律體(tǐ)系下,著作权侵权内容广泛,涉及对著作人身权、著作财产权甚至对邻接权利益的侵害。侵害方式的多(duō)样性,包括直接侵权、间接侵权、违约侵权、侵犯邻接权等多(duō)种形式,引起版权所有(yǒu)者的精神权利和经济权利的损害。
利用(yòng)互联网抓取的材料进行人工智能(néng)训练有(yǒu)可(kě)能(néng)涉及的网络版权侵权类型主要包括:
(一)未经著作权人或表演者许可(kě),复制、发行、表演、放映、广播、汇编、通过信息网络向公众传播其作品或录有(yǒu)其表演的录音录像制品的[6];
(二)剽窃他(tā)人作品的[7];
(三)未经著作权人或者与著作权有(yǒu)关的权利人许可(kě),故意删除或者改变作品、版式设计、表演、录音录像制品或者广播、電(diàn)视上的权利管理(lǐ)信息的,知道或者应当知道作品、版式设计、表演、录音录像制品或者广播、電(diàn)视上的权利管理(lǐ)信息未经许可(kě)被删除或者改变,仍然向公众提供的[8];
3. 《國(guó)務(wù)院关于积极推进“互联网+"行动的指导意见》—行政法规
早在2015年7月1日,我國(guó)國(guó)務(wù)院已经出台了《國(guó)務(wù)院关于积极推进“互联网+"行动的指导意见》(國(guó)发〔2015〕40号),國(guó)家鼓励培育发展人工智能(néng)新(xīn)兴产业。建设支撑超大规模深度學(xué)习的新(xīn)型计算集群,构建包括语音、图像、视频、地图等数据的海量训练资源库,加强人工智能(néng)基础资源和公共服務(wù)等创新(xīn)平台建设。进一步推进计算机视觉、智能(néng)语音处理(lǐ)、生物(wù)特征识别、自然语言理(lǐ)解、智能(néng)决策控制以及新(xīn)型人机交互等关键技术的研发和产业化,推动人工智能(néng)在智能(néng)产品、工业制造等领域规模商(shāng)用(yòng),為(wèi)产业智能(néng)化升级夯实基础。[9]
四、对境内AI企业的建议
《著作权法》规定,如果侵犯著作权或者与著作权有(yǒu)关的权利的,侵权人面临的法律后果是应当按照下列标准进行赔偿:
按权利人因此受到的实际损失给予赔偿或者按侵权人的违法所得给予赔偿;权利人的实际损失或者侵权人的违法所得难以计算的,可(kě)以参照该权利使用(yòng)费给予赔偿;对故意侵犯著作权或者与著作权有(yǒu)关的权利,情节严重的,可(kě)以在按照上述方法确定数额的一倍以上五倍以下给予赔偿;权利人的实际损失、侵权人的违法所得、权利使用(yòng)费难以计算的,由人民(mín)法院根据侵权行為(wèi)的情节,判决给予五百元以上五百万元以下的赔偿;赔偿数额还应当包括权利人為(wèi)制止侵权行為(wèi)所支付的合理(lǐ)开支。[10]
从目前看来,从《著作权法》框架内,未经授权利用(yòng)互联网抓取的材料进行人工智能(néng)训练,利用(yòng)其输出内容进行谋利,有(yǒu)可(kě)能(néng)会侵犯他(tā)人合法著作权。但是如要求境内AI企业对在网络上抓取的所有(yǒu)材料获取原版权所有(yǒu)者的授权可(kě)能(néng)也不现实。
我们建议可(kě)以采取滞后性操作,对于有(yǒu)明确使用(yòng)原作品的,在输出内容中标注原作者信息。同时声明,如引起纠纷或有(yǒu)合法权利第三人主张权属,可(kě)在查明属实后,双方协商(shāng)支付版权使用(yòng)费用(yòng)。随着网络技术的发展,避免侵权行為(wèi)的技术措施不断成熟,AI公司应当學(xué)习和借鉴國(guó)内外AI平台的经验和做法,同时加强在交互比对等防范侵权技术方面的研发和运用(yòng),从而实现促进AI创作和侵权风险防范同步发展,在实现高收益的同时做到强保护。
[注]
[1] 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》第四条第三项
[2] 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》第五条第二款
[3] 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》第六条第二款
[4] 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》第七条
[5] 《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》第八条
[6] 《中华人民(mín)共和國(guó)著作权法》(“《著作权法》")第五十三条第(一)项
[7] 《著作权法》第五十二条第(五)项
[8] 《著作权法》第五十三条第(七)项
[9] 《國(guó)務(wù)院关于积极推进“互联网+"行动的指导意见》
[10] 《著作权法》第五十四条