ChatGPT被起诉索赔30亿！16人匿名状告OpenAI--快科技--科技改变未来

正文内容 评论（0）

ChatGPT被起诉索赔30亿！16人匿名状告OpenAI

2023-07-08 17:26:38 出处：量子位作者：明敏编辑：随心评论(0)

#ChatGPT #起诉

一天吃两起官司，ChatGPT现在有大麻烦了。

原因都和数据有关。

先是16人匿名起诉OpenAI及微软，认为他们在未经允许的情况下使用并泄露了个人隐私数据，索赔金额高达30亿美元。

紧接着，2位全职作者提出，OpenAI未经允许使用了他们的小说训练ChatGPT，构成侵权。

而且两边的原告都表示，OpenAI从互联网上搜刮的数据可太多了，除了他们以外还有非常多人的数据正在被违规使用。

网上的讨论很多，有人表示作家就是应该维权，并且获得适当的报酬。

但也有人认为，生成式AI学习互联网数据就像是学生去参观艺术作品一样，应该选择开放。

现在这两起诉讼都被递交到了加利福尼亚旧金山联邦法院。

被告方OpenAI暂时没有做出公开回应。

16人索赔30亿

先来看第一起诉讼。

6月28日，16位匿名人士向OpenAI及微软发起诉讼，他们认为基于ChatGPT的AI产品在没有告知或获得本人同意的情况下，收集且泄露了他们的个人信息。

这种行为违反了AI模型数据相关的法律政策，而且没有付费。

他们从互联网、书籍、文章、网站和帖子中抓取了3000亿个单词，其中包括未经允许获取的个人信息。

这其中包含账户信息、姓名、联系方式、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天数据、cookie等等。

这使得个人信息被嵌入到了他们的AI产品中，而这些信息可以反映出个人爱好、观点、工作履历甚至家庭照片等。

原告认为OpenAI没能充分将这些敏感信息进行过滤，会导致数百万人面临信息被泄露的风险。

而且他们指控如上抓取数据的行为，OpenAI是“秘密进行”的，没有按照适用法律要求的那样注册为数据代理商。

负责这次起诉的律师事务所Clarkson，此前曾负责过数据泄露和虚假广告等问题的大规模集体诉讼。

但能否胜诉目前还很不确定。

知识产权律师凯瑟琳·加德纳（Katherine Gardner）表示，当用户将内容上传到社交平台或者其他网站时，他们都会授予平台广泛许可，允许平台使用他们的内容。

因此，普通用户想要就AI模型的数据获取问题获得赔偿，具有比较高的挑战性。

以及有人发现在这份长达157页的诉讼书中，大量引用了媒体及学界在AI伦理道德方面的讨论和警告，但是对于造成实际影响的具体案例列举不多。

另一边，两位美国作家也在同一天起诉OpenAI，认为他们的作品被拿去训练ChatGPT。

具体的证据是，ChatGPT能为他们的书生成“非常准确”的摘要，这足以说明这些书被收录在数据库中。

保罗·特朗布莱（Paul Tremblay）和莫娜·阿瓦德（Mona Awad）表示，ChatGPT未经许可就从数千本书中拷贝数据，这侵犯了作者们的版权。

起诉书中预估，OpenAI的训练数据中至少包含30万本书，其中很多来自侵权网站。

比如OpenAI在披露GPT-3训练数据情况时，就表示其中包含两个互联网图书语料库，大概占比为15%。起诉作者认为这些数据就是来自影子图书馆网站的，比如Library Genesis、Sci-Hub等。

以及在2018年，OpenAI透露他们给GPT-1喂的数据中包含7000+本小说。起诉方认为这些书是研究人员从一些盗版网站上复制下来的，而没有获得作者的同意或授权。

目前OpenAI方面没有进行公开回应。

实际上，从生成式AI大火以来，AI公司吃版权、数据隐私官司，也真的不稀奇了。

OpenAI一直深陷数据风波

早在去年11月时，OpenAI和GitHub一起推出的代码助手Copilot，就被程序员们告上了法庭。

原告们认为Copilot侵犯了众多原创代码作者的版权，同时还泄露了用户隐私，因此向法院提起诉讼，索赔达90亿美元。

但到目前为止，这个案件还没有最终定论。

AI画画那边，Stability AI、Midjourney等也同样官司缠身。

因为发现只要输入自己的名字，就能生成个人风格的画作，画家凯利·麦柯南（Kelly McKernan）联合另外两位创作者一起提起诉讼。

律师团队和上面起诉Copilot的都是同一家。

以及网站平台方也不愿意被白嫖数据。

这不最近马斯克给推特限流，给出的理由就是“不想让AI白嫖数据了”。目前限制措施还在实行中，还不知道之后会有怎么样的变化。

Reddit则表示自家平台上的数据非常有价值，所以推出了付费API，价格并不低，这个操作导致不少第三方应用被迫关闭。

总之，AI在网络上大规模抓取数据训练后，带来的隐私安全问题、版权问题层出不穷，被牵扯进来的人也越来越多。

但目前版权问题该怎么算，业内还没有形成确定的规范。

只有日本方面传出过消息，不会对训练AI所使用的数据实施版权保护，因为这能加速AI发展。

责任编辑：随心

文章价值打分

当前文章打分0 分，共有0人打分

0
0
0
打赏
|

分享好友:
分享至QQ
分享至微博
分享至QQ空间
|

生成海报

本文收录在

#ChatGPT #起诉 #索赔

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方
快科技官方微博
今日头条：快科技
带来硬件软件、手机数码最快资讯！
抖音：kkjcn
科技快讯、手机开箱、产品体验、应用推荐...

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章

换一波

好物推荐

换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容 评论（0）

相关资讯

文章价值打分

本文收录在

热门文章 换一波

好物推荐 换一波

关注我们

微博：快科技官方

今日头条：快科技

抖音：kkjcn

热点推荐

好物推荐

图片信息

正文内容评论（0）

热门文章

换一波

好物推荐

换一波