周三,微软和 OpenAI 被 16 名匿名人士起诉,他们声称这两家公司基于 ChatGPT 的人工智能产品在没有充分通知或同意的情况下收集和泄露了他们的个人信息。

该诉状 [PDF] 提交给加利福尼亚州旧金山联邦法院,指控这两家企业忽视了为其人工智能模型获取数据的合法手段,并选择在不付费的情况下收集数据。

诉状称:“尽管制定了购买和使用个人信息的协议,但被告采取了不同的方法:盗窃。” “他们系统地从互联网、‘书籍、文章、网站和帖子中窃取了 3000 亿个单词,包括未经同意获取的个人信息。’” OpenAI 是秘密这样做的,并且没有按照适用法律的要求注册为数据经纪人。”

据称,两家公司通过其人工智能产品“收集、存储、跟踪、共享和披露”数百万人的个人信息,包括产品详细信息、帐户信息、姓名、联系方式、登录凭据、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天日志、使用数据、分析、cookie、搜索和其他在线活动。

诉状称,微软和 OpenAI 在其人工智能产品中嵌入了数百万人的个人信息,这些信息反映了兴趣爱好、宗教信仰、政治观点、投票记录、社交和支持团体成员身份、性取向和性别认同、工作经历、家庭照片、朋友以及在线互动产生的其他数据。

OpenAI开发了一系列文本生成大语言模型,包括GPT-2、GPT-4和ChatGPT;微软不仅拥护这项技术,而且一直将其渗透到从 Windows 到 Azure 的帝国各个角落。

诉状称:“就个人身份信息而言,被告未能充分将其从培训模型中过滤掉,使数百万人面临着该信息立即或以其他方式泄露给世界各地陌生人的风险。” 登记册2021 年 3 月 18 日关于该主题的特别报告。

这份长达 157 页的投诉大量引用了媒体和学术引文,表达了对人工智能模型和道德规范的担忧,但很少提及具体的伤害实例。

对于 16 名原告,投诉表明他们使用 ChatGPT 以及 Reddit 等其他互联网服务,并预计他们的数字交互不会被纳入人工智能模型中。

原告创建的内容和元数据实际上是如何被利用的,以及 ChatGPT 或其他模型是否会复制这些数据,还有待观察。

OpenAI 过去通过过滤来处理个人信息的复制。

该诉讼正在寻求集体诉讼认证和 30 亿美元的损害赔偿——尽管这个数字可能只是一个占位符。如果原告胜诉,将根据法院的调查结果确定任何实际损害赔偿。

诉状称,微软和 OpenAI 获取和使用私人信息,以及通过与 ChatGPT 和类似产品集成非法拦截用户与第三方服务之间的通信,违反了美国的《电子隐私通信法》。

苏球进一步声称,被告通过插件拦截交互数据,违反了《计算机欺诈和滥用法》。

它还指控违反了《加州侵犯隐私法》和《不正当竞争法》、《伊利诺伊州生物识别信息隐私法》和《消费者欺诈和欺骗性商业行为法》以及《纽约商法》,以及疏忽和不当得利等各种一般损害(侵权行为) 。

微软和 OpenAI 拒绝置评。

微软及其 GitHub 子公司和 OpenAI 去年 11 月被起诉,涉嫌通过基于 GitHub 提供的 OpenAI 模型的 Copilot 服务,违反许可要求复制数百万软件开发人员的代码。该案正在进行中。 ®