Meta将使用欧盟用户数据训练人工智能模型

Meta 已确认计划利用其在欧盟的成年用户分享的内容来训练其人工智能模型。

该公告是在 Meta AI 功能近期在欧洲推出之后发布的，旨在增强其 AI 系统对该地区不同人群的能力和文化相关性。

Meta将使用欧盟用户数据训练人工智能模型

Meta 在一份声明中写道：“今天，我们宣布计划使用欧盟成年人在我们产品上分享的公共内容（如公开帖子和评论）在 Meta 上训练人工智能。

“人们与 Meta AI 的互动（例如问题和查询）也将用于训练和改进我们的模型。”

从本周开始，欧盟境内使用 Meta 平台（包括 Facebook、Instagram、WhatsApp 和 Messenger）的用户将收到解释数据使用情况的通知。这些通知将通过应用内和电子邮件发送，详细说明所涉及的公共数据类型，并提供异议表单链接。

Meta 解释说：“我们已将这份异议表格设计得易于查找、阅读和使用，并且我们将尊重所有已收到的异议表格以及新提交的异议表格。”

Meta 明确表示，某些数据类型对于 AI 训练目的仍然是禁止的。

该公司表示，不会“使用人们与亲朋好友的私人信息”来训练其生成式人工智能模型。此外，欧盟18岁以下用户账户的公开数据将不会被纳入训练数据集。

Meta 希望打造专为欧盟用户设计的人工智能工具

Meta 将这一举措定位为打造面向欧盟用户的人工智能工具的必要一步。Meta 上个月在其欧洲的即时通讯应用中推出了人工智能聊天机器人功能，并将此类数据使用视为改进服务的下一阶段。

该公司解释道：“我们相信，我们有责任打造不仅可供欧洲人使用，而且真正为他们打造的人工智能。”

“这意味着一切，从方言和口语，到超本地化知识，以及不同国家在我们的产品上使用幽默和讽刺的独特方式。”

随着人工智能模型不断发展，具有涵盖文本、语音、视频和图像的多模式功能，这一点变得越来越重要。

Meta 还将其在欧盟的行动置于更广泛的行业格局中，并指出利用用户数据训练人工智能是一种常见的做法。

声明中写道：“值得注意的是，我们所进行的人工智能训练并不是 Meta 独有的，也不会是欧洲独有的。”

“我们正在效仿谷歌和 OpenAI 等公司的做法，这两家公司都已经使用来自欧洲用户的数据来训练他们的人工智能模型。”

Meta 进一步声称其方法在开放性方面超越其他公司，并表示：“我们很自豪我们的方法比许多业内同行更加透明。”

关于监管合规性，Meta 提到了此前与监管机构的沟通，包括去年因等待法律要求澄清而推迟审批。该公司还提到了2024 年 12 月欧洲数据保护委员会(EDPB) 的积极意见。

Meta 写道：“我们欢迎 EDPB 12 月提出的意见，该意见肯定了我们最初的做法符合我们的法律义务。”

对人工智能训练数据的广泛担忧

尽管 Meta 在欧盟的做法是透明且合规的，但使用社交媒体平台的大量公共用户数据来训练大型语言模型 (LLM) 和生成式人工智能的做法仍然引起隐私倡导者的极大担忧。

首先，“公共”数据的定义可能存在争议。在Facebook或Instagram等平台上公开分享的内容，可能并非预期会成为训练商业人工智能系统的原材料，从而生成全新的内容或洞见。用户可能会在他们认知的社群内公开分享个人趣闻、观点或创意作品，却并未料到平台所有者会对其进行大规模的自动化分析和重新利用。

其次，“选择退出”系统与“选择加入”系统的有效性和公平性仍然存在争议。将主动反对的责任放在用户身上，尤其是在用户收到无数其他通知之后，这引发了关于知情同意的质疑。许多用户可能无法看到、理解或根据通知采取行动，这可能导致他们的数据被默认使用，而不是经过明确许可。

第三，固有偏见问题日益凸显。社交媒体平台反映甚至有时会放大社会偏见，包括种族主义、性别歧视和虚假信息。基于这些数据训练的人工智能模型可能会学习、复制甚至扩大这些偏见。尽管企业会采用过滤和微调技术，但消除数十亿数据点所吸收的偏见仍然是一项巨大的挑战。基于欧洲公共数据训练的人工智能需要精心管理，以避免对其试图理解的文化造成刻板印象或有害的概括。

此外，围绕版权和知识产权的问题依然存在。公开帖子通常包含用户创作的原创文本、图片和视频。使用这些内容来训练商业人工智能模型，这些模型可能会生成竞争内容或从中获取价值，这涉及所有权和公平报酬等模糊的法律领域——这些问题目前正在全球范围内的法庭上受到众多人工智能开发者的争议。

最后，尽管 Meta 强调其相对于竞争对手的透明度，但数据选择、过滤的实际机制及其对模型行为的具体影响往往仍然不透明。真正有意义的透明度需要更深入地了解特定数据如何影响 AI 输出，以及为防止滥用或意外后果而采取的保障措施。

Meta 在欧盟采取的做法凸显了科技巨头对用户生成内容的重视，认为它推动着蓬勃发展的人工智能经济。随着这些做法的普及，围绕数据隐私、知情同意、算法偏见以及人工智能开发者的道德责任的争论无疑将在整个欧洲乃至全球范围内愈演愈烈。

Meta将使用欧盟用户数据训练人工智能模型

Meta 希望打造专为欧盟用户设计的人工智能工具

对人工智能训练数据的广泛担忧

相关推荐

优质VPS推荐

国内外VPS测评，分享最新行业资讯

推荐栏目