为了训练AI模型,没想到浓眉大眼的“版权卫士”Adobe也叛变了。
今年2月,Adobe悄悄更新了产品服务条款。其中一项条款要求用户同意Adobe可以“通过自动和手动的方式”访问用户作品,包括受保密协议(NDA)保护的内容,并使用“机器学习等技术来改进Adobe的服务和软件”。
如果用户拒绝接受新条款,则无法正常使用Adobe的软件。
这一条款调整近期遭到曝光,引发了创意人士、数字艺术家和设计师等Adobe主力用户发文抵制。他们认为该条款实质上是一种强制授权,无异于“霸王条款”,目的是训练Adobe旗下的生成式AI模型“Firefly”。
X博主“SamSantala”在6月初发布的一条质疑该条款的推文,目前浏览量已达千万。
许多用户在社交媒体上表示,出于对隐私和版权的担忧,他们选择停止使用Adobe的产品。
无独有偶,Meta公司也采取了类似的措施。随着Meta的生成式AI功能在欧洲上线,其隐私政策更新为:“在Meta产品和服务上共享的信息”,包括“帖子、照片乃至标题等内容”将被用于训练AI。
如果用户不同意新的隐私政策,应考虑停止使用Meta旗下的社交媒体产品,如Facebook和Instagram。
随着AI技术迅猛发展,各大科技公司与用户之间围绕数据隐私、内容所有权和控制权的争夺愈发激烈。
从生产力工具到社交媒体,你的数据正在被无偿“投喂”给AI
“我们只用授权内容来训练AI”
“顺便说一句,由于你正在使用我们的服务,因此我们拥有你的内容授权。”
针对Adobe引发争议的产品服务条款,一位网友指出,这位创意软件巨头在处理用户内容用于AI训练方面的前后态度并不一致。
其他的AI图像生成工具,如StabilityAI的StableDiffusion、OpenAI的Dall-E2、Midjourney的Midjourney,都曾因版权问题而备受争议。
艺术家BrianKesinger发现,在未经他同意的情况下,Adobe图像库中出现了打着他名义贩卖的与其作品风格相似的AI生成图像。
在舆论压力下,Adobe于6月19日修订了服务条款,明确表示不会使用用户存储在本地或云端的内容来训练AI模型。
此外,不同国家和地区对用户数据保护的法规存在差异,这影响了社交媒体平台在制定用户服务条款时的策略。
据国外科技媒体Mashable报道,在通用数据保护条例(GDPR)的框架下,英国和欧盟的用户享有“反对权”,他们可以明确选择不将其个人数据用于训练Meta公司的人工智能模型。
而美国用户未获得同等的知情权。根据Meta现有的数据共享政策,美国用户在Meta旗下社交媒体产品上发布的内容,可能在未经明确同意的情况下已经被用于训练AI。
数据被喻为AI时代的“新石油”。但资源的“开采”,目前仍有不少灰色地带。
月之暗面创始人杨植麟近期在北京智源大会上表示,模型的“大”依然是第一性原理,现在最大的问题是解决怎么取得原本稀缺或者不存在的数据,以及如何高效地形成规模效应。
OpenAI对ScalingLaw(规模定律)的极致应用被一些业内人士形象地称为“暴力美学”,在灰色地带抓取数据训练模型,以获取相对于谷歌、Meta等科技巨头的竞争优势。
不止OpenAI,如今很多需要“炼模型”的科技大厂、头部互联网平台对用户数据的采集也处在模糊地带。
在国内,随着《互联网信息服务深度综合管理规定》和《生成式人工智能服务管理暂行办法》相继出台,对AI生成内容的监管日益严格。
然而,在实际操作中,用户往往在不知情的情况下同意平台使用其数据。例如,绘画博主“雪鱼”发现自己的作品在未经允许的情况下,被AI绘画应用“Trik”拿来进行模型训练,一怒之下,该博主选择了停更。
近期我们整理了海内外主流社交媒体平台的用户服务协议条款,发现多家平台的协议中都要求用户授权平台广泛的内容使用权,包括存储、使用、传播、复制以及“制作派生作品”等。这些也都存在一定的模糊地带。
马斯克掌管的X(前推特)直接在用户服务条款中明确写道:可能会使用收集的信息和公开可用的信息来帮助训练其机器学习或人工智能模型。
澎湃研究所指出,用户服务条款中包含的“制作派生作品”这一提法,让平台轻易就获得了用户的提前授权,可以免费将用户上传和发布的内容用于训练AIGC模型。
这种做法虽然通过一套严密的“话术”获得大量用户数据,节约了模型训练成本,但同时也引发了用户个人信息权利的双重困境:数字版权归属和数据隐私问题,严重损害用户对平台的信任。
此外,科技公司获取用户数据的另一种途径是:注册使用AI产品时,用户同意的用户使用须知或用户服务条款。