本站出售,有兴趣带价格联系QQ:503594296

互联网巨头 你的数据训练AI 如何合法地 偷 (互联网巨头们)

admin1 1年前 (2024-07-02) 阅读数 16 #财经

你知道吗,自己的数据,如今曾经开局合法地被互联网大厂们用作 AI 训练了。

在新一波的 AI 比赛中,由于训练模型须要少量数据,当互联网的个别数据开掘殆尽,平台上少量用户团体内容,便成了充溢诱惑的矿藏。

一些硅谷的科技公司如此盼望新数据,开局偷偷摸摸把 AI 训练参与到数据经常使用政策中,赋予自己经常使用人们数据的权益。

在过去一年多里,包括谷歌、Meta、Adobe、Zoom 和 X 等大公司纷繁降级其服务条款或隐衷政策,准许自己应用用户数据来训练生成式 AI 模型。

这些互联网大厂,都偷偷在「服务条款」里塞进了什么货?

01硅谷巨头的「小举措」

随着科技巨头对数据的盼望越来越大,它们正在细心重写其条款和条件,以蕴含「人工智能」、「机器学习」和「生成式人工智能」等词语。

为了防止用户对隐衷疑问的反感,公司有时轻轻地启动这些更改。在许多状况下,用户会在未浏览一字的状况下点击赞同,毫无警觉地接受协定。

上方是硅谷大厂们在用户服务条款中各自「夹带私货」的细节:

谷歌

在 2022 年末,当 OpenAI 发布了 ChatGPT 并引发了全行业的追逐比赛后,谷歌的钻研人员和工程师开局探讨如何应用其余用户数据。数十亿字的内容存储在人们的 Google 文档和其余收费 Google 运行中,然而公司的隐衷政策限度了他们如何经常使用这些数据。

过后,谷歌的隐衷政策规则公司只能经常使用地下可用信息来「协助训练谷歌的言语模型和构建像 Google 翻译这样的性能」。

去年 6 月,据纽约时报报道,谷歌的法律部门要求隐衷团队起草言语,以裁减公司可以经常使用生产者数据的范围。

去年 7 月,谷歌对其隐衷政策启动了修正,参与了公共信息可用于训练其 AI 聊天和其余服务的内容。

谷歌将 Bard 和云端 AI 参与到用户条款中|NYT

咱们经常使用地下可用的信息来协助训练谷歌的 AI 模型,并构建诸如谷歌翻译、Bard 和云 AI 性能等产品和性能 。」

为了安抚用户,谷歌申明称,其隐衷政策的变卦「只是廓清了像 Bard(现为 Gemini)这样的新服务也包括在内。咱们并没有由于这种言语变动而开局在其余类型的数据上训练模型。」

谷歌的 AI 训练当然也有用最公家化的数据,如给好友和家人的信息。谷歌发言人示意,在失掉一小群用户容许的状况下,谷歌被准许在某些方面经常使用他们的团体电子邮件训练其人工智能。

去年 Meta 就降级了关系隐衷政策,用户「在咱们的产品和服务上提供的优惠和信息」将被用来训练其 AI,包括在经常使用像其 AI 工具时所写或所说的一切。

Meta 示意,其 AI 不会读取用户在 Messenger 和 WhatsApp 等运行上与好友和家人之间发送的信息,除非用户在信息中 @ 了其 AI 聊天机器人。Meta 将与 AI 互动的责任推给用户,示意人们应该「留意」他们在提示中所说的话,比如不要包括任何团体信息,如家庭地址或电话号码。

Meta 申明示意:「我发送给生成式 AI 性能的信息会出现什么?AI 或者会保管并经常使用您在聊天中分享的信息,以提供更共性化的照应或关系信息,咱们或者会与可信任的协作同伴(如搜查提供商)共享您提出的某些疑问,以提供更关系、准确和最新的照应。」

「经常使用地下可用的信息训练人工智能模型是整个行业的惯例,并非咱们服务独有。」Meta 发言人在申明中说。

X 在条款前方补了一句关于人工智能模型训练的事项|NYT

马斯克不时在构建一个 AI 名目。去年 9 月,X 在其隐衷政策中参与了一句话,关于机器学习和人工智能。

「咱们经常使用搜集到的信息来提供和运营 X 产品和服务。咱们还经常使用搜集到的信息来改良和共性化咱们的产品和服务,以便您在 X 上取得更好的体验,包括向您展现更关系的内容和广告、倡议您关注的人和主题、启用和协助您发现关联公司、第三方运行和服务。咱们或者会经常使用搜集到的信息和地下可用的信息来协助训练咱们的机器学习或人工智能模型,以成功本政策中概述的目标。」

Snap 有些服务条款的变卦只要几个字。另一些则新增了整段内容来解释生成式人工智能模型的上班原理,以及它们对用户数据的访问类型。

例如,往年,Snap 降级了其聊天机器人 My AI 的数据搜集的隐衷政策。 Snap 提示用户不要与其人工智能聊天机器人分享秘密信息,由于这些信息将用于训练

Snap 关于 My AI 聊天机器人的条款改动较多|NYT

「My AI 是一个基于生成式 AI 技术构建的聊天机器人,设计理念确保安保。生成式 AI 是一种正在开发的技术,它或者会提供有成见、不正确、有害或误导性的答案。所以,你不应该依赖它的倡议。您也不应该分享任何秘密或敏感信息——假设您这样做,My AI 会经常使用它。」

「当您与 My AI 互动时,咱们会经常使用您分享的内容和您的位置(假设您已启用 Snapchat 的位置共享)以改良 Snap 的产品,包括增强 My AI 的安保性,并共性化您的体验,包括广告。」

Zoom 去年 7 月开局降级其服务条款,说明会将用户数据用于训练 AI,但遭逢用户和隐衷倡议者的少量批判。在面临社交媒体上的剧烈推戴声响后,Zoom 去年 8 月又再次降级了服务条款,廓清未经赞同不会经常使用视频、音频或聊天内容。

降级后的服务条款依然要求用户「在此授予 Zoom 终身性、世界性的、非独占性的、免版税的、可转容许和可转让的容许及一切其余权益」经常使用客户内容。

这些权益包括「从新散发、发布、导入、访问、经常使用、存储、传输、审查、披露、保管、提取、修正、复制、共享、展现、复制、散发、翻译、转录、创作衍生作品和解决」客户内容。

条款不再详细提及 Zoom 有权就客户内容启动「AI 和 ML 训练」,而是更含糊地提到「服务开发、营销、剖析、品质保障、机器学习、人工智能、培训、测试、服务、软件或 Zoom 其余产品、服务和软件的改良,或以上马何组合。」

往年 6 月初,Adobe 因在其隐衷政策中参与了一句关于智能化的短语,激怒了不少创作者,许多用户将其解读为与 AI 数据抓取无关。

「咱们访问您的内容:咱们或者会经过智能和手动方法访问、检查或倾听您的内容,但仅在有限的模式下,并且仅在法律准许的状况下。」

Adobe 公司的用户关于数据被拿来用 AI 训练比拟敏感|NYT

这些条款影响了 Adobe 创意云套件的超越 2000 万用户,一些用户以为这准许 Adobe 访问、检查他们的内容,包括受隐秘协定包全的作品。一些人以为 Adobe 正在监督他们的上班,排汇用户的艺术作品,并或者将其用于训练 AI 模型。

在用户剧烈推戴后,Adobe 降级了服务条款,明白示意不会经常使用客户作品训练 AI。

Adobe 经过博客文章廓清,这些变卦是为了检测和删除合法内容,例如儿童色情资料(CSAM),以及滥用内容或行为,包括渣滓邮件和网络钓鱼。Adobe 不会经常使用存储在 Adobe 云上的文件来训练其 Firefly AI。

02提早占好「免责」的坑

不过,巨头们的小举措,还是有监管在看着的。

美国联邦贸易委员会(FTC)常年以来不时盯着与公司隐衷政策无关的诈骗性和不偏心行为。过去曾起诉过那些以偷偷摸摸的模式更改隐衷政策、破坏对生产者的现有承诺的公司。

往年 2 月,美国联邦贸易委员会正告科技公司,扭转隐衷政策以追溯性地抓取旧数据或者是不偏心或诈骗性的,将清查「轻轻」更改隐衷政策以开掘用户数据用于 AI 的公司。

FTC 指出,公司或者会被诱惑从其用户群中开掘现有数据以供 AI 模型经常使用,有「弱小的商业动机」。FTC 称公司潜在的困境是利益抵触。「市场介入者应留意,任何背弃其用户隐衷承诺的公司都或者冒犯法律。」

不过,就在上周,微软 AI CEO Mustafa Suleyman 地下称互联网的地下内容可以被收费拿来训练 AI,如此直白的发言惹起了强势的言论反弹。

从硅谷巨头们在用户经常使用条款中的改动可以看出, 各家确实都在应用产品长处,将用户数据用于 AI 训练之中。不过,详细哪些数据会拿来训练,哪些不能,行业内仍未达成一个共识 ——一项技术出现的早期,必需会出现这种规则不足的「狂野西部」的阶段。

而上述被举措手脚的经常使用条款,无疑是巨头们为之后免责提早占的坑。不出异常的话,国际一种大厂和 AI 公司,应该也曾经在用户条款中修正、参与了 AI 训练的内容。

关于个别用户而言,关于长达数十页的用户经常使用条款,99% 都会间接忽视。然而,假设这个产品,能经过有限的数据复制出一个「你」的时刻,用户是不是该更审慎一些?


电商模特图如何用ai生成电商模特图如何用ai生成视频

电商模特图通过人工智能(AI)生成的方法主要包括以下几个步骤:1. 数据收集:首先,需要收集一定数量的衣物图片和模特图片作为训练数据。 这些数据可以从电商网站、社交媒体或其他合法来源获取。 2. 数据预处理:对收集到的图片进行预处理,包括缩放、裁剪、翻转等,以增加数据的多样性和模型的泛化能力。 3. 模型训练:使用深度学习算法(如卷积神经网络,CNN)对预处理后的图片数据进行训练。 训练过程中,AI 模型会学习如何识别和生成衣物和模特的特征。 4. 生成模特图:在模型训练完成后,当输入一张衣物图片时,AI 模型可以根据学到的特征生成相应的模特图。 这个过程通常包括以下几个步骤:a. 检测衣物区域:通过图像识别技术,AI 模型可以识别出输入图片中的衣物区域。 b. 生成轮廓:根据衣物区域,AI 模型可以生成衣物的轮廓线。 c. 生成模特身体:根据衣物轮廓线,AI 模型可以生成模特身体的形状和姿势。 d. 添加细节:AI 模型还可以根据衣物特征生成模特的手势、面部表情等细节。 5. 图像优化:对生成的模特图进行优化,包括调整颜色、亮度、对比度等,以使其更接近真实图片。 6. 输出成果:将生成的模特图用于电商网站或广告宣传,以提高商品的展示效果和吸引力。 通过以上步骤,电商卖家可以利用 AI 技术生成高质量的模特图,节省拍摄成本并提高营销效果。 需要注意的是,AI 生成的模特图在逼真度和个性化方面可能与真实模特图存在一定差距,因此在应用过程中要权衡利弊。 生成电商模特图的流程通常是这样的:1. 预处理照片,将背景抠出,只留下模特的照片。 2. 利用 AI 技术,对模特的照片进行人体分割和识别,以便后续对模特的不同部位进行修改和调整。 3. 根据需要,对模特的肤色、衣服、发型等进行修改或替换,以适应不同的服装和场景。 4. 绘制阴影和高光,以增加模特的立体感和逼真度。 5. 对整个图像进行后期调整,包括亮度、对比度、色彩等的调整,以确保最终效果质量。 具体如何用 AI 技术生成电商模特图,可以采用图片处理软件和 AI 工具集成的方式完成。 需要使用的 AI 工具包括人体分割模型、图像合成模型、人工智能化修图算法等。 这些 AI 工具大多数采用深度学习技术,经过大量的训练和优化,可以实现高精度的图像分割、处理和合成。 在实际操作中,需要具备一定的图像处理和人工智能技术的知识和技能,才能够达到较好的电商模特图生成效果。 同时,也需要注意保护用户的隐私和个人信息,遵守相关的法律法规和标准。

生成式AI需要使用哪些数据来进行训练和生成?数据提供商是如何确保数据的质量和可靠性?

生成式AI需要使用大量的训练数据来进行训练和生成,这些数据可以来自于不同的来源,例如互联网上的文章、图片、视频等,也可以来自于专门为训练AI而采集的数据集,如ImageNet、COCO等。 此外,还可以使用已有的语料库和词汇表来构建自然语言生成模型。 为了确保数据的质量和可靠性,数据提供商需要采取一系列措施来对数据进行清洗和过滤,例如去除重复数据、标注数据标签、纠正错误数据等。 同时,还需要对数据进行审核和筛选,确保数据的合法性和安全性。 此外,数据提供商还可以采用人工智能技术来自动化地识别和处理数据中的错误和异常,提高数据质量和可靠性。

c站ai模型如何使用c站功能

如果您想在c站使用ai模型,通常需要遵循以下步骤:1. 选择一个适合您需要的ai模型:c站上有许多ai模型可供选择,包括图像识别、自然语言处理、语音识别等。 您需要根据自己的需求选择一个适合的模型。 2. 准备数据集:在使用ai模型之前,您需要准备一个数据集,以便模型能够学习和训练。 数据集应该包含与您要解决的问题相关的信息。 3. 配置环境:在使用ai模型之前,您需要配置相应的环境。 例如,您可能需要安装python环境、相关的python库或者其他必要的软件。 4. 编写代码:一旦环境配置好了,您就可以编写代码来使用ai模型。 这包括加载模型、准备数据、训练模型、评估模型和使用模型进行预测等步骤。 5. 调试和优化:在使用ai模型时,您可能会遇到各种问题,例如性能问题、过拟合、欠拟合等。 您需要调试和优化模型,以确保它能够按照预期工作。 需要注意的是,使用ai模型需要一定的技术知识和经验。 如果您不熟悉ai模型的使用方法,建议先学习相关知识或者寻求专业人士的帮助。 使用c站ai模型需要了解以下几点:首先,需要明确使用的具体功能,例如图像分割、语音识别等;其次,需要找到对应的API,并检查是否需要申请API Key;接着,可根据API提供的SDK和文档进行开发和调试;最后,需要确保使用的数据和模型是合法的,并遵守相关的法律法规。 总的来说,c站ai模型的使用需要一定的技术储备和对相关领域的了解,但也提供了丰富的应用场景和方便的开发工具,可以帮助用户实现更加高效和智能的操作。 使用方法简单因为c站ai模型的使用方法是非常简单的,只需要打开c站网站,点击需要使用的ai模型,并根据指导进行操作即可。 如果你想更深入地了解c站ai模型的使用,可以参考c站官方提供的使用指南,学习相关的技术知识,并进行实践操作,进一步提高自己的技术水平。 总之,c站ai模型的使用方法简单易懂,只要掌握了相关技术知识,就能够高效地使用它来辅助自己的工作和生活。 使用c站ai模型需要遵循以下步骤:首先进入c站官网并注册账号,然后选择合适的ai模型并充值对应的虚拟币,如c元或者g币等。 接着,在具体应用中,需要上传相应的数据或者图像,并根据模型的训练和参数设置进行计算和推理。 最后,也要注意对结果进行评估和优化,以便得到更加准确和实用的输出。 其中,需要特别强调的是,在使用c站ai模型时需要保证数据的质量和隐私的安全。 此外,要根据具体的应用场景和需求选择合适的模型和参数,并关注模型的更新和升级。 只有充分理解和掌握使用方式,才能真正发挥ai模型的潜力和作用。

版权声明

本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。

热门