谷歌更新隱私政策 明確在用網(wǎng)上公共數據訓練AI
7月6日消息,谷歌更新后的隱私政策表明,諸如Bard和Cloud AI等各種人工智能服務(wù)可能是用谷歌從網(wǎng)上抓取公共數據進(jìn)行訓練的。
本文引用地址:http://dyxdggzs.com/article/202307/448356.htm本周一,谷歌更新了隱私政策。其中提到Bard、Cloud AI以及谷歌翻譯等人工智能服務(wù)可能使用了收集到的公共數據。
谷歌發(fā)言人克里斯塔·馬爾登(Christa Muldoon)表示,“我們的隱私政策一直是透明的,谷歌使用來(lái)自開(kāi)放網(wǎng)絡(luò )的公開(kāi)信息來(lái)訓練語(yǔ)言模型,從而提供谷歌翻譯等服務(wù)?!薄白罱淮胃轮皇钦f(shuō)明像Bard這樣的新服務(wù)也在內。我們將隱私原則和保障措施納入人工智能技術(shù)的開(kāi)發(fā)中,這與我們的人工智能原則是一致的?!?/p>
在2023年7月1日進(jìn)行更新后,谷歌隱私政策顯示,“谷歌使用信息來(lái)改進(jìn)服務(wù),開(kāi)發(fā)有利于用戶(hù)和公眾的新產(chǎn)品、功能和技術(shù)”,公司可能“使用公開(kāi)可用的信息來(lái)幫助訓練谷歌人工智能模型,開(kāi)發(fā)諸如谷歌翻譯、Bard以及Cloud AI等產(chǎn)品和功能?!?/p>
從谷歌隱私政策的歷次更新中可以看出,關(guān)于使用收集的公開(kāi)數據訓練哪些服務(wù),這次谷歌的說(shuō)法更為明確。例如,谷歌的隱私政策現在顯示,這些信息可能用于“人工智能模型”,而不只是“語(yǔ)言模型”,這讓谷歌在用公共數據訓練和開(kāi)發(fā)大語(yǔ)言模型以外的其他系統方面有了更大自由度。但這條注釋被藏在隱私政策中“你的本地信息”標簽“公共可訪(fǎng)問(wèn)資源”的嵌入式鏈接之下,用戶(hù)必須點(diǎn)擊這個(gè)鏈接才能看到相關(guān)內容。
更新后的隱私政策說(shuō)明,“公開(kāi)信息”將用于訓練谷歌的人工智能產(chǎn)品,但沒(méi)有說(shuō)明谷歌是否或者如何阻止受版權保護的內容進(jìn)入訓練數據庫。許多可公開(kāi)訪(fǎng)問(wèn)的網(wǎng)站都有相關(guān)政策,禁止為了訓練大語(yǔ)言模型和其他人工智能工具集開(kāi)展的數據收集或網(wǎng)絡(luò )抓取行為。因為《通用數據保護條例》(GDPR)等法規保護用戶(hù)數據不會(huì )在未經(jīng)明確許可的情況下被濫用。
這些法規加上日益激烈的市場(chǎng)競爭,使得GPT-4等主流生成式人工智能系統的開(kāi)發(fā)商對他們從哪里獲得用于訓練模型的數據,以及這些數據是否包括社交媒體內容或藝術(shù)家作家的版權作品,都非常謹慎。
但合理使用數據的原則是否可以延伸到這類(lèi)人工智能應用,目前還處于法律監管的灰色地帶。這種不確定性引發(fā)了各種訴訟,并促使一些國家出臺更嚴格的法律,更好地規范人工智能公司收集和使用訓練數據的方式。這種不確定性也帶來(lái)了各種問(wèn)題,比如到底該如何處理這些數據、確保不會(huì )導致人工智能系統出現高危故障;還有負責整理這些海量數據的人通常要忍受長(cháng)時(shí)間的極端工作條件。
美國最大報紙出版商Gannett正在起訴谷歌及其母公司Alphabet,聲稱(chēng)人工智能技術(shù)的進(jìn)步讓這家搜索行業(yè)巨頭進(jìn)一步壟斷了數字廣告市場(chǎng)。谷歌測試版人工智能搜索等產(chǎn)品也被指是“抄襲引擎”,并因導致其他網(wǎng)站流量枯竭而受到批評。
與此同時(shí),包含大量公共信息的社交媒體平臺推特和Reddit最近都采取了嚴厲措施,試圖阻止其他公司自由獲取他們平臺上的數據。但平臺調整和限制API現行機制的做法也遭到了各自用戶(hù)社區的強烈反對,因為這種出于反對網(wǎng)絡(luò )抓取數據的調整措施對核心用戶(hù)體驗產(chǎn)生了負面影響。
評論