反抗OpenAI“白嫖”,Reddit卻先被自家用戶(hù)“爆吧”了?
萬(wàn)萬(wàn)沒(méi)想到Reddit是這樣的人設
文| 編輯| VickyXiao
不知道有多少人還記得今年4月Reddit宣布對API接口收費的事。
省流版回顧是,因為不滿(mǎn)意OpenAI和谷歌等公司白嫖自己平臺的數據來(lái)訓練他們的大模型,Reddit準備開(kāi)始對調用它API的公司收費了。
最近有人發(fā)現,受此事影響,Reddit上規模不小的三個(gè)小組r/aww、r/pics和r/gifs(分別有3410萬(wàn)、3000萬(wàn)和2160萬(wàn)人訂閱),紛紛被John Oliver的梗圖“爆吧”了。
因為Reddit小組內顯示的帖子都是按點(diǎn)贊數排序的,所以當進(jìn)入這三個(gè)小組,翻下來(lái)滿(mǎn)屏都是John Oliver那張充滿(mǎn)喜感的臉龐……
spez是Reddit CEO Steve Huffman在Reddit的用戶(hù)名
r/gifs和r/aww還把各自的組名改成了“GIFs of John Oliver”和“A subreddit for cute and cuddly John Oliver pictures”。
John Oliver是知名脫口秀節目《上周今夜秀》的主持人,這檔節目因對時(shí)事新聞的嘲諷而出名,網(wǎng)友的集體行為藝術(shù)明顯是想借他的梗圖表達對Reddit的不滿(mǎn)。
比如有一個(gè)22.2萬(wàn)人點(diǎn)贊的圖,畫(huà)面內容是John Oliver和《芝麻街》三個(gè)主要角色的合影,配文則是:John Oliver和Reddit的CEO和高管們。
更抓馬的是,這些梗圖用到的素材好多都是John Oliver自己主動(dòng)提供給網(wǎng)友的。
所以這到底是怎么一回事?
挑撥離間的Reddit?Reddit曾在今年4月18日透過(guò)媒體宣布,將對調用其API的公司收取數據使用費,當時(shí)Reddit的CEO Steve Huffman明確表示,“Reddit 的數據語(yǔ)料庫非常有價(jià)值,但我們沒(méi)有必要把所有這些有價(jià)值的數據免費提供給一些全球數一數二的大公司?!?/span>
這個(gè)決定乍一聽(tīng)是針對OpenAI和谷歌等開(kāi)發(fā)大模型的公司說(shuō)的,但很快,一些其他領(lǐng)域的開(kāi)發(fā)者回過(guò)味來(lái),自己可能才是被宰得最狠的那個(gè)。
鬧得最大的一次是在本月8日,iOS平臺上的第三方Reddit客戶(hù)端Apollo宣布將在6月30日正式關(guān)閉。
我們知道,一直以來(lái)Reddit移動(dòng)端做得很差,所以催生了很多第三方App的開(kāi)發(fā)。他們會(huì )用到Reddit提供的免費API接口,來(lái)幫用戶(hù)更便捷地翻閱Reddit上的內容,Apollo就是最受用戶(hù)歡迎的第三方Reddit客戶(hù)端之一。
Apollo的開(kāi)發(fā)者Christian Selig談到關(guān)閉Apollo的原因時(shí)說(shuō),在新的API政策下,Reddit將對每5000萬(wàn)個(gè)API請求收取1.2萬(wàn)美元的費用,而按照Apollo的用戶(hù)規模和使用情況,上個(gè)月就要先支付168萬(wàn)美元(70億個(gè)API請求),每年可能要向Reddit支付高達2000萬(wàn)美元的費用。
問(wèn)題是這一天價(jià)費用對Christian Selig這樣的個(gè)人開(kāi)發(fā)者以及定位免費的Apollo來(lái)說(shuō),根本付不起。
Christian Selig和Reddit多次溝通無(wú)果,最后做出了關(guān)站的決定。其實(shí)事情一般發(fā)展到這里大家就可以散了,Reddit對API收費也在情理之中,不過(guò)真正讓用戶(hù)感到憤怒的,是Reddit接下來(lái)一系列的騷操作。
Christian Selig還在和Reddit商談時(shí),有一天突然收到一條信息,問(wèn)他怎么評價(jià)Reddit內部聲稱(chēng)的“Apollo試圖威脅Reddit索要1000萬(wàn)美元以平息紛爭”的事。
但讓Reddit沒(méi)想到的是,Christian Selig在和他們的溝通中進(jìn)行了錄音。隨后他便把這部分通話(huà)的文字記錄和音頻發(fā)在了網(wǎng)上,并評價(jià)Reddit是在“明目張膽地撒謊”。
本以為經(jīng)過(guò)這次,Reddit會(huì )重新思考定價(jià)的事,可它不僅依然強硬地表示會(huì )推進(jìn)新的API政策,還繼續抨擊Christian Selig,“對我們說(shuō)一套,對外卻完全是另一套話(huà)……錄音并泄露私人電話(huà),以至于我不知道我們該如何與他做生意?!?/span>
這場(chǎng)糟糕的回應最終導致Reddit上7000多個(gè)小組都加入到了抗議Reddit的活動(dòng)中,有的小組大部分內容都變黑了,有的轉為私有,還有的則選擇直接關(guān)閉。
一度甚至搜不到Reddit上最大的小組r/funny
盡管這波抗議讓Reddit幾乎癱瘓,Reddit CEO Steve Huffman依然發(fā)表了一些驚人的言論,比如把為Reddit小組無(wú)償奉獻的組長(cháng)們稱(chēng)作是“地主紳士”,而很多組員則是不得不聽(tīng)他們的話(huà),“就像一個(gè)城市里的抗議活動(dòng)持續了太久,其他市民都想繼續他們的生活……如果能評論,我敢打賭這些組員會(huì )說(shuō) ‘把它關(guān)掉,這很煩人’?!?/span>
隨后便有了本文開(kāi)頭用戶(hù)的行為藝術(shù)。
這幾個(gè)小組的組長(cháng)為了推翻Steve Huffman的言論,號召各自的組員進(jìn)行了一次投票來(lái)決定小組的未來(lái),選項則是:A-恢復正常,B-只允許發(fā)John Oliver的梗圖。
結果選B的票數壓倒性地獲得了勝利。
一切因大模型而起Reddit其實(shí)不是第一個(gè)因為大模型調用數據的問(wèn)題而更改API費用規則的平臺。今年2月,馬斯克宣布推特的API訪(fǎng)問(wèn)將在未來(lái)設置付費墻。
根據推特客戶(hù)代表在3月初公布的一份文件來(lái)看,該公司計劃向開(kāi)發(fā)者提供三個(gè)級別的企業(yè)包:
其中最便宜的Small Package每月需要支付4.2萬(wàn)美元,可以訪(fǎng)問(wèn)5000萬(wàn)條推文。更高的級別可以讓研究人員或企業(yè)訪(fǎng)問(wèn)更多數據,分別為1億條和2億條推文,但每月的費用分別為12.5萬(wàn)美元和21萬(wàn)美元。
也就是說(shuō),開(kāi)發(fā)者每年至少要向推特支付50萬(wàn)美元的費用(但50萬(wàn)5000萬(wàn)條推文的數據量對訓練大模型來(lái)說(shuō)遠遠不夠)。
而到了4月19日(也是Reddit宣布將對API使用收費的后一天),因對未來(lái)無(wú)法免費訪(fǎng)問(wèn)推特數據不滿(mǎn),微軟發(fā)布公告稱(chēng)將不再對推特提供面向用戶(hù)的廣告數據管理服務(wù)。
接著(zhù)就是馬斯克在第二天發(fā)推文稱(chēng)可能會(huì )起訴微軟,指控其“非法”利用推特數據訓練AI。
另外Getty Images也在今年2月起訴了Stability AI,稱(chēng)其侵犯了Getty Images的圖片版權。
不過(guò)類(lèi)似的事發(fā)展到Reddit這里,情況似乎不太一樣,一是Reddit沒(méi)選擇起訴大模型公司,二是在Reddit的API收費標準曝光之后,大模型公司們(尤其是OpenAI)仍在保持沉默。
很多人不知道的是,如今OpenAI的CEO山姆·奧特曼(Sam Altman)曾是Reddit的早期投資人。
奧特曼早期創(chuàng )業(yè)開(kāi)發(fā)的移動(dòng)應用程序Loopt曾和Reddit是老牌知名孵化器Y Combinator投資的同一批創(chuàng )業(yè)公司,后來(lái)創(chuàng )業(yè)失敗,在2012年賣(mài)掉Loopt之后,奧特曼便加入了Y Combinator做兼職合伙人。
2014年,Y Combinator創(chuàng )始人Paul Graham選了比自己小整整20歲的奧特曼繼任Y Combinator的總裁,再后來(lái)就有了奧特曼領(lǐng)導的Y Combinator在2014年9月領(lǐng)投Reddit B輪融資的事。
他甚至還在2014年Reddit CEO Yishan Wong辭職后,擔任了Reddit 8天的臨時(shí)CEO。
此后的7年多時(shí)間,奧特曼一直都是Reddit的董事會(huì )成員,直到2022年1月才宣布離開(kāi)。他在離開(kāi)時(shí)表示,“作為用戶(hù)我很愛(ài)Reddit,也很愛(ài)我在董事會(huì )度過(guò)的歲月,Steve領(lǐng)導的團隊和董事會(huì )的其他成員都很棒,整個(gè)公司都是非常有能力的人?!?/span>
因此有人猜測,憑著(zhù)7年的“交情”,Reddit對API使用收費的決定反而可能是和OpenAI商量好了的。
數據被認為是未來(lái)大模型競爭的關(guān)鍵要素之一,尤其隨著(zhù)Meta的開(kāi)源大語(yǔ)言模型LLaMA發(fā)布,不久前針對大模型開(kāi)源與否的“谷歌和OpenAI沒(méi)有護城河”的說(shuō)法也一度被廣泛討論——結論之一就是,用于訓練大模型的數據質(zhì)量要優(yōu)于數據大小。
而不論是數據質(zhì)量還是數據大小,Reddit都是占優(yōu)勢的。首先它是全球訪(fǎng)問(wèn)量排名第11的網(wǎng)站(美國訪(fǎng)問(wèn)量排名第6),其次它每天都在產(chǎn)生不斷更新的、對當下最熱事件的真實(shí)討論——怎么看都是訓練大模型最理想的數據庫。
此前有報道稱(chēng),Reddit計劃在今年晚些時(shí)候IPO,意味著(zhù)至今收入仍以廣告為主且仍未盈利的Reddit迫切需要找到更多盈利途經(jīng),而不差錢(qián)的OpenAI明顯又比個(gè)人開(kāi)發(fā)者更有吸引力。
奧特曼之前也說(shuō)過(guò),OpenAI在積極和內容公司合作、獲得授權,表示愿意為特定領(lǐng)域的高質(zhì)量數據支付高價(jià)。
一個(gè)出數據,一個(gè)出錢(qián),看起來(lái)是非常完美的組合了。還有人猜想,以后Reddit會(huì )接入大模型也說(shuō)不定。
從目前Reddit強硬的態(tài)度來(lái)看,它似乎并沒(méi)有太多想照顧個(gè)人開(kāi)發(fā)者的意思,在用戶(hù)和商業(yè)利益面前,它選擇的是后者。但一個(gè)矛盾的問(wèn)題是,Steve Huffman口中Reddit平臺能夠訓練大模型產(chǎn)生最佳結果的、同時(shí)具備“新穎性和相關(guān)性”的數據,又是一個(gè)又一個(gè)Reddit用戶(hù)創(chuàng )造的。
但就像Steve Huffman會(huì )說(shuō)出“一個(gè)城市里抗議活動(dòng)持續了太久,其他市民都想繼續他們的生活”的話(huà),他似乎非常堅信用戶(hù)不會(huì )離開(kāi)。
*參考資料:
注:封面圖來(lái)自于Pexels,版權屬于原作者。如果不同意使用,請盡快聯(lián)系我們,我們會(huì )立即刪除。END
*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。