<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>
"); //-->

博客專(zhuān)欄

EEPW首頁(yè) > 博客 > OpenAI采集了超一百萬(wàn)小時(shí)的YouTube視頻來(lái)訓練GPT-4

OpenAI采集了超一百萬(wàn)小時(shí)的YouTube視頻來(lái)訓練GPT-4

發(fā)布人:12345zhi 時(shí)間:2024-05-28 來(lái)源:工程師 發(fā)布文章

近日,《華爾街日報》報道稱(chēng)(https://www.wsj.com/tech/ai/ai-training-data-synthetic-openai-anthropic-9230f8d8),人工智能公司在收集高質(zhì)量培訓數據方面遇到了困難?!都~約時(shí)報》詳細介紹了一些公司處理這一問(wèn)題的方式。不出所料,它涉及到一些落入人工智能版權法模糊灰色地帶的事情。

故事從OpenAI開(kāi)始,據報道,OpenAI迫切需要訓練數據,開(kāi)發(fā)了Whisper音頻轉錄模型來(lái)克服困難,轉錄了超過(guò)一百萬(wàn)小時(shí)的YouTube視頻來(lái)訓練其最先進(jìn)的大型語(yǔ)言模型GPT-4。據《紐約時(shí)報》報道,該公司知道這在法律上有問(wèn)題,但認為這是合理使用的?!短┪钍繄蟆穼?xiě)道,OpenAI總裁Greg Brockman親自參與了收集使用的視頻。

OpenAI發(fā)言人Lindsay Held在一封電子郵件中告訴The Verge,該公司為每個(gè)模型策劃了“獨特”的數據集,以“幫助他們理解世界”,并保持其全球研究競爭力。Held補充道,該公司使用“許多來(lái)源,包括公開(kāi)數據和非公開(kāi)數據的合作伙伴關(guān)系”,并正在考慮生成自己的合成數據。

《泰晤士報》的文章稱(chēng),OpenAI在2021年耗盡了有用的數據供應,并在耗盡其他資源后討論了轉錄YouTube視頻、播客和有聲讀物的可行性。此外,OpenAI使用了包括來(lái)自Github的計算機代碼、國際象棋走棋數據庫和來(lái)自Quizlet的作業(yè)內容。

谷歌發(fā)言人Matt Bryant在一封電子郵件中告訴The Verge,該公司“看到了未經(jīng)證實(shí)的關(guān)于OpenAI活動(dòng)的報道”,并補充道,“我們的robots.txt文件和服務(wù)條款都禁止未經(jīng)授權的抓取或下載YouTube內容”,這與該公司的使用條款相呼應。YouTube首席執行官Neal Mohan對OpenAI使用YouTube訓練其Sora視頻生成模型的可能性表示了類(lèi)似的看法。Bryant說(shuō),“當我們有明確的法律或技術(shù)依據時(shí)”,谷歌會(huì )采取“技術(shù)和法律措施”來(lái)防止這種未經(jīng)授權的使用。

*博客內容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權請聯(lián)系工作人員刪除。



關(guān)鍵詞: 人工智能 OpenAI

相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>