<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 報告稱(chēng) OpenAI 采集了超一百萬(wàn)小時(shí)的 YouTube 視頻來(lái)訓練 GPT-4

報告稱(chēng) OpenAI 采集了超一百萬(wàn)小時(shí)的 YouTube 視頻來(lái)訓練 GPT-4

作者：時(shí)間：2024-04-08 來(lái)源：IT之家

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

4 月 7 日消息，本周早些時(shí)候，《華爾街日報》報道稱(chēng) AI 公司在收集高質(zhì)量訓練數據方面遇到了困難。今天，《紐約時(shí)報》詳細介紹了 AI 公司處理此問(wèn)題的一些方法，其中涉及到屬于 AI 版權法模糊灰色區域的內容。

本文引用地址：http://dyxdggzs.com/article/202404/457226.htm

報道稱(chēng)，OpenAI 迫切需要訓練數據，并開(kāi)發(fā)了 Whisper 音頻轉錄模型來(lái)克服困難，轉錄了超過(guò) 100 萬(wàn)小時(shí)的 YouTube 視頻來(lái)訓練其最先進(jìn)的大型語(yǔ)言模型 GPT-4。

報道提到，OpenAI在 2021 年耗盡了有用的數據供應，并在耗盡其他資源后討論了轉錄 YouTube 視頻、播客和有聲讀物的可行性。此外，OpenAI 使用了包括來(lái)自 Github 的計算機代碼、國際象棋走棋數據庫和來(lái)自 Quizlet 的作業(yè)內容。

據報道，OpenAI公司知道這在法律上存在問(wèn)題，但認為這是合理使用?！短┪钍繄蟆穭t透露，OpenAI 總裁 Greg Brockman 親自參與了所使用視頻的收集。

OpenAI 發(fā)言人 Lindsay Held 在一封電子郵件中告訴 The Verge，該公司為其每個(gè)模型策劃了“獨特”的數據集，以“幫助他們了解世界”并保持其全球研究競爭力。Held 補充說(shuō)，該公司使用“眾多來(lái)源，包括公開(kāi)數據和非公開(kāi)數據的合作伙伴”，并且正在考慮生成自己的合成數據。

谷歌發(fā)言人 Matt Bryant 在一封電子郵件中表示，該公司“看到了有關(guān) OpenAI 活動(dòng)的未經(jīng)證實(shí)的報告”，并補充說(shuō)“我們的 robots.txt 文件（注：網(wǎng)站與爬蟲(chóng)間的君子協(xié)定）和服務(wù)條款都禁止未經(jīng)授權的抓取或下載 YouTube 內容”。

YouTube 首席執行官 Neal Mohan 近日在采訪(fǎng)中公開(kāi)表示，盡管沒(méi)有直接證據表明 OpenAI 使用 YouTube 視頻來(lái)訓練 Sora（文本生成視頻的 AI 模型），但警告稱(chēng)這種行為違反了 YouTube 現行的平臺服務(wù)條款。

Meta 同樣也遇到了數據可用性的限制，在《泰晤士報》聽(tīng)到的錄音中，Meta 的AI 團隊為了努力追趕 OpenAI，討論了未經(jīng)許可使用版權作品的情況。該公司在瀏覽了“互聯(lián)網(wǎng)上幾乎可用的英語(yǔ)書(shū)籍、散文、詩(shī)歌和新聞文章”后，顯然考慮采取一些措施，例如支付圖書(shū)許可費用，甚至直接收購一家大型出版商。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： OpenAI YouTube GPT-4

評論

相關(guān)推薦

介紹 LTM4626 和 LTM4638 μModule

視頻 ADI 穩壓器第 4 代 μModule | 2018-12-03

π/4-DQPSK調制與解調在SystemView中的仿真實(shí)現

資源下載 The MathWorks π/4-DQPSK調制與解調 SystemView中的仿真 | 2007-12-08

MIC79050-4.2BS的內部結構框圖

設計方案 MIC79050-4.2BS 內部結構框圖 | 2009-07-06

2024Q4 對決，聯(lián)發(fā)科天璣 9400、高通驍龍 8 Gen 4 被曝已流片

EDA/PCB 聯(lián)發(fā)科天璣 9400 高通驍龍 8 Gen 4 流片 | 2024-07-09

我國最大的數據處理超級服務(wù)器通過(guò)驗收

liujt_ic | 2003-03-17

OpenAI「草莓」聊天機器人應答能力接近人類(lèi)

OpenAI 草莓聊天機器人 | 2024-07-15

觸發(fā)控制板KJZ6-4電原理圖

設計方案觸發(fā) 控制板 KJZ6-4 原理 | 2009-07-06

MPLAB? ICE 4簡(jiǎn)介

視頻 Microchip開(kāi)發(fā)工具 Microchip MPLAB? ICE 4 | 2023-05-08

ACDSEE2.4 經(jīng)典看圖老軟件

資源下載圖片 ACDSEE2.4 EMF SGI Alias PIX Kodak KDC | 2007-02-09

為什么OpenAI今年可能會(huì )虧損50億美元？

智能計算 OpenAI 虧損 ChatGPT | 2024-07-25

機械擬人思考 OpenAI拚了

機械擬人思考 OpenAI 草莓 | 2024-07-15

LM3420-8.4構成的鋰電池快速充電器

設計方案 LM3420-8.4 構成鋰電池快速充電器 | 2009-07-06

反壟斷機構加強對OpenAI的審查，取消董事會(huì )中觀(guān)察員席位

OpenAI 微軟蘋(píng)果壟斷 | 2024-07-11

AD7124——PGA型4/8通道Σ-Δ ADC上的診斷功能

視頻 ADI AD7124-4 AD7124-8 診斷 | 2017-02-13

BM70藍牙解決方案

視頻 Microchip Microchip應用方案 BM70 Bluetooth? 4.2 RF IC | 2016-07-06

紅帽發(fā)布紅帽OpenShift 4.16，簡(jiǎn)化混合云工作負載多樣性

嵌入式系統紅帽紅帽OpenShift 4.16 混合云工作負載 | 2024-07-17

用LTC732作為控制器為單節4.2伏鋰離子電池充電

設計方案 LTC732 作為控制器單節 4.2伏鋰離子電池充 | 2012-01-18

MPEG-4流媒體著(zhù)作權保護標準基本確定

liujt_ic | 2003-04-09

在tornado2.02/vxworks5.4 下如何支持usb?

hanxu1974 | 2003-07-24

garfield4 Plus spec_Release to customer

資源下載 Prochip Sep3221 嵌入式微控制器 Garfield 4 Plus | 2007-02-09

嵌入式圖形界面GUI-4，需要的請回復！

jackwang | 2002-05-21

platform_general_vxworks_getting_started_3.4

資源下載 vxworks platform general started_3.4 | 2007-02-09

AST-4型彩色顯示器的電源電路圖

設計方案 AST-4 彩色顯示器電源電路圖 | 2009-07-06

反壟斷審查愈演愈烈，微軟、蘋(píng)果放棄OpenAI董事會(huì )席位

智能計算微軟蘋(píng)果 OpenAI | 2024-07-11

AD7124概述：集成PGA和基準電壓源的4通道/8通道Σ-Δ型ADC

視頻 ADI AD7124-4 AD7124-8 集成PGA ADC | 2017-02-13

消息稱(chēng) OpenAI 公司 2024 年資金缺口達到 50 億美元

智能計算 OpenAI ChatGPT AI | 2024-07-25

劍指搜索巨頭谷歌！OpenAI推出AI搜索引擎SearchGPT

智能計算 openAI SearchGPT 谷歌 | 2024-07-26

存儲器接口生成器(MIG) 相關(guān)資料

資源下載 xinlinx FPGA Virtex-4 存儲器接口生成器 | 2007-02-09

全國電話(huà)用戶(hù)達到4.6億戶(hù) 繼續居世界第一

hpnet | 2003-06-21

美光首款M.2 2230 PCIe 4.0 SSD推出

網(wǎng)絡(luò )與存儲美光 M.2 2230 PCIe 4.0 SSD | 2024-07-19

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>