<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 英偉達 Parakeet TDT 0.6B 成開(kāi)源 ASR 新王：1秒轉錄60分鐘音頻

英偉達 Parakeet TDT 0.6B 成開(kāi)源 ASR 新王：1秒轉錄60分鐘音頻

作者：時(shí)間：2025-05-08 來(lái)源：IT之家

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢(xún)

收藏

5 月 7 日消息，科技媒體 marktechpost 昨日（5 月 6 日）發(fā)布博文，報道稱(chēng)英偉達最新推出 Parakeet TDT 0.6B，是一款先進(jìn)的自動(dòng)語(yǔ)音識別（ASR）模型，已在 Hugging Face 平臺上完全開(kāi)源。

本文引用地址：http://dyxdggzs.com/article/202505/470178.htm

Parakeet TDT 0.6B 的核心優(yōu)勢在于其無(wú)與倫比的速度和轉錄質(zhì)量。該模型僅需 1 秒即可處理 60 分鐘音頻，是現有主流開(kāi)源 ASR 典型模型速度的 50 倍。

在 Hugging Face 的 Open ASR Leaderboard 上，其字錯率（WER）低至 6.05%，成為開(kāi)源模型中的佼佼者。這一性能為實(shí)時(shí)轉錄、語(yǔ)音分析、呼叫中心智能和音頻內容索引等企業(yè)級應用提供了強大支持。

無(wú)標題.jpg

該模型基于 Transformer 架構，結合高質(zhì)量轉錄數據進(jìn)行微調，并針對英偉達硬件優(yōu)化推理。

援引博文介紹，該模型關(guān)鍵特性包括：6 億參數的編碼-解碼結構、量化和融合內核以提升推理效率、支持 TDT（Transducer Decoder Transformer）架構，以及精確的時(shí)間戳、數字格式化和標點(diǎn)恢復功能。

此外，該模型還開(kāi)創(chuàng )性地支持歌曲轉歌詞轉錄，這一罕見(jiàn)功能拓展了音樂(lè )索引和媒體平臺的用例，依托英偉達的 TensorRT 和 FP8 量化技術(shù)，其實(shí)時(shí)率（Real Time Factor，RTF，模型處理時(shí)間和音頻長(cháng)度的比值）達到 3386。

Parakeet TDT 0.6B 不僅關(guān)注速度和精度，還內置了多項獨特功能。該模型能將歌曲內容轉為歌詞，適用于音樂(lè )和媒體領(lǐng)域；支持數字和時(shí)間戳格式化，提升會(huì )議記錄、法律轉錄和醫療記錄的可讀性；標點(diǎn)恢復功能則增強了下游自然語(yǔ)言處理（NLP）應用的表現。這些特性大幅提升轉錄質(zhì)量，減輕后期處理或人工編輯的負擔，尤其適合企業(yè)級部署。

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 英偉達 Parakeet TDT 0.6B 開(kāi)源 ASR 自動(dòng)語(yǔ)音識別

評論

相關(guān)推薦

一個(gè)自己制作u盤(pán)的開(kāi)源項目 - www.lumit.org

lumit | 2004-08-27

華為Ascend 910D志在與英偉達Blackwell和Rubin GPU競爭

智能計算華為 Ascend 910D 英偉達 Blackwell Rubin GPU Nvidia | 2025-04-30

開(kāi)源的 JAIN-SLEE SIP 軟交換 -- Mobic...

資源下載開(kāi)源 JAIN-SLEE 軟交 Mobicents | 2013-09-18

英偉達 Parakeet TDT 0.6B 成開(kāi)源 ASR 新王：1秒轉錄60分鐘音頻

智能計算英偉達 Parakeet TDT 0.6B 開(kāi)源 ASR 自動(dòng)語(yǔ)音識別 | 2025-05-08

搶英偉達訂單？三星提前量產(chǎn)12層堆疊HBM3E

網(wǎng)絡(luò )與存儲英偉達三星 12層堆疊 HBM3E | 2025-05-07

黃仁勛：若被排除在中國AI市場(chǎng)之外將是“巨大的損失”

智能計算黃仁勛 AI 人工智能英偉達 | 2025-05-07

便宜大碗，阿里云開(kāi)源Qwen3系列大模型

智能計算阿里云開(kāi)源 Qwen3 DeepSeek-R1 OpenAI o1 Grok-3 | 2025-04-29

一種汽車(chē)基于A(yíng)BS系統的功能拓展技術(shù)

設計方案驅動(dòng)防滑系統牽引力控制系統 ASR | 2015-09-14

[推薦]嵌入式開(kāi)源項目

prince98 | 2006-12-06

轎車(chē)ABS ASR ACC 集成化電控系統

資源下載 ABS ASR ACC 汽車(chē)集成電控 | 2007-11-22

騰飛FS-6B FS-9B沸騰式電開(kāi)水器電路圖

設計方案騰飛 FS-6B FS-9B 沸騰式電開(kāi)水電路圖 | 2011-07-27

美的YLRT3-6C YLRT3-6B冷熱飲水機電路圖

設計方案美的 YLRT3-6C YLRT3-6B 冷熱飲水機電路 | 2011-07-18

AI數據中心建設熱火朝天，科技巨頭卻集體踩剎車(chē)

智能計算 AI 數據中心 AWS 亞馬遜英偉達 | 2025-04-28

英偉達正設計新特供版AI芯片

智能計算英偉達特供版 AI芯片 H20 | 2025-05-06

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（1）

視頻英偉達嵌入式 ARM 軟銀 | 2023-11-06

大嘴業(yè)話(huà)——ARM再次上市，究竟7年時(shí)間算不算被偷走的？（2）

視頻 AI 英偉達 ARM | 2023-11-07

2005中國軟件技術(shù)大會(huì )

麥莎就是我 | 2005-11-18

轎車(chē)ABS_ESP_ASR_ACC主動(dòng)安全集成系統

資源下載 ABS ESP ASR ACC | 2010-07-19

轎車(chē)ABS ASR ACC 集成化電控系統

資源下載 ABS ASR ACC 電控 | 2007-12-05

美的YLRT3-6C,YLRT3-6B冷熱飲水機電路圖

設計方案電路圖飲水機冷熱 YLRT3-6B YLRT3-6C | 2013-11-22

[開(kāi)源] UML State machine Wizard 6.1

stan2005 | 2005-08-14

一個(gè)自己制作u盤(pán)的開(kāi)源項目 - www.lumit.org

lumit | 2004-08-27

英偉達和聯(lián)發(fā)科技可能會(huì )在 Computex 上推出聯(lián)合開(kāi)發(fā)的適用于 Windows PC 的“N1”Arm 芯片

消費電子英偉達聯(lián)發(fā)科技 Computex Windows PC N1 Arm 芯片 | 2025-05-07

從ABS防抱死系統到ASR_ESP

資源下載汽車(chē)安全 ESP ASR | 2011-05-13

四個(gè)月兩次到訪(fǎng)，中國市場(chǎng)對英偉達到底有多重要？

國際視野英偉達 | 2025-04-29

世紀聯(lián)星U073-6B電腦刻繪機開(kāi)關(guān)電源電路

設計方案世紀聯(lián)星 U073-6B 電腦刻繪機開(kāi)關(guān)電源 | 2009-07-06

大嘴業(yè)話(huà)——英偉達宣布進(jìn)軍CPU市場(chǎng)

視頻英偉達 AI CPU | 2023-11-10

英偉達否認將分拆中國業(yè)務(wù)獨立運營(yíng)：這些說(shuō)法沒(méi)有任何依據

智能計算英偉達分拆中國業(yè)務(wù) 獨立運營(yíng) | 2025-04-29

GPU的形態(tài)已徹底改變，英偉達GTC大會(huì )發(fā)布的到底是什么

視頻英偉達 GPU Blackwell AI GTC | 2024-03-26

《E點(diǎn)冷知識》：引發(fā)AI行業(yè)大地震的CUDA究竟有多強大

視頻英偉達 GPU CUDA AI | 2024-03-26

焦點(diǎn)

推薦視頻

技術(shù)專(zhuān)區

国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放

<dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"></dfn><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>