<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 智能計算 > 業(yè)界動(dòng)態(tài) > 英偉達 Parakeet TDT 0.6B 成開(kāi)源 ASR 新王:1秒轉錄60分鐘音頻

英偉達 Parakeet TDT 0.6B 成開(kāi)源 ASR 新王:1秒轉錄60分鐘音頻

作者: 時(shí)間:2025-05-08 來(lái)源:IT之家 收藏

5 月 7 日消息,科技媒體 marktechpost 昨日(5 月 6 日)發(fā)布博文,報道稱(chēng)最新推出 ,是一款先進(jìn)的)模型,已在 Hugging Face 平臺上完全。

本文引用地址:http://dyxdggzs.com/article/202505/470178.htm

的核心優(yōu)勢在于其無(wú)與倫比的速度和轉錄質(zhì)量。該模型僅需 1 秒即可處理 60 分鐘音頻,是現有主流 典型模型速度的 50 倍。

在 Hugging Face 的 Open Leaderboard 上,其字錯率(WER)低至 6.05%,成為模型中的佼佼者。這一性能為實(shí)時(shí)轉錄、語(yǔ)音分析、呼叫中心智能和音頻內容索引等企業(yè)級應用提供了強大支持。

無(wú)標題.jpg

該模型基于 Transformer 架構,結合高質(zhì)量轉錄數據進(jìn)行微調,并針對硬件優(yōu)化推理。

援引博文介紹,該模型關(guān)鍵特性包括:6 億參數的編碼-解碼結構、量化和融合內核以提升推理效率、支持 TDT(Transducer Decoder Transformer)架構,以及精確的時(shí)間戳、數字格式化和標點(diǎn)恢復功能。

此外,該模型還開(kāi)創(chuàng )性地支持歌曲轉歌詞轉錄,這一罕見(jiàn)功能拓展了音樂(lè )索引和媒體平臺的用例,依托的 TensorRT 和 FP8 量化技術(shù),其實(shí)時(shí)率(Real Time Factor,RTF,模型處理時(shí)間和音頻長(cháng)度的比值)達到 3386。

Parakeet TDT 0.6B 不僅關(guān)注速度和精度,還內置了多項獨特功能。該模型能將歌曲內容轉為歌詞,適用于音樂(lè )和媒體領(lǐng)域;支持數字和時(shí)間戳格式化,提升會(huì )議記錄、法律轉錄和醫療記錄的可讀性;標點(diǎn)恢復功能則增強了下游自然語(yǔ)言處理(NLP)應用的表現。這些特性大幅提升轉錄質(zhì)量,減輕后期處理或人工編輯的負擔,尤其適合企業(yè)級部署。



評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>