商湯斬獲NLP頂級賽事視頻語(yǔ)義理解任務(wù)桂冠
近日,在NLP(自然語(yǔ)言處理)領(lǐng)域的頂級賽事LIC 2022語(yǔ)言與智能技術(shù)競賽中,商湯科技研究院NLP團隊攜手香港中文大學(xué)團隊,在王歷偉教授的指導和帶領(lǐng)下,從超過(guò)500個(gè)注冊隊伍中脫穎而出,斬獲視頻語(yǔ)義理解任務(wù)冠軍。這也是商湯科技在人工智能學(xué)術(shù)領(lǐng)域獲得的又一項超高含金量的技術(shù)殊榮。
本文引用地址:http://dyxdggzs.com/article/202209/438482.htm語(yǔ)言是人類(lèi)信息傳遞最重要的媒介,讓機器理解語(yǔ)言并進(jìn)行交互是人工智能的基本挑戰。作為由中國中文信息學(xué)會(huì )(CIPS)和中國計算機學(xué)會(huì )(CCF)主辦的NLP學(xué)術(shù)競賽,LIC已連續成功舉辦五年。本屆LIC覆蓋自然語(yǔ)言處理和人工智能領(lǐng)域的重要前沿課題,設計了圍繞跨模態(tài)、知識驅動(dòng)、可信學(xué)習等方面的四大任務(wù),難度相比往屆也進(jìn)一步提升。競賽吸引了包括騰訊、阿里巴巴、清華大學(xué)等在內的學(xué)術(shù)界、工業(yè)界的知名研究者和開(kāi)發(fā)者約3000余名選手共同參與,展開(kāi)激烈角逐。
本次競賽的視頻語(yǔ)義理解任務(wù)包含分類(lèi)標簽預測和語(yǔ)義標簽預測兩個(gè)子任務(wù)。在分類(lèi)標簽預測任務(wù)中,商湯NLP團隊利用預訓練模型和類(lèi)Transformer結構對不同模態(tài)的數據進(jìn)行編碼和融合,并進(jìn)行了數據增強和模型融合,出色地完成了視頻中兩個(gè)級別的標簽分類(lèi)。在語(yǔ)義標簽預測任務(wù)中,商湯NLP團隊提出了將命名實(shí)體識別模型和標簽分類(lèi)模型結合的方案,經(jīng)過(guò)創(chuàng )新地數據增強和模型融合后,不僅可以發(fā)掘文本中存在的標簽,還可以提供額外的標簽預測。憑借在多模態(tài)和NLP領(lǐng)域的不斷積累和創(chuàng )新能力,商湯NLP團隊在這兩個(gè)子任務(wù)中均摘得桂冠。
隨著(zhù)人工智能技術(shù)的發(fā)展以及在不同場(chǎng)景的快速落地,NLP領(lǐng)域的需求和應用越來(lái)越廣泛,重要性日益突顯。例如在數字人領(lǐng)域,語(yǔ)音語(yǔ)義理解是數字人“AI大腦”的重要組成部分?;谡Z(yǔ)音識別(ASR)、語(yǔ)音合成(TTS)、自然語(yǔ)言理解(NLP)等技術(shù)組合,結合商湯所積累的語(yǔ)音語(yǔ)義理解和生成能力,以及知識庫自動(dòng)學(xué)習和模型訓練能力,可以根據不同行業(yè)業(yè)務(wù)需求,快速定制AI數字人的智能語(yǔ)音對話(huà)和問(wèn)答系統,并可通過(guò)接入后臺運營(yíng)管理平臺,支持知識庫的在線(xiàn)更新和維護,實(shí)現AI數字人的深度學(xué)習和迭代升級。依托深厚的技術(shù)積累,商湯數字人解決方案已覆蓋超過(guò)200款手機、平板電腦、AR/VR眼鏡、智慧大屏及線(xiàn)下一體機等多種終端設備。在不久前知名研究機構沙利文聯(lián)合頭豹研究院發(fā)布的報告中,商湯被列入數字人領(lǐng)導者陣營(yíng)。
自成立以來(lái),商湯科技長(cháng)期持續投入引領(lǐng)全球的人工智能技術(shù)研究,不斷斬獲佳績(jì),積累了深厚的技術(shù)基礎與人才優(yōu)勢。目前,商湯已在各項全球競賽中已獲得70多項冠軍,發(fā)表超過(guò)600篇頂級學(xué)術(shù)論文,擁有8,000多項人工智能專(zhuān)利及專(zhuān)利申請。商湯科技還前瞻打造了行業(yè)領(lǐng)先的人工智能基礎設施SenseCore商湯AI大裝置,為技術(shù)研發(fā)和落地提供重要支撐,并幫助研究人員快速實(shí)驗并驗證新的想法,加速創(chuàng )新與迭代。
通過(guò)凝聚頂尖人才,持續打造更具擴展性、更普惠的人工智能軟件平臺,商湯未來(lái)將更加高效地推動(dòng)前沿AI技術(shù)的創(chuàng )新轉化和落地應用,更好地滿(mǎn)足多領(lǐng)域、多場(chǎng)景的產(chǎn)業(yè)應用,為學(xué)術(shù)及產(chǎn)業(yè)界發(fā)展貢獻力量。
評論