<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>

新聞中心

EEPW首頁(yè) > 汽車(chē)電子 > 新品快遞 > 禾賽科技攜手Scale AI發(fā)布開(kāi)源數據集

禾賽科技攜手Scale AI發(fā)布開(kāi)源數據集

—— 含37種語(yǔ)義標簽、超百個(gè)場(chǎng)景
作者: 時(shí)間:2020-07-10 來(lái)源:美通社 收藏

自動(dòng)駕駛的發(fā)展離不開(kāi)數據。近日,聯(lián)合發(fā)布了自動(dòng)駕駛開(kāi)源數據集 --  PandaSet。PandaSet采用先進(jìn)的激光雷達進(jìn)行數據采集,并通過(guò)Scale  AI強大的標注平臺進(jìn)行精準的數據標注,為從事自動(dòng)駕駛研發(fā)的公司、機構和個(gè)人,提供了內容豐富、目標物密集的高質(zhì)量免費數據。

本文引用地址:http://dyxdggzs.com/article/202007/415391.htm

盤(pán)點(diǎn)全球人工智能數據平臺,是當之無(wú)愧的領(lǐng)軍者。這家由華裔青年Alexandr  Wang在19歲時(shí)參與創(chuàng )立的公司,自成立以來(lái)一直深受投資者的青睞,僅用3年時(shí)間就成為了市值超10億美元的獨角獸企業(yè)。依托強大的技術(shù)實(shí)力,Scale   AI結合人工標注、智能工具和標注質(zhì)量保證體系,推出了面向傳感器數據、圖像、視頻和文本的一系列標注產(chǎn)品,為人工智能應用提供了一流的培訓和驗證數據。而作為全球領(lǐng)先的激光雷達制造商,則憑借自主研發(fā)的微振鏡和波形加密技術(shù),始終引領(lǐng)傳感器創(chuàng )新的發(fā)展方向,目前已布局400多項專(zhuān)利,客戶(hù)遍布全球21個(gè)國家和地區的70座城市。此次禾賽科技與Scale  AI攜手打造PandaSet開(kāi)源數據集,無(wú)疑為自動(dòng)駕駛行業(yè)的發(fā)展注入了新的活力。

在自動(dòng)駕駛的發(fā)展進(jìn)程中,數據是處于核心地位的生產(chǎn)資料,代表著(zhù)一家公司的核心競爭力,也決定著(zhù)自動(dòng)駕駛能否實(shí)現安全和穩定。以往,自動(dòng)駕駛“玩家”對自己的數據普遍呈現出敏感的姿態(tài),而隨著(zhù)自動(dòng)駕駛的實(shí)現難度越來(lái)越浮出水面,大家也逐漸認識到單打獨斗絕對不行,開(kāi)放合作才是正途,于是開(kāi)源數據集成為了很多自動(dòng)駕駛公司的選擇。

截至目前,Waymo、Cruise、百度、Uber、Lyft、Aptiv等全球領(lǐng)先的自動(dòng)駕駛公司都已陸續開(kāi)源了自己的數據集,對促進(jìn)自動(dòng)駕駛整體研發(fā)進(jìn)程起到了舉足輕重的作用。不過(guò),開(kāi)源數據集并不是自動(dòng)駕駛公司的“專(zhuān)利”,傳感器企業(yè)同樣有能力在這一領(lǐng)域大顯身手,甚至可能比自動(dòng)駕駛公司做得更好。禾賽科技與Scale  AI聯(lián)合發(fā)布PandaSet就是很好的例子,它為自動(dòng)駕駛行業(yè)鏈條上的很多企業(yè)開(kāi)辟了嶄新的發(fā)展思路。

PandaSet開(kāi)源數據集內容概覽  
  PandaSet開(kāi)源數據集內容概覽    

PandaSet:疫情期間的一場(chǎng)及時(shí)雨

高質(zhì)量標注數據是訓練深度學(xué)習算法的“燃料”。目前,全球的自動(dòng)駕駛公司所使用的深度學(xué)習算法,基本都需要使用標注數據來(lái)進(jìn)行訓練——只有通過(guò)不斷學(xué)習標注數據,深度學(xué)習算法模型才能夠幫助自動(dòng)駕駛汽車(chē)更好地識別障礙物。而除了自動(dòng)駕駛公司,其他自動(dòng)駕駛算法開(kāi)發(fā)者,例如學(xué)生、學(xué)術(shù)機構等,同樣對高質(zhì)量標注數據有著(zhù)持續、強烈的需求。

然而,今年以來(lái),受新冠肺炎疫情沖擊,一大批自動(dòng)駕駛公司不得不暫停路測工作,直接導致可用路測數據的減少甚至斷供,對自動(dòng)駕駛深度學(xué)習算法模型的訓練造成了嚴重影響。  在這樣的背景下,近日禾賽科技與聯(lián)合發(fā)布了PandaSet開(kāi)源數據集,為眾多自動(dòng)駕駛算法開(kāi)發(fā)者帶來(lái)了一場(chǎng)及時(shí)雨。

PandaSet數據集采用2款激光雷達和6個(gè)攝像頭進(jìn)行數據采集,包含超過(guò)16000幀激光雷達點(diǎn)云和超過(guò)48000張照片,共100多個(gè)場(chǎng)景。除了激光雷達點(diǎn)云和照片外,數據集還包含GPS(全球定位系統)/IMU(慣性傳感器)、標定參數、標注、SDK(軟件開(kāi)發(fā)工具包)等信息。

PandaSet點(diǎn)云、照片標注對照  
  PandaSet點(diǎn)云、照片標注對照    

 

PandaSet數據采集的兩款激光雷達Pandar64和PandarGT,以及配置6個(gè)攝像頭  
  PandaSet數據采集的兩款激光雷達Pandar64和PandarGT,以及配置6個(gè)攝像頭    

尤其值得關(guān)注的是,PandaSet數據集對100多個(gè)場(chǎng)景的每個(gè)場(chǎng)景都進(jìn)行了目標檢測,共檢測28類(lèi)物體;大多數場(chǎng)景還進(jìn)行了語(yǔ)義分割,共37種語(yǔ)義標簽。目標檢測采用傳統的長(cháng)方體標注,例如,自行車(chē)和汽車(chē)可以用長(cháng)方體線(xiàn)框框出來(lái)。而對于激光雷達點(diǎn)云數據,并非每個(gè)點(diǎn)都隸屬于某一目標物,因此數據集還通過(guò)點(diǎn)云分割工具精確標注了每個(gè)點(diǎn)的語(yǔ)義標簽。如此細膩的標注,也為深度學(xué)習算法模型提供了絕佳的數據資料。

PandaSet數據集還通過(guò)點(diǎn)云分割工具精確標注了每個(gè)點(diǎn)的語(yǔ)義標簽  
  PandaSet數據集還通過(guò)點(diǎn)云分割工具精確標注了每個(gè)點(diǎn)的語(yǔ)義標簽    

對于一個(gè)自動(dòng)駕駛數據集,場(chǎng)景的多樣性和復雜性是衡量其優(yōu)劣程度的重要標準之一。PandaSet數據集中的所有數據均采集自舊金山的城區道路和硅谷的郊區道路,這些道路涵蓋了汽車(chē)、自行車(chē)、交通燈、行人、建筑物等各種各樣的交通信息,是對自動(dòng)駕駛挑戰性最大的一類(lèi)應用場(chǎng)景。此外,PandaSet數據集的數據覆蓋了白天和黑夜,也讓其具備了很強的適用性。

夜晚場(chǎng)景的三維框標注  
  夜晚場(chǎng)景的三維框標注    

別被不可靠的數據集帶溝里

對于自動(dòng)駕駛研發(fā)者,如果想要訓練出優(yōu)秀的深度學(xué)習算法模型,就必須在選擇數據集時(shí)格外擦亮雙眼。因為一些不可靠的數據集,非但不能很好地訓練算法,反而會(huì )給算法帶來(lái)巨大危害,起到適得其反的作用。那么,什么樣的數據集是不可靠的呢?簡(jiǎn)單來(lái)說(shuō),不準確、不完整的數據集就是不可靠的數據集。

一些不準確、不完整的數據集正在把自動(dòng)駕駛汽車(chē)帶溝里,其中也包括知名數據集。一個(gè)被廣泛使用的、包含15000張圖片的開(kāi)源數據集,在該數據集中發(fā)現了數千張缺少標注的圖片,其中有數百張甚至沒(méi)有任何標注,但這些圖片中確實(shí)有小汽車(chē)、卡車(chē)、自行車(chē)、街燈或行人。不僅如此,該數據集還存在虛假標注、復制粘貼的情況,有些標注框的體積明顯超標。

“成千上萬(wàn)的學(xué)生都在使用開(kāi)源數據集支持自己的自動(dòng)駕駛項目,但質(zhì)量堪憂(yōu)的數據集極易誤導算法模型,從而導致自動(dòng)駕駛汽車(chē)做出糟糕決策,這對于自動(dòng)駕駛的研發(fā)是災難性的?!?/p>

事實(shí)上,數據集的準確性和完整性與數據采集、數據標注的流程密切相關(guān)。例如,在數據采集中,如果采集車(chē)搭載的傳感器性能很差,那么采集到的數據質(zhì)量一定也會(huì )很差,直接影響后續的標注及最終的使用。而在數據標注中,如果沒(méi)有一套完整的標注方法,就很容易出現各種錯誤標記,如:未標出畫(huà)面中存在的物體,反而標出不存在的物體,或者標注框沒(méi)有貼合實(shí)際物體,甚至與實(shí)際物體發(fā)生大幅偏移。

對于如何打造一個(gè)高質(zhì)量數據集,PandaSet是一個(gè)優(yōu)秀案例。在數據采集中,PandaSet用于數據采集的兩款激光雷達均為業(yè)內領(lǐng)先產(chǎn)品,這兩款激光雷達由禾賽科技自主研發(fā),一款是具有圖像級分辨率的前向激光雷達PandarGT,另一款是64線(xiàn)機械旋轉式激光雷達Pandar64,保證采集到的點(diǎn)云足夠準確、清晰、細膩  -- 世界上現有的開(kāi)源數據集普遍采集較早,還鮮有使用Pandar64和PandarGT這樣的高性能激光雷達來(lái)采集數據。

此外,在數據標注中,負責該部分的Scale  AI作為標注領(lǐng)域的翹楚,具有一套非常嚴格的標注體系,包括怎么標注、怎么檢查、怎么復核、怎么對不合格的標注進(jìn)行重新標注、怎么管理和考評負責標注的員工等。在整個(gè)標注流程中,Scale  AI以人工作業(yè)為主,結合計算機輔助,充分保證了數據標注的完整性和準確性。

開(kāi)源數據集是大勢所趨

作為自動(dòng)駕駛行業(yè)的領(lǐng)頭羊,Waymo也在去年發(fā)布了自己的開(kāi)源數據集Waymo Open  Dataset。該數據集包含20萬(wàn)幀畫(huà)面、1200萬(wàn)條3D標注和120萬(wàn)條2D注釋。Waymo希望自家的數據集能夠幫助研發(fā)者在2D和3D感知、場(chǎng)景理解、行為預測等方面取得進(jìn)展,從而不斷提高自動(dòng)駕駛汽車(chē)的性能,并促進(jìn)計算機視覺(jué)和機器人等其他相關(guān)領(lǐng)域的應用。

在Waymo發(fā)布開(kāi)源數據集之前,Cruise、百度、Uber、Aptiv等處于領(lǐng)先梯隊的自動(dòng)駕駛公司都已發(fā)布了自己的開(kāi)源數據集。而在Waymo發(fā)布開(kāi)源數據集之后,又有多家公司發(fā)布了自動(dòng)駕駛開(kāi)源數據集,例如Lyft、福特、奧迪等。

通觀(guān)自動(dòng)駕駛開(kāi)源數據集的發(fā)展歷程可見(jiàn),在PandaSet發(fā)布之前,開(kāi)源數據集基本都是自動(dòng)駕駛公司的“專(zhuān)利”。而禾賽科技的“入局”,則以傳感器企業(yè)的特殊視角為這一領(lǐng)域添上了一抹亮色,同時(shí)也讓人們看到了傳感器企業(yè)在自動(dòng)駕駛賽場(chǎng)上的更多可能性。

事實(shí)上,相比于那些自動(dòng)駕駛“頭部玩家”,傳感器企業(yè)在開(kāi)源數據集中的表現并不遜色。以PandaSet為例,該數據集就擁有其他很多數據集沒(méi)有的優(yōu)勢:采集數據的傳感器業(yè)內頂尖,采集場(chǎng)景多樣化,采集信息密度高,數據標注詳盡準確并進(jìn)行了精細的語(yǔ)義分割。還有非常重要的一點(diǎn)就是,PandaSet面向學(xué)術(shù)及商業(yè)應用均完全開(kāi)源免費——不像很多開(kāi)源數據集其實(shí)是有商用限制的。不過(guò),PandaSet也有其局限性,例如:總的場(chǎng)景量和數據量均不夠大,缺少不同天氣狀況下的數據,缺少短距激光雷達數據。

當然,PandaSet對于禾賽科技和Scale AI都只是一個(gè)開(kāi)端而已。未來(lái),兩家公司將繼續深入合作,采用更高線(xiàn)數的激光雷達以及PandarQT等短距激光雷達,采集更多場(chǎng)景、更多數據,并進(jìn)一步優(yōu)化標注方法、標注流程,讓數據集更豐富、全面,讓細節更完美。

禾賽科技表示,參與開(kāi)源數據集是一個(gè)非常正確的決定,不僅因為這是同行沒(méi)做過(guò)的事,也因為可以從中取得很多收獲。

“一方面,PandaSet數據集為自動(dòng)駕駛行業(yè)豐富了數據,讓研發(fā)者有更多、更全面、更高質(zhì)量的數據可以應用和參考,特別是對那些缺少資金和渠道來(lái)獲取可靠數據集的學(xué)生們,幫助巨大。另一方面,數據集也讓更多人看到了禾賽激光雷達的表現,有助于吸引客戶(hù)購買(mǎi)我們的產(chǎn)品。此外,數據采集過(guò)程涉及采集車(chē)的搭建、不同傳感器的融合、多傳感器之間的標定……這些都是自動(dòng)駕駛公司做的事,對禾賽團隊是前所未有的考驗,也讓我們在實(shí)踐中大大提升了自己的能力?!?/p>

就目前而言,開(kāi)源數據集是大勢所趨,是利人利己的一件事。因為自動(dòng)駕駛數據采集是一個(gè)周期長(cháng)、地域廣的超大型項目,如果各家企業(yè)都能將自己的數據進(jìn)行共享,并吸引更多企業(yè)和研發(fā)者應用并補充數據集,就可以為整個(gè)行業(yè)大大縮減數據采集時(shí)間,從而促進(jìn)自動(dòng)駕駛早日實(shí)現商業(yè)化落地。而從企業(yè)自身出發(fā),如果自家的數據或代碼被廣泛采用,甚至連競爭對手也大量采用,就相當于在業(yè)內樹(shù)立起了一個(gè)非正式標準,對企業(yè)地位提升和長(cháng)遠發(fā)展意義重大。




關(guān)鍵詞: 禾賽科技 Scale AI

評論


相關(guān)推薦

技術(shù)專(zhuān)區

關(guān)閉
国产精品自在自线亚洲|国产精品无圣光一区二区|国产日产欧洲无码视频|久久久一本精品99久久K精品66|欧美人与动牲交片免费播放
<dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><small id="yhprb"></small><dfn id="yhprb"></dfn><small id="yhprb"><delect id="yhprb"></delect></small><small id="yhprb"></small><small id="yhprb"></small> <delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"></dfn><dfn id="yhprb"></dfn><s id="yhprb"><noframes id="yhprb"><small id="yhprb"><dfn id="yhprb"></dfn></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><small id="yhprb"></small><dfn id="yhprb"><delect id="yhprb"></delect></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn> <small id="yhprb"></small><delect id="yhprb"><strike id="yhprb"></strike></delect><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn><dfn id="yhprb"><s id="yhprb"><strike id="yhprb"></strike></s></dfn><dfn id="yhprb"><s id="yhprb"></s></dfn>