AI Challenger 開(kāi)賽:國內最大規模深度學(xué)習數據集上線(xiàn),ImageNet 冠軍、Kaggle 大賽優(yōu)勝者加入角逐
由創(chuàng )新工場(chǎng)、搜狗和今日頭條聯(lián)合宣布發(fā)起的 AI Challenger 挑戰賽,在今年的比賽時(shí)間為 9 月 4 日至 12 月 3 日,每雙周評出周冠軍,每個(gè)賽題中效果突出的團隊還將進(jìn)行答辯,角逐總冠軍。目前,報名者已超過(guò) 1000 名,參賽隊伍超過(guò) 500 支,其中很多人來(lái)自國內外 AI 實(shí)力強勁的高校、公司和機構,不乏過(guò)去各類(lèi)比賽的獲獎?wù)?,比?ImageNet 兩項任務(wù)冠軍、天池阿里移動(dòng)推薦算法大賽冠軍以及 Kaggle 大賽的眾多優(yōu)勝者。
本文引用地址:http://dyxdggzs.com/article/201709/363897.htm隨著(zhù)以 30 萬(wàn)張圖片為基礎的計算機視覺(jué)賽道數據集和以 1000 萬(wàn)對英中對照的句子為基礎的自然語(yǔ)言賽道數據集的上傳,第一屆 AI Challenger(AIC)在 9 月 4 日正式拉開(kāi)帷幕。這個(gè)由創(chuàng )新工場(chǎng)、搜狗和今日頭條聯(lián)合宣布發(fā)起的挑戰賽,希望打造中國最大的科研數據集與世界級 AI 競賽平臺,推動(dòng)中國人工智能領(lǐng)域科研創(chuàng )新。

圖:(左起)搜狗 CEO 王小川、創(chuàng )新工場(chǎng)創(chuàng )始人兼 CEO 李開(kāi)復、今日頭條顧問(wèn)兼技術(shù)戰略研究院院長(cháng)張宏江 在 8 月 14 日的 AI Challenger 啟動(dòng)儀式上
第一屆 AIC 共開(kāi)辟了兩個(gè)賽道、五個(gè)賽題,分別是自然語(yǔ)言/機器翻譯領(lǐng)域的英中機器同聲傳譯(English-Chinese Simultaneous Interpretation)賽題、英中機器文本翻譯(English-Chinese Machine Translation)賽題,以及計算機視覺(jué)賽道的場(chǎng)景分類(lèi)(Scene Classification)賽題、 人體骨骼關(guān)鍵點(diǎn)檢測(Human Skeleton System Keypoints Detection)賽題和圖像中文描述(Image Caption)賽題。
在數據集上線(xiàn)前夕,機器之心和 AI Challenger 競賽組委會(huì )執行委員會(huì )成員、創(chuàng )新工場(chǎng)人工智能研究院副院長(cháng)王詠剛聊了聊,從「發(fā)起人」和「建設者」的角度談了談 AI Challenger 的選題考量、數據集建設情況以及長(cháng)期的展望。
計算機視覺(jué)賽道:更專(zhuān)門(mén)化、更貼近商業(yè)應用場(chǎng)景、更有中國特色的賽題設置
創(chuàng )新工場(chǎng)本次主要負責了計算機視覺(jué)賽道數據集的建設。去年開(kāi)始規劃 AI Challenger 的建設之后,團隊咨詢(xún)了大量競賽方面的專(zhuān)家。包括 ImageNet 的發(fā)起人李飛飛、來(lái)自 MS COCO 團隊的負責人和在 CVPR 主辦競賽及研討會(huì )的研究者。專(zhuān)家們認為:后 ImageNet 時(shí)代,需求最大的不再是通用數據集,而是和商業(yè)應用場(chǎng)景結合更緊密的前沿領(lǐng)域專(zhuān)門(mén)數據集。因此,AIC 的團隊通過(guò)與中國較為前沿的和視覺(jué)相關(guān)的領(lǐng)域,如無(wú)人駕駛、醫療影像、安防等從業(yè)者進(jìn)行溝通,確定了以下這三個(gè)更加專(zhuān)門(mén)化的、更具有中國特色的數據集方向。
其中,人體骨骼關(guān)鍵點(diǎn)檢測在無(wú)人駕駛領(lǐng)域和安防領(lǐng)域都有眾多應用場(chǎng)景。無(wú)人駕駛需要純視覺(jué)方案來(lái)感知行人的動(dòng)作。這里的感知遠比「識別」、「確定位置」要復雜。因為行人的動(dòng)作模式非常多樣,對行人的動(dòng)作意圖檢測要遠遠難于對車(chē)的檢測。在現在前沿的行人動(dòng)作姿態(tài)檢測算法中,基于人體骨骼關(guān)鍵點(diǎn)的算法是其中一類(lèi)主流算法,而這類(lèi)主流算法的準確度還不那么理想。而在安防領(lǐng)域,取得不錯成果的人臉識別課題其實(shí)只覆蓋了安防領(lǐng)域中的「身份識別」這一個(gè)非常小的場(chǎng)景,而且需要在臉部相對比較清晰、完整的情況下進(jìn)行。但在更多的場(chǎng)景中,人的臉部都不一定清晰,而且需要分析人的整體動(dòng)作進(jìn)行追蹤。在人體追蹤技術(shù)里,人體骨骼關(guān)鍵點(diǎn)也是其中的重要因素。
「圖像描述任務(wù)是當下的一個(gè)熱點(diǎn)方向,因為它的核心是跨模式、多模態(tài)的學(xué)習?!雇踉亜傟U述自己對圖像描述的理解。人工智能現在已經(jīng)能很好地完成感知(perception)任務(wù)了,在「從聲音和圖片中識別出內容」這項工作上甚至可以取得勝過(guò)人類(lèi)的成果。然而「語(yǔ)義理解」工作方面卻一直未見(jiàn)長(cháng)足進(jìn)展。圖像描述任務(wù)需要把感知模塊得到的結果用一定方法轉為文本內容,是一個(gè)從感知到理解的過(guò)渡項目。當前的圖像描述一般以 MS COCO 數據集為標準數據集,MS COCO 是一個(gè)包含 14 萬(wàn)張圖片的數據集,每張圖片有 4 - 5 句英文描述。在此基礎上,AIC 希望建設一個(gè)中文的圖像描述數據集,第一檢測現有的算法應用到中文數據上效果如何,第二嘗試在此基礎上是否能做出有針對性的算法來(lái)增強效果。
圖像分類(lèi)任務(wù)是上兩個(gè)問(wèn)題的「副產(chǎn)品」,人體骨骼關(guān)鍵點(diǎn)監測和圖像描述都涉及了大量的場(chǎng)景,AIC 把其中的典型場(chǎng)景和一些可能帶來(lái)挑戰的場(chǎng)景結合起來(lái),篩選了 80 個(gè)場(chǎng)景下的 8 萬(wàn)張圖片,設計了一個(gè)相對簡(jiǎn)單,可以讓更多對深度學(xué)習感興趣的人參與進(jìn)來(lái)的問(wèn)題。
人體骨骼關(guān)鍵點(diǎn)和圖像描述的標注難度都遠大于 ImageNet 傳統的物體檢測、定位標注。創(chuàng )新工場(chǎng)以及其他兩家合作伙伴在數據集的建設上投入了大量的人力物力,與多家團隊合作完成了標注工作。機器之心了解到,今年的計算機視覺(jué)數據標注工作動(dòng)員了超過(guò) 100 名專(zhuān)業(yè)標注員,創(chuàng )新工場(chǎng)也成立了 12 人的質(zhì)檢團隊,專(zhuān)門(mén)負責用基線(xiàn)模型對不同批次的標注數據進(jìn)行交叉驗證??偼度胧仟劷鸪赝度氲?4-5 倍,而計算機視覺(jué)方向的獎金池規模累計大于 100 萬(wàn)人民幣。
今年的計算機視覺(jué)賽道數據集(訓練集)以 21 萬(wàn)張圖片為基礎,其中人體骨骼關(guān)鍵點(diǎn)檢測的訓練集中包含了超過(guò) 35 萬(wàn)個(gè)人物,使用的圖片覆蓋了超過(guò) 250 種日常生活場(chǎng)景,壓縮后數據集大小為 14.8G;圖像中文描述的訓練集包含了 105 萬(wàn)句中文描述,覆蓋了超過(guò) 200 種日常生活場(chǎng)景,壓縮后數據集大小 19.2G。

圖:人體骨骼關(guān)鍵點(diǎn)訓練集中,14 個(gè)關(guān)鍵點(diǎn)的分布情況。其中,藍色代表「標注且可見(jiàn)關(guān)鍵點(diǎn)」,橙色代表「標注但不可見(jiàn)關(guān)鍵點(diǎn)」,綠色代表「未標注關(guān)鍵點(diǎn)」(關(guān)鍵點(diǎn)在圖像外)

圖:計算機視覺(jué)日常場(chǎng)景分布圖,典型場(chǎng)景包括:球場(chǎng)、道路 、運動(dòng)場(chǎng)、舞臺、房間、大廳、草地等等
王詠剛:打造越來(lái)越全面和多樣化的數據集是未來(lái)目標
今年的比賽時(shí)間為 9 月 4 日至 12 月 3 日,為期三個(gè)月。每雙周會(huì )評出周冠軍,每個(gè)賽題中效果突出的團隊還將進(jìn)行答辯,角逐總冠軍。自啟動(dòng)儀式開(kāi)放報名以來(lái),平臺已經(jīng)匯聚了來(lái)自世界各地的超過(guò) 1000 名參賽者和超過(guò) 500 支參賽隊伍。他們中很多人來(lái)自國內外 AI 實(shí)力強勁的高校和公司機構,其中不乏過(guò)去各類(lèi)比賽的獲獎?wù)?,比?ImageNet 兩項任務(wù)冠軍、天池阿里移動(dòng)推薦算法大賽冠軍以及 Kaggle 大賽的眾多優(yōu)勝者。
王詠剛表示,AI Challenger 并非只舉辦一年,而是一個(gè)長(cháng)期的愿景。一家投資、孵化了三十余家 AI 公司的投資機構,兩家以科研、技術(shù)能力著(zhù)稱(chēng)的互聯(lián)網(wǎng)公司,這三家主辦方承諾在 3 年內投入數千萬(wàn)元人民幣,建設這個(gè)集科研數據集與 AI 競賽為一體的平臺。今年開(kāi)放的兩個(gè)賽道五個(gè)賽題,也只不過(guò)是「萬(wàn)里長(cháng)征第一步」。
「我們的偉大理想是建造一個(gè)世界一流的數據集,這不是一個(gè)一蹴而就的過(guò)程,需要幾年的時(shí)間慢慢打造?!雇踉亜傉f(shuō)。第一年,AIC 雖然都是學(xué)術(shù)研究前沿方向,然而出于謹慎的態(tài)度,只選擇了幾個(gè)「點(diǎn)」來(lái)進(jìn)行嘗試。團隊希望在未來(lái),數據集能越來(lái)越全面和多樣化。王詠剛表示,在數據集公布后,他們會(huì )將過(guò)程和經(jīng)驗整理為論文,在 CVPR 等會(huì )議上與研究者交流,更多地搜集研究者對數據的需求,為明年的數據集建設提供指導意見(jiàn)。
王詠剛認為,數據集建設的路上還有很多高山等待著(zhù) AIC 去攀登,這其中包括視頻數據、虛擬系統生成數據等更多樣化的數據形式,也包括醫療影像數據等數據集的體量問(wèn)題,以及數據集外的標注成本、版權問(wèn)題、隱私問(wèn)題亟待考慮與解決。
如同創(chuàng )新工場(chǎng)創(chuàng )始人兼 CEO 李開(kāi)復在啟動(dòng)儀式上提到的,AI 在我國推進(jìn)的最大落差就是數據的落差。而 AIC 希望以競賽平臺的形式給更多學(xué)生、學(xué)校、實(shí)驗室和新創(chuàng )公司提供數據與計算能力,從而提升整個(gè)中國的人工智能水平?!赶M斘覀冊谌迥旰蠡仡檿r(shí),當我們看到中美 AI 人才沒(méi)有落差時(shí),也許會(huì )想到 AI Challenger 在這個(gè)重大過(guò)程中扮演了一個(gè)小小角色?!估铋_(kāi)復如是說(shuō)。
評論