特斯拉收購初創(chuàng )公司 專(zhuān)注自動(dòng)駕駛“深度神經(jīng)網(wǎng)絡(luò )”
據外媒報道,特斯拉收購計算機視覺(jué)初創(chuàng )公司DeepScale的交易開(kāi)始收獲回報,通過(guò)收購完整團隊開(kāi)始為這家電動(dòng)汽車(chē)制造商提供新的專(zhuān)利。
本文引用地址:http://dyxdggzs.com/article/202004/412155.htm2019年年底,有消息稱(chēng)特斯拉收購了位于舊金山灣區的初創(chuàng )公司DeepScale,該公司專(zhuān)注于開(kāi)發(fā)自動(dòng)駕駛汽車(chē)的“深度神經(jīng)網(wǎng)絡(luò )”,收購金額未披露。DeepScale專(zhuān)注于計算節能的深度學(xué)習系統,這也是特斯拉關(guān)注的重點(diǎn)領(lǐng)域,特斯拉決定設計自己的電腦芯片來(lái)驅動(dòng)自動(dòng)駕駛軟件。有猜測稱(chēng),特斯拉收購這個(gè)團隊是為了加速其機器學(xué)習的發(fā)展。
現在,特斯拉公布了名為“用擴充數據訓練機器模型的系統和方法”的新專(zhuān)利,我們也看到了這筆收購帶來(lái)的成果。這項專(zhuān)利的發(fā)明者包括DeepScale的三名成員,分別是馬修.庫珀(Matthew Cooper)、帕拉斯.賈因(Paras Jain)和哈西姆蘭.辛格.西杜(Harsimran Singh Sidhu)。
目前在特斯拉旗下工作的DeepScale團隊正在嘗試申請的這個(gè)系統,它與利用幾個(gè)不同傳感器觀(guān)測場(chǎng)景的數據來(lái)訓練神經(jīng)網(wǎng)絡(luò )有關(guān),比如特斯拉司機輔助駕駛系統Autopilot傳感器陣列中的八個(gè)攝像頭。
特斯拉在專(zhuān)利申請中描述了這種情況的困難:“在典型的機器學(xué)習應用中,數據可以通過(guò)多種方式進(jìn)行擴充,以避免過(guò)度擬合用于獲取訓練數據的捕獲設備的特征模型。例如,在用于訓練計算機模型的典型圖像集中,圖像可能代表許多不同捕獲環(huán)境的對象,這些環(huán)境具有與被捕獲對象相關(guān)的不同傳感器特征。例如,這樣的圖像可以通過(guò)不同的傳感器特性來(lái)捕獲,就像不同的尺度、焦距、鏡頭類(lèi)型、預處理或后處理、軟件環(huán)境以及傳感器陣列硬件等等。這些傳感器在不同的外部參數方面也可能有所不同,例如成像傳感器的位置和方向相對于捕獲圖像時(shí)的環(huán)境。所有這些不同類(lèi)型的傳感器特性都會(huì )導致所捕獲的圖像在圖像集中呈現不同的形式,使正確地訓練計算機模型變得更加困難?!?/p>
對此,特斯拉團隊總結了他們應對這個(gè)問(wèn)題的解決方案:
第一個(gè)部分是用于訓練預測計算機模型一組參數的方法。該實(shí)施例可以包括:1)識別由一組攝像頭捕獲的圖像,該圖像被附加到一個(gè)或多個(gè)圖像收集系統中;2)對于圖像集合中的每一幅圖像,識別該圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過(guò)以下特定步驟生成增強圖像:通過(guò)用維護圖像的攝像頭屬性的圖像操縱功能修改圖像來(lái)為該組圖像生成增強圖像,并將該增強訓練圖像與該圖像的訓練輸出相關(guān)聯(lián);4)訓練預測計算機模型的該組參數以基于包括該圖像和該組增強圖像的圖像訓練集來(lái)預測訓練輸出。
第二部分包括具有一個(gè)或多個(gè)處理器和存儲指令的非暫時(shí)性計算機存儲介質(zhì)系統,該指令在由一個(gè)或多個(gè)處理器執行時(shí),會(huì )使處理器執行相關(guān)操作,這些操作包括:1)識別由一組攝像頭捕獲的、同時(shí)附著(zhù)到一個(gè)或多個(gè)圖像采集系統的圖像集合;2)對于所述圖像集合中的每幅圖像,識別圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過(guò)以下步驟為一組圖像生成增強圖像:通過(guò)用維護圖像的攝像頭屬性的圖像處理函數修改圖像來(lái)為該組圖像生成增強圖像,并將該增強訓練圖像與該圖像的訓練輸出相關(guān)聯(lián);4)訓練預測計算機模型的參數集來(lái)預測基于圖像訓練集的訓練輸出,包括圖像和增強圖像集。
第三部分以包括具有供處理器執行指令的非暫時(shí)性計算機可讀介質(zhì),該指令在由處理器執行時(shí)使得處理器能夠:1)識別由一組攝像頭捕獲的、同時(shí)附著(zhù)到一個(gè)或多個(gè)圖像采集系統的一組圖像;2)對于該組圖像中的每幅圖像,識別該圖像的訓練輸出;3)對于該組圖像中的一幅或多幅圖像,通過(guò)以下步驟為一組圖像生成增強圖像:通過(guò)用維持圖像的攝像頭屬性的圖像操作功能修改圖像來(lái)為一組圖像生成增強圖像,并將增強的訓練圖像與圖像的訓練輸出相關(guān)聯(lián);4)訓練計算機模型以學(xué)習基于包括圖像和該組增強圖像的圖像訓練集來(lái)預測訓練輸出。
正如之前報道的那樣,特斯拉正在經(jīng)歷“對特斯拉Autopilot的重大基礎性重寫(xiě)”。作為重寫(xiě)的一部分,首席執行官埃隆.馬斯克(Elon Musk)表示:“神經(jīng)網(wǎng)絡(luò )正在吸收越來(lái)越多的問(wèn)題?!?/p>
新專(zhuān)利中還將包括一個(gè)標簽系統,馬斯克稱(chēng)3D標簽將改變游戲規則:汽車(chē)進(jìn)入有八個(gè)攝像頭的場(chǎng)景,畫(huà)一條路,然后你可以用3D標記那條路。這種用多個(gè)攝像頭訓練機器學(xué)習系統的新方法,就像特斯拉的Autopilot一樣,帶有附加數據,可以成為Autopilot更新的一部分。
評論