半導體產(chǎn)業(yè)應如何在大數據中淘金?
根據思科的數據,全球互聯(lián)網(wǎng)吞吐量在2016年為1.2ZB(1ZB相當于10億TB或1萬(wàn)億GB),預計到2021年將增長(cháng)到3.3ZB每年。洶涌上漲的數據洪流,波峰越來(lái)越高,在2016年,每天數據流量同比增長(cháng)了32%,而流量最高的1小時(shí)數據吞吐量同比增長(cháng)了51%。

當上述統計也不完整,實(shí)際上沒(méi)有人知道全球每天產(chǎn)生多少數據,因為并不是所有設備的數據都會(huì )連入互聯(lián)網(wǎng)。
數據量本身意義不大,如何量化數據的價(jià)值才是關(guān)鍵所在,但在如何應用數據,以實(shí)現其價(jià)值方面,當前還沒(méi)有行之有效的方法。
想挖掘數據的真正價(jià)值,就要對天量數字與模擬數據進(jìn)行過(guò)濾,并充分考慮應用場(chǎng)景,這就像沙里淘金,大多數可能無(wú)功而返。不過(guò),隨著(zhù)計算力的提高以及大規模并行計算工具的成熟,數據過(guò)濾分析--即找到更好的應用數據方法--已經(jīng)能夠創(chuàng )造出頗具市場(chǎng)前景的商業(yè)模式。
“眾多行業(yè)人士指出,不同數據應用方法與其器件和商業(yè)模式相互關(guān)聯(lián),并對其商業(yè)、市場(chǎng)以及商業(yè)模式產(chǎn)生影響,”Synopsys董事長(cháng)兼共同CEO Aart de Geus說(shuō)道,“如果你能夠從中找到捷徑,提升效率,或者全新的商業(yè)模式,那就會(huì )是非常大的影響。 ”這也意味著(zhù)高利潤的可能,“你會(huì )看到,所有從事數據處理的人都在仔細聆聽(tīng),以解碼市場(chǎng)未來(lái)需求,或者自行判斷當前市場(chǎng)需求,”de Geus繼續說(shuō)道,“或者更進(jìn)一步,他們準備置身于數據通路之中,從而最靠近數據商業(yè)化的中心?!?/p>
這正是資本瘋狂涌入的原因,從數據挖掘到云端服務(wù),從機器學(xué)習到工業(yè)物聯(lián)網(wǎng),每一個(gè)數據應用場(chǎng)景都戰況激烈。
“誰(shuí)擁有數據,具備數據分析及處理能力,誰(shuí)就能把所有錢(qián)都賺走,”西門(mén)子Mentor事業(yè)部總裁兼CEO Wally Rhines這樣表示。
現在還難說(shuō)數據應用是一個(gè)勝者通吃的游戲,不過(guò)確實(shí)有不少科技巨頭在這個(gè)領(lǐng)域跑馬圈地,奮勇?tīng)幭?,例如亞馬遜、谷歌、微軟、Facebook和IBM等掰著(zhù)手指頭就可以輸出來(lái)的大家伙。
“收集上來(lái)的物聯(lián)網(wǎng)數據中,包含了設備大量的性能、行為及應用數據,”IBM美洲區銷(xiāo)售主管Christophe Begue說(shuō)道,“我們接下來(lái)會(huì )把收集到的數據丟給Watson(IBM人工智能平臺)去分析?!?/p>
現在的大問(wèn)題是如何將這些數據變現,有哪些人愿意為數據付費。要將數據變現,首先要做到如下幾點(diǎn):第一,行業(yè)里的公司要真正懂數據的價(jià)值;其次,公司要能夠快速應對數據變化,只要比別人快百分之一秒,券商就能夠以此牟利,但現在大公司應對數據變化的反應時(shí)間通常是幾天甚至幾周;第三,變現數據的價(jià)格要有競爭力,不能波動(dòng)太大。
IBM正準備將全球供應鏈的數據商業(yè)化?!肮湐祿譃閮蓪?,”Begue說(shuō)道,“第一層是零售與快速消費品(CPG)等數據,就是那些可能會(huì )影響到食品與飲料等銷(xiāo)售的數據。你可以在附近的一個(gè)商店收集天氣、交通或運動(dòng)賽事等相關(guān)信息,并通過(guò)交通模式追蹤它。我們用Metro Pulse平臺來(lái)做數據分析,該平臺會(huì )覆蓋500個(gè)數據元素,用戶(hù)既可以購買(mǎi)數據用于深度學(xué)習或機器學(xué)習分析,也可以全部委托IBM來(lái)做分析。第二層即我們正在導入市場(chǎng)的概念:供應商風(fēng)險。IBM將天氣與政局變化等諸多因素納入考慮,從數據中分析供應鏈的安全程度,并根據分析結果來(lái)提升供應鏈的安全。如果注意到15個(gè)因素有風(fēng)險,那么你就會(huì )對這15個(gè)因素嚴密監控?!?/p>
IBM的服務(wù)并不是值分析已有數據,還會(huì )給出建議,洞見(jiàn)未來(lái)?!拔覀兪占_(kāi)與半公開(kāi)數據,有些數據只在IBM內部使用,我們建立預測模型。當然,我們也意識到,在計劃和反應之間,仍然存在差距,‘決策室’概念有助于縮小計劃和行動(dòng)之間的鴻溝?!?/p>
智能制造
并不只外部收集的數據才有用,工業(yè)生產(chǎn)中,內部產(chǎn)生的數據就很有價(jià)值。事實(shí)上,整個(gè)智能制造的概念(德國稱(chēng)為工業(yè)4.0,也有人稱(chēng)之為工業(yè)互聯(lián)網(wǎng))就是如何把內部數據利用好。
“一言以蔽之,工業(yè)物聯(lián)網(wǎng)是為了提升生產(chǎn)效率,”Optimal+市場(chǎng)副總裁David Park說(shuō),“現在這些公司都偏愛(ài)流程分析和無(wú)庫存生產(chǎn),但它們真正需要的是預測性分析。預測性分析可以讓工廠(chǎng)受益,不過(guò)受益最多的是品牌商,品牌商和工廠(chǎng)可不一定是一回事?!?/p>
風(fēng)險在于,數據不一定都是正確的?;阱e誤數據而做出的決定,將導致結果難以預期。
“如果數據沒(méi)問(wèn)題,那么可以把良率提高2%到3%,非常顯著(zhù)的提高,”P(pán)ark說(shuō)道,“供應鏈上通過(guò)檢測的任何元器件的所有時(shí)間段數據都會(huì )被收集。當你拿到一些有劃痕的晶圓,根據數據就能查出在哪一個(gè)環(huán)節晶圓被劃破,你也可以查看元器件在現場(chǎng)的老化過(guò)程。如果汽車(chē)配備了預測性維護服務(wù),那么你就能看到汽車(chē)在路上的相關(guān)數據。金融業(yè)同樣會(huì )受益,如果你手上有數十萬(wàn)張發(fā)票,靠人工是捋不清發(fā)票之間的相互關(guān)系的?!?/p>
這種數據分析對于復雜供應鏈特別重要,半導體制造本身在數據分析與應用上先進(jìn),但整個(gè)半導體供應鏈對數據的應用,并不都能達到制造環(huán)節的水平。
“有效利用數據是智能制造顧問(wèn)委員會(huì )(隸屬于SEMI)的一大主題,”SEMI協(xié)作技術(shù)平臺副總裁Tom Salmon說(shuō)道,“獲取數據很重要,但現在問(wèn)題不是我們獲取的數據量不夠,而是因為數據利用率只有10%左右。真正的挑戰在于我們應該問(wèn)什么樣的問(wèn)題,如何把數據應用于制造。所以可能會(huì )有可靠性問(wèn)題,但不會(huì )有制程問(wèn)題?!?/p>
找到關(guān)鍵數據,在預設參數下利用機器對數據規律進(jìn)行外推,這就是機器學(xué)習的基礎。這種方法已經(jīng)應用于汽車(chē)自動(dòng)駕駛領(lǐng)域,機器學(xué)習系統將輔助并最終取代人類(lèi)去駕駛汽車(chē),自動(dòng)駕駛系統做決策時(shí),需要根據行駛場(chǎng)景給出多種預案。
在半導體設計與制造中,也會(huì )利用機器學(xué)習來(lái)提高質(zhì)量、可靠性及良率。
“采用合適的比例來(lái)抽取數據做分析,就能應用于未來(lái)的設計,”eSilicon市場(chǎng)副總裁Mike Gianfagna說(shuō)道,“如何將機器學(xué)習算法應用于新領(lǐng)域是關(guān)鍵,在過(guò)去7年中,我們在這方面積累了很多經(jīng)驗,我們知道如何挖掘開(kāi)發(fā)數據的價(jià)值。當你擁有大量數據時(shí),怎么去抽取分析這些數據?如果抽取數據比例太高,你會(huì )迷失在大量數據中,如果抽取數據比例過(guò)低,又可能得不出結論?!?/p>
Gianfagna表示,在降低風(fēng)險與增加效率的基礎上,實(shí)現數據變現是機器學(xué)習的目標?!耙龅竭@一點(diǎn),你需要從全局上來(lái)看待大數據分析?!?/p>
與很多由大云端服務(wù)商提供服務(wù)的大數據分析相比,半導體設計和測試行業(yè)產(chǎn)生的數據量很少,不過(guò)半導體設計與測試數據可能更復雜。
“當前主要任務(wù)是收集數據,”NI解決方案市場(chǎng)總監George Zafiropoulos說(shuō)道,“下一階段的目標是通過(guò)數據分析來(lái)給出改進(jìn)方法。無(wú)須刻意尋找,你就能發(fā)現數據中的價(jià)值嗎?你要找的,是數據的趨勢和相關(guān)性,可以將機器學(xué)習應用于任何環(huán)節。如果軟件提示,本周四產(chǎn)線(xiàn)產(chǎn)出較低,為什么會(huì )產(chǎn)出低?或者特定溫度與特定電壓對產(chǎn)品性能的影響。(這些都可以用數據分析來(lái)指導)”
Zafiropoulos指出,可以將更好的芯片設計作為目標?!白鳛楣こ處?,我們圍繞設計來(lái)制定規則,但如果你想面面俱到,那么效率就不會(huì )高。如果在保證可靠性與性能基礎上,可以減少保護規則,那將會(huì )有很大價(jià)值。很多大數據分析都是針對多個(gè)數據采集點(diǎn),一座城市可能有一萬(wàn)個(gè)傳感器,每天產(chǎn)生大量數據,而亞馬遜的訂單更是數不勝數。半導體數據比個(gè)人能處理的數據顯然要多,但也遠達不到亞馬遜交易數據這個(gè)量級?!?/p>
然而,系統數據可能就比設計數據高幾個(gè)數量級了,特別是涉及多物理層仿真時(shí)?!拔覀冋J為,7納米將是首次導入機器學(xué)習和大數據分析的節點(diǎn),數據量將會(huì )膨脹,處理速度也需要增加?!?ANSYS總經(jīng)理兼副總裁John Lee說(shuō)道,“你需要做同步熱分析。熱效應影響系統的可靠性,但如果數據量增大到當前技術(shù)無(wú)法解決,那么就要引入新的方法,所以我們需要大數據技術(shù)。最新的GPU有210億個(gè)晶體管,而且可應用于汽車(chē),但這種規模的芯片發(fā)熱量巨大,(如果散熱設計不好),發(fā)熱時(shí)會(huì )增加對電路板的壓力,并可能導致板子彎曲,但要知道,車(chē)用芯片使用壽命長(cháng)達十年?!?/p>
總結
大數據分析在半導體產(chǎn)業(yè)應用還處于中段(發(fā)展期)。一方面,為提高芯片的性能、效率和可靠性,半導體產(chǎn)業(yè)的數據量在增長(cháng),數據分析任務(wù)在增加;另一方面,半導體產(chǎn)業(yè)也在發(fā)展各種技術(shù),以充分挖掘數據用途。
這為產(chǎn)業(yè)帶來(lái)了新的增長(cháng)機會(huì )。Cadence 總裁兼CEO 陳立武表示,2015年全球聯(lián)網(wǎng)汽車(chē)市場(chǎng)規模為240億美元,到2020年,將發(fā)展到370億美元,與之相應,深度學(xué)習市場(chǎng)規模2020年將達100億美元(2015年為6億美元),云和數據中心市場(chǎng)規模將達800億美元(2015年650億美元)?!斑@將給半導體產(chǎn)業(yè)帶來(lái)機會(huì ),”他說(shuō)道,“從優(yōu)化物聯(lián)網(wǎng)到云端,都將給半導體帶來(lái)很大的機會(huì )?!?/p>
現在的問(wèn)題是,圍繞這些數據還能做些什么,以及到底如何去實(shí)現。這將是半導體產(chǎn)業(yè)的一個(gè)全新機會(huì ),也許會(huì )推動(dòng)半導體產(chǎn)業(yè)發(fā)展登上一個(gè)新臺階。
評論