GPU,加速計算光刻
計算光刻技術(shù)是通過(guò)對掩膜、光源的正向或反演優(yōu)化,降低因光波衍射影響光刻效果的程度。計算光刻是采用計算機模擬、仿真光刻工藝的光化學(xué)反應和物理過(guò)程,從理論上指導光刻工藝參數的優(yōu)化。計算光刻通常包括光學(xué)鄰近效應 修正(OPC)、光源-掩膜協(xié)同優(yōu)化技術(shù)(SMO)、多重圖形技術(shù)(MPT)、 反演光刻技術(shù)(ILT)等四大技術(shù)。
本文引用地址:http://dyxdggzs.com/article/202502/467280.htm在制造現代半導體器件方面存在許多挑戰,整個(gè)行業(yè)能夠克服這些挑戰本身就令人驚嘆。從基礎物理到制造工藝再到開(kāi)發(fā)流程,都不乏棘手的問(wèn)題需要解決。其中一些最大的挑戰出現在用于深亞微米芯片的光刻技術(shù)中。最近的一篇文章概述了光刻技術(shù)的主要趨勢,并總結了幾個(gè)挑戰和新興解決方案。這篇文章聚焦于另一個(gè)關(guān)鍵挑戰——光刻計算需求的大幅增加——并討論了圖形處理單元(GPU)如何幫助滿(mǎn)足這一需求。
計算需求增加的原因在于通過(guò)衍射或工藝效應來(lái)補償光刻過(guò)程中引入的圖像誤差,隨著(zhù)芯片設計的日益密集,這個(gè)過(guò)程需要更長(cháng)的時(shí)間。如果不進(jìn)行校正,刻在硅上的圖案將無(wú)法精確再現設計者繪制的形狀。角落可能會(huì )被圓化,線(xiàn)寬可能與預期不同。處理這一問(wèn)題的傳統方法是使用光學(xué)鄰近校正(OPC),它調整邊緣和多邊形,以?xún)?yōu)化刻蝕特征,盡可能接近設計意圖。
OPC 需要大量的計算,但這通常不是一個(gè)主要的問(wèn)題,因為基于分段的優(yōu)化,可進(jìn)行并行處理。更大的問(wèn)題是,OPC 提供了有限的自由度,在復雜的糾正形狀和用于糾正他們的技術(shù)。近年來(lái),逆光刻技術(shù)(ILT)作為一種更靈活的方法出現。模式被轉換為像素,以便可以使用基于像素的優(yōu)化技術(shù)。ILT 可以處理更廣泛的形狀和圖案,但它比 OPC 需要更多的計算能力。并行處理被廣泛使用,但用戶(hù)報告說(shuō),一個(gè) ILT 掩碼可以在多天內消耗超過(guò) 10K 個(gè) CPU 核心。
計算光刻的需求不斷增長(cháng)。每個(gè)新的節點(diǎn)意味著(zhù)每個(gè)掩模有更多的多邊形,先進(jìn)的工藝需要更多的掩模,而使用的形狀變得越來(lái)越復雜。鑒于 GPU 提供了巨大的并行性并成功加速了芯片開(kāi)發(fā)過(guò)程中的其他幾個(gè)步驟,人們自然會(huì )想知道它們是否能加速 ILT 的計算。用戶(hù)很清楚他們的愿望:使用合理的資源,計算時(shí)間不到一天。NVIDIA、臺積電和 Synopsys 之間的近期合作提供了顯著(zhù)的證據,表明 GPU 可以幫助實(shí)現這一目標。這項工作涉及光刻代碼從 CPU 到 GPU 的三個(gè)主要轉換:
一些基于圖像的操作自然適合通過(guò)直接重寫(xiě)來(lái)實(shí)現 GPU 并行化,包括 FFT、卷積和圖像處理。這些操作在下圖中的綠色橢圓形中顯示。
從多邊形/邊/點(diǎn)迭代到基于像素計算的算法,如新模型形式等都被轉移到了 GPU 適配的領(lǐng)域。這些算法如下圖中藍色橢圓所示。將非 GPU 友好型數據結構(如基于多邊形的布爾值和交互、用于創(chuàng )建水平集的多邊形-2-像素算法以及輪廓繪制)遷移到 GPU 代碼。這需要大量的研究、創(chuàng )新和軟件工程。這些結構如下圖中紅色橢圓所示。
過(guò)去,基于 CPU 的算法和計算服務(wù)器硬件的改進(jìn)為計算光刻技術(shù)提供了 2-4 倍的速度提升。2020 年使用 GPU 的初步實(shí)驗表明,ILT 仿真功能的速度提高了 10 倍。如上圖所示,隨后的工作發(fā)現許多其他計算,如多邊形和非基于圖像的操作,都適合 GPU。其中一些操作既可用于 OPC,也可用于 ILT,這表明 GPU 可以加快這兩種類(lèi)型的掩模優(yōu)化。
NVIDIA、臺積電(TSMC)和 Synopsys 還共同開(kāi)發(fā)了一個(gè)新的 GPU 光刻庫,用于 OPC 和 ILT。該庫具有基于多邊形和邊緣的幾何算法、多邊形光柵化、FFT、卷積等特性。在某些類(lèi)型的功能上,速度比 CPU 快高達 40 倍。從 CPU 到 GPU 的總體加速比,對于單個(gè) ILT「配方」在幾個(gè)模板上累積的總運行時(shí)間超過(guò) 15 倍。使用較少的并行機器,多天的 CPU 運行時(shí)間可以縮短到不到一天。
計算光刻技術(shù)仍然是一個(gè)非?;钴S的研究、開(kāi)發(fā)和部署領(lǐng)域。更多流程和功能將繼續為 GPU 啟用,人工智能機器學(xué)習(ML)的應用也在不斷增加,更有效的 CPU+GPU 協(xié)同優(yōu)化也在不斷推進(jìn)。
評論