采用帶有收發(fā)器的全系列40-nm FPGA 和ASIC 實(shí)現創(chuàng )
工藝技術(shù)和40-nm 的優(yōu)勢和以前的65-nm 節點(diǎn)以及最近的45-nm 節點(diǎn)相比, 40-nm 工藝有很大的優(yōu)勢。最顯著(zhù)的一點(diǎn)是更高的集成度,半導體生產(chǎn)商可以在更小的管芯中集成更多的功能,生產(chǎn)出密度更高的器件。
40-nm 工藝還進(jìn)一步提高了性能。40 nm 最小的晶體管邏輯門(mén)長(cháng)度比65 nm 邏輯門(mén)長(cháng)度短38.5%,比45-nm 工藝的邏輯門(mén)長(cháng)度短11%。40 nm 的阻抗進(jìn)一步降低,從而提高了驅動(dòng)能力,實(shí)現了性能更好的晶體管。應變硅技術(shù)使電子和空穴的移動(dòng)能力提高了30%,晶體管性能提高了近40%。
采用帶有收發(fā)器的全系列40-nm FPGA 和ASIC 實(shí)現創(chuàng )新設計Altera 公司
4
雖然密度和性能的提高非常顯著(zhù),但是,當今系統開(kāi)發(fā)人員在設計中需要著(zhù)重考慮的是功耗問(wèn)題。40-nm節點(diǎn)在功耗上也有一定的優(yōu)勢,更小的工藝尺寸減小了導致動(dòng)態(tài)功耗的雜散電容。特別是,臺積電(TSMC)的40-nm 工藝技術(shù)要比其45-nm 工藝技術(shù)的有功功耗低15%。(2)
但是,工藝尺寸的降低卻增大了待機功耗。Altera 使用多種方法來(lái)降低靜態(tài)功耗,包括多閾值晶體管、長(cháng)度不同的晶體管溝道、三重氧化等,并且在對性能要求不高的PLD 上綜合考慮性能和功耗,例如配置邏輯等。
可編程功耗技術(shù)和性能
除了常用的電路設計方法, Altera 還引入了65-nm Stratix® III FPGA 的可編程功耗技術(shù)(3) 來(lái)降低靜態(tài)功耗??删幊坦募夹g(shù)使靜態(tài)功耗降低了70%,在設計中以最低的功耗實(shí)現最好的性能。這一創(chuàng )新技術(shù)利用了這一事實(shí)――在典型設計中,全部邏輯中只有很少一部分用在關(guān)鍵時(shí)序通道上?;鶞蕼y試表明,時(shí)序余度很小的高性能邏輯和時(shí)序余度較大的慢速邏輯比平均為30:70。
在任何設計中, Altera 的Quartus® II 開(kāi)發(fā)軟件自動(dòng)確定設計中每一通道的松弛余度。這樣,通過(guò)調整晶體管的反向偏置電壓,將每一邏輯模塊、存儲器和DSP 模塊的晶體管自動(dòng)設置為合適的模式――高性能或者低功耗:
■ 在低功耗模式中, Quartus II 軟件減小反向偏置電壓,使晶體管很難接通。這樣,減小了時(shí)序不重要電路中的亞閾值泄漏電流,以及無(wú)用的靜態(tài)功耗( 圖2 中的藍色部分)。
■ 在高性能模式中, Quartus II 軟件增大反向偏置電壓,時(shí)序關(guān)鍵通路上的晶體管更容易接通,以滿(mǎn)足設計中規定的時(shí)序約束要求,實(shí)現最佳性能( 圖2 中的黃色部分)。
圖2. Quartus II 軟件降低了功耗,提高了性能本文引用地址:http://dyxdggzs.com/article/191798.htm
邏輯架構和通用I/O
Altera 的40-nm 器件架構使用了包括自適應邏輯模塊(ALM)、TriMatrix 片內存儲器模塊和DSP模塊的通用內核邏輯體系結構。ALM 含有一個(gè)可配置8 輸入分段式查找表(LUT)、兩個(gè)嵌入式加法器和兩個(gè)寄存器,并采用了MultiTrack 互聯(lián)結構進(jìn)行布線(xiàn),以支持高速邏輯、算法和寄存器功能,器件利用率非常高。
TriMatrix 片內存儲器提供三種不同的存儲器模塊容量,大大提高了效率和靈活性,如圖3 所示。
Power
High speed
Low power
Threshold voltage
Source
Substrate
Drain
Channel
Gnd
Gate
High Speed Logic Low Power Logic
High-speed logic Low-power logic
Altera 公司 采用帶有收發(fā)器的全系列40-nm FPGA 和ASIC 實(shí)現創(chuàng )新設計
5
圖3. TriMatrix 存儲器結構
圖4 中的DSP 模塊是高性能芯片體系結構,其強大的可編程能力可以在多種應用中實(shí)現最佳處理功能。每一模塊含有8 個(gè)18x18 乘法器,以及寄存器、加法器、減法器、累加器和求和單元,這些都是典型DSP 算法中常用的功能。DSP 模塊支持可變位寬和各種取整飽和模式,有效地滿(mǎn)足了應用需求。
圖4. DSP 模塊體系結構
通用PLLAltera 的通用鎖相環(huán)(PLL) 包括閉環(huán)頻率控制系統,該系統基于輸入時(shí)鐘信號和受控振蕩器反饋時(shí)鐘信號之間的相位差。圖5 顯示了PLL 中主要組件的簡(jiǎn)要結構。
6
圖5. PLL 結構圖
這些PLL 的模擬特性使其具有非常低的抖動(dòng),能夠實(shí)現可靠的時(shí)鐘方案。很多可配置時(shí)鐘輸出能夠非常靈活的實(shí)現系統時(shí)鐘,為存儲器接口和I/O 接口輸出時(shí)鐘。
最佳通用I/O 和外部存儲器接口
如圖6 所示, I/O 結構的關(guān)鍵構建模塊包括:
■ 單端I/O 支持,提供可編程擺率和驅動(dòng)能力,可變延遲鏈補償電路板走線(xiàn),以及串行和并行動(dòng)態(tài)片內匹
配(OCT)。
■ 支持差分片內匹配的高性能LVDS 傳輸和接收差分信號
■ 為多通道LVDS 接口提供的硬核動(dòng)態(tài)相位對齊(DPA) 模塊,避免了時(shí)鐘至通道和通道至通道偏移,以及
時(shí)鐘轉發(fā)功能,實(shí)現軟核時(shí)鐘數據恢復(CDR)。
圖6. DPA 結構圖
Altera 的I/O 引腳支持已有以及新興的外部存儲器標準,例如,DDR、DDR2、DDR3、QDRII、QDRII+ 和RLDRAMII 等。它們包括自校準數據通路,對自己不斷進(jìn)行動(dòng)態(tài)調整,在工藝、電壓和溫度變化時(shí),提供最可靠的工作頻率。其他電路包括對齊和同步、通道去偏移、讀/ 寫(xiě)調平,以及時(shí)鐘域交叉功能等。
評論