TI KeyStone 架構支持 L2 與傳輸處理
借助多內核導航器,系統中的所有數據包都能夠滿(mǎn)足數據包DMA 接口規范要求。數據包通常以圖 8 中的主機類(lèi)型數據包格式表示,其可實(shí)現靈活的存儲器使用模式。在這種格式下,數據包通過(guò)鏈路緩沖器描述符 (BD) 來(lái)表述。我們將第一個(gè) BD被稱(chēng)為數據包描述符 (PD)。BD 具有指向儲存數據包有效負載的數據包緩沖器指針。隊列管理器可與 PD 協(xié)同工作。
圖 8 –主機類(lèi)型的數據包格式
9
隊列管理器可在其內部隨機訪(fǎng)問(wèn)存儲器 (RAM) 中維護數據包鏈路信息,從而為實(shí)現超高效率的數據包壓入與彈出提供簡(jiǎn)單的軟件應用編程接口 (API)。此外,其還可以確保隊列所有訪(fǎng)問(wèn)的多核原子性,從而將多核軟件從門(mén)控與保護邏輯中釋放出來(lái)。為了實(shí)現基于演進(jìn)數據包系統 (EPS) QoS 的無(wú)線(xiàn)電廣播承載服務(wù)架構目標,相似服務(wù)等級的無(wú)線(xiàn)電廣播承載都要以硬件隊列集的形式出現。
零復制 RLC/MAC 概念充分利用數據有效負載無(wú)需在 PHY 編碼器/解碼器的 PDCP 加密(解密)與 CRC 生成(或校驗)之間進(jìn)行處理的這一原理。RLC 與 MAC 子層需要對數據包進(jìn)行匯聚/解匯聚、分段/解分段、多路復用/解多路復用,并需添加/移除控制信息與報頭。想要在無(wú)需觸及有效負載數據(零復制)的情況下實(shí)現這一點(diǎn)可節約多達 90-95% 的處理周期時(shí)間。因此,有效負載數據駐留在 DDR 中,而且 L2 DSP 核心軟件是不可觸及的。
圖 9 – 下行數據流示例
10
例如,在下行方向,網(wǎng)絡(luò )協(xié)處理器數據包 DMA 進(jìn)程負責對數據包進(jìn)行接收、分段與分配。RLC/MAC 軟件可在數據包描述符上運行且無(wú)需訪(fǎng)問(wèn)數據包有效負載。其構建的 MAC PDU 可被 SRIO 數據包 DMA 發(fā)出并反向重組成相鄰的存儲器。
RLC/MAC 軟件使用數據包 API 庫在數據包內運行。該軟件可在數據包鏈中移除/插入描述符,而且還能執行數據包合并/分離操作。在需要額外報頭時(shí)才用得上新的描述符。圖 9 以在網(wǎng)絡(luò )協(xié)處理器中執行 PDCP (RoHC) 等所有快速通道處理為假定條件,對下行數據流進(jìn)行了總結。
我們將所有指向預分配固定容量數據緩沖器的 BD 鏈接在一起,并將其放置在下行 (DL) 自由隊列中。有多個(gè)自由隊列,每一個(gè)隊列都對應一個(gè)固定容量的緩沖器。當來(lái)自網(wǎng)絡(luò )協(xié)處理器的數據包到達后,網(wǎng)絡(luò )協(xié)處理器中的數據包 DMA 即從 DL 自由隊列中拉取 BD,然后根據 GTP-U ID/RBQ ID 映射對其進(jìn)行初始化和構建 PD,并將 PD 壓入 RBQ。DL 調度程序制定分配決策,并向 RLC/MAC 進(jìn)程發(fā)布分配授權。
RLC 與 MAC 根據需要彈出授權的 RBQ,然后將 PD 路由至 RLC 與MAC 隊列??赡軐祿侄?,之后統一進(jìn)行多路復用并為其添加報頭。數據包被保留在 RLC AM 重傳隊列中,同時(shí)對這些數據包克隆的復制版本(新的 PD 指向同一緩沖器)會(huì )向下流至可創(chuàng )建 MAC PDU 的協(xié)議棧。當傳輸就緒時(shí),數據包(用于已分配 UE 的 MAC PDU)在硬件 DL PHY 隊列中排隊。SRIO 中的數據包 DMA 從 DL PHY 隊列獲取數據包,然后將它們傳輸至 LTE PHY 設備。傳輸開(kāi)始后,數據包進(jìn)入 HARQ 重傳隊列,并且在成功交付后返回到 DL 自由隊列中。
調度層對于調度層,制定無(wú)線(xiàn)電廣播資源的分配時(shí)需將瞬時(shí)通道條件、流量條件以及 QoS 等要求納入考慮范圍。因為通道與流量條件因時(shí)間和頻率的不同會(huì )有很大差異,因此能否實(shí)現高效的帶寬利用率很大程度上取決于調度程序選擇最佳可能用戶(hù)(單個(gè)用戶(hù)或用戶(hù)對)的能力。
典型的調度算法可為單個(gè)或多個(gè)用戶(hù)模式構建一組調度假定方案。調度程序然后根據鏈路的自適應性為每種假定計算中標率。最終,調度程序選出最佳假定方案并用以指導通道分配。
調度算法的復雜性是由單個(gè)調度假定的計算成本以及需檢查的假定數目來(lái)決定的。信號處理密度型調度是一種高效率的動(dòng)態(tài)的通道感知型調度。上行端的 FDD/TDD 調度程序需要計算足夠大的一套假定方案才能維持單個(gè)或多個(gè)用戶(hù)模式的調度增益;同時(shí),帶下行鏈路波束成形 (downlink beam foaming) 的 TDD 調度程序要求的假定方案可假定定向傳輸與特征值分解 (EVD) 計算。KeyStone 架構中的 C66x DSP 內核可支持專(zhuān)業(yè)的定點(diǎn)與浮點(diǎn)指令,可實(shí)現高效的 EVD 計算,如矩陣相乘、矩陣求逆以及大量用戶(hù)(數以百計甚至數以千計)的高效搜索與篩選。圖 10 提供了由 TI 仿真工具生成的調度程序可視化示例。此例使用 100 個(gè)無(wú)線(xiàn)電廣播資源模塊,每個(gè)傳輸時(shí)間間隔(TTI,1 毫秒)可生成 20 個(gè)分配授權。頻譜的較低位部分可用于半持續性語(yǔ)音流量,而較高位部分則用于特定的數據流量。
圖 10 – 調度程序可視化示例
結論TI KeyStone 多內核 SoC 架構可提供一個(gè)低時(shí)延、高吞吐量的低成本高效率平臺,可支持適用于宏與小型蜂窩 eNodeB 系統的真正多標準 (LTE、WCDMA)解決方案。高吞吐量硬件加速器與數據包基礎局端加速可實(shí)現靈活且可擴展的 LTE 部署,同時(shí)還能最大限度地縮短 LTE 系統所需的時(shí)延。在同一 DSP 中集成定點(diǎn)與浮點(diǎn)技術(shù)可實(shí)現優(yōu)化的矩陣處理最,以滿(mǎn)足 LTE要求的調度效率。
根據對宏 LTE 系統的解決方案分析,由于采用KeyStone 多內核架構實(shí)現快速通道與零復制處理,可以將 20 MHz、2x2 多重輸入多重輸出 (MIMO) 以及 105 Mbps 下行與 52Mbps 上行數據率- L2 數據-以及傳輸層系統開(kāi)銷(xiāo)降低10 到 15 倍。借助針對 LTE 調度程序運行而優(yōu)化的 C66x DSP 定點(diǎn)與浮點(diǎn)指令,還可以使用更多高級調度算法,從而將頻譜利用率提高 20%。
評論