前言 人工智慧(AI)的迅猛發展推動了數據中心處理能力的顯著增長。如圖1所示,英飛凌預測單台GPU的功耗將呈指數級上升,預計到2030年將達到約2000W [1],而AI服務器機架的峰值功耗將突破驚人的300kW。這一趨勢促使數據中心機架的AC和DC配電系統進行架構升級,重在減少從電網到核心設備的電力轉換和配送過程中的功率損耗。
圖2(右)展示了開放計算項目(OCP)機架供電架構的示例。每個電源架由三相輸入供電,可容納多台PSU;每台PSU由單相輸入供電。機架將直流電壓(例如,50V)輸出到母線,母線則連接到IT和電池架。
AI的發展趨勢要求對PSU功率進行革新,如圖2(左)所示。接下來,我們將通過各代PSU的拓撲結構和器件技術建議示例,來逐步介紹這些PSU的演變。 AI服務器機架PSU的趨勢和功率演進 ▴ 第一代AI PSU:在相同的架構下提升功率,~5.5-8kW、50Vout、277Vac、單相 當前的AI服務器PSU大多遵循ORv3-HPR標準[9]。相較於先前的ORv3 3 kW標準[9],該標準的大部分要求(包括輸入和輸出電壓以及效率)保持不變,但增加了與AI服務器需求相關的更新,例如,更高的功率和峰值功率要求(稍後詳述)。此外,由於與BBU架的通信方式有所調整,輸出電壓的調節範圍變得更窄。
儘管每個電源架都通過三相輸入(400-480 Vac L-L)供電(見圖2),但每台PSU的輸入仍為單相(230-277 Vac)。圖3展示了符合ORv3-HPR標準的第一代PSU的部署示例:PFC級可以採用兩個交錯的圖騰柱拓撲結構,其中,650V CoolSiC™ MOSFET用於快臂開關,600V CoolMOS™ SJ MOSFET用於慢臂開關。DC-DC級可以選用650V CoolGaN™電晶體的全橋LLC,次級全橋整流器和ORing則使用80V OptiMOS™ Power MOSFET。此外,示例還展示了一個中間級,也稱“延長保持時間”或“小型升壓”,其作用是減小大容量電容器的尺寸。該中間級由一個升壓轉換器組成,在線路周期掉電事件期間,通過儲能電容器放電,以調節LLC輸入電壓。在正常運行期間,升壓轉換器保持空閒狀態,並通過低阻抗的600V CoolMOS™ SJ MOSFET旁路。 ▴ 第二代AI PSU:增加線路電壓,以實現更高的功率,~8-12kW、50Vout、277–347Vac、單相 如上所述,隨著機架功率增加到300kW以上,電源架的功率密度變得至關重要。因此,下一代PSU的設計方向是,在單相架構中實現8kW至12kW的輸出功率。隨著每個機架的功率增加,數據中心中的機架數量在某些情況下,可能會受配電電流額定值和損耗的約束。因此,為了降低交流配電的電流和損耗,部分數據中心可能會將機架的交流配電電壓從400/480V提高到600Vac L–L(三相),同時將PSU的輸入電壓從230/277Vac 提高到347Vac(單相)。
雖然這一變化有利於數據中心的運行效率和資源利用,但會影響PSU的額定電壓和設計。在347Vac的輸入電壓下,PFC的輸出電壓必須設定在575Vdc左右,這意味著傳統的650V器件的額定電壓已無法滿足要求。圖4展示了一個示例:第一代PSU使用的兩電平圖騰柱PFC被替換為400V CoolSiC™ MOSFET的三電平飛電容圖騰柱PFC(3-L FCTP PFC)級。多電平功率轉換概念使得在使用較低額定電壓的開關器件的同時,支持更高的輸入電壓。憑藉多電平拓撲結構的頻率倍增效應,3-L FCTP PFC能夠帶來更高的效率和功率密度。最重要的是,CoolSiC™技術針對400V的較低擊穿電壓進行了優化,與650V 和750V CoolSiC™參考器件相比,其FoM更為優異(見圖5(左))。此外,圖5(右)顯示了導通電阻在整個溫度範圍內的曲線,其中,400V CoolSiC™ MOSFET的RDS(on) 100°C僅比RDS(on) 25°C高11%。RDS(on)與Tj之間的這一平緩關係有助於CoolSiC™ MOSFET實現更高的RDS(on) typ,從而降低成本並提升開關性能。
對於DC-DC級來說,三相LLC拓撲結構是一種理想選擇,其中,750V CoolSiC™ MOSFET用於初級側開關,80V OptiMOS™ 5 Power MOSFET用於次級全橋整流器和ORing。由於增加了第三個半橋開關臂,該解決方案能夠提供更高的功率,有效降低輸出電流的紋波,並通過三個開關半橋之間的固有耦合實現自動電流分配。 ▴ 第三代AI PSU:三相架構與400V配電,最高功率約為22kW,400Vout,480-600Vac,三相 為了進一步提高機架功率,第三代AI PSU將採用更具顛覆性的機架架構,具體如下:
圖6展示了一個三相輸入、400V輸出的PSU部署示例,以及推薦的器件和技術。PFC級採用Vienna整流器,這是一種常用於三相PFC應用的拓撲結構。其主要優勢在於採用分離式總線電壓設計,因此可以使用650 V器件:通過使用雙倍數量的背靠背650V CoolSiC™ MOSFET和1200V CoolSiC™二極體實現。PFC輸出配置為分離式電容器,每個電容器電壓為430V,並為全橋LLC轉換器供電,該轉換器在初級和次級側均使用650V CoolGaN™電晶體。兩個LLC級在初級側串聯,次級側並聯,以向400V母線供電。
此外,也可以將兩個背靠背的650V CoolSiC™ MOSFET替換為650V CoolGaN™ 雙向開關(BDS),後者是真正的常關型單片雙向開關。這意味著一個CoolGaN™ BDS即可取代4個分立式電源開關,以實現相同的RDS(on),這是因為它在RDS(on)/mm2方面具備更高的晶片尺寸利用率。
WBG為 AI PSU帶來的優勢 ▴ CoolGaN™助力實現高峰值功率瞬變 寬禁帶(WBG)半導體(例如,CoolGaN™[2])能夠在更高的開關頻率下,實現最佳效率,使轉換器在不影響轉換效率的前提下,實現更高的功率密度,因此,成為AI PSU的理想選擇。
除了AI PSU的額定功率顯著增加外,GPU在運行時還會拉動更高的峰值功率,並產生高負載瞬變(見圖7)。因此,DC-DC級的輸出必須具有足夠的動態響應能力,同時需確保電壓的過沖和下沖保持在規定的範圍內。通過提升開關頻率,並增加控制環路帶寬,可以提高DC-DC級的輸出動態響應能力。 ![]() ▴ 400V CoolSiC™ MOSFET可在3-L飛電容圖騰柱PFC中實現最高效率 使用 CoolSiC™ MOSFET 400V的三電平級飛跨電容圖騰柱PFC(3-L FCTP PFC)不僅能夠實現更高的交流輸入電壓(見第2.2節),且相較CoolSiC™ 650V和750V參考器件,其品質因數(FoM)更佳,因此還能提供顯著的功率密度和效率優勢。經過優化的電感器設計(包括尺寸、材料和繞組)和3L拓撲結構中的RDS(on)選擇,結合更低的開關損耗,能夠實現平緩的效率曲線:峰值效率超過99.3%,滿載效率超過99.15%(見圖8)。
結論 了滿足數據中心對AI應用的需求,新一輪技術角逐已經啟動,推動了機架和PSU的電力需求大幅增長。其中,AI PSU的功率需求已經從3-5.5kW,提升到8-12kW(單相)和高達22kW(三相)。這種需求給數據中心運營商帶來了新的挑戰,即如何優化數據中心的空間和電力的效率和利用率。應對這些挑戰需要採用新的機架架構和AC-DC配電配置,使得基於CoolSiC™和CoolGaN™的設計處於PSU設計的前沿,致力於實現最佳效率和功率密度。
此外,新的寬禁帶器件在新型拓撲結構中也展現了極佳的性價比,例如,在三電平飛跨電容圖騰柱PFC中採用400V CoolSiC™ MOSFET,或在三相Vienna PFC中使用650V CoolGaN™ BDS(詳見前文)。
總而言之,英飛凌的功率器件技術組合(矽、碳化矽和氮化鎵)和經過優化的柵極驅動IC產品組合,通過混合應用,為當前和下一代平台及趨勢的發展提供了支持。這些組合充分利用了三種技術的優勢,使PSU設計實現了最佳靈活性,並在效率、功率密度和系統成本之間達成平衡。此外,英飛凌還率先推出了全球首項300毫米氮化鎵功率半導體等先進技術,進一步推動了文章[10]中所述的未來設計發展。
關於作者 Sam Abdel-Rahman擁有中佛羅里達大學電氣工程博士學位,效力英飛凌已十三年有餘,現任高級首席系統架構師,負責開發服務器/數據中心SMPS和可再生能源應用的應用路線圖。Sam在功率半導體行業擁有豐富的經驗,專注於系統架構、拓撲結構和控制技術。
參考文獻 |