根據 Uptime Institute 的說法,資料中心的 IT 團隊需要同時在減少用電需求的情況下和使用高耗電的下一代晶片之間取得平衡。
文/Ann Bednarz‧譯/Christy
尖端伺服器晶片因其提升效能的潛力而備受矚目,但下一代處理器的執行溫度也比舊款的設計更高,資料中心的營運商也難以從晶片製造商所提供的有限指導中找尋到解決方法。
與此同時,IT 設備在能源效能工作中所扮演的角色將受到更嚴格的審查。這些相關的趨勢是 Uptime Institute 對今年資料中心所做的最重要預測之一。
Uptime 研究分析師 Jacqueline Davis 在 2023 年的一個關於機構資料中心預測的網路會議上表示:「營運商將面臨新型、溫度更高的伺服器晶片的挑戰。」與此同時,「能源效率的焦點將會擴展到 IT 設備本身,這是我們認為早該發生的事情。」
伺服器的溫度持續上升
如今正在建造的資料中心需要在未來的 10 至 15 年內保持經濟競爭力和技術能力,然而新的晶片技術正在導致營運商對傳統的資料中心設計準則提出質疑。
「資料中心設計必須滿足伺服器的電力和冷卻需求,多年來,這些需求一直保持一致。設計師可以為每個機架規劃 4 到 6 千瓦的功率,」Uptime 研究總監 Daniel Bizo 說道。「連續的 IT 更新不需要升級電源或冷卻基礎建設。」
然而,現在這種情況正在改變。每個機架和每個伺服器機箱的功率密度正不斷上升。例如,英特爾的第四代 Xeon 可擴充處理器(代號為 Sapphire Rapids),其熱設計功耗(TDP)高達 350 瓦,而AMD 第四代 EPYC 處理器(代號為 Genoa),其熱設計功耗(TDP)高達 360 瓦。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
Bizo 表示:「未來的產品路線圖正呼籲在未來幾年內推出具有 500 至 600 瓦 TDP 的主流伺服器處理器。因此,這個趨勢將會很快開始動搖設施設計的假設,因為我們看到的主流伺服器越來越接近或超過每個一千瓦的功率。」
目前,基於 GPU 的專用高效能運算(HPC)系統在峰值功率時可能每個晶片需要數百瓦。除了高熱功率之外,它們還具有較低的溫度限制。
Bizo 說:「這些效應實際上對冷卻系統構成了雙重束縛,因為它們產生更多的熱能,而且其中許多系統還需要更低的工作溫度。」他解釋著:「為了達到低溫,去除大量的熱量在技術上具有挑戰性,這將推動營運商採取不同的冷卻方法。例如,一些資料中心的營運商將考慮支持直接液體冷卻。」
高效能運算應用所帶來的設計困境,可以視為對高熱設計功耗處理器將帶給主流企業伺服器市場的耗能和冷卻挑戰的早期警示。「這現在需要一些猜測,」Bizo 說道。「典型 IT 機架的功率將會有多大?高密度機架將變得有多強大?資料中心需要在本十年結束時支援哪些冷卻模式?」
[ 推薦閱讀:【製造業】艾利丹尼森推動 ESG 就緒的高招 ]
保守的方法可能是繼續採用低密度機架設計,但這會讓資料中心的資源和能力受到限制,甚至可能會產生其使用壽命尚未結束之前就變得過時的風險。然而,Bizo 警告說,更激進的設計方法需要高度密集的機架,這會增加未充分利用的容量和功能上超支的風險。
「營運商在處理新一代 IT 技術時將面臨各種選擇。它們可以限制空氣溫度並接受效率損失。或者,正如美國行業機構 ASHRAE 以其 H1 級熱標準所建議的那樣,他們可以為這些溫度受限的 IT 系統建立專用環境,以最大程度地減少對設施效率的影響。或是他們也可以轉變到直接液體冷卻的方式,」Bizo 說。「雖然半導體物理學是這裡的物理基礎驅動因素,但基礎設施經濟學將決定資料中心設計和營運的結果。由於晶片製造商的指導非常有限,適應性將會成為關鍵。」
能源效率重點轉向 IT
Uptime 預測,企業和資料中心營運商將繼續面臨提升 IT 效能的壓力。
過去,這項責任主要在設施方面。 Bizo 說道,資料中心營運商,在可持續性和效率要求上承受了巨大的壓力,這些壓力在過去的 15 年左右中已經實現了大規模的節能成果。(PUE 衡量 IT 設備使用的能源與整個資料中心使用的能源的比率。)透過一些措施,如空氣分離、更靈活的溫度容忍度,以及對冷卻、風扇和電源分配的更嚴格控制,和使用可再生能源,這些努力都讓設施在資源使用上表現的更有效率。
「資料中心營運商為永續發展做了很多事情。與此同時,IT 部門在很大程度上並未參與這些討論,」Bizo 說道。「這樣的說法正變得越來越牽強。為什麼呢?原因很簡單,效率提升方面的剩餘部分都隱藏在 IT 能源績效中。」
根據 Uptime,壓力正在四個關鍵領域中不斷的增加:
- 市政對於新建大型資料中心的抵制:自2019年以來,對於電力和土地供應的擔憂已經導致對新資料中心建設的限制變得更多,而這種抵制可能會進一步加劇。例如,在德國的法蘭克福,出於對擴大土地使用和城市天際線變化的擔憂,新的雲端和共用機房建設被限制在指定區域。
- 電力網供應有限,無法支援不斷增加的資料中心容量:Uptime 提到了兩個地區,愛爾蘭的都柏林和美國北維吉尼亞,這些地區的電力網不堪負荷,電力公用事業要不就暫停了新連接,要不就限制了新連接,因為發電或輸電能力不足。
- 加強永續發展和減碳監管,以及更嚴格的報告要求:在歐盟,資料中心面臨新的、更詳細的能源消耗報告要求,例如,他們必須公開其能源績效指標。根據 Uptime 的說法,類似的措施現在也正在美國出現。
- 高能源成本:在俄羅斯入侵烏克蘭之前,能源價格以及電價就已經一直呈上升趨勢。 至 2021 年,歐洲和美國市場的電力批發遠期價格更是大幅上漲。如今的趨勢仍然是電力成本上升,高能源成本正在創造一個使電價更加不穩定的環境。
處理高能源價格、碳報告和電網容量不足一直是設施營運商的職責範圍。但根據 Uptime 的說法,設施方面的干預措施正在造成越來越少的效益。相比之下,IT 部門在提高資料中心能源效能方面有更大的潛力,尤其是在伺服器硬體領域。
未充分利用和效能不佳的伺服器硬體是 IT 部門可以提升能源效能的一個關鍵領域。例如,減少伺服器數量,但提高性能指標,可以實現節能。Bizo 指出,IT 部門可以做出更明智的硬體配置選擇,並使用動態工作負載整併。而能源管理功能,如節能模式和功耗調節功能,也可以實現重大的能源效能增益。
需要更好地規劃 IT 基礎建設以實現更高的能源效能,這種要求將持續增加。Uptime 斷言,IT 部門每節省的一瓦電量都能減輕其他方面的壓力,而應提供的報告將會很快披露出隱藏在 IT 基礎建設中的更高能源效能潛力。
Bizo 表示:「我們預計 IT 基礎建設和營運團隊很快就會證明他們正在盡一切努力提高伺服器基礎建設的典型利用率。」
地緣政治、雲端和資料中心成本
讓我們總結一下,Uptime 對於 2023 年的兩項預測將使 IT 部門更加關注伺服器硬體:第一,隨著更高功率的伺服器處理器上市,能源需求不斷上升。第二,能源效率的期望現今已落在 IT 團隊的身上,而不是僅僅在設施團隊身上。
根據 Uptime 對 2023 年五項資料中心預測的部分,我們可以得出以下結論:
- 地緣政治將繼續加深供應鏈擔憂:Uptime 指出,以美國主導的西方聯盟、中國和俄羅斯之間的政治緊張局勢正在提高供應鏈中斷的風險。
- 該公司預測,半導體供應鏈和海底電纜系統特別容易受到潛在經濟和軍事對抗的影響。
- 雲端遷移將面臨更嚴格的審查:Uptime 預測,在經濟壓力和不確定的時期,遷移成本和雲端成本不斷上升的威脅將減緩或阻礙一些關鍵任務的遷移。
- 資料中心的成本將會上升:近年來,IT 和資料中心的設施成本一直呈下降趨勢。 Uptime 預測,這一趨勢現在已經結束,價格將會轉為上漲。供應鏈問題、能源價格上升以及勞動成本上漲都將導致成本提升。這並不意味著價格上漲會抑制對資料中心的需求,但它們可能會推動人們重新努力提高效率。
(本文授權非營利轉載,請註明出處:CIO Taiwan)