【Arm 專欄】Neoverse 新解决方案發表!助力擴展雲到邊緣的次世代基礎架構

Arm 親自詳解 Neoverse 全新的 V1 平台與 N2 平台,如何增加數據中心效率,以降低電能浪費。
評論
Shutterstock/達志影像
Shutterstock/達志影像
評論

自駕車、智慧醫療裝置與智慧建築物,正逐漸改變我們的生活,但這些應用之所以變為可能,是因為大約每兩年到兩年半手機、伺服器與其它裝置每瓦電所能執行的工作量幾乎加倍。根據 IEA 的資料,以數據中心為例,自 2015 年以來網際網路流量增加 5 倍,數據中心的工作負載幾乎成長兩倍,但受惠於技術的突破,數據中心電力消耗維持在 1,980 億千瓦小時左右。

unnamed_(14)
資料來源:國際能源機構 (IEA), 2015

由於智慧裝置普及使得傳送與處理的資料量增加,根據 Nature 期刊引用 Anders Andrae 的資料,預期至 2030 年數據中心的耗電將占全球總電量需求的大宗,而根據 State of the Edge 2020 報告指出,為了服務新型應用,2028 年需要 102 千兆瓦 (GW) 的新電量。

由於電費往往佔數據中心營運成本的三至五成,但數據中心一個機櫃 (rack) 只能容納有限的電量與熱氣,若非透過增加每瓦工作量來提升生產力,則需建置更大的空間與更多的伺服器,將使數據中心運作遭遇挑戰。

因此,另一個觀察能源效率的方法是評估運算密度,提升運算密度可以提升數據中心可用的資源,降低利用此基礎架構所需負擔的價格。下面這些方法將能提升每瓦效能,以獲得更佳的用電效率與密度,有助城市運作。

unnamed_(15)
資料來源:Nature, 2018

1. 使用更多的核心

過去 15 年來,企業多半以下列方式增加效率 : 改裝建物以提升空氣對流,在機架上放上塑膠片以降低冷卻的預算,移除機架內運作僵滯的伺服器,或以 GPU 與快閃記憶體加速器提升每瓦運作。

另一種方式則是調整數據中心中的伺服器處理器,以大量的高效能運算核心取代少量但運算力強大的核心,也就是使伺服器從較低檔位高轉速 (RPM) 轉變成高檔位較低轉速運作。亞馬遜網路服務公司 (AWS) 的 Graviton2 系統單晶片由 64 個運算核心組成,每個機架上有少則數百個多則數千個核心。

而去年 11 月榮登 Green 500 名單榜首的 Fugaku 超級電腦,內建近 3.7 萬個節能核心可達到每瓦運算效能 16.876GFlops/watts, 2020 年 Fugaku 超級電腦在「高效能共軛梯度」(HPCG) 名單中榮獲最高榮譽,這象徵了當代基礎架構需求重大的演進。此外, Ampere 公司發布業界首款基於 Arm Neoverse N1 平台的 80 個內核 64 位元伺服器處理器晶片 Altra,將 3,680 個核心裝至單一機架裡,比一般多出 2.5 倍。

2. 利用邊緣運算

理論上,雲端架構的數據中心是置放運算負載最具效率的地方,工作負載可以被積極地整併,可用最高效率的設備進行填充。但實際上,雲端只要出現 15 分鐘的電力需求暴增,就可能導致被收取較高的尖峰功率費用,為了避免被收取較高費用,可將負載分散到週邊,而自駕車運作與 AI 驅動的工廠,也需要複雜的邊緣基礎架構。這種趨勢將驅使電信業者與其它公司開發出能夠極大化使用率並極小化功率與網路流量的技術以轉移負載。

在全國或全球性危機中,以雲端為中心還可能導致緩慢的連線速度與資料傳送不穩定。譬如以冠狀病毒大流行為例,CDN 技術服務商 Cloudflare 調查發現,當今年 3 月 13 日周五美國宣布全國進入緊急狀況後,美國數據中心的網路流量 (下圖紅線) 比往常 (下圖灰線) 驟升 20%,由於後疫情時代視訊會議更為普遍,深度邊緣運算的需求將更為提升。

Inria 專案實驗室的報告指出,跟傳統以雲端為中心的數據中心相比,若在分散的伺服器上管理物聯網相關任務,由於能減少網路中繼、降低冷卻負載,以及針對運算資產能做更佳運用,將能減少 14% 到 25% 的耗電量。

unnamed_(16)
資料來源:Cloudflare Blog, 2020

3. 增加 NPU 應用

微神經網路處理技術,以向量延伸、整合積體電路,或是以特別設計用來高效率執行矩陣乘法的專用神經網路處理器 (NPU) 等形式出現。在以 AI 降低從影片與影像擷取洞察所需的資源方面 NPU 技術扮演關鍵角色。今日影片已佔大約 75% 的網際網路流量,由於預期臉部辨識與即時分析的擴展將佔用更多的流量,思科預估到 2022 年,影片流量將成長兩倍,將佔有 82% 的網路流量。

為了持續提升基礎建設效能,Arm 延續其在 Neoverse N1 生態體系之基礎,發布了全新的Neoverse V1 平台與 N2 平台,Neoverse V1 平台極致優化性能,為首個支援可擴展延伸向量指令集(SVE)的平台,與 N1 平台相比提升 50% 以上的單執行緒 (single-threaded) 效能,SVE 允許使用與單元的寬度無關的軟體程式設計模型在更寬的向量單元上執行 SIMD 整數、bfloat16 或浮點指令,透過 SVE 確保了軟體編碼的可攜性、壽命及有效執行,應用上以高性能雲、HPC 和機器學習等市場為主。

而 Neoverse N2 平台則提供了可擴展的性能在維持與 N1 相同的面積與功耗下提升了 40% 的單執行緒 (single-threaded) 效能,能支援多達 192 個核心設計,具有最大的面積運算密度 (TDP/Area) ,可應用於雲端高核心運算、5G 邊緣、企業網路、智慧網卡 (Smart NIC) 、路由器與數據交換器等應用。

unnamed
Arm 提供

若想要進一步了解 Arm Neoverse 解決方案,歡迎報名 11 月 4-5 日於線上舉辦的 Arm DevSummit,在本場 Arm 最盛大的年度科技論壇中,我們邀請到 AWS、Fujitsu、Arm 等專家為您介紹最新設計、工具、生態系統與應用案例。此外,針對其他主題,我們亦邀請到來自 Facebook、Google、Netflix、福斯集團、高通、凌華科技、群聯電子、阿里巴巴創業者基金等多位重量級講者進行近 40 場技術演講,期待與您線上相見。

核稿編輯:Chris

更多資訊請點此報名 Arm DevSummit

延伸閱讀: