【Arm 專欄】Arm 發表全面運算解決方案,驅動行動運算的未來十年

Arm 於 5/26 發布為終端產品市場推出的全面運算解決方案,新產品包括基於新的 Armv9 架構,為卓越效能與效率打造的首款 Cortex 處理器,具優越繪圖能力的 Mali GPU 與系統 IP,現在就讓我們來進一步瞭解全面運算將帶來的運算變革與 Arm 新品。
評論
Arm 提供
評論

2019 年 Arm 推出了全面運算策略,對系統單晶片(SoC)的設計採取一種全方位、並且聚焦在解決方案的方法。 Arm 已經從個別 IP 元件提升到以系統層級為主的設計與優化,以便打造使用場景驅動的解決方案來帶動下一個十年的運算創新。在 2021 年 5 月最新發布的全面運算解決方案是 Arm 實現這個願景的第一步;針對消費性產品市場上不同效能與效率層級的應用,推出了完整的解決方案。

這全系統優化解決方案的核心,是全面運算的三大支柱。首先, Arm 的目標是把運算效能所涵蓋的範圍從通用的工作負載,擴展到特定處理,例如 3A 級遊戲。其次, Arm 在打造堅實的安全基礎時,還兼顧了讓這些新安全功能所造成的碎片化、成本與效能等等衝擊降到最低。第三, Arm 在打造解決方案時同時考量到更佳的開發人員取用性,讓他們在各種不同消費性終端產品上開發、除錯、部署、優化與轉移應用時,更為簡便。

全新的解決方案

每個解決方案都提供不同層級的效能、效率與擴充性,以便在不同的消費性終端產品市場達成特定的運算需求。Premium 解決方案,主要是為高階智慧手機與筆電裝置的頂級效能與連網用戶體驗設計。Performance 解決方案則可對應不同市場的多樣化需求,應對多個區塊的各式各樣需求,包括中階智慧手機、Chromebook 筆電與高階智慧電視。最後, Efficiency 解決方案則提供超高的擴充性,以便在入門智慧手機、AR(擴增實境)與 VR(虛擬實境)穿戴裝置、中階與入門數位電視、機上盒及智慧手錶上,達成同級最佳的成本效率。硬體 IP(包括最新的 Armv9 CPU 核心、Mali GPU 與系統 IP)、實體 IP、軟體、工具與標準,則是這些解決方案的核心。

Arm 提供

為何需要全面運算解決方案?

Arm 需要這種全新解決方案,主要是因為消費者對於各種不同消費性終端產品的要求,導致更為複雜的運算需求。在筆電的領域裡,消費者想要可以提升他們生產力的裝置、包含對 4K、甚至 8K 視訊內容的支援,以及可以參與整天的視訊會議而毋需充電。在智慧手機領域,5G 預計很快會會橫掃所有層級的智慧手機,包括旗艦、主流與入門機型。不管成本為何,消費者都想要在他們的智慧手機上達成更多的事。例如更多的遊戲內容與相機能力,搭配更高的解析度與幀率。在家用領域裡,消費者想要在電視上看到 4K 與 8K 的內容,以及更順暢的體驗與更快的 app 載入速度。最後,在新興的穿戴與混合實境(XR)領域,消費者想要不受線材羈絆且能享受更久的沉浸式體驗。對安全性的根本需求,則涵蓋所有這些不同的市場領域。

利用全面運算解決方案進行遊戲

Arm 全面運算解決方案把運算效能的規模從泛用工作負載以外,擴展到特定工作負載。新的全面運算解決方案的一環、同時也是 Arm 檢視與優化關鍵的工作負載之一就是遊戲。遊戲持續挑戰行動科技的極限,不單只在 GPU(繪圖處理器),同時對於 CPU 與系統 IP 也是一樣。

Arm 提供

透過遊戲可以了解 Arm 全面運算解決方案如何為複雜的真實世界與特定的工作負載帶來具體的好處。為了加速遊戲工作負載的 CPU 效能, Arm 聚焦在 Armv9 CPU、Mali GPU,與其在 CPU 叢集上運行的軟體驅動程式。 同時結合 CPU 的微架構創新與導入像命令流前端 (CSF) 這樣嶄新的 GPU 技術,來降低 CPU 的使用率。這可以為遊戲的運行,帶來 CPU 的效能提升。另外,伴隨著 Arm Mali-G710 嶄新功能的導入,比如重新設計的紋理單元與執行引擎等, 可以處理要求更為嚴苛的遊戲內容,同時達成更高的整體每秒幀數(FPS)。最後, 全新的CoreLink CI-700互連技術支援系統層級的快取記憶體(SLC),它與 GPU 推出的新功能結合之後,可以為在系統上運行的各種遊戲內容降低延遲與系統的功耗。

 Arm 也針對不同的遊戲內容,測量這些跨IP的系統與軟體優化在效能與效率上帶來的好處。對於在 Arm Cortex-A710 CPU 上運行的各種遊戲內容,它對各種 Mali-DDK 工作負載提供平均 27% 的提升;Mali G710 與前一世代的 Arm Mali G-78 GPU 相比,在運行各種不同的遊戲內容上其效能與效率也提升 20%。此外,藉由啟動像 SLC、FP16、AFBC(Arm 幀緩衝壓縮) 與 CSF 等系統核心功能, 系統的效率整體提升了 15%。

Arm 提供

如同 Arm GPU 的部落格中討論過,對於遊戲 Arm 不是只仰賴 IP 的提升。 Arm 對遊戲的生態系進行投資,並與市場領先的遊戲引擎及公司合作,確保他們的遊戲內容能夠針對 Arm IP 優化。Arm Mobile Studio就是支援開發人員優化他們的遊戲內容、並進一步釋放出效能與效率好處的工具平台的絕佳實例。這是一套免費使用的效能分析工具,可以分析CPU 活動、GPU 活動與遊戲的內容度量。這意味遊戲開發人員可以迅速找出並修正可能讓遊戲慢下來、讓裝置過熱,或讓電池快速消耗的任何問題。

人工智慧與機器學習

除了遊戲,應對橫跨所有消費裝置的人工智慧(AI)與機器學習(ML)爆炸性使用場景,對效能會帶來挑戰, 可以藉由全面運算的解決方案來應對。像 AI 相機等運算密集的使用場景在某些時序限制下,通常需要即時且並行的 ML 演算法處理。因此,效能的效率相當重要。另外, 開發者還需要在單一的系統單晶片(SoC)內廣泛支援多元的 ML 演算法。這需要讓系統能夠支援橫跨不同運算元件的不同數據格式。最後,針對安全敏感的使用場景與高價資產使用越來越多的 ML 演算法,例如人臉解鎖與行動銀行,都需要強大的保護。

Arm 提供

隨著越來越多的消費性終端產品搭載相當強大的神經網路處理器(NPU), 人們很容易就認為 NPU 可以獨自解決複雜的問題。事實上,運算的許多階段都需要不同的特定處理單元。例如,對於智慧手機相機裡的肖像模式(一種常見的 ML 工作負載), 人們可以使用 CPU 進行影像前後處理,隨後由 GPU 與 NPU 擷取深度圖與分割,然後把它傳回 CPU 進行散景效果,最後再回到 NPU 進行超解析處理。這個例子可以解釋常見的 AI 工作負載如何在單一 SoC 上需要多元的運算 AI 需求,而全系統範圍的優化大幅度的提升了此點。

全面運算解決方案的所有 IP,都提供特定與可擴充的運算能力。全新的 Armv9 核心透過支援第二代可擴展向量延伸指令集(SVE2)、Matmul 與 BFloat16,推進數位訊號處理與 ML 工作負載。Mali GPU 針對影像強化提供混合精度能力;而 Ethos NPU 則是效率極高的神經網路處理器,它對於高通量的 AI 視訊處理,具備多核心的支援性。另外, Arm 還提供 Arm Cortex-M55 CPUArm Ethos-U65 NPU,兩者都是專門處理常時啟動的 ML 使用情境。

Arm 提供

AI 與 ML 工作負載在消費性終端產品上的重要性,正是 Arm 的全面運算解決方案提供範圍最廣的特定與可擴充的人工智慧的原因。在所有解決方案的所有 IP 上,ML 效能都有顯著的提升,提升幅度從 Mali-G710 GPU 的 35%,到應用於功率受限的使用場景例如關鍵詞辨認, Cortex-M55 效能可提升十倍。這種跨 IP、針對 ML 能力的全系統範圍聚焦,讓 Arm 的合作夥伴在受限於不同的功率與矽晶圓成本之下,能為各種使用場景執行特定的 AI 與 ML 工作負載。

安全性

如同在 Armv9 CPU 部落格中討論過, Arm 正在重新思考安全性架構,將其從分散且昂貴的緩和手段轉移到標準化且可擴充的解決方案。透過安全性與架構基礎層的結合,更多消費性終端產品對於安全性的威脅,會獲得更好的保護。這種方式同時也可以將碎片化、成本以及導入這些全新安全能力帶來的效能衝擊極小化。相對於只倚靠軟體的安全性解決方案,這種作法提供更可觀的效能提升。

透過 Armv9 CPU, Arm 導入全新的安全性功能與技術,並強化既有的功能與支援,以解決橫跨多種消費裝置的多元安全性議題。這些設計全部都是為了因應與日俱增的安全性威脅與攻擊表層。

Arm 提供

Secure-EL2 為信任的服務,提供標準且安全的隔離。從定義、開發到部署都與 Google 共同設計的記憶體標籤擴充(MTE),讓檢測記憶體安全問題更為簡易且效率更高,而這也是現有 C/C++ 程式碼常見的漏洞。最後,PAC 與 BTI,針對鎖定複雜軟體堆疊的返回導向程式設計(ROP)與跳轉導向程式設計(JOP)攻擊,減緩傷害的程度。

這種處理安全性的方式,不是只有對矽晶圓夥伴或裝置製造商有用,開發人員同時因為高效率地為客戶部署可靠、穩定與安全的應用,卻不會被安全性的複雜度困住而受益。對於開發人員來說,MTE、PAC 與 BTI 特別有用。PAC 與 BTI 可以針對許多開發人員不是很熟悉的 ROP 與 JOP 攻擊,提供保護。在此同時,MTE 讓開發人員可以快速追蹤發現像 C 與C++ 語言的記憶體安全錯誤,並加快產品的上市時程。

MTE尤其受到 Arm 夥伴的熱烈歡迎。以下是臉書公司的安全工程師 Chris Rohlf 的評論:

「臉書的安全性工程團隊相信 Armv9 CPU 採用 Arm 的記憶體標籤擴充(MTE)技術,可以協助 我們的產業從安卓裝置找出、並根除關鍵的記憶體安全方面的安全性弱點。」

利用 POP IP 凸顯全面運算的優勢

把全面運算解決方案的堆疊延伸到晶片時,實體的實作相當關鍵。為全面運算設計的 Arm POP IP,利用獨特的實作計劃應對解決方案的多樣性,而這個實作計劃則會依設計需求與選用的製程節點,有所不同。這種獨特性對於為特定處理技術取得最佳矽晶圓效能成果相當關鍵,並且可為先進節點設計的許多挑戰提供解決方案,並讓 Arm 的夥伴可以更快地進行產品的量產。

對工具的投資

除了對應用開發人員提供奧援, Arm 對於各種可以讓 SoC 開發人員在開發尖端設計時擷取驚人效能並降低風險的工具,持續進行投資。在最初的開發階段中, Arm 的夥伴可以透過使用Arm Fast Model,針對最新的IP進行虛擬原型設計,同時透過 CoreLink NI-700 的先進設計與驗證工具,評估系統層級的效能。

此外,針對第一個版本的全面運算固定虛擬平台(FVP)推出的參考開源軟體堆疊,目前已經可用,名稱為 TC0。它可以促成產品軟體的開發,並讓 Arm 夥伴的各種產品與軟體解決方案進行無縫的整合。針對系統層級分析,Arm Development Studio 則為複雜的系統與完全的負載提供異質的效能分析。這將讓開發人員可以訊問硬體計數器,並橫跨 CPU、GPU 與 NPU 資源進一步優化系統。最後, Arm 已經與關鍵的夥伴協作,確保用戶在使用 Arm 的工具鏈時可以充份利用全新的 SVE2 與 MT E功能,而 LLVM9 與 GNU10 也會對新架構提供支援。所有的這些工具不是內建在全面運算解決方案內,就是對解決方案提供支援,以便達成終極的開發人員體驗。

Arm 提供

帶動運算的新時代

對於運算來說,這是一個令人興奮的時代。透過實現全面運算策略, Arm 將能提供效能更高、更安全、更有效率、可以擴充、以及對開發人員友善的解決方案,來帶動次世代的消費性終端產品。它也將為生態系的真正創新奠定基礎,提供可以讓我們的數位生活為之改觀的運算體驗。

責任編輯:Mia
核稿編輯:MindyLi



蛻變敏捷開發組織並不難! AWS Amplify幫前端工程師從雲端快速建立REACT程式

台灣企業勢必需要明確轉型策略,搭配適合的雲端工具作為入場券,一來降低數位化門檻、二來減少摸索資源的浪費。
評論
shutterstock_1451794139.jpg
評論

打造敏捷開發流程、加速前後端工程師的協作效率,是許多企業在面臨疫情之後,認為亟需將彈性元素納入為企業文化當中。雲端運算服務領導業者 AWS 台灣,觀察到前端工程師主要負責處理最貼近用戶的 Web、行動應用程式,但他們往往需要與後端團隊合作過程,遭遇耗費大量討論時間,才能處理使用者介面事項。

為了降低前後端的溝通成本,有些前端工程師在掌握介面管理能力之後,開始橫跨到後端的伺服器、資料庫開發經驗,甚至進一步培養技能,成為能負責測試、安全、效能多面向的全端工程師。

有的人會透過 Side Project(利用業餘時間開發有興趣的專案)或參加 Hackathon(黑客松)方式,運用 AWS 雲端工具嘗試自行擴展後端,並建立簡單易用的工具程式。究竟,AWS 平台提供哪些資源幫助前端工程師擴展更多元的技能樹?

掌握入門教學!前端工程師如何將 REACT 程式快速上雲

前端工程師運用 AWS Amplify,快速在雲端建立 REACT 應用程式

事實上,AWS 的入門課程指出,運用 AWS Amplify 在雲端建立 React 應用程式及服務集,只需五個學習歷程,包含建立 React 應用程式、初始化本機應用程式、新增身份驗證、新增 API 和資料庫、新增儲存體。如果想快速了解 REACT 程式快速上雲的方法及示範教學,本文節錄 AWS QUICKSTART 學習資源內容,幫助前端工程師更快掌握重點。

首先,何謂 AWS Amplify?AWS Amplify 是一項全托管 Front-End Web & Mobile 服務,採取無伺服器模式,在後端建立、部署和託管單一頁面 Web 應用程式或靜態網站的 Git 型 CI/CD 工作流程,加速開發過程直接整合其他 AWS 服務。舉例來說,像是整合封裝好的 Library 資源、或運用一些 Components UI 軟體去配置後端,以及利用 Admin 的 UI 做資源上的管理。

透過 AWS 增加雲端技能 在組織發揮你的影響力

AWS Amplify加速Develop、Deliver 與 Manage流程

AWS Amplify 主要優勢展現在三大項工作階段,分別是 Develop、Deliver 和 Manage。Develop 部分可利用 CLI(Command-Line Interface)或 Admin UI 設定後端,使用 GraphQL 或 REST API 設定也是可行的,進而快速建構一個前後端專案。此外,開發者還能搭配 AWS 其他服務,例如使用 AWS Authentication 全托管認證服務,或 DataStore、Storage 等多項 Feature Categories。

到了 Deliver 階段,若是要透過 AWS Amplify 執行 Web Hosting 任務,可拆解出三個流程。首先是將 Repository 與 AWS Amplify 進行連結,這邊可整合 Amplify Console 提供的支援資源包含 Github、Bit Bucket、Gitlab、以及 AWS 的程式碼代管工具 AWS CodeCommit。一旦連結以後,開發者可透過自己的 Configuration,决定在各個不同的 Build 要執行什麽樣的指令,最後再透過 Deploy 方式,幫助工程師進行前端的 Hosting。

在最後一個 Manage 階段,開發者則可利用 AWS Amplify 的 Admin UI,以開啓瀏覽器方式,透過視覺化介面統一管理資源。例如在 Admin UI 介面左側選單,涵蓋 Content、User Management 的區塊,讓參與專案但沒有 AWS Console 權限的使用者,可利用 E-mail 方式邀請使用者進到 Admin UI,進行一些設定或觀看其他相關資源;甚至在 Set Up 區塊還有相關選項,例如要針對 Data Modeling 或 APP User 做權限管理,以及可連結到 AWS 其他服務。

運用開放資源 AWS Amplify Framework,打造高效能應用服務

AWS QUICKSTART 學習資源還介紹到另一個 AWS 提供的開放資源 Amplify Framework,一樣可利用 Amplify CLI 的方式,配置 Web 和行動應用程式的前後端,以及開發者需要用到的服務,讓應用程式更易於構建,並獲得安全、高性能的使用體驗。

Amplify CLI 一樣有支援多個不同 Category,例如較常使用的幾個 Comment Line,像是Amplify Init 指令做初始化或創建幾個不同資源;或是 Amplify Status 指令,隨時在開發過程查看各個 Category 狀態;甚至專案結束後,可利用 Amplify Delete 直接把 Amplify 所創建的資源做一次性删除。另外也可透過 AWS Amplify Client 利用比較抽象化方式,讓開發者直接利用 Component 實現想要完成的項目。

填寫表單 找到適合你的快速上雲服務與工具!

實際示範給你看,設定 React 程式可以如此簡單

假設前端工程師現在要快速部署一項有驗證功能(Authentication)還要搭配 Rest API、GraphQL、Analytics 等服務的應用,如何快速設定 React 程式?在 AWS QUICKSTART 的學習資源後半段,有詳細說明要啟動這類型專案的操作方法。

開發者可以先利用 AWS Lambda Function 結合 Amazon API Gateway 方式,創建出一個 Rest API,到了 Authentication 階段,則使用到 AWS Cognito 的服務,接著針對 GraphQL 需求,可利用 AWS AppSync 服務,以及最後如果有 Analytics 的需求,也可以串聯 Amazon Pinpoint 工具。Amazon Pinpoint 是一項彈性而可以擴展的行銷通訊服務,開發人員可利用 Amazon Pinpoint API 追蹤 Web 使用者的行爲,或是針對 APP 推送、電子郵件、簡訊點擊行為蒐集到具體的資訊。

在這整套流程示範之後,值得特別強調的是,AWS AppSync 是一項全托管的服務,能及時更新,甚至在使用者離線時仍可以持續去創建和修改數據。一旦設備連上線之後,這項應用程式就可重新連線,並接到後端同步數據,達成彈性、自動化擴展或減縮各式 API 的請求。

打造第一個你在 AWS 上的應用程式

AWS 最後強調,Amplify 是相當適合建構出一個靜態 Web、Apps 服務模式,例如說像是打造部落格,或者是一項 APP 內的代辦事項應用等;加上 Amplify 具全托管服務特色,可串聯上述 AWS 在雲端所提供的資源,都能在部署過程加以整合,加速開發流程及效率,並且有效節省開發資源。如果想用低門檻的雲端解決方案,其實前端工程師是能在開發流程更靈活配置資源,甚至為公司的商業、服務模式挖掘出創新價值。

了解更多:AWS 開發者系列