【Arm 專欄】用智慧電視姿勢追蹤在家健身!看 Arm AI Platform 如何助力智慧家庭應用

疫情下在家健身的需求崛起,Arm 的 AI Platform 就利用 深度學習來讓智慧電視看懂使用者的姿勢,讓你在家健身也能像有教練指點。
評論
Arm 提供
評論

新冠肺炎大流行迫使人們花更多的時間在室內,加上智慧電視近來的進展提供了全新的需求與機會,使得我們能夠將新興的體驗引入客廳。

許多人現在的生活形態與以前相比差異很大,藉由適當的科技協助,將使在家健身更方便與更有效,對許多消費者而言,在未來遠距健身將持續是個吸引人的選項。相機是這項科技關鍵的一環,而相機重返數位電視 (DTV) 市場也創造了機會。由於現代的電視都是高解析與大螢幕,這些用戶體驗有可能非常沉浸式,也能為健康帶來好處。

透過應用於大螢幕智慧電視的 app,能讓舒適地在家中健身成為可能。我們首先簡介一下這個 app,接著說明適合 Android 電視的身體姿勢預估與追蹤的深度學習,並討論在選擇正確的卷積類神經網路 (CNN) 時的主要考量點。

概述

除了量化教練與學員兩人身體姿勢差異帶來的挑戰,我們必須解決如何從兩個影像串流中,正確辨識出對應圖框的問題。教練與學員在健身時難免會產生延遲。基於這個原因,同時考量不同的健身速度,我們必須進行搜尋以決定要比較的是哪兩張影像。

如下圖所示,在我們的應用程式中,正在將兩個視訊串流視覺化,並加上骨骼數據以及用百分比呈現的分數。

圖一: 使用 BlazePose 模型的健身應用。Arm 提供。

本文將聚焦在智慧電視上,因為這個領域具有龐大的潛力。不過,在此討論到的許多軟體模型與工具,也適用於其它你可能想要鎖定的消費性裝置。

深度學習

自從微軟公司開發出 Kinect 感測器以及估計身體姿勢的 Random Forest 模型,至今已有近十年,它突顯出這項任務對於許多終端用戶應用的重要性。在那之後,機器學習 (ML) 研究就持續聚焦在 2D 與 3D 人體姿勢估計。近年來,深度學習已經顯現龐大潛力,目前在這個領域是領先市場的技術。

以深度學習估計與追蹤身體位置時,我們必須考慮很多。針對智慧電視、手機與家庭裝置的解決方案,通常效能必須很高,因此選擇適當的 CNN 模型是相當具挑戰性的工作。估計體姿的輕量模型通常將來自相機的 RGB 影像作為身體關鍵點位置的 2D 或 3D 輸入與輸出,可以透過單一端對端的模型來執行,也可以分成兩個模型:第一個模型負責人的檢測,第二個模型則負責定位關節或地標的位置。第一類模型的範例是 PoseNet (基於 MobileNetV1 或 ResNet50),而第二個範例則是 BlazePose(類似 MobileNetV2,具備客製化區塊)

圖二: BlazePose 模型的結果,紅色表示檢測框。Arm 提供。

最重要的是精準度與效能。為了更佳地了解精準度,我們必須檢視訓練的資料集以及錯誤度量,但往往還是無法一窺全貌。資料集常常由人工標註,可能會因自遮蔽與低解析產生巨大的錯誤,即便我們使用既有的 CNN 模型,我們應該考慮打造自己的小型資料集以供評估。如此一來,我們可以更瞭解它在特定使用情境中的表現。此外,我們必須不斷地評估效能,權衡精準度 vs. 效能。要瞭解不同模型與推論引擎的效能,可以先從 TensorFlow 的基準校正工具著手。

針對 TFLite 模型在 Android 裝置上運行推論有許多選項,包括軟體 (SW) 與硬體 (HW),使得大家可能馬上就對此感到困惑。在軟體方面有NNAPI、TFLite CPU 或 GPU(繪圖處理器)代理;在硬體方面,可以在許多可供推論的運算單元中選擇,例如 CPU、GPU、NPU(神經網路處理器)等。以 Arm 的平台來說,使用 ArmNN TFLite delegate 是個好選項,它可以提供更高層級的抽象化。或者您也可直接鎖定 Arm 運算函式庫 (ACL) 與 Arm NN,它們可以讓用戶進行更多的管控。對我們而言,兩種模型都在 Mali GPU 上達到最佳效能,針對不同硬體裝置效能情況可能有所不同。

圖三: ArmNN 推論流程圖。Arm 提供。

其它考量

既然模型的效能只是整個考量點的一環,還要考慮到前處理與後處理運作。例如,以 PoseNet 模型來說,採用 257 x 257的 RGB 影像輸入,並輸出熱點圖與偏移向量,這些都必須進行處理,以確定每個關節在原相機影像中的最終位置。另一方面,BlazePose的地標模型則輸出 x、y 與 z 座標,以及每個關節的存在與能見度。這聽起來似乎更簡單,但實際上卻涉及更多的處理階段。這是因為地標模型輸出的座標必須投影到原始圖框上,從而恢復與檢測模型相關的預處理和後處理階段。

圖四: BlazePose 模型示範。Arm 提供。

這些處理階段與應用裡的其它功能,也需具備很高的效能,且身為開發人員,會想要儘可能地利用您的系統。您需要專注優化能提供最顯著效能提升的部份。針對這個目的,Arm 的Streamline Performance Analyzer 是適合的工具。它針對您系統中不同的單元,提供詳細的硬體計數器。隨後,倘若您在程式碼中增加註解,您可以看到它在管線中對每個軟體階段的確切影響。Florent 的部落格針對 ML 應用,提供針對 Streamline 很好的概述。由於我們的應用裡同時有視訊串流與相機串流,必須對兩者都進行推論。幸運的是,可以預先進行處理教練的視訊。我們可以先離線把骨骼的位置寫入檔案中,然後即時讀取、計算分數並開始繪圖,從而提供明顯的效能提升。

結論

本文分享了使用深度學習進行體姿估計時面臨的挑戰與限制,從 BlazePose 模型看到一些不錯的成果,讓我們更加瞭解如何透過 Android 智慧電視打造健身應用。如同時下其他的高階行動裝置,數位電視也可以提供全新的互動體驗,並將這些體驗帶進您客廳的螢幕上。增加深度感測器會進一步提升姿勢估計的準確度與強固性,並考量 3D 重組與情境理解,以獲得更身歷其境的沉浸體驗。

欲了解更多 Arm AI Platform 針對開發者提供的實用協助與設計指引,請造訪相關網頁,以助力您實現機器學習與深度學習應用。

責任編輯:Mia
核稿編輯:MindyLi

延伸閱讀:



不限車款、車齡都能升級?《車管+懶人包》輕鬆加入「手機車鑰匙」的行列

笠眾實業(IVTES)開發的「車管+」系統安裝與使用教學,升級手機車鑰匙的方法,全都整理在這裡了。
評論
評論

不限車款或年份的「車管+」手機車鑰匙,近期引起許多車主的興趣。畢竟不用花大錢換名牌車,就能夠輕鬆入門享有智慧便捷的 iKey,確實是相對無負擔的高 CP 值選擇。那麼使用「車管+」手機車鑰匙是否會要大幅度改車,其實也不必。這款由笠眾實業(IVTES)開發的「車管+」系統,只需要改裝一支「原廠車鑰匙」,並在車上安裝主機、手機下載「車管+1號」App,就可擁有一系列手機車鑰匙的智慧應用。

安裝簡易:可請一般汽修保養廠代勞或自行 DIY,下載 App 萬事俱足

從官網線上訂購並收到「車管+」的主機套組後,首先第一步就是改裝遙控器,再安裝車內主機,日後即可透過手機作為汽車門鎖的備份鑰匙。其實安裝產品並不難,車主可以選擇:

  1. 如果自己對從遙控器中取出電路板與電路焊接作業有信心,可以直接自行 DIY,笠眾會隨產品提供簡易量測工具與說明手冊,若車主對汽車電系了解也能自行安裝主機與收納。
  2. 可寄送遙控器請笠眾公司代為改裝隨產品回寄後,車主再請汽車保修廠安裝主機與收納。
  3. 現場安裝地點位於新北市中和,需與笠眾公司預約安裝時段。

遙控器改裝、車內主機安裝的作業原理可以參考上圖。特別要注意的是,「手機車鑰匙」僅作為汽車門鎖控制,並非日後用手機就能直接啟動汽車引擎。如果是「一鍵啟動」的車款,與車主的手機藍牙配對連線時即會對車內改裝電路板供應 3V 電源,所以可以直接啟動汽車;若為「插鑰匙啟動」車款,一樣要插入五金鑰匙啟動才能發動引擎,建議車內可預先放置五金鑰匙。

常用功能指南:共享車機 vs 虛擬鑰匙

除了上圖直接以 App 介面為例說明常用功能之外,入門使用者較容易混淆的通常是「共享車機」和「虛擬鑰匙」這兩種功能。其實這兩者的分別很簡單,可以參考下表一目瞭然:

簡單來說,如果是長期要一起共享汽車的親朋好友或是公務用車,建議使用「共享車機」,用車時藍牙會自動傳輸資料,便於車主或公務車人員管理,掌握汽車動向;如果是單次臨時用車,則建議使用「虛擬鑰匙」,用車者會拿到一組有時效性的虛擬鑰匙連結,可作為短期用車使用,不必大費周章面交實體鑰匙,就能共享用車。

使用者常見Q&A

使用者常見 Q&A 整理如上圖。人手一機、手機不離身的時代,升級為「車管+」的手機車鑰匙,利用手機藍牙自動感應功能,就能自動上解/鎖,解決過往要開車時才發現忘記拿鑰匙、下車後又忘記鎖車的問題。如果不小心被反鎖在車外,連自己的手機也被鎖在車內時,也可以借用他人的手機下載 App,登入帳號即可以解鎖。

另外,日後如果賣車或換新車,有需要的話也可以恢復成原本的車鑰匙;而且產品拆卸簡易,要移機至新車繼續使用也是沒問題的。想要體驗手機車鑰匙的新潮與便利嗎?不限車款、車齡都能輕鬆入門!

立即安裝車管+