換個姿勢看,蘋果發表會全是 AI

評論
評論

本文獲得合作媒體 雷鋒網 授權轉載。

好像沒有別的了。

「無聊」、「沒有驚喜」這些詞似乎和蘋果發表會捆綁住了。

不管是 WWDC,還是秋季新品發表會,總會有人熬完夜頂著黑眼圈大喊「無聊」。看完發表會,我發現除了 Apple Watch 的部分,整個 iPhone 的發表都在講 A12 仿生晶片以及其賦予的各種全新 AI 功能。

或許,我們以後需要用看 AI 發表會的姿勢來看蘋果秋季新品發表會了。

在 AI 浪潮下,網際網路巨頭都已經完成了 AI 戰略轉型,Google 從 Mobile First 轉為 AI First ,微軟強調全新的世界觀--智慧雲端和智慧終端計算。而蘋果在 AI 上則更為低調,一直沒有響亮的口號,似乎不想忘記自己是一家做產品的公司。(註:智慧終端計算指的是參與物聯網的每個終端裝置都具備處理數據的能力,而不只簡單將數據儲存在雲端。)

然而,蘋果行動力卻絲毫沒有停滯,顯然已經集齊 AI 三要素:算力、演算法、數據。在算力方面,發表會重點介紹了全新 A12 仿生智慧晶片;在演算法方面有 Neural Engine 、 Core ML 和 Create ML ;數據方面, 20 億台 iPhone 的用戶數據大概已經足夠了。

今天,伴隨著三款 iPhone X 系列手機,我們再來看看蘋果如何用 AI 給手機做徹頭徹尾的大改造。

換個姿勢看,蘋果發布會全是AI

 A12 仿生智慧晶片是這次發表會的重中之重,以至於讓人感到全程都在講晶片。

在去年的秋季發表會上,蘋果推出 iPhone X 的同時,推出了 A11 仿生晶片。蘋果高級副總裁 Phil Schiller 將其稱為「最強大的智慧型手機晶片」。而現在, A12 仿生晶片順利超越,把前任狠狠甩在後頭。

 A12 採用最新採用 7nm 製程,配備六核 CPU 、 4 核 GPU , CPU 包括 2 個性能核心和四個效能核心,其性能雙核比 A11 仿生晶片速度提高 15% , 4 個效率核功耗降低 50%  ; 4 核 GPU 圖形處理速度比 A11 仿生晶片提高 50% 。

換個姿勢看,蘋果發布會全是AI

除此之外, A12 晶片最強大的地方在於 A12 晶片上全新的神經網絡引擎(Neural Engine)。神經網路引擎在去年推出 A11 時一併推出,去年是 2 核,今年是 8 核設計,支援複雜的機器學習,還有一個智慧運算的系統,能夠合理分配 CPU 、 GPU 和神經網路引擎上進行的運算任務。去年, A11 上的神經網路可以每秒運行 6 千萬次計算,今年 A12 上的神經網路引擎可以每秒運行 5 兆次計算。這個數據的飛躍,簡直難以置信。

由此,基於全新的 A12 仿生晶片, iPhone 上的拍照功能、影片功能、語音助理、 Face ID 、 AR ,所有這些會調用 CPU 、 GPU 能力的功能都上升到全新水平。最顯而易見的是, iPhone 現在的內部儲存空間首次擴展到了 512GB ,能夠儲存 20 萬張圖片,當然,也把 iPhone 價格推向了歷史新高。

電腦視覺

電腦視覺是最主要的人工智慧技術,也是目前在智慧型手機上運用最成熟的技術。在智慧型手機上可以實現的主要功能有:人臉辨識、手勢辨識、人體運動追蹤、圖像辨識、物體辨識等。

 iPhone X 首創的 Face ID 人臉辨識解鎖已經成為智慧型手機的標準配備,各大廠商都在追趕蘋果帶起來的這波潮流。

根據廠商透漏,即時人臉辨識對演算法要求極高,蘋果特意在 A11 仿生晶片的神經網路引擎上劃出一片區域來支持 Face ID 。這也是蘋果做 Face ID 獨有的軟硬體一體化優勢。

 Schiller 說道, A12 上新的神經網路引擎能夠更有效地辨識人臉的各個部分,加快 Face ID 的辨識速度。由於全靠 A12 晶片處理,而沒有用到雲端 AI , Face ID 的安全性也將更高。

換個姿勢看,蘋果發布會全是AI

人臉辨識就這麼難,辨識距離更遠的人體運動辨識顯然難度更高。現場,開發者帶來了一款叫做《Homecourt》的應用,可以用來記錄跟蹤籃球比賽,即時記錄比分。強大的神經網路引擎能夠即時追蹤和辨識人體運動、預測運動軌跡、即時分析六項運動數據,可以精細到投籃的角度。

續航

 iPhone X 搭載了支持 Face ID 的原深度鏡頭,數十個傳感器使得 iPhone X 成為史上最短續航力的 iPhone 手機。而 A12 改善了這一狀況, A12 能合理分配 CPU 、 GPU 和神經引擎上進行的計算任務,從而節省耗電。 iPhone XS Max  的續航時間比 iPhone X 長 90 分鐘, iPhone Xs 比 iPhone X 可以多用 30 分鐘, Max 則比 iPhone X 多用 1.5 小時。

Smart HDR

在 AI 手機時代,拍照成為彰顯 AI 圖像處理能力最顯而易見的亮點。除了觸控螢幕、 App Store 之外,攝影鏡頭也是蘋果帶給世界的一大創新。

鏡頭方面, iPhone Xs 系列採用了與 iPhone X 相類似的後置雙鏡頭,有更大的感應器,更深的相觸。在智慧型手機圖像處理領域,有一種說法照片是否能拍好,更多地取決於 AI 演算法, AI 演算法也會和硬體設計有關。

 Schiller 介紹了全新的 Smart HDR 拍攝功能, HDR 拍照指的是在按下快門時,相機會拍下多張不同曝光的照片,將它們拼在一起,使得從高光到暗影的每一處細節都呈現更清晰。 Smart HDR 可以做到零快門延遲、有更多的高光和陰影、細節更豐富、逆光處理更好。這一切不是用通常的 ISP+CPU 實現的,而是由 ISP+神經網路引擎實現,你每拍下一張照片,都會進行一兆次操作。

換個姿勢看,蘋果發布會全是AI

同時, Smart HDR 的拍攝功能也能支援後期調焦。蘋果用單反相機拍攝的照片反複訓練神經網路引擎,得到了可以先拍照再選擇虛化區域的效果。可以說是相當驚艷了。

無處不在的 AI 應用

為了用機器學習帶來更好的用使用者體驗,蘋果已經做出了很多嘗試。比如在 iPad 上利用機器學習辨識手寫的文本、在 iPhone 上透過學習和預測用戶的使用習慣來讓 iOS 更省電、在照片 app 裡自動創建的回憶相簿以及臉部辨識,  Siri 也利用機器學習帶來了更多貼心的功能和更流暢的對答。在今年的 WWDC 上我們也來看一些新的功能,比如:

智慧化的照片分享功能。當用戶在分享一張照片時,系統會把相關的照片都找出來,並且將照片中出現的人作為發送的推薦對象。然後,當對方收到照片後,系統會建議對方回覆手機中相關的照片。這樣一來,雙方就能很簡單地獲得在同一個活動或者事件中的完整照片。

 Siri Shortcuts 。每個應用都可以將一些快捷功能提供給 Siri ,讓 Siri 以更智慧、更便捷、更符合用戶行為習慣的方式執行。例如,通過設定一句「I lost my keys」幫助尋找鑰匙的應用 Tile App 可以添加一個 Shortcuts 給 Siri 。然後當你說出這句話時, Siri 可以自動打開 Tile ,並且在 Siri 的界面直接調動尋找鑰匙這一功能,而無需去到應用程式裡。

 Siri Suggestion 。 Siri Suggestion 更加有智慧,其能夠根據你的使用行為來預測你將要做的事情,並且在相應的時間給出你建議。例如,你的行程裡有一個聚會安排,但是 Siri 透過定位發現,聚會時間快到了你還離聚會地點很遠, Siri 就會跳出一個通知的消息,向你的朋友發訊息說你會晚一點到。

AR

由於在 WWDC 2018 上,蘋果已經發表了 ARKit 2.0 ,這次大會 AR 雖然佔據了一定的時間,但是並沒有什麼大消息,主要是軟硬體的升級。

 Schiller 曾說, iPhone X 是第一款專為 AR 打造的手機,鏡頭專門為 AR 而校準,刷新率達到 60 fps ,全新的陀螺儀和加速計,以及準確的動作追蹤。這一切都依賴於 A11 晶片的 CPU 、 GPU 和 ISP 即時光照, A12 當然更進一步支援 AR 。我們已經知道, ARKit 2 能夠更精準地進行垂直和水平面檢測,支援多玩家操作,新的空間測繪能力可以把 3D 物體放到真實場景裡看到效果。

換個姿勢看,蘋果發布會全是AI

這次,最驚豔的或許是 Directive Games 團隊帶來了多人聯機 AR 遊戲《Galaga AR》, 在 WWDC  上,蘋果展示了多人樂高遊戲,內容很簡單。而《Galaga AR》則是看起來十分炫酷的 AR 射擊遊戲,可以同時支援 4 個人,畫面的渲染和音效的呈現都上升了不止一個檔次。或許,我們在不久之後就能看到更多炫酷的 AR 聯機遊戲。

要想看到 AR 方面更重磅的消息,或許還得等到蘋果在 2021 年發表 AR 眼鏡。

AI 開發生態

有了這麼強的晶片,一向喜歡打造封閉式生態的蘋果自然也希望開發者在蘋果的平台上開發 AI 應用,將蘋果的 AI 能力落地。

在 WWDC2017 上,蘋果介紹了 Core ML 。 Core ML 是能在蘋果產品上使用的高性能機器學習框架,能幫助開發者快速地將多種機器學習模型融合到 App 中。 WWDC2018 ,升級的 Core ML 2 ,其可以使模型運行更快,處理速度提升 30% ,模型大小能減少 75% 。同時,蘋果還發表 Create ML ,支援電腦視覺、自然語言處理等機器學習任務模型開發,能直接在 Mac 上完成模型訓練。

 A12 晶片搭載全新的神經網路引擎 Neural Engine 採用 8 核架構,它每秒可以進行 5 兆次運算,是運行即時機器學習的利器。更好的消息是, A12 仿生晶片上的 Neural Engine 向第三方開發者開放,可以透過蘋果的機器學習框架 Core ML 來存取, Core ML 的運行速度將能提升 9 倍,應用程序的啟動速度提高 30%  ,功耗只是原來的十分之一。

這樣,開發者可以用 Core ML 來運行更複雜的 AI 模型,且能運行更快更流程。

小結

 AI 時代,演算法的提升對算力提出了更高要求。蘋果雖然沒有高喊 AI 的口號,但是 iPhone 顯然是目前最領先的 AI 手機, Face ID 的成功是蘋果軟體、演算法與全新 AI 晶片無縫融合的勝利。目前,蘋果的 7nm 製造工藝的 A12 仿生晶片配合上神經網路引擎已經成為行動終端的最強晶片。蘋果還透過 Core ML 和 Create ML 等機器學習工具,建立起 AI 開發者生態,將自己的 AI 能力開放給上千萬蘋果開發者,為 iPhone 開發更多的 AI 應用。蘋果在 AI 軟硬體佈局上,不知道又已經領先多少年。

延伸閱讀:

【蘋果 2018 秋季發表】A12 全新晶片 3 款 iPhone XS、iPhone XS MAX、iPhone XR 搶先 速報

玻璃心碎?中國官媒怒批 iPhone 發表會標示「Taiwan」

 

歡迎加入「Inside」Line 官方帳號,關注最新創業、科技、網路、工作訊息

好友人數

相關文章

評論