智慧型眼鏡一戴 20 年:專訪 Google Glass 技術負責人 Thad Starner

評論
評論

Inside 合作媒體 36 氪編按:本文作者為王曦,36 氪特約撰稿人。王曦畢業於清華大學建築技術系,目前生活在美國。她非常喜歡科技與網路,還熱衷分享她在美國採訪到的人和事,大家可以關注她的微信公眾帳號「王曦訪談」。這次她專訪的是 Google Glass 技術負責人 Thad Starner 博士。

有關 Google Glass 的起源

Thad 在 MIT(麻省理工學院)讀大學的時候遇到了一個難題:如果上課認真記筆記,他就無法很好地理解教授的意思,因為記錄佔去了他所有的腦力;而如果不記筆記,只是認真聽課,他雖然能夠很好地跟上教授的思路,但是課後很容易就忘記了。Thad 嘗試過使用電腦記筆記,但是眼睛從黑板和電腦螢幕之間的不停的轉換讓他很快選擇了放棄。也就是在那個時候,Thad 開始琢磨是否可以有這樣一個互動界面:既不影響面對面的交流,又可以隨時隨地記錄,那一年是 1989 年。

01

1993 年,Thad 終於戴上了自己設計的第一代智慧型眼鏡:左眼如常,但是右眼看到的卻是顯示器,左手握著單手鍵盤輸入,然後還要斜背一個用於裝主機的包。自那以後, Thad 每一天無論去哪裡,無論幹什麼,他都會戴著智慧型眼鏡。據 Thad 介紹,這個單手鍵盤輸入是他的一個好朋友發明的,並因此創立了一個叫 Hand Key 的公司。Thad 說單手鍵盤輸入比通常的電腦鍵盤輸入更容易學會,且熟練以後單手打字的速度與電腦鍵盤打字速度是一樣的。

當我問起這是否意味著今後人們的打字習慣需要改變時,Thad 說:「手機已經改變了我們打字的習慣。人們總是覺得改變一個習慣很難,事實上並非如此。我們現在使用的智慧型手機是手勢控制加螢幕鍵盤。因此,只要可以得到方便,人們是願意改變的。目前的問題在於,真正使用行動智慧型裝置的人太少了。幾乎所有的智慧型裝置都是你需要停下來看著螢幕去使用(比如手機,你總是需要中斷談話,拿出手機來操作),而如果將來越來越多的人使用起真正的行動智慧型裝置,即你可以邊走路邊寫郵件,那麼這個單手鍵盤輸入很有可能會成為大家的選擇。」

在 1998 年舊金山的一個會議上,Thad 依舊戴著這套行頭,自然是享受著超高的回頭率。有兩個學生走過來和他打招呼:「Hey,我是 Larry Page,他是 Sergey Brin,我們是史丹佛大學的學生,你戴的是什麼東西?」是的,你沒有聽錯,這兩位史丹佛大學的學生在不久之後創立了 Google,。在那次會議上,Sergey 給 Thad 留下了聯繫方式。

時間一晃到了 2010 年,Google 正在大力推廣其 Android 系統,儘管 Thad 不知道 Sergey 當年的電子信箱是否還在使用,他還是給 Sergey 寫了封郵件。在郵件裡 Thad 說:「你們現在正在做 Android 系統和智慧型手機,你真的應該看看我們在學術領域做的可穿戴式運算技術。你為什麼不來一趟亞特蘭大,我給你看看我的眼鏡。」Sergey 回覆說,「不,請你來加州,來 Google 做講座。」Thad 後來才知道,他發郵件前的兩個月,Google 剛剛開始籌備智慧型眼鏡這個專案,因此這真是天賜的緣分。

我問 Thad 為什麼當時選擇了 Google 而不是蘋果,畢竟 2010 年應該是蘋果最強的時候。Thad 說事實上,他在蘋果的朋友聽說 Thad 給 Google 做了一個講座,便也邀請他去蘋果做了講座,準確的說是做了兩次講座,一次是關於智慧型手錶,一次是關於電腦手勢控制。所以 Google 和蘋果在相同的時間是得到了相同的訊息的(賈伯斯是 2011 年去世的,至於為什麼蘋果沒有對智慧型眼睛感興趣,請大家自行消化理解)。

02

我又問起 Thad 為什麼當初不自己創業生產智慧型眼鏡,Thad 說:「我有自己的公司啊,我現在就給你展示我們公司的產品。」這應該算是第二代智慧型眼鏡吧,專為研究人員生產的,當時大概賣幾千美元,圖中的眼鏡是 Thad 在 ebay 上花 500 美元買回來的。其實從這個智慧型眼鏡上,我們應該已經可以看出 Google Glass 的一些原型,比如左眼鏡片前的成像玻璃螢幕。Thad 說這個智慧型眼鏡的性能堪比一台電腦,當年他所有的筆記、會議記錄和郵件都是用這個眼鏡完成的。

目前的 Google Glass 是沒有鍵盤輸入的,所有的指令都是通過語

音下達。Thad 為自己的 Google Glass 配備了藍牙連接的單手鍵盤,不知道這個會不會是今後 Google Glass 改良的一個方向。

Thad 介紹說智慧型眼鏡的想法最早可以追溯到 60 年代。其實在 1945 年時,Vannevar Bush(二戰時期美國接觸的科學家,「曼哈

頓計劃」的提出者和執行人)就已經有了一個想法:在你的頭上放一個小的相機,它可以拍下你做的事情,然後它會將所有關於你的訊息儲存起來供你將來使用。

「要知道,那是在 1945 年,甚至還沒有硬件呢,Vannevar Bush 只是大概知道電腦即將誕生了。而當我在 90 年代開始做這個事情的時候,我希望可以給它贏得一個更加令人尊敬的名字,所以我加入了增強現實技術(Augment Reality),我讓你可以看到更多的東西,而不是替代你的視覺。93 年到 99 年,我在 MIT 做這個,後來在喬治亞理工繼續做這個。我們實驗室裡的人每天會花上好幾個小時戴智慧型眼鏡,所以我們可以非常了解這項技術。」

Thad 說他不是第一個產生智慧型眼鏡想法的人,但卻是第一個每天都戴著,一整天都戴著的人,他是最堅持的那個人。這讓我想起訪談前,專門負責 Thad 的媒體邀約的 Jason 給我講的一個小故事:Thad 每天都戴著各種奇怪的眼鏡,所以大家都習以為常了,以至於沒有注意到其實他戴著第一代的 Google Glass 很久了,而那個時候,所有的媒體都在各種諜報 Google Glass 到底長啥樣。

Thad 眼中的可穿戴式裝置

王曦:對今年的 CES 大會上展示的可穿戴式裝置有什麼評價嗎?

沒有什麼讓人感到特別驚喜的。其實我們最早就預測到第一個可穿戴式計算裝置是電子音樂播放器。我還記得那個時候我們向 Sony 音樂介紹說「我們可以將音樂壓縮到文件裡,這樣的可穿戴式裝置會比 Sony Discman 小很多,卻和 Sony Discman 擁有一樣棒的音質。而且儲存量每 18 個月會成長一倍,這樣用不了幾年,人們就可以擁有一個行動音樂館了,而且這個裝置會越來越小。你們真的應該做這個東西。」

而當年的 Sony 回答道「我們剛剛買下哥倫比亞唱片,我們考慮過做一個閃存的(flash-based)音樂播放器,但是這會產生盜版,所以我們不打算這樣做。」(後來的 iPod 證明,Sony 當年做了多麼錯誤的決定!)電子音樂播放器是第一代可穿戴式運算裝置,因為你不需要停下手頭的事情,所以它大大的增強了你的環境。接下來的就是藍牙測試集(Bluetooth Test Sets)。我們在 1997 年的第一屆可穿戴式計算大會上展示了導航地圖,如何做導航。這些東西現在都應用在了智慧型手機上,事實上,智慧型手機花了這麼長時間才出來,這真的是最讓人感到尷尬的。

(這個時候,Thad 的手機響了,他拿起手機看了半天,等重新回到我們的對話時,他忘記了剛剛說了什麼,於是他說「你看,如果在對話過程中拿出手機來看,這真的是一個非常大的干擾。而如果我使用智慧型眼鏡的話,我就可以隨時處理訊息,同時又不會影響我們之間的交流。」)

王曦:你對可穿戴式裝置的未來有什麼遠見?

事實上和是什麼裝置無關,重要的是它能做什麼。如果它能夠很聰明,那將很吸引人。比如說,它知道你在哪裡,正在做什麼,它會在你需要的時候提供正確的訊息。像 Google Now,它現在就可以根據 GPS 的訊息知道你在哪裡,然後它會根據交通狀況提醒你下一個會議的時間,所以應該像一個聰明的助手一樣。

它將觀察你每天都做了什麼,並且把你經常去的地方進行分類,很快它將能夠識別出哪裡是家,哪裡是商店,哪裡是辦公室。它會發現你每天都是從家去工作、然後再去超市、然後回家,你從來不會從家去超

市、再去辦公室、然後再回家。所以,它就會在你離開辦公室、上車之前提醒你去超市,以避免你開車上了高速錯過了超市。

03

我覺得智慧型手機最大的問題在於,你要把它放在口袋裡,所以它相當於聾的,半瞎的。而如果把裝置放在你的頭頂上,它就可以觀察你,然後得到很多有上下文的對話訊息,這樣它才能幫助你更多。像我這樣,在帽子上有一個相機。我們發現,其實人類的很多行為活動都是和手有關。舉個例子,如果我想識別出什麼是一本書,如果僅僅靠書的封皮是很難的,因為這也可能是一幅畫,相機怎麼會知道呢?但是,如果相機能夠看到你翻開書,並且一頁一頁在瀏覽,那麼它就可以識別出這是一本書。

同理,它將識別出什麼是杯子,什麼是刀和叉子,慢慢的,它將識別出什麼是吃飯,因為你會在每天差不多的時間做一系列一樣的動作,因此逐漸的,它將學會人類社會是什麼樣。然後,它將會更好地為你服務,它會明白如何服務於你,什麼事情對你來說是重要的。我們做過一個非常酷的實驗,我們給這個帽子做同樣的手勢 500 次,它自動學會了這個手勢是什麼意思。所以,你不需要教它,它會自己理解的,這真的太酷了,這個趨勢非常有意思。

王曦:這是一個智慧型帽子?!

它現在有點破了,原來這有一個大大的雷射。這個帽子更好看一些。瞧,這個更時尚些,我喜歡這個!這個手勢是黃色的意思。很酷的是,這個相機很高,所以它能夠看到我很多手部活動,從而自行掌握每個手勢的意思。

04

王曦:所以,你認為將來每個人都會有一個助理嘍?

當然!舉個例子,日本公司的 CEO 的助理都是很高級別的人,他們通過當助理來學習如何成為一個 CEO,當然,這個助理薪水很高。所以,如果電腦成為

我們的助理,這不是很棒嘛!

王曦:你覺得這個在未來 5 年或者 10 年會實現嗎?如果電腦可以做這麼多的事情,那我們人類還幹嘛呢?

這個很難估計,我認為可能會是很久以後。電腦的聰明和人類的聰明是不一樣的。電腦擅長回憶訊息,而人類擅長識別哪些訊息是好的。舉個例子,我要做一個報告,於是我讓電腦幫我提供相關的訊息,它會搜索我所有的筆記、郵件和程式,然後在我眼前的螢幕上提供所有相關的訊息,但卻無法很好地將這些訊息組織起來。但是,我只需要看一眼這些訊息,就可以馬上識別出哪些是有用的。

如果我問你,誰是你二年級的英文老師,你也許不記得了,但是你會記得你在二年級受過傷。所以,如果你問電腦這些訊息意味著什麼,它將不會回答。因此,人們需要的是智慧型的助手,你通過符號與他們連接,然後它們就可以成為你延伸的一部分。就像你戴著眼鏡一樣,你從來不會想著說我戴著眼鏡。或者,你騎自行車時,遇到紅燈會自然地剎車。我想要做的就是通過可穿戴式計算來延伸你的大腦。我們現在不需要背書,因為用 Google 就可以搜到書的內容。我們要讓智慧型裝置更加強大、更加獨立、更加聰明。

王曦:為了實現這些,目前最大的困難是什麼?

首先是電源,如何為裝置裡的晶片充電。另外就是我們說的路徑識別(Pattern Discovery)。如何識別你是怎麼行動的,怎麼交流的。人類最基本的行為單元非常不同,現在沒有人花時間來好好研究我們每一天最基本的行為單元。到底吃飯或者握手最基本的行為單元是什麼,手勢實際上和語言同等重要。我們正在做的就是建立發現人類基本行為組成單元的算法,然後你又是每天如何將這些行為單元組合起來行動的。這是一個長遠的計劃,因為我們需要演算法明白什麼構成了你,它又是如何讓你和這個世界交流的。

王曦:這就是你說的 Symbolic Intelligence 對嗎?

是的。

如何成為一名天才

我一直以來都對「你是如何發現自己喜歡做什麼的」和「是什麼成就了現在的你」這兩個問題感興趣,也是我在訪談中一定會問到的問題。當我問到 Thad 是如何這麼有創造力,如何成為天才時,他說了一個我從來沒有聽過的詞「filarious」。訪談後,我在 Google 上查了半天才知道這是一個俚語,即 fun(有趣)+hilarious(歡鬧)的意思。

你不怕別人認為你是一個傻子,很顯然,我不怕別人認為我是一個傻子(Thad 戴了 20 年形狀各異的眼鏡!)。有一句名言,我認為是 Linux Pauling(諾貝爾化學獎獲得者)的話,「有一個偉大的想法的最好的辦法,就是有很多想法。」你所需要做的就是不停的有想法,迅速地弄清楚它是否會失敗。真正的本事並非是想法,而是能夠評估想法,想出驗證它的方式,執行想法,這是最難的事情。這個東西,我弄了 20 年(Thad 指著自己戴的 Google Glass)。

把東西弄亂沒有關係,破壞了什麼東西也沒有關係,因為你會從中學到東西。探索這個世界沒有關係,變得 filarious 也沒有關係。有玩的意識非常重要。很多時候,你都是在幾十年之後才知道有些事情是非常重要的。讓你周圍充滿聰明的人,充滿同樣愛搞惡作劇的伙伴。真的,愛搞惡作劇就是你所需要的。我們很多的科學研究專案都是為了好玩,因為它聽起來酷極了。

12 歲的時候,我對電腦產生

了興趣。14 歲的時候,我決定要成為 MIT 的教授。29 歲的時候,我拿到了 MIT 職位,但是我決定留在喬治亞理工大學,因為這裡更好玩。


精選熱門好工作

遊戲美術 Game Artist

Orangenose Studio 易銘有限公司
臺北市.台灣

獎勵 NT$20,000

樂趣買 事業開發 Business Development(Rakuma)

台灣樂天市場
臺北市.台灣

獎勵 NT$20,000

客服督導/客服主管

VeryBuy非常勸敗
臺北市.台灣

獎勵 NT$20,000

評論