立志成為物聯網中樞,亞馬遜 Echo 的開發秘辛

作為亞馬遜打入智慧家居並佔據入口地位的標誌產品,Echo 的研發歷程一波三折。本文作者採訪內部一線人員,得到 Echo 問世幕後消息:亞馬遜最初瞄準 AR,不成後轉做聲控喇叭,Fire Phone 的失敗讓這款產品成了亞馬遜語音控制的出口
評論
評論

原文來自 Bloomberg.com ,作者 Joshua Brustein ,新智元(微信公眾號 AI_era)米粒 翻譯,Inside 獲授權轉載。

作為亞馬遜打入智慧家居並佔據入口地位的標誌產品, Echo 的研發歷程一波三折。本文作者採訪內部一線人員,得到 Echo 問世幕後消息:亞馬遜最初瞄準 AR,不成後轉做聲控喇叭,Fire Phone 的失敗讓這款產品成了亞馬遜語音控制的出口,出貨時間一延再延,偶然之下被定位成智慧家居入口型產品,最後關頭做出 5 大改變。文中能看到亞馬遜產品研發流程、員工待遇,還有傑夫 ·貝佐斯其人其心的剪影。 告訴傑夫 ·貝佐斯( Jeff Bezos)他有錯是件恐怖的事情。2014 年秋天,亞馬遜全新語音控制喇叭的開發團隊認為,他們需要去跟 CEO 好好談一談。喇叭的發佈迫近,大部分事情準備就緒。裝置外觀看起來很不錯,聲音識別軟體也有了飛速提升,連出貨的箱子都已設計並組裝好。但是,有個懸而未決的問題,那就是印在盒子上的名字:Amazon Flash。

據兩位亞馬遜前員工所述,在亞馬遜硬體部門 126 實驗室工作的很多人都不喜歡 Amazon Flash 這個名字。然而,貝佐斯十分鍾愛這個名字。此外,還存在另一個顧慮:這款裝置的核心功能是通過「喚醒詞」開啓語音指令,「 Alexa」是兩個候選詞的其中之一。貝佐斯卻認為最好的喚醒詞應該是「Amazon」,而這就帶來了問題,因為人們太常說這個詞了。126 實驗室達成的共識是,這個專案有可能正朝著災難性的方向急速發展:喇叭會在聽到電視中亞馬遜的廣告後便自行啓動,然後開始隨機在網上購物。

一般情況下, 126 實驗室的工程師與產品經理會在平息歧見之後才找貝佐斯會談,而不是一起告訴老闆他們認為老闆想要的是什麼。據一位前員工所述:「我們花費了很多時間努力揣測傑夫想要做什麼或說什麼,拼命分析他在會議上的發言,想從字裡行間讀出他的想法,這為我們帶來了很多額外的工作量。」

把事情變得更糟糕的是 126 實驗室那個夏天的整體氣氛。亞馬遜在 2014 年 7 月發佈了與 iPhone 競爭的 Fire Phone。在喇叭研發的最後衝刺階段,Fire Phone 一敗塗地,整個實驗室那段日子舉步維艱。員工要麼轉到新的專案中,要麼辭職,這感覺就像 126 實驗室跌到了谷底。

在喇叭裝好準備出貨的幾周前,反對者找貝佐斯攤牌。最後貝佐斯願意做出改變:這個設備改稱為 Echo,喚醒詞是「Alexa」。用戶之後可以根據自己喜好把喚醒詞改為 Echo 或 Amazon。Amazon Flash 的包裝盒被銷毀,首批擴音器在 2015 年 11 月份出貨。

在一個滿是長方形觸控螢幕構成的硬體市場, Echo 確實與眾不同。這款喇叭是一個沒有螢幕的圓柱體,高約 9.25 英吋(約 23.5 公分),直徑 3.27 英吋(約 8.35 公分)。它能夠播放音樂,回答一些基本的居家問題,例如一茶杯等於幾茶匙。與 Echo 互動的唯一方法是與它交談,它也隨時待機等候喚醒詞。

Echo 一經推出,就有批判者跳出來取笑亞馬遜。有人稱它為無用的噱頭;另一些人則指出這是亞馬遜「喬治 ·歐威爾傾向」的證據。緊接著,一些奇怪的事情發生了:人們開始喜歡上 Echo。亞馬遜從來沒有披露過有關該產品銷量的數據,但是 2016 年 4 月 Consumer Intelligence Research Partners 發佈的一份報告指出,亞馬遜 Echo 的銷量已經了超過 300 萬台,其中有 100 萬銷售是在 2015 年聖誕節假期間完成的。約有 3.5 萬人在亞馬遜網站為這款擴音器打分數,評分有 4.5星之高,滿分為 5 星(注:新智元編譯這篇文章時查看評分為 4.4 星)。

對於亞馬遜而言,更重要的或許是有幾十個獨立開發商都在編寫可供 Echo 語音控制使用的 a pp。用戶可以說一聲 Alexa 來關燈,詢問它自己汽車還剩多少汽油,或者預訂披薩。考慮到亞馬遜在研發 Echo 時其語音控制與蘋果及 Google 之間的差距,這就更令人吃驚了。起初 Echo 看起來可能只是一個多餘的玩具,但是現在看來這成了亞馬遜進軍人與電腦和網路交互入口的一種方式。

「我們想成為一家大公司,同時也是一家發明工廠」,貝佐斯 2016 年 4 月在一封給投資者的信中這麼寫道。 Echo 展現了亞馬遜實現其目標後所發生的事情。貝佐斯拒絕接受有關 Echo 開發過程的採訪,但是 10 位亞馬遜的現員工及前員工同意接受訪談,鑒於他們沒有獲得公司的授權,大多數以匿名形式進行。接下來就是亞馬遜開發 Echo 的真實故事。

佈局 6 年的專利戰

亞馬遜在 2004 年設立 126 實驗室來打造 Kindle 電子閱讀器。實驗室名字的由來參考了字母表, 1表示字母 A,26 表示字母 Z。實驗室的人有時候把 Kindle 叫做專案 A。Fire Phone是專案 B。Echo——作為專案 D——始於 2011 年。在專案高峰期,西雅圖、舊金山灣區及麻州劍橋市,有幾百名員工為專案 D 效力。

Echo 的構思是專案 C 的衍生,許多 Echo的早期員工都來自專案 C。儘管這個專案已經停止,但亞馬遜十分小心地讓有關消息保持機密。不過,可以從 126 實驗室工程師所申請的專利中對專案 C 略知一二。

首次行動是在 2010 年 12 月 21 日至 23 日之間出現的。 126 實驗室的員工在此期間申請了 5 項標題包含「擴增實境」一詞的專利。擴增實境 ——把類似全息影像的展示投影到現實世界中,已經是當時的一個流行詞語。一家電商公司不大可能成為該領域的標桿。但是,亞馬遜的專利申請向我們展示了亞馬遜早在 6 年之前便開始追尋一個願景,這個願景遠遠超出現今市面上的任何商品。

其中一項最初的專利申請描述了一個可以顯示擴增實境圖像的設備,人可以與這些圖像進行互動;另一項則是在人們鼓掌、吹口哨、唱歌或說話時候,對人的動作與反應進行追蹤的設備。總體來看,亞馬遜在這段時間所申請的專利都描繪了智慧家居的願景,虛擬顯示器跟著人從一個房間走到另一房間,根據語音指令和肢體語言為人提供相應的一系列服務。貝佐斯自己也是此期間申請的兩項專利的發明者,都跟語音控制或擴增實境有關。

亞馬遜並沒有參與原始專利申請, Rawles 有限責任公司是這些專利的受讓人,也就是擁有專利的機構。 Rawles 恰好是在亞馬遜開始提交有關擴增實境專利申請的兩周之前在特拉華州註冊成立的。自那年起, 126 實驗室員工提出了數十項以 Rawles 為受讓人的專利申請,全部都與擴增實境或語音控制有關。在 LinkedIn上沒有人把 Rawles 列為雇主,而 Rawles 公司與美國版權與商標局來往的信件均由華盛頓州的律師來處理,而亞馬遜的總部正好就在華盛頓州。

「毋庸置疑,我們想要低調做事情,」亞馬遜設備高級副總裁 Dave Limp 說:「除非產品問市,能從中獲益的只有競爭對手,或許還有媒體。」

用 Rawles 做專利掩護並沒有把保密工作做得很徹底,但這確實讓它更難被察覺。這樣的策略似乎起了作用。儘管圍繞著亞馬遜智慧手機及機頂盒研發進度的猜測早在這些專案開始前幾年已經有了,但亞馬遜以擴增實境為核心的智慧家居野心仍不為人所知。 2015 年 11 月, Rawles 把 106 項專利轉到亞馬遜名下。一個月之後,美國版權與標籤局批准了其中一項專利,引發了媒體一小輪的關注。那時候,虛擬現實專案已破冰而出, Echo 已上市。

整合購物的每一個環節

一些曾經在專案 C 工作的員工感嘆,專案 C 的失敗是亞馬遜雄心限縮的訊號;其他人則說,亞馬遜只是意識到是時候放棄一些對處於全盛期的公司而言太過愚蠢的想法。據稱,直到 Fire Phone 一敗塗地導致 126 實驗室的管理層質疑其領導大型專案能力的時候,專案 C 才徹底終止。但是 Echo 早在此之前就脫離出來,作為獨立專案運作,其目標是開發一款不會太過科幻的商品。

按照最初的設想, Echo 要比現存的喇叭更簡單、更便宜。據效力於該專案的一位員工回憶,公司預計該裝置的生產價是 17 美元,售價為 50 美元。現在 Echo 的成本是 180美元,如果把包裝、運輸及市場推廣等費用計算在內,市場分析人士認為亞馬遜每賣出一台 Echo 都是在虧本。亞馬遜公司拒絕就此發表評論。

當時,人們還不清楚這款擴音器的主要用途為何。當然,它可以用來播放音樂,但是除此之外,人們為何想要一個可以對話的擴音器呢?貝佐斯有很多的想法。「該設備的功能幾乎是一個非理性的預期,」據一位當時在 126 實驗室工作的人所述:「傑夫有一個願景,他想要整合購物體驗的每一個環節。」

亞馬遜聘請了幾位曾經在語音識別公司 Nuance 工作過的人員,也收購了兩家專門從事語音識別的新創公司 Yap 及 Evi。亞馬遜的工程師全身心投入開發一個能夠和 Google Now 或蘋果 Siri 相媲美的語音識別系統,考慮到這兩家公司已經取得的成就,這實在是一個艱巨的任務。

當亞馬遜的工程師開始製作這款擴音器的時候,他們立馬就意識到該裝置需要比預期更強的處理能力。他們拋棄了微型控制器,一種用於控制設備的簡單運算裝置(例如遙控器),改用能夠處理更多複雜任務的微型處理器。進行了這些根本性的改變之後,實驗室的負責人還是深信擴音器已經做好上市準備,在連續 3 年的時間裡,這款產品的預期送貨時間都在 6個月之內。 50 美元的定價變得越來越勉強。

效力於 126 實驗室不同專案的員工對其他正在進行的專案的情況並不瞭解,因此, Echo 團隊有數年時間並不清楚其他實驗室人員正在開發一款電話,其他團隊情況亦是如此。 2014 年 6 月,當貝佐斯推出 Fire Phone 的時候,擴音器專案進展十分順利。但 Fire Phone 的失敗讓 126 實驗室的一切偏離了原有的軌道。

亞馬遜對於 Fire Phone 的官方說法是,偶爾跌倒也是工作的一部分。在他最近給投資者的信中,貝佐斯把此次失敗看作是發明不可分割的一部分。 Limp 表示, Kindle 與 Fire TV 受歡迎是團隊的慰藉。他說:「看到產品受客戶預料之外的好評與產品不受待見相比當然有很大差距。」

曾經在那個時候效力於 126 實驗的人把那個時期描述為極其痛苦的時刻,完全是對該部門集體自信心的摧殘。亞馬遜並沒有立即解雇為 Fire Phone 效力的員工。取而代之的是一小部分管理人員空降 Echo 團隊,這些人對擴音器有著不同的看法,懷著不同的熱情。這激怒了一部分從開始就一直參與該專案的員工。此外,這款喇叭身負挽回亞馬遜的聲譽的重擔,而這也構成了壓力。更糟糕的是,所有的事件使整個實驗室質疑四起:或許亞馬遜確實無法生產理想中的高級消費產品。

最後關頭 5 大改變

Echo 在最後關頭經歷了幾次大的關鍵改變。這款喇叭必須要擁有在同一時間發聲與接聽指令的功能,這對工程師而言一直是個問題,如果音樂聲音太大,掩蓋了人的聲音怎麼辦?研發初期,工程師設計了一些外觀像冰球一樣的小型樣品,可以放在房間各處,在用戶離主喇叭太遠的時候接收指令。實驗室的負責人把這個想法置於一邊,而把重點放在主要設備的研發。但是,這個想法在近期變身成為了 Echo Dot。亞馬遜於 2016 年 3 月發佈了 Echo Dot, 該產品目前以限量形式發售。

echo dot
▲ Amazon Dot (Photo Credit: Guillermo Fernandes)

在 2014 年秋天,有關於 Echo 自身聽力是否足夠仍然存在分歧。除了喇叭本身的聲音控制輸入模式以外,貝佐斯及其他高層主管堅決反對使用任何其他形式的輸入模式,他們將其視為作弊行為。一些工程師卻不這麼認為,他們力推遙控器,以便人們可以在房間的任何角落進行語音輸入。好在亞馬遜已經為 Fire TV 做了一款遙控器。雙方最終達成共識,第一批喇叭會配置遙控器。之後工程師收集了關於人們使用頻率的數據,並對產品做出了調整。顯而易見,這種擔心似乎是多餘了。用戶使用 Echo 時幾乎從來沒有使用過遙控器,因此,在之後的配送中原裝不再附有遙控器。

2014 年年末以前, 126 實驗室都沒有關心過要把 Echo 與其他公司生產的聯網功能電燈泡與溫度控制裝置連接。有位工程師鬧著玩,把喇叭當作一部串流媒體電視設備的聲音控制系統。據某位與貝佐斯直接共事的員工所述,這如同給了他當頭棒喝。那人說,貝佐斯越來越中意這個想法,而且很積極地推廣它。亞馬遜現在對 Echo 的願景很大程度上依賴於這個喇叭作為所謂智慧家居的中樞。 Limp 開玩笑說,讓躍躍欲試的開發人員寫程式,用 Echo 語音控制來沖馬桶只是早晚的問題。

許多曾經參於開發 Echo 的人已經不在亞馬遜工作。他們離開的原因各式各樣:做完某個大專案後的完結感;競爭對手高薪挖角,或開始自己嘗試製作一些東西;長期工作後的倦怠;多年來內部政治鬥爭的痛苦。接受採訪的前員工對於在亞馬遜工作是不是很殘酷這一點沒有一個閃爍其詞。當被問及參與例如 Echo 產品工作是否真的「有趣」,某位前員工嘲笑說,沒有人會用「有趣」形容亞馬遜。

Echo 的成功正吸引著代替這些離職員工的人。 2016 年 2 月,亞馬遜在總部舉行了公開徵才會。數百名程式設計師與工程師出席 ——他們之中很多人來自微軟。他們聽取了亞馬遜高管有關公司未來發展的宏大計劃,將亞馬遜的語音控制喇叭作為連接所有市面上已有和將有聯網功能設備的中心。「現在是讓智慧家居成為現實的時候了,」 Alexa 智慧家居總監 Charlie Kindel 告訴與會者。

手機之後的下一個平台

在開發了 Echo 後,亞馬遜已想出了如何透過其他設備與服務來加入客戶的互動,而一部分歸因於時機。科技行業早已在尋找手機之後下一個大平台。目前對一些語音控制與人工智慧相結合的專案還沒有出現大規模投資。蘋果、 Google 及微軟均擁有屬於自己的虛擬助手,他們設計虛擬助手的目的是為了讓智慧手機運作地更好。但 Echo 與過去這些案例有很大的差異。

在某種程度上來說, Echo 的成功是 Fire Phone 失敗的一個結果。亞馬遜扼殺了智慧手機專案,它在語音控制上的努力注定要放在其他方面。雖然智慧手機已被吹捧為帶來方便的巔峰之作,一邊拿出手機點開某個 a pp 查詢天氣,一邊扣上襯衫扣子,跟在房間裡喊一聲相比,工作量其實還挺大的。

Alexa 有超過 500 項技能 ——你可以透過這款喇叭來查詢銀行帳戶餘額、播放 Pandora 電台,或發出你孩子喜歡的動物叫聲。公司存有一個內部記錄,上面列有客戶提出的新增操作建議,根據受歡迎程度排序來確認實行順序。

亞馬遜下一步大的任務是要開始嘗試提供組合服務的新路線, Forrester Research 的分析師 Julie Ask 表示。她說,能夠告訴 Echo 去 Uber 叫車很有趣,但不是必需。「 5 年後,我的 Echo 會說,嗨,現在該去機場了。需要我幫你叫輛車嗎?我會說,好,」她這樣說:「這就是現實與希望之間的差距。」

作為一家公司,亞馬遜更傾向面對這些挑戰,而不是退回去解決 Echo 開發過程中那些沒有解決的問題。 Limp 似乎更願意大略描述 Echo 的開發過程,但談話中涉及具體時總會閃爍其詞。對他而言,整個開發過程最顯著的一步就是減少了延遲時間,也就是你向 Echo 提問之後,它作出反應的時間間隔,從約 9 秒縮短到 1.5 秒。他聲稱已經不記得有關喇叭命名焦慮的任何細節,唯一記得的是最終大家達成了共識。

他說:「我向你保證,傑夫喜歡 Echo 這個名字。」

歡迎加入「Inside」Line 官方帳號,關注最新創業、科技、網路、工作訊息

好友人數