百度最強大腦在想什麼?——專訪百度首席科學家 Andrew Ng

Andrew 身上的有著史丹佛教授,Google 大腦創始人,百度首席科學家等等各種光環,但是在光環的背後,我看到是其實是一個親切,謙遜,有著篤定信念的學者,一個甚為可愛的丈夫,總是能保持著對未知事物的好奇心。
評論
評論

本文轉自合作媒體 36 氪 〈 百度最強大腦在想什麼?——專訪百度首席科學家 Andrew Ng

編者按:在去採訪 Andrew 的路上,心裡特別的沒底氣。總擔心自己無法和學術高智商怪獸級別的人物順暢溝通,在前一天晚上還嘗試看了一遍 Andrew 關於 COTS HPC 系統論文 ... 的摘要部分。但另一方面又有種異樣的親切感,終於可以在 Coursera 教學影片外,與現實生活中的 Prof. Ng 交流。

Andrew 身上的有著史丹佛教授,Google 大腦創始人,百度首席科學家等等各種光環,但是在光環的背後,我看到是其實是一個親切,謙遜,有著篤定信念的學者,一個甚為可愛的丈夫。Andrew 總是能保持著對未知事物的好奇心,在採訪前拿著我的米 3 把玩了很久;Andrew 講話聲音不大,給人娓娓道來的平靜感;下面,我們就來和 Andrew 一起,聊聊他對線上教育的願景,聊聊他作為百度首席科學家,對未來大數據和深度學習的看法。

02

36 氪: Coursera 如今是線上教育全球性的品牌,超過 700 萬的註冊使用者和 12 種語言的課程教學。有著科學 / 工程背景的人都傾向於規模化地去解決一個問題。所以當年成立 Coursera 的使命是為了更好的規模化地提供線上教育體驗(scale up online education experience),還是要通過科技改變線下教育的現狀呢(shake up the status quo of offline education)?

Andrew:Coursera 成立的初衷並不是為了改變線下教育的現狀,而是為了解決高等教育的延續性的問題。從 2007 年開始,我和我的團隊成員都在嘗試不同的線上教育體驗,譬如早期的 OpenClassroom。我們一直想要做的都是可以讓所有人都獲得免費的高等教育資源,但是並不是要取代線下教育。線下教育可以有很好的及時交互(instant interaction),線上教育更多的是點播式的(on demand)。線下教育對學生的深度理解和啟發是線上教育無法取代的,線上教育的靈活性也是線下教育無法取代的。所以二者更多的是一種互補關係而非競爭關係,我們的團隊也從來沒有考慮過要改變甚至取代線下教育體驗。

36 氪:但是我們注意到了 Rick 作為耶魯大學任期最長的校長加盟 Coursera,人們不可避免地會聯想到,這是不是 Coursera 要向傳統高等教育市場進軍一個信號?畢竟如今美國社會最需要顛覆的,一個是醫療市場,另一個就是教育市場。如今美國高等教育平均學費(私立大學)約 4.5 萬一年,基本和美國中產家庭年收入相當。在高昂的學費壓力下,顛覆傳統高等教育難道不是 Coursera 未來的方向嗎?

Andrew:顛覆傳統高等教育並不是我們的目的。首先,大學本科的教育我個人覺得非常重要,而且是線上教育無法取代的,至少現在的技術還沒有達到那個程度。假設你被加州理工大學錄取,同時加州理工提供本科線上教育,你在煩惱選擇哪一個,我會毫無疑問建議你去傳統的線下大學教育而不是線上。其次,我們的定位不是 18 到 21 歲的目標人群,我們要做的是解決高等教育延續性的問題。Coursera 的平均使用者年齡是 35 歲,並且 75% 的使用者已經擁有學士學位。我們認為高等基礎教育是無法取代的,在有了線下高等教育基礎後,對於那些需要繼續學習或者擴展知識面的專業人士,Coursera 上的課程才是更好的選擇。所以我們更多定位是在高等再教育或者研究生課程,因此在 Coursera 上的課程一般專業性的要求都相對要高。我們這樣做的目的是,對於所有的像你和我這樣的職業從業者,我們需要繼續學習保持競爭力,但是我們沒有整塊的時間或者條件去大學課堂進行再教育,這個時候 Coursera 就是一個很好的選擇。

36 氪:如今有了 Rick 的加入,Andrew 你會繼續為 Coursera 發展添磚加瓦嗎?

Andrew:那是當然的。首先我成立了 Coursera,出於一個很簡單的想法。而且我在 Coursera 上教課,我是 Coursera 上 800 多位教授的其中一員。我比任何人都希望未來 Cousera 能做的更好,未來我也會不遺餘力地為 Coursera 的發展做貢獻的。

36 氪:能和我們聊聊對矽谷最近幾年炙手可熱的大數據浪潮有什麼看法麼?「大數據」是在 2011 年之後開始有了指數增長的關注度,我甚至覺得這個標籤已經是被過度濫用了,因為大數據太泛且太不明確(too broad and too undefined)。有無數公司有了自己的 Hadoop 集群,就號稱自己是大數據企業,或者隨便一個什麼和機器學習沾邊的產品,都號稱自己是大數據產品,你對這個「大數據」現象怎麼看?你覺得真正的大數據產品應該是如何定義呢?

03

上圖為 Big Data 在 Google 的搜尋熱度趨勢

Andrew:「大數據」是在兩種趨勢的發展下催生的產物。第一個趨勢隨著我們進入數位化社會,我們越來越多的行為是在數位世界中進行的,隨之而來是大量數據的產生,特別是由人們行為產生的機器數據(Machine generated data as a result of human behavior)。第二個趨勢是數據儲存以及計算的成本降低讓我們有能力去儲存和處理這些數據。百度在北京的大數據實驗室做的就是如何能在同一時間計算 / 處理更多的數據量,並且使用這些數據去做更好的預測。我認為所有可以有效利用這種海量數據進行預測和功能優化的產品,都是大數據產品。

36 氪:很多人說到大數據都會自動和 Hadoop 聯繫起來,但是 Hadoop 只是大數據基礎架構的一種(infrastructure)。在大數據的應用層面上你認為未來可能的突破點會有哪些呢?

Andrew:我們現在在百度的策略,是先把基礎建設以及演算法層面的技術難點攻破,然後再去考慮有什麼可以產品化的應用。產品不是難點,技術瓶頸一旦突破產品化是分分鐘鐘的事情。有許多商業化的應用,譬如電子商務裡的圖像識別,都是因為技術層面的精準度達不到要求而無法很好的進行應用。雖然我們在探索一些可能可以產品化的應用,但是我們現在沒有任何可以對外公佈的產品。譬如圖像識別,語音識別,深度學習和人工智慧,這些都是基礎層面的技術需要我們進一步去加強和改進,只有基礎層面的技術成熟了之後,我們才能進行應用層面的選擇和開發。譬如當年我在 Google Brain,我們團隊也是利用我們的深度學習技術大大改善了 Google Now 語音識別的表現。其他應用還有譬如 Google Keep,這些都是產品化的例子。

36 氪:關於人工智慧,許多人都覺得是一門非常深奧且科幻的學科。我很好奇你當年是如何選擇了人工智慧這個研究方向,因為很有可能這個領域在你有生之年都沒有重大突破,也許在 50 年後這個領域和你設想的 1% 都沒有達到,那麼是什麼動力驅動你在人工智慧領域不斷前行呢?

Andrew:其實我的想法很簡單,就是如果能讓電腦聰明些,那麼人類社會的潛力是無窮大的。人工智慧其實早已在我們日常生活中有了廣泛的應用,不是只有科幻電影裡的那些才叫人工智慧。譬如最簡單的數位相機的笑臉捕捉,那個就是人工智慧。還有電子商務裡的推薦引擎,那個也是人工智慧。還有電子郵件,如果沒有 spam filter,估計電子郵件完全就成了垃圾信箱,這也是人工智慧的功勞。這些都是讓電腦變的更聰明,從而改變人類生活的例子。還有許多應用的現階段瓶頸就是人工智慧,譬如農業上的自動化收割,我要摘櫻桃,怎麼分辨好的和不好的?這個就是電腦視覺可以解決的問題。但是現在人工智慧還有很長的路要走才能達到實現這些應用的高度。我早年花了很大的精力在解決人工智慧硬件層面的架構問題,現在是時候進一步提高技術的可用性了。

36 氪:我們很多人都想知道,為什麼是百度。矽谷這麼多企業,為什麼最終選擇了百度呢?

Andrew:矽谷確實有很多在這個領域做的很好的企業,但是百度的優勢不僅僅是在於他的資源,技術側重點,更多是在於它的強大的執行力(Baidu is unusual in different aspects, and it's not just its resources, focus, but also the nimbleness to excute)。百度作為一個如此大的企業,對於科技的強大執行力是讓我非常吃驚的。我在百度的好朋友余凱(余凱為百度深度學習研究院常務副院長),決定要在百度建 GPU 集群,執行速度快的出乎我的意料。這種執行力在許多大企業來說非常難得的。百度一個最大的優勢就在於,對於想法的快速迭代和產品化。我知道中國國內對百度,騰訊和阿里巴巴的評價,許多人覺得百度近幾年甚少創新。但是很多技術創新並不是使用者可見的,特別是對於人工智慧或者深度學習這種後端技術。某個演算法精準度提高了 1%,使用者不會有切身的體驗。百度的強項絕對是在於後端技術,這個是著眼未來 10 年,甚至 20 年的佈局,並非短期內的效益。科技這個東西很有意思,往往最好的技術都是不可見的(the best technology is always invisible)。如果有人說這幾年百度什麼都沒有做,那我看到的完全不是這樣。另外你要知道,核心技術是非常難,門檻非常高的一項資產,而且非常難被模仿複製或者超越,這些都是百度在技術端的優勢所在。我覺得我加入百度,能最好地位人工智慧事業做貢獻,百度有強大的執行力,技術支撐,以及人工智慧研究所需的大量數據和資本,綜合這些因素,百度是我最好的選擇。

(Andrew 這個時候看了看手錶,滿臉歉意的對著我說「I really have to take off at 6 o'clock. I have been late for home everyday and I promise my wife will be home early today」. 老婆大人在家等,果然是比什麼都重要啊!於是我們下面邊走邊閒聊了一下 Andrew 的婚後生活,經 Andrew 同意可以和大家一起分享~)

04

簡單介紹一下 Andrew 的妻子 Carol Reiley. Carol 是約翰·霍普金斯大學的醫學博士以及在讀電腦博士,研究方向是生物醫學方向的機器人應用。Andrew 結婚這事兒還上了 IEEE 主頁... "Robots Bring Couple Together"

36 氪:覺得已婚生活怎麼樣?我們都很好奇兩個電腦科學家在家裡都會討論什麼樣的話題。

Andrew:似乎從來沒有人問過我這個問題哈哈。我們的婚後生活很美好。很多人之前在我們約會的時候和我說,如果你已經有了一個很穩定的關係,結婚之後的生活不會有什麼改變。但我個人覺得不是這麼回事。我結婚以後,回到家見到 Carol,「這是我的妻子」,這種感覺非常溫暖。

36 氪:你們是更互補呢?還是更相似?你們在家是不是也繼續在討論機器學習的學術問題,感覺是一個非常學術的家庭呢。

05
上圖為 Carol Reiley 在 MAKE 雜誌的封面

Andrew:我們幾乎無所不談,學術性的,社會性的,各種話題。我們更多的是討論很多高層面的東西,譬如科技未來發展的趨勢,機器人應用策略等,實現細節不會怎麼聊。其實有時候很酷,我一回家發現 Carol 在家裡經常會弄些她做的小玩意,各種各樣瘋狂的機器人設備,或者在網上買的某個新型感應器,有些東西也讓我大開眼界。她有次還登上了 MAKE 雜誌的主頁,是個女超人的形象,把我樂壞了(上圖)。我們平時周末最好的休閒時光就是一起去一家安靜的咖啡館,在那裡閱讀,工作。「Carol is a wonderful woman」