Google如何令人驚嘆的打造地圖服務?

評論
評論

(Photo by Jaap (@tjaap))

原文編譯自:theatlantic

在每張 Google 地圖的背後,都有一張肉眼不可見的地圖,正是這張隱藏地圖隱含著真實地理位置的邏輯:哪些地方不能左轉,哪些是高速公路匝道,限速要求和即時路況等等。正是這些數據讓 Google 為你提供導航成為可能。上週,Google 請我去參觀這張隱藏地圖背後的構建機制,這是 Google 首次向外界披露這項名為 Ground Truth 或者 GT(地面實況)的計劃到底是怎麼回事。

Google 是以搜尋引擎起家的,但是隨著行動網路時代的來臨,你在那兒搜尋的重要性,開始與你搜尋什麼不相上下。如果 Google 的使命是組織全世界的資訊,那麼最大的挑戰不是為網路設立目錄,而是將這個世界的物理訊息整合成可用的資訊系統。

「看看我們真實生活所處的離線世界,你就會發現很多訊息其實都是在線下的,網絡無法涵蓋一切,」Manik,Google 地圖的高級產品經理如是說,「我們希望能填補真實世界和網路世界的鴻溝,地圖就是其中的重要一環。」

Google 用於構建完美展示真實世界的地圖的辦公室其實很普通,像其他辦公室一樣,也有免費美食和健身娛樂,但是真說起來也只是山景城郊區的一棟挺矮的辦公樓而已。我在那兒見到了 Manik 和他的得力干將 Michael,前 NASA 工程師,他會把 20% 的工作時間花在 Google 火星項目上,此外還有一名叫 Nick 負責處理地圖數據的操作員。

Michael 給我詳細介紹了製作一個地圖的具體過程:首先你得從合作夥伴那兒獲得原始數據,然後通過工程處理將這些數據整理成合適的格式並同其他源頭獲得的數據進行整合,之後還需要一些列人工處理,最後才能生成一張高品質的地圖——遠勝過簡單拼湊所得的效果。

具體來講,首先是從美國審計局拿到最初的 TIGER 數據,如下圖:

 

乍看之下這些數據非常完美,但是如果你仔細看的話,會發現有些地方是與真實世界有差別的,我用紅圈標出了幾個地方:

 

 

撇開與衛星圖片比較之外,Google 還有其他的處理方法,比如同其他數據庫如美國地質調查局獲得的數據做比較。另外一個重要數據源則是 Google 的街景車,據稱街景車每兩週發佈的圖片數據要比 2006 年 Google 處理的數據總和還多。

讓搭載著訂制相機的街景車走遍全世界,這個主意值得大家致以敬意。目前 Google 的街景車已經行駛了 500 多萬英里,這些里程為地圖製作提供了兩類有價值的資訊:其中之一是街景車實地走過的路徑,這意味著到底那些路是走得通的;其二是拍攝的照片,透過它們,Google 可以利用算法分離出其中的交通信號,並將這些信息嵌入到 Google 地圖的底層中去。如此處理後,舊金山的某個鬧市區就成了這個樣子:

Google 街景的初衷並不是為了製作地圖,但是 Google 的地理團隊很快就意識到可以利用街景的數據來充實地圖。你可以把街景車想像成在網頁上搜尋字符的網路爬蟲,它們可以發現街道上的各種標誌和地址,幫助 Google 地圖更好的理解人類的交通系統。隨著電腦視覺和光學字符識別技術的發展,路上的每一個字符都會成為 Google 為現實世界製作的索引的一部分。

也許將來有一天電腦視覺可以直接將街景圖片完美轉化成地理上可理解的資訊,但現在依然需要人工進行很多處理,比如要判斷某個交叉口是否可以左轉,最好的辦法還是派人去看一眼,不管是實地駕駛觀測或者是通過街景車傳來的圖像進行判斷。

這一點與 Google 另一個偉大的產品 Google Translate 有相似之處,同樣看起來是機器的智慧,實則是人類智慧的集合。Google Translate 依賴海量的人類語言翻譯素材,之後通過算法將各種詞彙片語進行配對,相比起算法,海量的語言庫扮演著更關鍵的角色。

Google 地圖有著相似的策略,人類對路況訊息進行編碼,之後電腦就可以簡單的複製貼上。這也意味著地圖的製作需要大量的人工,據 Michael 稱,為一個國家編制地圖一般都要幾百個作業員。實際上你看到的每一張地圖都是經過很多人工處理的,每天 Google 地圖都得處理上千份用戶反饋報告,地圖團隊都會在數分鐘內進行對應的處理。

如果你認真想想為全世界提供如此詳實的地圖服務,標註出每個交叉口的行車方向,隨時對路況進行更正修改,就會發現這真不是隨便哪家公司就能做到的,你需要的遠不僅僅是幾個聰明的工程師,還需要對數據的掌控和處理,以及支持你做這項事業的決心和財力。Google 地圖最終展示給用戶的其實是人類的智慧,正是這類智慧才能讓 Google 的電腦告訴你從舊金山到波士頓最好走的路到底是哪條。

談到未來地圖時,我們也許會想起博爾赫斯式的同真實世界完美一致的地圖。既然我們已經有了真實世界,似乎再做一個一模一樣的地圖會是一個很奇怪的念頭。但是如果考慮下 Nathan 關於擴增實境的定義,你就會發現如他所言,每一寸真實的物理空間,都是被訊息滲透的。物理空間實質上也是訊息空間。我們每個人在腦中都有一個完美地圖,指導我們在現實中前行。Google 的策略就是將每個人的腦中地圖集合到一塊,處理成每人都可使用的形式。

MapMaker 這款產品清晰的解釋了 Google 的野心。通過 MapMaker,每個用戶都可以將自己世界裡的訊息添加到 Google 地圖中去。這也是一種將人類大腦中的訊息抓取到網路的方式,類似的競爭者還有 Open Street Map,也是通過群眾外包的方式來製作地圖。

隨著這個世界在線上線下都變得越來越後現代,Google 的地理數據正在成為它最寶貴的資產。不單單是因為這些地理數據本身,還在於這些數據能讓 Google 正在做的和已經做的事情更有價值。也許就像我一個朋友 Robin 所說:「我堅信地圖才是 Google 的核心資產。50 年內,Google 就會成為一家自動駕駛汽車公司(依靠的就是對這個世界真正的理解),哦對了,它應該還會留著搜索引擎吧。」

 

評論