Google AI 中國中心正式成立,負責人李佳:AI 需要「四步走」!

Google 中國開發者大會上備受關注的 AI 中心在北京成立,由李飛飛和 Google Cloud 研發負責人李佳博士​​共同領導,會上李佳進行了一段演講,介紹了她帶領的 Google 團隊近期的研究和技術產品!
評論
評論

本篇來自合作媒體 雷鋒網 ,INSIDE 經授權轉載。

12 月 13 日,Google 中國開發者大會 2017 在上海召開,多名 Google 工程師和重量級嘉賓登台演講,宣布了許多振奮人心的消息,美國工程師的中文演講也讓現場聽眾覺得親切有趣。

最令廣大 AI 研究和從業者感興趣的,是 Google Cloud 首席科學家李飛飛宣布 Google AI 中國中心在北京成立,並且也正是由李飛飛和她曾經的博士生、現在的 Google Cloud 研發負責人李佳共同領導 Google AI 中國中心的工作。Google Cloud  AI、Google Brain 以及 Google 的中國團隊的工作也將由李飛飛統籌。

在李飛飛的主會場演講結束後,李飛飛和李佳來到分會場,和受邀請參與面對面溝通活動的學生、教授、AI 從業人員以及媒體進行了更多溝通和交流。

李佳也在現場進行了一個小演講,介紹了她帶領的 Google 研發團隊近期的一些研發思路和技術產品,主要內容整理如下:

李佳:很高興在這裡見到大家,我叫李佳。我是 Google Cloud AI 的研發主管,自己也是一個開發者,今天想在這分享一下 AI 研究的一些心得和 Google Cloud 團隊研發的 AI 的一些應用。

在過去的幾天裡我花了很多的時間練習用中文說話。這是我第一次用中文演講,如果有很多的英文或者是說英文的單詞,請大家諒解。我一度曾經想放棄,想用英文來講,但是今天看到有這麼多的我們外國的友人,在很拼命的用中文來講,我感到非常的慚愧。練習到昨天我還發覺,大概我的演講裡面大概 70% 的部分還是英文的單詞,但是我希望今天能做的更好一點。

今天我想講這個的原因是,作為一個開發者,我自己覺得很幸運,可以參與一個想法到成為一個完成產品的過程,所以我今天在這裡想給大家分享這樣的一個歷程。希望有更多的人投身到這樣過程當中,能夠促成 AI 產品的產生。我把這個過程叫做 AI Journey(AI 歷程)。

它有幾個主要的組成部分。

首先,不管我們想要做任何的 AI 也好,它總是從問題本身開始,我們想要發覺、發現哪一個問題值得去解決,這就是第一步。

有了這個問題以後,我們就會去升級,去考慮用什麼樣的方式來表現這個問題,這就是第二步。

一旦有了我們的數據過後,我們可以在數據上面有很多很多的應用,有很多的算法的創新。

最後一步就是一旦我們有了很好的算法過後,我們怎樣把它變得更好,更準確。經過了這些過程,它就會成為一個很成熟的產品技術。

定義目標

這個 AI 的歷程通常是從最初的問題定義開始,比如圖像分類識別。如果想從這個圖裡面識別出有個毛線團,這個問題的表達形式有很多種,它的解決方案也有各種各樣的。

從 ImageNet 數據集發表以後,很多的研究者在它上面去運行他們的算法,很大推動了這個領域的發展。最近我們自己在上面也有一些小的嘗試。

可能在座的同學們、老師們,你們有一些人可能聽說過 Neural Architecture Search(神經網路結構搜尋),這個就是我們最早的一些嘗試。開始是由我們研究的一個算法,最近我們 Google Cloud 和 Google 的其他的一些團隊,也在這上面做了一些新的嘗試。這個是什麼樣的算法呢?它會嘗試搜索、組合不同的基礎網路結構,形成一個完整的網路。它的最終目的,是想讓機器自動生成神經網路。圖中是一個例子,我們怎麼樣生成在 ImageNet 和 CIFAR 上有良好表現的神經網路。

現在在我們最新的嘗試裡面,這種機器生成的算法已經是頂級的了。但我想提醒大家的是,雖然這是一個很激動人心的技術發展成果,但是,目前這種機器生成的模型只局限於某一個特定的問題,是端到端的一種解決方案。但是在現實生活中,或者對於現實當中的問題,會涉及到許許多多不同技術的共同應用。在這個例子裡面,數據都是收集好的,但是在很多的情況裡面我們是沒有辦法收集數據的,比如說罕見的疾病,還有自然災害當中發生的問題,很多的數據是非常難以收集的,或者是收集起來非常危險的。

收集數據

這裡就有一個例子,在自動駕駛技術中我們根本沒有辦法去訓練算法如何應對交通事故,或者比較罕見遇到的交通情況,因為沒有這樣的數據。這種情況是否能有替代做法呢?我想提下這個模擬器的技術。這樣我們可以自由生成各種各樣的數據,來表現這些複雜的情況。

另外一個有名的例子就是 AlphaGo 和很多很多的遊戲,當我們對遊戲的規則非常明確了之後,就可以讓算法自己生成許多數據,然後從生成的數據中學習。

這個技術經常被用在遷移學習裡面,我們可能在原有領域有很多數據,但很難在新的領域收集同樣多的數據;這是其中一個問題。還有很多其它問題,比如說我們在 Google Cloud 上面遇到的很多問題,它們通常是沒有已知的解決辦法的,它們也沒有辦法找到這樣大量的數據。

我們這裡要解決的是一個小數據的問題,不是大數據的問題。在這個過程中,遷移學習、模擬器技術都是非常值得去研究去探索的,在能夠真正的解決實際問題之前,能夠達到我們希望的能夠處理任何情況之前,先用這樣的技術讓模型快速成長。

我們同時也能挖掘出一個很大的寶藏,機器人技術。比如說用模擬器的方法解決機器人技術的問題。

我當時和我的同事一起去把 Gazebo 平台的代碼收集好,開放給大家來用。我們自己在上面做了一些探索,發現如果我們把大量的問題放在裡面,就算不是從直覺上能完美解決好的問題,只要能夠把問題和大規模計算、大規模仿真模擬進行結合的話,實際上它還是能得到非常好的效果的。

設計算法

我剛才談到一些有關模擬器生成數據的探索,實際上算法也對這個領域至關重要,其中包含了怎麼樣有效讓我們人指導機器來進行學習。當然,讓機器學習也還有各種不同的辦法。

我剛才談到了幾個比較小的例子,都有什麼樣的問題是值得我們去解決的。而數據中蘊含的價值很多、數據的來源和用途很廣,我們實際需要數據相關技術來解決的問題比剛才我談到的還要更廣泛。舉一些簡單的例子,我們在 flickr 數據的數據清洗上面還是取得了一些令人振奮的結果。但是在這樣的技術上面,我們有很多的問題需要去解決。我們最終需要考慮的是其中有什麼樣的人、他們在做一些什麼樣的事情、裡面還有怎麼樣的內容、從一個時間段到下一個時間段有哪些變化、這個變化怎麼產生的。實際上我們作為數據領域的研究者還沒有特別多關注和投入在這些方面。

我剛才談到了機器人方面的很多問題,另外一個大的方向是自然語言。大家看到有很多的好玩的聊天機器人,是一種為了好玩的、隨意的聊天。但是在我們人和人之間,我們聊天的雙方或者是多方是有不同的背景的,整個聊天的過程是有一個希望達成的目的的。對話的目的的理解、利用和算法更新現在都做得不多。所以很多問題,很多聊天的問題是有一個目標需要完成的,這樣才能讓機器和人類的交流更有價值。我們非常感興趣將來繼續探索這方面的問題。

形成整體解決方案

在 Google Cloud,我們有非常非常多的傳統的行業跟我們進行合作,我們在跟他們交流的過程或者溝通的過程,發覺有好多的問題,我們整個 AI 領域還沒有給予特別多的關注,比如說其中一個就是 AI 醫療。

我們知道醫療技術裡面,實際上有很多非常非常有意思的問題,比如說我們的醫生資源非常少,特別是中國,一個醫生一天看上百人的病人,我覺得這對醫生來說是非常繁重的勞動,而且病人也沒有得到足夠的關照。如果有更多的、足夠的時間去探討和理解他的疾病的話,應該會非常有幫助。在很多發展中國家,甚至都沒有很多的醫生來幫助這些病人解決問題。所以,我們想看看 AI 能怎麼樣幫助解決這些問題。

這裡我想給一個比較簡單的例子,我們自己在這上面做了一些小的、比較新的探索,實際上就是讓 AI 識別胸部 X 光片。

通常人類醫生做這個過程、判斷疾病的嚴重程度非常花時間,而且它對醫生的要求也非常高。假設我們如果有一個基於 AI 的 X 光疾病識別算法,就可以極大地減少人類醫生的工作量。但這裡也有一個悖論:一方面,我們想做這樣的 AI 去幫助醫生做一些判斷,幫助醫生對疾病形成更好、更深的理解;而通常現在的技術就是深度學習,如果我們要做這個問題的話,深度學習會需要大量的標註數據才能做出一些成果。這樣就回到了我們開始想要解決的問題:我們本來是想幫我們的人員減少他們的工作量,減少他們對數據的處理,結果我們做這些事情,反而要讓他們處理更多的數據。

我們這裡就開始在看怎麼樣去解決這個具體問題。通常來說,如果我們要去獲取這種標註數據,對做標註的醫生要求是非常高的。不過其實我們有很多的 X 光圖像都是帶有醫學的報告的,這些醫學的報告來自於以往積累的真實診療記錄。我們合作研究的醫院有十多萬張 X 光圖像,然而在這麼大量的圖像裡面只有小於一千張有這種帶邊界框的數據標註。

我們最近一段時間對這個問題進行了一些探討,去考慮如何用深度學習的方法來解決這個問題。中間我們的 Wang Chong 博士也是對這個專案的學習算法貢獻非常大,我們想的是怎麼用半監督學習,和這些小量的數據,用一個算法來極大地提高了這些少量數據的有效性。這樣的結果我們就可以不但有對這個疾病的類別的判定,同時還能給我們的一些建議,怎麼樣解決這個問題。

這是一個簡單的例子去怎麼看從我們如何去設計算法。在我們這個里面,我們還有做很多的嘗試,中間包括數據收集和總體解決方案的建立。我剛才介紹到對 AI 醫療的領域,我們整個團隊也是非常感興趣。因為有很多的產業的這種合作,所以我們也會用開放的態度積極參與。用 AI 改善人們的生活是我們非常關注的問題,我們想用 AI 來對相關行業做出更多的貢獻。

在中國我們有很多有意思的事情在計劃中或者是說已經在執行了,今天給大家介紹了一些我們近期做的技術和產品,給大家分享了一下我們在做的事情。之後的時間裡也希望 Google AI 中國中心的研究員們能和全中國的 AI 學生、專家、教授們都有更多的合作,合力解決更多尚未解決的問題。

謝謝大家!


上雲猶如太空探險之旅,iKala Cloud AIOps Services協助企業輕鬆穿梭多雲環境

人類從上個世紀積極探索外太空,為了將太空人送上天際必須克服各式挑戰,而現代企業要從「地端」飛向「雲端」,困難程度有過之而無不及。iKala Cloud AIOps Services 提供多項關鍵服務,幫助 IT 團隊輕鬆悠遊多雲環境。
評論
評論

探索外太空,曾經是國際間的科技競賽,近年 Tesla 創辦人馬斯克更準備把太空旅行當成商業服務,預計 2026 年要帶著人類登陸火星。完成一趟星際旅行,需仰賴嶄新的科技及跨科學精密計算,但你知道嗎?現代企業要從「地端」飛上「雲端」,其實挑戰程度不亞於飛向太空。

對企業資訊管理者來說,有限的 IT 資源無法應付繁重的維運項目,加上同時管理公私有雲架構更顯困難、資安管理複雜,例如需要人工執行過濾警示,各種大大小小挑戰不勝枚舉。換言之,企業想航行雲端,就像打造火箭需要龐大資源及人力。不過,現在有更輕鬆穿梭雲端的方式,就是使用雲端技術服務商 iKala 所提供的 AIOps Services(自動化雲端託管服務)

火箭升空前的全盤規劃:iKala AIOps 擬定系統架構規劃、教育訓練

完成一趟太空之旅,必須做足各種研究,例如精準計算飛行軌道、降落定位點、燃料耗用數、與地球通訊設定…等。

對沒有雲端架構經驗的企業來說,就如同當時的科學家,必須用土法煉鋼的方式檢查數據是否有誤。換言之,企業 IT 在升級之前,就需要有經驗的「雲端顧問」來釐清需求、協助規劃「升雲」之旅。而 iKala 就是企業的最佳雲端顧問,旗下 iKala Cloud AIOps Services 會搭配一位專責的技術客戶經理,協助企業提供即時的技術服務與專業建議。

究竟 IT 升級之前,iKala Cloud AIOps Services 有哪些服務?首先是「系統設計規劃」,涵蓋系統架構規劃書、系統上線/遷移計畫書,可因應客戶產業需求,提供對應的解決方案以及顧問服務。而越來越多企業會使用到 Google 的雲端資源,iKala 也有提供 Google 雲端平台訓練服務。

GCP 教育訓練課程多元,包含 GCP 基礎架構(網路設定規劃、權限控管、計算資源等)、大數據與機器學習(大數據分析 Pipeline、BigQuery、ML 模型訓練與應用)、軟體開發技術與流程(容器化、CI/CD、DevOps)等。因為 iKala 團隊取得 10 多項 Google 專業技術證照,才能在企業規劃雲端轉型的前期就一步到位,規劃出整體藍圖,提供更全面的解決方案建議。

火箭升空中的精密操作:iKala AIOps 輔助即時技術維運、資安管理

當火箭準備就緒、升空倒數之際便是決定這趟太空之旅能否成功的關鍵時刻。從太空人的行前訓練與身體檢查,到火箭的引擎測試完成,如果有靜電或一點火花都可能引發爆炸事故。光是在升空階段,太空總部就要有結構、熱控、姿態控制、資料處理、電能、遙傳指令、推進以及飛行軟體等龐大的系統工程師在旁待命。

換言之,企業 IT 移轉雲端過程就像火箭發射的當下,需要有專業、經驗足夠的工程師,才能即時協助企業順利上雲,甚至快速排除緊急的狀況。對此,iKala Cloud AIOps Services 提供兩大關鍵的幫助:技術維運、資訊安全管理。

iKala Cloud AIOps Services 的技術維運服務內容,提供 7 x 24 的 Help Desk,像是緊急 GCP 問題報修、產品使用技術諮詢;或是事故管理,如搭建監控系統、設定規劃告警政策、規劃日誌收集與留存。每月也會提供企業維運報告,報告書有營運效率檢討、流程優化、新服務項目、營運系統建議等。

至於資訊安全管理方面,除了基本的 GCP 專案權限控管掃描、應用程式 OWASP(Open Web Application Security Project)前 10 大項目資安弱點掃描,同時也針對近年相當受重視的 DDoS 防護,iKala 可協助企業導入 GCP 平台的 DDOS 防禦機制。iKala 掌握多年軟體開發和雲端管理經驗,可分享給客戶 DevOps、AI 第一手實務的作法與經驗。

火箭升空後啟動自動導航:iKala AIOps 提供 AI 自動化監控、帳務管理

當火箭成功升空後,太空人為了執行下一階段任務,這時候火箭就需要轉換成自動駕駛模式,或在探索其他星球時,出動機器人來協助執行人力無法負荷的任務,讓太空人專心處理更關鍵的工作。換言之,上雲後的 IT 架構就像升空後的火箭,應該減少 IT 人員的負擔,甚至不需浪費例行時間,就能夠快速掌握整體資訊系統的運作狀況。

不過要讓 IT 架構像火箭具備自動駕駛功能,勢必需要相當高的技術門檻,而 iKala Cloud AIOps Services 正好有相對應的服務。如此一來,IT 人員的生產力就能投入在更具商業價值的研發專案,讓 IT 部門轉型成可創造產值的單位,而非單純的後勤支援角色。

盤點 iKala Cloud AIOps Services 在此環節共有三大類服務。其中一項是 AI 自動化監控與通報服務,幫助 IT 成員主動監控系統,掌握是否有異常操作狀況。其二是帳務方面的管理,幫助企業產出雲端服務月用量帳務分析報告,針對軟體授權需求,整合出帳至  Marketplace 與第三方服務商,自動化做到 License 採購管理。

第三項則是針對服務級別協定(SLA)iKala Cloud AIOps Services 提供 24 x 7、5 x 8 兩種模式,在重大 GCP 服務異常中斷服務時,提供電話、e-mail 聯繫。而且每月會舉辦 1 次月會(以 on-site 或遠端視訊會議方式)提交書面報告。目前 iKala 的企業客戶服務超過 400 多家、涵蓋數 10 種產業,可說是企業成功上雲,最能安心託付的合作夥伴。 

事實上,雲端託管服務(CMS)是目前最夯的新趨勢,根據市調公司 MarketsandMarkets Research 報告指出,全球雲端託管服務的市場規模,預計從 2020 年的 624 億美元,到 2025 年成長至 1,162 億美元,複合年增長率(CAGR)為 13.3%。代表未來有大量企業採用 CMS,以降低 IT 基礎設施的投資成本及風險,藉此提升企業營運的競爭力。

由此看來,企業的數位轉型,就像上個世紀的太空軍備競賽一樣。「時間就是決勝點」,越晚起步的公司與其他數位能力領先群的企業相比,差距只會越來越大。現在就攜手 iKala 嘗試 iKala Cloud AIOps Services,打造穩定的 IT 系統、邁向數據驅動的商業模式,讓企業在數位世代站穩腳步,輕鬆穿梭多雲之間。

了解更多 iKala Cloud AIOps Services