工程師也失業?「會寫 AI 的 AI」效率超越人類,Google、MIT 相繼投入開發

工程師的工作 AI 還是很難勝任的對吧?畢竟這個東西需要邏輯思考,需要框架和流程設計,哪裡是 AI 能一下子勝任的事情。但 Google 等公司認為,AI 現在可以開始學習一些 AI 專家做的事情了,那就是寫 AI 程式。
評論
ies (CEATEC) JAPAN 2014 in Chiba, east of Tokyo, October 7, 2014. Over 500 companies and organisations are exhibiting at CEATEC JAPAN 2014, which will be held until October 11, 2014.  REUTERS/Issei Kato (JAPAN - Tags: SCIENCE TECHNOLOGY BUSINESS SOCIETY) - RTR49758
ies (CEATEC) JAPAN 2014 in Chiba, east of Tokyo, October 7, 2014. Over 500 companies and organisations are exhibiting at CEATEC JAPAN 2014, which will be held until October 11, 2014. REUTERS/Issei Kato (JAPAN - Tags: SCIENCE TECHNOLOGY BUSINESS SOCIETY) - RTR49758
評論

原文刊登於合作媒體 36Kr,INSIDE 獲授權轉載。

認圖片辨聲音下圍棋 、玩 德州撲克開卡車 ⋯⋯似乎越來越多人能玩的事情 AI 也能玩,而且玩得比人還溜。但暫時有一部分人還是自我感覺安全的——工程師的工作 AI 還是很難勝任的對吧?畢竟這個東西需要邏輯思考,需要框架和流程設計,哪裡是 AI 能一下子勝任的事情。但 Google 等公司認為,AI 現在可以開始學習一些 AI 專家做的事情了,那就是寫 AI 程式。

Google Brain 人工智慧研究小組的研究人員最近就進行了這樣的嘗試。他們在一次試驗中讓軟體設計了一套機器學習系統,然後對這套系統進行測試語言處理方面的測試。結果發現該系統的表現超過了人類設計的軟體。

Google Brain 團隊首先用遞歸神經網路生成神經網路(RNN)的描述,然後利用強化學習對該 RNN 進行訓練。其方法可以讓 AI 從零開始設計出一個新穎的神經網路架構,在利用 CIFAR-10 數據集(含 6 萬張 32×32 的彩圖,涉及 10 類對象,每一類各 6000 張。其中 5 萬張為訓練圖像,1 萬張為測試圖像)進行圖像辨識測試時,其辨識的精度甚至比人類設計的最好架構還要高,錯誤率僅為 3.84%,與目前最先進的神經網路模型相比,其錯誤率僅低 0.1 個百分點,但速度快了 1.2 倍。而在用於自然語言處理的 Penn Treebank 數據集上,其模型構造出來的一種遞歸神經單元也超越了被廣泛使用的 LSTM 神經單元等最新基準指標,在複雜度方面比後者好 3.6 倍。

類似地,Google 的另一個 AI 團隊 DeepMind 最近也發表了一篇名為《學會強化學習》的論文。其研究同樣針對的是深度學習所需的訓練數據量大且獲取成本高的缺點。他們提出了一種名為 deep meta-reinforcement learning 的強化學習方法,利用遞歸神經網路可在完全有監督的背景下支持元學習的特點,把它應用到了強化學習上面。從而將用一個強化學習算法訓練出來的神經網路部署到任意環境上,使得 AI 在訓練數據量很少的情況下具備了應用於多種場景的元學習能力。或者用 DeepMind 團隊的話來說,叫做「學會學習」的能力,或者叫做能解決類似相關問題的歸納能力。

Google Brain 團隊的負責人 Jeff Dean 最近在回顧 AI 進展情況時,就曾經表態說機器學習專家的部分工作其實應該由軟體來負責。他把這種技術叫做「自動化機器學習」,並認為這是最有前途的 AI 研究方向之一,因為這將大大降低 AI 應用的門檻。

當然,創建學會學習的軟體這個想法由來已久,蒙特婁大學的 Yoshua Bengio 早在 1990 年代就提出了這個想法。但之前的試驗結果並不理想,因為 AI 做出來的東西還是比不上人類想出來的模型。但近年來隨著運算能力的不斷增強,以及深度學習的出現,AI 學會學習的能力終於取得了突破。

儘管 AI 的自學能力取得了突破,但是在近期內還無法大量推廣。因為首先這種能力需要龐大的計算資源。比方說 Google Brain 那個設計出辨識率超過人類所開發系統的圖像辨識系統的 AI ,就需要 800 個 GPU。

但這種情況將來可能會發生變化。最近 MIT Media Lab 也開發出了設計深度學習系統的學習軟體,其所開發出來的深度學習系統的對象辨識率也超過了人類設計的系統。MIT Media Lab 計劃將來把它的這套 AI 開源出來,讓大家繼續這方面的探索。

除了 Google 和 MIT 以外,據報導最近幾個月有好幾個小組也在讓 AI 軟體學習編寫 AI 軟體方面取得了進展。其中包括了非盈利的 AI 研究組織 OpenAI、MIT、加州大學柏克萊分校等。

一旦這類自動式的 AI 技術具備實用性,機器學習軟體在各行業應用的節奏無疑將大大加快。因為目前機器學習專家極為短缺,各家企業組織都需要高薪供養這批人才。