為何人類能接收比AI更少的訊息就學會工作?DeepMind發表人類的元學習理論

人工智慧需要數千小時的遊戲時間才能達到並超越人類玩家的水平,我們則可以在幾分鐘內掌握以前從未玩過的遊戲的基礎操作。 DeepMind 對這個問題進行了研究,並撰寫了一篇網誌介紹了論文的主要內容。

AlphaGo使用的強化學習是人工智慧新星?讓專家告訴你為什麼這不是通用解方

深度強化學習可以說是人工智慧領域現在最熱門的方向,它之所以聲名大振,與 DeepMind 團隊用它在 AlphaGo 和 AlphaZero 上大獲成功脫不了關係。但本文作者 Alex Irpan 想要告訴大家,深度強化學習是個大坑,別著急入坑!它的成功案例其實不算很多,但每個都太有名了,導致不了解的人對它產生了很大的錯覺,高估能力而低估了難度。