成為大數據時代的精英學子:Big Data 的推薦好課!

巨量資料刺激了科技的躍進,也引領了一股工作熱潮,市場供不應求,各大公司都在聘請厲害的數據專家、資料科學家。想抓緊這波工作熱潮順勢進入大公司嗎?在這邊為大家整理幾個學習 Big Data 的平台及熱門課程推薦,一起來學習資料科學攻搶職缺吧!
評論
評論

本文由 Yahoo 奇摩贊助。

「Big Data, Big Idea」

在先前的文章 《巨量資料的時代,用「大、快、雜、疑」四字箴言帶你認識大數據》 中淺談大數據的起源及 4Vs 定義,又在 《7 個你不可不知的大數據定義》 一文中用不同的角度檢視大數據,了解大數據的起源和眾多定義之後,你對大數據這個「大點子」更感興趣了嗎?

資料增加得太快,讓這個世界開始「演化」,許多曾經不可能變得可能,未知的潛力也能漸漸挖掘出來。巨量資料刺激了科技的躍進,也引領了一股工作熱潮,根據 Indeed 網站的工作趨勢分析,從 2006 年到 2014 年間,跟 Big Data 有關的工作職缺大大的提升,市場供不應求,可以看出各大公司都在聘請厲害的數據專家、資料科學家。

想抓緊這波工作熱潮順勢進入大公司工作嗎?首先當然得先花功夫學習大數據囉。在這邊為大家整理幾個學習 Big Data 的平台及熱門課程推薦,一起來學習數據科學(Data Science)攻搶職缺吧!

Udacity

Udacity 是 MOOC 三大平台之一,其名稱來自於「audacious for you, the student」的理念,期許學生勇於學習,用 U(You)跟 Audacity 組合成「Udacity」一字。Udacity 平台著重於科技業的職前培訓,課程內容偏實用,有一系列 資料科學的核心課程 可供學習。

udacity

Udacity 課程內容有難易度之分,從 Intros to Computer Science、Descriptive Statistics、Inferential Statistics 開始,進展到更深入的 Data Analysis with R、Data Wrangling with MongoDB,還有機器學習的一系列課程 Supervised Learning、Reinforcement Learning、Unsupervised Learning 等,讓初學者從基礎課程循序漸進到進階課程,一步一步打好基礎。

可惜這些課程不是免費,14 天的免費試用期過後,必須繳交一個月 $199 美金的費用才能繼續在平台上修課。

Coursera

深受大家喜愛、MOOC 三大巨頭之一、完全免費的 Coursera 自然也有一堆大數據課程囉!

JHU-data

Coursera 上有 Johns Hopkins 大學的資料科學核心課程,一共十堂課,按部就班修完還可以取得專項課程證書(Specialization),課程如下:

JHU-courses

其他像是華盛頓大學 Bill Howe 的 Introduction to Data Science 課程、史丹佛大學 Andrew Ng 的 Machine Learning 課程、多倫多大學 Alison Gibbs 和 Jeffrey Rosenthal 聯合教授的 Statistics:Making Sense of Data 等,都是備受推薦的基礎好課。

史丹佛大學 Andrew Ng 的這堂 Machine Learning 也可以在標榜「完整課程、簡短影片、全都免費」(Full courses. Short Videos. Free for everyone.)的網站 OpenClassroom 上找到,就看大家習慣什麼版面。

openClassroom

另外推薦一門哲學入門課 Introduction to Philosophy,學習大數據為什麼要上哲學課?這難道不是兩碼子事?不,IT 專家 Jeff Remis 說過 1,他曾共事過的大數據專家們,精英中的精英往往有著很強大的哲學背景跟邏輯,能幫助他們分別哪些資料需要挖掘、哪些則需要管理、以及如何理解這些資料。這堂課最一開始便問大家,「到底什麼是哲學?」,有興趣可以上上這堂課,說不定會在你未來的大數據路上影響甚遠。

edX

上面介紹了 MOOC 的三大巨頭 Coursera、Udacity,當然不能漏掉 edX!

edX 上有一堂加州理工學院的機器學習經典好課:Learning from Data,由知名的電機工程與電腦科學教授 Yaser Abu-Moustafa 主講,可以說是機器學習領域的名師+名課!

edx

Learning from Data 第一課裡就提及了 Netflix 曾以 100 萬重金聘請 Abu-Moustafa 教授為 Netflix 改進演算法,希望能提升 Netflix 上對使用者的內容推薦。這堂課的完整影片、教材、跟作業也都在加州理工學院的 網站 上。 網易公開課網站 上則有翻譯成簡體中文字幕供大家參考。

除此之外,再推薦兩堂 edX 資料科學入門課,分別是麻省理工的 Introduction to Computational Thinking and Data Science,以及柏克萊大學的 Introduction to Big Data with Apache Spark

EMC

EMC 為美國一家跨國資訊科技企業,主要提供資料儲存、資訊安全、雲端計算等用於儲存、管理、保護和分析大量數據的產品和服務。EMC 曾引用使丹佛大學數據專家 Andreas Weigend 的一段話:

「當科技演化得太快而職場技能來不及趕上時 ,公司機構必須在這大數據現實中選擇適應 —— 不然就被淘汰。」2

“technology has evolved faster than the workforce skills to make sense of it and organizations across sectors must adapt to this new reality or perish” –– Andreas Weigend, Ph.D Stanford, Head of the Social Data Lab at Stanford

為了在這演化速度飛快的大數據時代中適應,EMC 提供了巨量資料的專屬課程「Big Science and Big Data Analytics」,逐一介紹資料分析方法和工具。可惜的是,這套課程並不便宜,Starter Kit 一堂課要 $600 美金,整套課程則需花費 $5000 元美金。

EMC 網站上也有精心製作的影片解釋大數據:

Big Data 是什麼?

從企業的角度來看,Big Data 為什麼重要?

Big Data University

bigdata-university

Big Data University 有涵括 Big Data 跟資料科學的 全系列課程 ,從大數據入門課 Big Data FundamentalsBig Data Analytics -- Demos 、資料分析、關聯資料庫、到十一堂 Hadoop 核心課程,全部約有 20 多堂相關課程。

Udemy

Udemy 上的好課有些都需要花錢購買,課程的好壞可以參考修課的人數跟評價。最推薦的是目前有超過 18000 人選修、平均評價 4.5 顆星(滿分是 5 顆星)的 Big Data and Hadoop Essentials,讓人最感動的是,這堂備受推薦的好課居然免費。

udemy

Big Data and Hadoop Essentials 的授課老師 Nitesh Jain 還有另外一堂 Hadoop 課程也十分受歡迎:Become a Certified Hadoop Developer,課程原價 $198 美金,現在使用優惠代碼「Endless19」能以 $19 美金的價錢購買課程,而且課程內容終身有效。

udemy-19

Udemy 上的課程有些定價十分高,尤其是一些已經有百人、千人甚至萬人選修的熱門課程,定價可以到三萬台幣之多。還好 Udemy 經常推出特惠代碼活動,可以用 $29 或 $19 美金買到課程,個人遇過最便宜的是萬聖節及跨年時節 $10 的優惠。因此 Udemy 還是不失為一個自我學習、自我提升的好平台。

Springboard

如果對現在正熱們的機器學習有興趣的朋友,Springboard 上也推薦一堂用 Python 學機器學習的免費課程 ,由 Springboard 的資料科學教育總監編寫。

這堂課能讓你了解機器學習是什麼,以及領域常用技術,並藉由實作真正導入 Python 機器學系系統。

Python 是機器學習最常使用的語言之一,而這套課程彙集了 PyData、PyCon 等頂尖 Python 研討會的資源,輔以實用的動手做練習。根據課程敘述,這套課程只需要 20-25 小時就能完成,分配下來大約可以於 2-4 週學完,相較之下坊間許多機器學習課程通常要長達數月。