微軟與資策會攜手,啟動華文區首次資料科學家培訓與認證計畫!

在目前的科技業裡,資料科學人才可謂供不應求,但該怎麼成為一位合格的資料科學家?今天微軟與資策會宣布,將聯手在台推動「資料科學家培訓與認證計畫」,結合微軟認證線上共 250 小時的培訓與認證機制,以培植具備資料科學家所需能力的人才。
評論
Photo Credit: Microsoft
評論

在目前的科技業裡,資料科學人才可謂供不應求,但該怎麼成為一位合格的資料科學家?今天微軟與資策會宣布,將聯手在台推動「資料科學家培訓與認證計畫」,結合微軟認證線上課程共 250 小時的培訓與認證機制,以培植具備資料科學家所需能力的人才。

以下是他們所提供之新聞稿:

大數據應用在各行各業間持續發酵,包含近年最夯的 AI、無人車、機器人等應用都與之息息相關,也為目前全球最為搶手的「資料科學家」人才打造出一個發光發熱的舞台。微軟與財團法人資訊工業策進會 (下稱資策會) 於今日 (3) 宣布將攜手推動大中華區第一個「資料科學家培訓與認證計畫」,結合微軟專業認證 (Microsoft Professional Program , MPP) 的線上課程,內容涵蓋雲端運算、大數據和人工智慧,約 250 小時的培訓課程與認證機制,以培植具備資料科學家所需能力的人才。資策會也將成為微軟在大中華區首家推廣「資料科學家」線上培訓與認證課程的微軟授權教育訓練中心。

逾七成五台灣企業主肯定資料洞察將有助開拓營收來源 資料科學人才供不應求

大數據時代帶動了資料科學應用面的需求,面對日益龐雜的數據,需要透過更有效率的方式去蕪存菁,進而提煉出有價值的資訊。從股市解析、資安威脅預測、電商領域的消費者行為研究以至職業運動隊伍針對球員攻擊與防守路線與戰術分析,新興行業「資料科學家」可在各領域中發掘隱藏在巨量數據背後的可觀商機。根據麥肯錫 2016 年調查顯示,全球管理階層中有近半數認為資料與分析人才難以尋覓,為數不多的專業資料科學家,也因而成為全球就業市場中最為珍貴的人才資產。

微軟在 2016 年進行的「亞洲數位轉型調查」訪問了橫跨金融、零售、醫療照護、製造業及教育等五大產業、共 1,494 位參與擬定企業數位策略的領導者 (其中 105 位來自台灣百大企業主),調查顯示有高達 76% 的台灣企業領導者贊同從資訊洞察新趨勢,將能為企業創造持續性的新營收來源。

微軟大中華區副總裁暨市場行銷兼營運事業部總經理 康容表示:「數位轉型趨勢下,雲端技術與大數據的蓬勃發展為微軟與合作夥伴帶來許多機會,然而隨著產業需求的攀升,人才與技術的斷層問題也隨之浮上檯面。為解決這些斷層所帶來的大量培訓需求,微軟專業認證 (Microsoft Professional Program , MPP) 也應運而生。現今國際間對資料科學家的需求大量且迫切,微軟也及早因應市場與產業的需求,截至目前已透過微軟專業認證中的資料科學相關課程,在全球培育 600 位通過認證的人才。本次也很榮幸能與在地夥伴資策會共同攜手,首度將資料科學家培訓與認證計畫引進大中華區,期盼能透過此次合作培育在地人才。」

台灣 Open Data 資料開放指數在全球 149 個評比國家中名列第一,在政府、非營利團體與企業的共同推動下,資料分析逐漸攀升為各大產業不約而同挹注資源的重點發展項目,而台灣更是國際間相當看好的資料科學發展搖籃。然而根據 104 人力銀行統計,台灣目前在資料科學方面雖有大量需求,卻面臨人才短缺的處境。2018 年國內資料人才需求預估將達到 10 萬人,但目前全台資料科學家卻僅有 1,092 人,求職市場呈現嚴重供需失衡。

資策會做為國家資通訊領域的「智庫」,長期致力於推廣資訊技術應用、解決數位落差,關於本次與微軟的合作計畫,資策會數位教育研究所所長李進寶表示:「有鑑於資料科學的前瞻性與業界對此領域人才的強烈需求,資策會本次與微軟合作、將國際資源導入台灣,透過 Open edX 開設資料科學系列線上課程與認證機制,培養出能運用資料洞察為企業創造營收的科技人才;未來此計畫也將導入大專院校,盼能從資訊教育開始,培育出足以勝任包含資料科學家在內的『未來明星工作』的優秀人才,提升台灣軟實力。」

參透大數據 R 語言先驅 Dr. Graham Williams 揭密資料科學家必備利器

哈佛商業評論將資料科學家譽為「21 世紀最性感工作」。做為一名資料科學家,意味著將有機會獲得來自金融、零售、科技、教育等跨領域的工作,以及在美國比整體平均薪資多出 113% 的薪資水準 (Indeed.com 調查)。資料科學家何以在近年來成為企業眼中最炙手可熱的瑰寶?微軟亞太地區資料科學總監 Dr. Graham Williams 表示:「資料科學家可為組織解析大數據中所蘊含的規律與可供商業決策的洞見,進行以實證數據基礎為導向的決策模式,將有助於減少片面資訊的誤導與人為判斷的失誤,加快決策的進行與決策品質。」

被譽為 R 語言先驅的 Dr. Graham Williams 在 2005 年即開發出使用 R 語言且圖形介面簡單易用的資料探勘應用 Rattle;並在 2015、2016 為 R 語言使用者設計出一套被公認為資料科學重要教材的免費資源。Dr. Graham Williams 以 30 餘年在第一線的豐富經驗,提供以資料科學家為目標的學習者幾項建議:1. 成為資料科學家需擁有的先進能力/技術 2. 善用工具:Rattle 與 R 語言在資料科學的應用。R 語言在資料分析領域功能完備且強大,但對使用者而言可能較難上手。開放資源 Rattle 藉由圖形化介面,可協助使用 R 語言的資料科學家快速地建立機器學習模型,也成為目前相當適合入門且被廣泛使用的工具。」Dr. Graham Williams 同時也鼓勵學習者可運用線上平台的開放課程資源進行自學,充實資料科學基礎能力。

微軟與資策會共推 Open edX 線上學習消弭技術斷層 培養九大資料科學關鍵能力

隨著雲端學習的普及化,開設大規模開放式線上課程「慕課」(Massive Open Online Courses, MOOCs) 已不再是大學的專屬權利,此次微軟與資策會合作推動的資料科學家培訓與認證計畫,即是在全球前三大線上教學平台 edX 的開放原始碼平台 OPEN edX 開課。目前微軟發展全球線上課程的成果已達到 149 門課、125 萬位學員,而資策會更是微軟在大中華區使用微軟專業認證 (Microsoft Professional Program , MPP) 線上課程推動線上教學的第一家微軟授權教育訓練中心。微軟透過本次與資策會合作導入的資料科學培訓,也期待能落實「學習即服務 (Learning as a service)」的概念,運用教學資源為資策會與未來更多在地夥伴創造加值服務。

本次導入台灣的資料科學培訓計畫課程內容,是由微軟調查業界工作職位所需核心技能來設計,一系列課程共包括了 9 門主要學習科目以及 1 項專案,課程內容涵蓋雲端運算、大數據和人工智慧,全程約為 250 小時。完成後不僅具備資料科學家的核心技能,也將獲得微軟專業認證 (MPP) 的資料科學學程認證。培訓計畫中的 9 門學習科目可歸納為基礎課程、核心資料科學、應用資料科學三大階段,循序漸進學習完所有課程後,需再實際完成一項大數據專案,通過審核後方可正式取得認證。

基礎課程:

  • 資料科學導論 (Data Science Orientation)
  • 運用 Transact SQL 查詢資料 (Querying Data with Transact SQL)
  • 使用 Excel 進行資料分析與視覺化 (Analyzing and Visualizing Data with Excel) / 使用 Power BI 進行資料分析與視覺化 (Analyzing and Visualizing Data with Power BI) (擇一修習)

核心資料科學:

  • Excel 資料分析基礎 (Essential Statistics for Data Analysis using Excel)
  • 資料科學之 R 語言介紹 (Introduction to R for Data Science)/資料科學之 Python 語言介紹 ( Introduction to Python for Data Science) (擇一修習)
  • 資料科學基礎 (Data Science Essentials)
  • 機器學習法則 (Principles of Machine Learning)

應用資料科學:

  • 利用 R 開發大數據 (Programming with R for Data Science)/利用 Python 開發大數據 (Programming with Python for Data Science) (擇一修習)
  • 機器學習案例 (Applied Machine Learning)/利用在 Azure HDInsight 中的 Spark 建立可預測的資料模組 (Implementing Predictive Solutions with Spark in Azure HDInsight)/開發智慧化應用 (Developing Intelligent Applications)/ Analyzing Big Data with Microsoft R Server (擇一修習)

大數據專案


電動自駕車上路迎曙光!Turing Drive 借重 AWS IoT Lab 雲端服務,桃園青埔開放道路成功試營運

Turing Drive 透過 AWS IoT Core 進行資料彙整並集中傳送到 AWS 雲端,事後新創團隊更快梳理資料庫的數據,持續優化自駕車路線,AWS 除了技術面、架構面的協助之外,更重要是提供實作的引導,讓管理資料安全更有效率。
評論
Photo Credit:TNL Brand Studio
評論

電動車浪潮,讓無人自駕車的場景應用,增加更多想像空間!市調預測 2020~2024 年 L1-L5 等級電動自駕車,年複合成長率 18.3%。然而,電動自駕車要實際上路,除了要配套法規,保護乘客、行人的安全,更備受考驗。

團隊成員平均 30 歲的新創台灣智駕(Turing Drive)於 2018 年創立,致力研發可商轉的自動駕駛系統,他們開發的特製國產電動車,上路測試兩年行駛超過 30,000 公里、運載 70,000 位旅客。達成 98% 車輛妥善率,背後正仰賴龐大感測數據做為支撐,過程中 Turing Drive 借重 AWS IoT Lab 物聯網實驗室服務,讓創新之路更加拓寬。

特殊交通情境提供創新養分,封閉到開放場域 Turing Drive 累積實戰經驗與數據

Photo Credit:TNL Brand Studio
Turing Drive 執行長沈大維提出電動自駕車在台灣交通情境下所擁有的優勢與挑戰。

「要在台灣創新,尤其是電動自駕車全新題目,對我們新創是相當大挑戰,但也迫使我們每天想破頭思考,在困境之下該如何找出路!」Turing Drive 執行長沈大維開門見山表示,創業三年多來,走得每一步有多麼不容易。

Turing Drive 握有 CPU、GPU 平行運算核心能力,正因為資源稀缺,盡可能發揮自駕系統的多重定位技術,從GPS、光達、雷達、影像、到車體慣性導航等應用,Turing Drive具備足以提供市場最快速 time-to-market 應用方案。然而,除了握有 AI 演算、晶片感測能力,沈大維認為台灣的獨特交通情境,對發展自動駕駛技術推了一把。

他解釋,「台灣摩托車、汽車齊聚路上,還有偏鄉接駁、市區夜間公車專用道,多元交通環境交錯,讓我們嘗試用自動駕駛創造新的營運模式,這是其他國家沒有的先天優勢。」因為有實際場域得以試營運,Turing Drive 一路從封閉環境的桃園農博會、台中麗寶樂園,再到台北信義區夜間、桃園青埔的開放道路環境,象徵台灣交通情境的縮影,這家新創正逐步破關打怪。

Photo Credit:Turing Drive
全台第一條電動自駕巴士路線,就在桃園青埔。

除了 Turing Drive 積極突破技術提升安全率,提供場域驗證、城市建設的桃園市也貢獻良多。桃園市政府經濟發展局局長郭裕信回應,桃園近年積極推動創新城市治理,被 ICF 智慧城市論壇評選為「全球智慧城市首獎」,電動自駕車是智慧城市的一環,因此桃園不遺餘力推動全台第一條自駕巴士路線試營運,提供載客接駁累計超過 800 位人次乘坐,創下 90% 乘客滿意度。

Photo Credit:TNL Brand Studio
桃園市政府經濟發展局局長郭裕信表示,桃園近年積極推動創新城市治理,電動自駕車是智慧城市的一環,因此桃園不遺餘力推動全台第一條自駕巴士路線試營運。

大量的感測、影像數據該如何加值使用?借力 AWS 邁向「雲」運算成必經之路

Turing Drive 的電動巴士每天在桃園青埔定點載客、行駛,可想而知,有多麼龐大的感測、影像數據不斷累積。沈大維點出過去其他案例測試時,若想達成 Data Driven 驅動更多自駕車服務,勢必要先克服數據的儲存、加值、運用等實際挑戰,他解釋,「以前用終端硬碟儲存資料,往往我們工程師要留守到半夜,再去插拔車上的硬碟、整理車子運行數據,我們發現這樣做很沒效率,甚至隨著數據資料越來越多,在分類管理的工作也更為困難。」

面對難題,就是尋求解方!Turing Drive 找上 AWS IoT Lab 物聯網實驗室,雙方開始盤點,該如何運用雲端環境的優勢,更輕鬆掌握、洞察自駕車數據的金礦。AWS IoT Lab 表示,

「我們從三大面向切入,協助 Turing Drive 加速他們開發流程、減少工程師例行工作,甚至將影像資料有效加值,又能確保資料安全。」

AWS 所説的的三大面向,正是 AWS IoT Lab 所提供的三項解決方案服務。首先針對工程師要排班到試營運現場,插拔硬碟下載資料的冗長流程,AWS 提供 AWS IoT Device SDK 透過 MQTT over TLS1.2 安全機制加密與 AWS IoT Core 連結,通過認證後可將終端裝置的資料傳到 AWS 雲端儲存。同時允許開發團隊從遠端,直接登入自駕車系統做韌體更新或回收數據等指令,大幅縮短 Turing Drive 在開發、調教程式的時間。

第二項服務則聚焦協助 Turing Drive 針對自駕車運行所錄製的影像,AWS 提供 Amazon Kinesis Video Streams (Amazon KVS) 服務,讓終端裝置的影像資料串流到 AWS 雲端平台,進行後續機器學習、分析處理。讓 Turing Drive 省去過去人工傳輸影響資料流程,也幫助開發團隊更便利做後續的資料加值利用。

Photo Credit:TNL Brand Studio
AWS IoT Solutions Architect Tec 介紹三項解決方案內容服務。

第三項則鎖定自駕車的資料,因為搭載光達、雷達、GPS、陀螺儀等感測器,每天每秒都在產生巨量資料,Turing Drive 透過 AWS IoT Core 進行資料彙整並集中傳送到 AWS 雲端,事後新創團隊更快梳理資料庫的數據,持續優化自駕車路線。除這三項關鍵服務,沈大維特別回應,「AWS 帶給我們技術面、架構面的協助之外,更重要是提供實作的引導,讓我們管理資料安全更有效率,把資料放到雲端儲存,再也不用煩惱地端伺服器的維護跟管理。」

Turing Drive、AWS、桃園市政府,各司其職聯手出力助攻電動自家車加速上路

Photo Credit:TNL Brand Studio
沈大維指出,電動自駕車上路的普及,須同步具備雲端數據解決方案與硬體環境的配合。

在 Turing Drive 的眼中,與桃園市政府合作在青埔導入電動巴士試營運只是開端,沈大維說:「十年、二十年後,我們認為新世代的智慧車會趨向平台化發展,一方面需要有像桃園市願意投資智慧城市硬體環境的地方政府;另一方面則仰賴 AWS 雲端方案,完善數位基礎建設來整合道路號誌資料、車輛運行資料,當這兩端同步發展之下,電動自駕車上路才會加速普及。」

尤其是自駕車數據背後隱含的商業創新,郭裕信回應說,「智慧城市治理最重要就是數據, Turing Drive 掌握的數據未來還能跟保險公司、電商導購做結合,只要資料去識別化在安全範圍下使用,相信 Turing Drive 與 AWS 兩家新創企業的創新能量,我們非常樂見有更多資料應用,搭配新興商業模式,在充滿活力的桃園市進行驗證,看見更多創新應用具體落地。」

Turing Drive 展望未來的佈局,沈大維認為自駕車的發展不會只靠一家企業單打獨鬥,未來他們將聯手產業鏈夥伴,將 AI 技術、車載設備、關鍵組件、路側設備端到端的解決方案輸出海外,放眼全球商機。他肯定表示,「AWS 雲端平台具備彈性,不斷推出新應用的價值,我們會持續與 AWS 合作,把新世代智慧車的數位基礎建設産品放在 AWS 平台一起推廣,鼓勵更多勇於築夢的新創,善用 AWS 的優勢展開創新之旅!」