如何成為一名資料科學家

資料科學家是近幾年非常「性感」的工作之一,但一位資料科學家到底該具備什麼思維與能力?有時或許沒你想象中那麼複雜。
評論
評論

資料科學家是近幾年出現的名詞(但是實際上已經存在於好幾十年),像是這篇「搶佔 2013 全球最性感行業」,以及曾經寫過的「資料科學家 vs 資料工程師」,甚至很誇張的「美企業搶資料科學家,兩年資歷年薪上看 30 萬美元」,讓很多人對資料科學家抱持的不同的幻想,在一般介紹資料科學的投影片中,最常出現的是下面這張圖:

主要是要闡述資料科學家主要必須具備的技能包括 Hacking,Math,以及產業經驗。大部份在談資料科學家的文章也是從技術以及分析角度出發來談論培養資料科學家的過程,像是這篇我覺得很清楚的「How to become a data scients」。但是因為我是顧問業背景出身,所以想從另外一個方向來談談資料科學家的養成,特別是在商業環境中的資料科學家。

技術力

我們先來談談大家比較常聽到的技術好了,技術聽起來是個很高的門檻,又要會架硬體又要搞軟體。從架分散式系統到寫分散式演算法,又是R又是 Python 又是 SQL 什麼的,對於很多非資工出身的人的確很眼花撩亂。但是凡事總有個輕重緩急,不可能從底層系統到應用都自己一手包辦,要切入的話總得先從最關鍵的地方下手。

對於資料科學家,我認為在技術這端,並不需要真正自己從無到有架系統,只要了解基本的系統架構以及能力限制就行。首先要做的事情其實是要了解不同技術工具在整個資料科學的生產流程中所扮演的角色以及基本的使用方式。

如果把「資料科學」當成是資料科學家主要要生產的產品,那我們可能不用去瞭解每台生產工具內部如何運作,但是卻要非常熟悉整個生產流程應該如何串接,例如資料來源要從哪裡來,面對結構或非結構的資料,有什麼辦法可以處理或存放針對不同的資料原料,有什麼適當的分析工具可以使用?當產出一包資料分析結果後,可以用什麼方式包裝成產品?除了從結構面了解生產流程外,最好能規劃出良好的生產系統和檢核流程(透過 ETL 或是 CI 工具),確保資料產品能夠定期定量以及高品質的產出。

分析力

那在這個生產流程中,關鍵的分析方式以及原料篩選,就需要靠分析力來處理。分析學家有兩個關鍵武器 — 數學以及研究方法,透過嚴謹的研究設計以及數學分析來尋找最適合分析方式。如果只有技術但是不會分析,就會發生只有資料產出,但是不知道如何解釋的悲劇。

無法解釋資料是很恐怖的事情,最恐怖的地方在於對局結果沒有 sense,跑出錯誤的結果還找不到原因。在程式中繞了半天結果錯誤可能是一開始的資料就不正確。 分析力必須培養辨識原料好壞以及設計關鍵演算法的能力,才能確保資料從輸入到輸出都有好的品質。

在資料處理的過程中,不是只有建模才是分析,現在一些 XNN 之類的流行,彷彿資料只要拿來丟到模型裡就好,但其實在實務上,前處理還是必不可少。從原始資料開始,每一步的處理過程,其實都是分析再分析,濃縮再濃縮、提煉再提煉的結果。

商務力

最後關鍵的商業力。產品如果不賣,不見得是東西不好,而是沒有拿出去賣。資料科學家(特別是商業模式中的)所使用的技術和分析方式,都會受到商業模式的影響,也都必須合乎商業模式。例如一個以中年婦女為主要客群的成衣業者,最應該優先發展的技術並不該是即時的網路廣告分析模型,而是精準的商品推薦系統。

另外對於已經有基本上百萬消費者的企業來說,可能不會嘗試還在測試中的科技,而會選擇穩定的商業產品。例如可口可樂和 google 對於技術以及分析的發展方向一定會完全不同。這一切並不是技術的好外,而是商業模式的差異。

同時在一家企業中,不是只有演算法和推薦模型才能幫助公司賺錢。公司的業務、行政流程,也都可以透過資料的搜集和分析,來找到可以優化的點,讓資料科學能夠應用在方方面面來幫助企業成長。

結語

最後再回到技術力上。海德格曾說「技術是世界的解蔽(〈技術的追問〉 海德格爾選集)」, 技術本身會影響人觀看世界的方式 。當我們還在使用 1.44Mb 碟片的時候,絕對不會想到有什麼 Big Data 演算法或是個人化資料。但是當目前技術發展到資料空間以 PB 來算,處理和讀取資料的速度也開始利用分散式架構來處理,ram 也越來越大進入 in memory 計算的時候,絕對也會影響人們的分析方式以及商業模式。

當我們將商業的角度擺入,來思考資料科學家的任務和定位時,又會得到不一樣的看法,以及需要琢磨的面向。


趕上全民投資運動!國泰世華網銀 App 線上搞定證券戶,還能投資美股、加強理財

因疫情而興起的產業類別,在過去一段時間的表現,讓不投資的民眾對於「航海王」、「鋼鐵人」…等詞彙也能朗朗上口,連大學生愛用的社群平台Dcard也有不少的股票討論。用投資來刻畫更好的生活,已經是全民運動。
評論
Photo Credit:iStock
評論

「持續投資」是管理超過千億美元、全球最知名的資產管理公司橡樹資本共同創辦人霍華.馬克斯(Howard Marks)6 月在國泰世華銀行舉辦的全球投資展望線上論壇中,給予所有投資人的未來建議。儘管下半年不可預期,但持續出擊仍是投資巨擘的建議方向。

就算對投資毫無頭緒,也必須明白一個道理:通貨膨脹在短期內也許沒有感覺,但長期來看,一般民眾放在銀行裡面的錢只會愈來愈小。抵抗通膨的方式,便是有目的性地理財。撇開通膨,不管旅遊、購物、添購生財器具,甚至是退休,都需要有財務規劃的支持,投資理財絕對是規劃道路上事半功倍的選擇。

立即體驗行動金融

投資已成全民運動,國泰世華網銀 App,最快 5 分鐘完成開戶手續

不過,投資並不是有錢人的專利。根據證交所的資料顯示,2020 年台灣的開戶數達到 1,124 萬人,也就是說,每兩個台灣人,就有一個人擁有證券戶。尤其是 20 至 30 歲的年輕族群,占比從五年前的 25.4% 快速增加至 36.1%,大幅成長至 123 萬人。

也因為航海、鋼鐵族群過去一段時間的表現,讓不投資的民眾對於「航海王」、「鋼鐵人」也能朗朗上口,連大學生愛用的社群平台 Dcard 也有不少的股票討論。用投資來刻畫更好的生活,已經是全民運動。

一切的起點都必須從擁有證券戶開始。但自從新冠狀病毒(COVID-19)侵擾以來,臨櫃開戶伴隨而來的等待時間,無形中提高了染疫風險,要參與這項全民運動似乎難度不低。

國泰世華網路銀行 App 以民眾需求為優先,提供了「線上開證券戶」服務,只要備妥雙證件,最快 5 分鐘就能完成開戶手續。國泰世華網路銀行 App 不只提供買賣台股的功能,同步開通了美股複委託,讓跨海購買 Google、Apple 或微軟的股票都在手機上就能輕鬆操作。

Photo Credit:國泰世華

有了證券戶後,固然可以開啟投資人生,但對初步踏入股市的民眾來說,投資不懂得標的無疑是一種賭博。國泰提供每月最低 1,000 元的定期定額存股,不管是熱門股票,或者想要選擇風險較為分散的 ETF,都任由民眾挑選、輕鬆存股;或者也能透過國泰提供的「投資屬性」分析,了解自己的風險承受程度及偏好,選擇適合的基金來投資。

Photo Credit:國泰世華

上述的功能全部收攏在國泰世華網銀 App 內,用一個簡單的 App 就能輕鬆掌握,並檢視所有的資產狀況。

不只是手機上的銀行,更是消費者所有金融服務的提供者

投資難免有風險,對於尚在觀望,或是投資性格較為保守的民眾來說,先安穩地「存一筆本金」是個比較好的開始。

許多理財專家都提到,唯有掌握現金流的流入與流出,才是儲蓄的開端。國泰世華網銀 App 內提供了「母子帳戶」的服務。舉例來說,可以在母帳戶下分出旅遊帳戶、投資帳戶、緊急帳戶、教育基金帳戶等,每一筆錢都有了固定的去處,就不怕克制不了購物慾造成的額外開支。唯有自動化、不必費心的服務,才能最無痛地把錢存起來。

Photo Credit:國泰世華

但這也不代表要犧牲生活品質,利用母子帳戶「目標儲蓄」的功能,也能設定自動匯入固定的款項到子帳戶中,譬如設定一個「大餐帳戶」,每月存入 NT$3,000 元作為犒賞自己辛勞的來源;或是設定一個「遊戲基金」,存入固定的金額來限制自己每年的購買遊戲金額。

如果你打算在疫情解封之後,來一趟好久不見的旅行,除了目標儲蓄之外,利用國泰世華網路銀行 App,只要三分鐘就能開設外幣帳戶,除了買賣外幣有獨享的優惠,國泰還提供最長一年的匯率走勢圖,讓民眾可以在外幣便宜的時刻分批購買。

其他網路銀行應有的功能,不論是存、提、轉、匯,或是繳費、貸款、刷卡推波、消費紀錄查詢、臨時的額度調整等,國泰世華網銀 App 中也都能找到。除此之外,針對資料傳輸、儲存都建立了保護機制,加密技術、使用者辨識系統、存取控制等機制都是基本,來避免資料被第三人截取得知,為資料做最完善的安全把關。

Photo Credit:國泰世華

更重要的是,國泰世華銀行讓手機不只是銀行,同時也是投資幫手、資產管理師。提供最貼近生活上的金融服務,才能回歸服務好每一位消費者的初心。

立即體驗行動金融

本文係由國泰世華邀稿

證券服務由國泰證券提供

台北市敦化南路二段333號19樓| 客服專線 (02) 7732-6888 | 109年金管正總字第0044號