張善政:大數據應立專法,但不是現在

昨日行政院副院長張善政出「數位金融 3.0 論壇」,以 〈大數據應用新思維——從政府施政談起〉 為題發表演說,他分享政府大數據研究的案例,表示行政院正在推動數據運用的相關國家標準,並鼓勵金融業者放棄對部分資料的控制以擴大影響力。最後他談到大數據運用雖然應該立法規範,但現在還不是時候。
評論
評論

昨日行政院副院長張善政出席經濟日報舉辦的「數位金融 3.0 論壇」,以 〈大數據應用新思維——從政府施政談起〉 為題發表演說,除了分享行政院與各部會運用資料的心得之外,也表達了政府對於資料運用的態度。他鼓勵金融業者放棄對部分資料的控制以擴大影響力,並表示行政院正在推動數據運用的相關國家標準,而大數據運用雖說應該立法規範,但現在還不是時候。

政府做大數據分析是實作科學

張善政表示,要談數位金融 3.0,除了讓消費者可以更方便享受金融服務,他也想從業界的角度來談資料的收集和運用,因此將行政院過去半年推動大數據的經驗拿來和與會者分享。他表示,大數據分析是實作科學,政府在做大數據分析,也是邊做邊學,邊做邊調整。

上個月張善政曾經發表過民間企業薪資大數據分析報告,1 統計 2014 年約 484.5 萬人,其中薪資所得在年薪 55 萬元以下約占 65%,發現過去三年,企業間的薪資調幅僅約 3%。他進一步解釋,行政院使用的分析方法,是比對了勞保和所得稅資料進行分析,而過去主計處進行統計,取得的資料是來自於問卷調查,準確度不足。「看得出來,低薪狀況確實存在。」張善政說。

而且,這次運用的數據,還可以讓政府了解低薪狀況的年齡分佈,除了大家比較容易想到的年輕人(剛出社會),其實部分中高齡人士也屬於低薪族。

沒資料=沒輒

張善政分享的另外一個例子是追蹤不同科系大學畢業生和碩、博士的就業/待遇情形,這些資料除了可以做為研究學用落差、教育資源安排(例如關閉大學)等等的參考。「可惜,這部分有點遺憾,原本我們對於這份資料的期望很高,後來有點失望。」他解釋,因為教育部從全國各大專院校收集而來、經過電子化之後的資料,是從民國 100 年開始,換言之,只有四年的資料。「可惜教育部沒有早 10 年想到,不然我們就有 14 年的資料,這太有用了,但四年的資料不夠,只能繼續收集。」

其他還在進行的,像是新住民和新住民第二代的發展,以及追蹤吸毒人口的成長歷程,另外也在規劃低收入戶家庭背景分析、銀髮族就業供需等等,並且做出因應。張善政特別提到,在分析低收入戶資料時,就會出現個資問題。

跨部會問題,需要輔導

張善政表示,在進行這些數據分析工作時,遇到的困難之一是各部會的技術能力參差不齊,因此需要成立大數據技術輔導小組。

過去,曾有一派人士提出:當大數據分析發展到極致,要分析特定領域的問題時,是不是就不需要該領域的專業知識了呢?2 但是在張善政的經驗裡,至少目前還不是這樣的。他說,以現在進行中的吸毒人口成長背景分析為例,他發現自己大概只能聽懂一半,顯然不能插手太多,只能交由衛福部、內政部和法務部去進行。「越往下做,非專業的人能介入的空間越少。」

張善政特別指出跨部會問題也是在做大數據分析時的障礙。以前面提過的民間企業薪資分析為例,他建議財政部整合勞動部的勞保資料,得到的回應竟然是「不想,因為很麻煩。」然而光是依靠所得稅資料來看的結果,就是怎麼做都做不出來。「做大數據分析,要勇於跨出部會間的藩籬。」

制定國家標準

大數據議題在實做時經常伴隨著個資問題。如同張善政在前面提到的,如要追蹤低收入戶或是新住民第二代的發展情形,就會牽涉到個資問題。真的要做,數據上來說都能追蹤到,但這就是目前政府還沒有結論的地方。「政府的出發點是好的,但有時人家就是不願意讓你知道自己是新住民。」

因此,政府正在準備大數據分析的國家標準,2011 年,ISO 已經推出個資國際標準,去年六月,政府也推出了「CNS 29100 資訊安全個資管理國家標準」,3 七月底會完成另一項 CNS 制訂工作。

資料先收集再說,以免用時方恨少

如同前面教育部資料收集不足的案例,張善政認為資料應儘早收集,或許一開始看不出用途,但大數據的特性之一就是往往能在分析之後發現原本我們觀察不到、聯想不到的東西。

「現在硬碟便宜的不得了。」張善政說:「先別問資料要幹嘛,先收集再說,未來會有人想到資料的用途。」

他舉例,像是行道樹在市區的分布圖,有人問說為何要收集這樣的資料,但後來發現,在花季的時候,這項資料對於容易過敏的人來說卻很有用,因為他們可以避開過敏原密集的區域。這樣的應用在日本也相當常見,例如就有「あなたの街の花粉情報(你家附近的花粉症情報)」、「花粉症ナビ(花粉症導航)」等 app。

鼓勵發想

張善政提到,過去他任職於科技部時,曾經提出由科技部出預算、資料所屬部會出資料(有限度開放的資料,非 open data),讓大學教授提出研究計畫,提出過去「沒資料就不能做」的研究,後來學校提出的題目大約有 100 項之多。張善政表示,這些專案如果能做出結果,他相信政府的資料分析會因此跨出一大步。

廣結善緣,放棄控制,擴大影響力

「Give up control to gain influence.」這是張善政對在場金融業者的呼籲,他說銀行現在手上握有許多客戶的資料,應該思考該如何運用,去擴大影響力。他舉例,本週稍早中國信託與 PChome、7-ELEVEN 合作發展行動支付 ,以及台達電注資歐付寶申請第三方支付業者執照,4 雖然一方不能掌控所有資料,但影響力可以擴大。「金融界的資料分享出來與產業結盟,產業其他公司的資料也可以分享作為回報,影響力才能擴大。」

大數據運用可立專法,但不是現在

最後,對於大數據專法,張善政表示,可立專法,但現在還不是時機,由於大數據分析對我們來說還是比較新的東西,應該先給業界幾年時間,觀察各界如何運用,再來立法,而不是在發展都還沒開始之前,訂出未必符合實務運作的法規。

「各位可以回想一下個資法。」他說當時法律走得太快,訂出了許多實施後沒多久即需要修訂,甚至有些至今仍不敢實施。

「現在大數據案例還不多,大家都在起跑點,趕快做吧!」張善政說。