數據愈大愈好?沒能力分析反易陷入盲點

評論
評論

原文刊載於 ForbesTECH2IPO 編譯,Inside 獲授權轉載。

更多的數據會帶來更好的決定?答案顯然是否定的,就像用各式各樣的健康設備精準地測量各項數據,但是你卻還是一直變胖。

在「大數據」時代的很多領域都流傳著這樣一句諺語:如果你擁有的數據越多,那麼所能做出的決定就會更加得精準。那麼在現實生活中真的是這樣嗎?又或者如我過去所指出的,我們現在所獲得的分析比以前更沒有代表性呢?

智慧體重管理成效有限

一個非常典型的例子就是全球肥胖率,讓我們意識到儘管擁有更多的數據,甚至是即時數據,如果沒有意願或者沒有足夠毅力和耐力採取實際行動,那麼這些數據的價值是微乎其微的。當代的普通市民從未像現在一樣擁有如此多的方式來監控健康。智慧體重計在每天清晨能夠記錄我們的體重;智慧手機的條碼掃描能夠記錄我們攝取的卡路里;心率感應器和血氧感應器能夠每隔幾秒監控我們的劇烈運動;計步器能夠追蹤你的步數;從血壓計到血糖計的大量其他醫療設備都能傳達關乎我們健康生活的精準數據。而這個不斷膨脹的市場甚至出現了測試血液和基因的產品。

那麼為什麼在這些能夠頻繁接觸各種健康監測設備的國家內肥胖率卻不斷刷新歷史記錄?我們只需要點幾下鼠標就能以最近幾天的鍛鍊方式和每天記錄的體重變化來提供獨立個體的理想卡路里攝入量,但是為何這些精準的數據無法轉換成為完美的健康體態?這是一個非常值得深思的問題,我們正發揮「龐大的創意」來發掘各種欺騙裝置的方式,而不是將它們作為工具來改善我們的健康。

坐擁龐大數據卻不知如何使用

問題在於,查看這些數據並非簡單地等於充分利用這些數據。正如我在今年 三月份 所指出的,美國政府不乏龐大的精細數據,但是缺乏處理數據的專業技能和授權,將所有的數據轉換成具體措施。一家典型的美國成衣公司通常具備龐大的數據監控,從 T 恤縫的第一針開始,到 T 恤被消費者購買並帶出商店整個過程的運作都有。而問題是如何將這些複雜的數據串聯整合起來用於解決商業挑戰。

我所接觸的太多公司和機構都視「大數據」孵化和數據分析是充滿神奇力量的解決方案,簡單地認為只需要獲得夠多的數據,就能夠立即推動現有的業務。近年來多家公司瘋狂投資物理和數位感應器並嘗試和現有業務進行融合,然而他們都還沒有搞清楚這些數據希望能夠解答什麼樣的問題,且這樣匆忙地安裝感應器到現有公司生態系統中,是否會產生盲點等等。事實上,這種情況已經在社會多媒體分析領域出現,我經常看到公司憑藉令人難以置信的精準社交媒體及本地分析來調查社會觀點,與此同時卻忽略了在有些地圖上依然處於黑暗中的地區,導致其他分析師在其他分析管道產生從未注意到的盲點。

小心別被無用資訊淹沒

在數據社群存在這樣一種共識:充足的數據就像是一鍋粥,而雜訊和偏見就像老鼠屎,會破壞整鍋粥的味道。而問題是當我們不斷往鍋中投入食材(數據),整鍋粥並不會因此重新回歸到正確的味道,反而會增強偏見的存在。在這樣的情況下,小型且更平衡的數據池或許可以散髮出更迷人的香氣。事實上,正是這種想法才能在龐大的數據面前,催生出了糾正情感分析弊端的能量。

資訊過載同樣也是驅動迫使人類朝人工智慧(AI)聊天機器人發展的重要因素。當企業爭奪越來越多的大數據,他們已經不再能夠在龐大的螢幕前簡單地挖掘包含數千項指標的所有數據。他們需要人工智慧來對所有數據進行篩選並總結預判事物未來的走向。

事實上,昨天 華盛頓郵報 刊登了極具震撼力的新聞報導,當醫生被接二連三的自動警報淹沒的時候在醫院接受治療的患者卻承受了極大的痛苦。在未來電子醫療記錄系統將會整合不斷發展的詳盡醫療指標,透過減少醫療錯誤的精準演算法,讓接近於無限次的交互參照累積成豐富的領域知識。換言之,你可以想像乘坐一輛無人駕駛汽車在繁忙的城市街道穿梭,而人類駕駛員可以幸福地不去關注車輛前方有什麼東西,無人駕駛汽車的各種感應器能夠避免數千種潛在危險,並預估實際上可能會產生什麼後果。以醫療警報為例,有效警報容易淹沒在大量的誤報中,那麼同樣也可以引申 ,大部分的網路安全警告容易在正確卻過當的流量中迷失。

人類需要限縮資訊來源,或者靠 AI 幫忙解讀大量資料

綜上所述,或許大數據今後的焦點應該減少專注在任意安裝感應器來收集越來越多的數據,而是多聚焦如何篩選能夠反映問題的小型輔助數據流上。又或者隨著人工智慧的成熟,在未來能夠應付無限龐大的數據並解決處理所有的問題。在文章的最後,給企業的一點建議是必須減少依賴「數據收集」,並花費更多的時間和精力去探討如何對數據進行分析。


精選熱門好工作

遊戲美術 Game Artist

Orangenose Studio 易銘有限公司
臺北市.台灣

獎勵 NT$20,000

Server Developer

PicCollage 拼貼趣
臺北市.台灣

獎勵 NT$20,000

前端開發者 / Frontend Developer

奔騰網路科技有限公司
臺北市.台灣

獎勵 NT$4,000

評論