巨量資料的時代,用「大、快、雜、疑」四字箴言帶你認識大數據

你可能有注意到,「大數據(Big Data)」在我們的生活裡已經掀起滔天巨浪,繼雲端運算之後,儼然成為學術界跟科技業中最熱門的潮字(Buzz Word),似乎每家公司都在進行有關的研究,三句不離大數據。究竟大數據是怎麼出現,又代表著什麼意思呢?這篇文章為你整理了大數據的起源以及最有名的 4Vs 定義。
評論
評論

本文由 Yahoo 奇摩贊助。

你可能有注意到,「大數據(Big Data)」在我們的生活裡已經掀起滔天巨浪,繼雲端運算(Cloud Computing)之後,儼然成為學術界跟科技業中最熱門的潮字(Buzz Word),似乎每家公司都在進行有關的研究,三句不離大數據。究竟大數據是怎麼出現,又代表著什麼意思呢?

大數據(Big Data),資料爆炸的時代

Java Printing

大數據(Big Data)—— 或稱巨量資料 ,顧名思義,是指大量的資訊,當資料量龐大到資料庫系統無法在合理時間內進行儲存、運算、處理,分析成能解讀的資訊時,就稱為大數據。

“Big data is data that exceeds the processing capacity of conventional database systems.”

這些巨量資料中有著珍貴的訊息,像是相關性(Unknown Correlation)、未顯露的模式(Hidden Patterns)、市場趨勢(Market Trend),可能埋藏著前所未見的知識跟應用等著被我們挖掘發現;但由於資料量太龐大,流動速度太快,現今科技無法處理分析,促使我們不斷研發出新一代的資料儲存設備及科技,希望從大數據中萃取出那些有價值的資訊。

「Big Data」這個詞最早由 IBM 提出,2010 年才真正開始受到注目,並成為專業用語登上維基百科 1,算是「大數據」的正式問世。而在 2012 年時,《紐約時報》的專欄文章「The Age of Big Data2」更是宣告了「大數據時代」的來臨。值得一提的是,大數據並不是什麼新興的概念,事實上,歐洲粒子物理研究中心(CERN)的科學家已經面對巨量資料的問題好幾十年了,處理著每秒上看 PB(Peta Bytes,註:PB = 1,024 TB)的資料量 3

TED-Ed 的影片講解 Big Data 概念,簡單又好懂:

一般來說,大數據涵蓋的範圍很廣,定義也各家歧異。最早由 Gartner 公司的分析師 Doug Laney 在 2001 年發表的「3D Data Management: Controlling Data Volume, Velocity, and Variety.」4 一文中挑明了資料處理的三個關鍵挑戰 –– 資料量、速度、多樣性,並在 2012 年 Doug Laney 給予大數據一個全新的定義 5:「大數據是大量、高速、及/或類型多變的資訊資產,它需要全新的處理方式,去促成更強的決策能力、洞察力與最佳化處理。」

"Big data is high volume, high velocity, and/or high variety information assets that require new forms of processing to enable enhanced decision making, insight discovery and process optimization."

於是大部份機構跟公司都將大數據的特性歸類為「3Vs」或「4Vs」–– 資料量 Volume、資料傳輸速度 Velocity、資料類型 Variety,以及後來提出的第四個 V —— 真實性 Veracity。以下整理了 4Vs 簡單的定義跟解釋,可以從這四點切入認識大數據。

Volume 資料量

Data volume: amount of data

以前人們「手動」在表格中記錄、累積出數據;現在數據是由機器、網路、人與人之間的社群互動來生成。你現在正在點擊的滑鼠、來電、簡訊、網路搜尋、線上交易... 都正在生成累積成龐大的數據,因此資料量很容易就能達到數 TB(Tera Bytes,兆位元組),甚至上看 PB(Peta Bytes,千兆位元組)或 EB(Exabytes,百萬兆位元組)的等級。

Velocity 資料輸入輸出速度

Data velocity: speed of data in and out

資料的傳輸流動(data streaming)是連續且快速的,隨著越來越多的機器、網路使用者,社群網站、搜尋結果每秒都在成長,每天都在輸出更多的內容。公司跟機構要處理龐大的資訊大潮向他們襲來,而回應、反應這些資料的速度也成為他們最大的挑戰,許多資料要能即時得到結果才能發揮最大的價值,因此也有人會將 Velocity 認為是「時效性」。

Variety 資料類型

Data variety: range of data types and sources

大數據的來源種類包羅萬象,十分多樣化,如果一定要把資料分類的話,最簡單的方法是分兩類,結構化與非結構化。早期的非結構化資料主要是文字,隨著網路的發展,又擴展到電子郵件、網頁、社交媒體、視訊,音樂、圖片等等,這些非結構化的資料造成儲存(storage)、探勘(mining)、分析(analyzing)上的困難。

Veracity 真實性

Data veracity: uncertainty of data

這個詞由在 Express Scripts 擔任首席數據官(Chief Data Officer, CDO)的 Inderpal Bhandar 在波士頓 大數據創新高峰會(Big Data Innovation Summit) 的演講中提出,認為大數據分析中應該加入這點做考慮,分析並過濾資料有偏差、偽造、異常的部分,防止這些「dirty data」損害到資料系統的完整跟正確性,進而影響決策。

大數據特性,謹記四字箴言:「大、快、雜、疑」

大數據資料量龐「大」(Volume)、變化飛「快」(Velocity),種類繁「雜」(Variety),以及真偽存「疑」(Veracity)。尤其在這資訊大爆炸時代,這些資料變得又多、又快、又雜、又真偽難分。

當然在「大數據」一詞像病毒一樣,侵入我們生活中的各個層面,也有越來越多人提出更多的「V」來解釋大數據,像是 Volatility、Validity、Value、Victory 等,這些分歧的意見在這就不多詳述,只要知道有這些說法、以後聽到別人說到「7Vs」時不要覺得驚訝就行啦!


免跑銀行!國泰世華視訊服務每月使用人數破萬,3 分鐘就能解決問題

國泰世華銀行網銀App、KOKO App提供視訊服務,意即無論身在何地,都可藉視訊滿足客戶一站式金融服務需求。
評論
Photo Credit:TNL Brand Studio
評論

後疫情時代,為了減少與人實體接觸的風險,同時又能兼顧客戶服務,不少金融業者思考擴大線上服務的可能性。過去礙於技術與法規限制,客戶必須親自跑一趟銀行申辦業務;如今,國泰世華銀行網銀 App、KOKO App ,提供視訊服務,無論身在何地,都可藉由視訊一站式完成申辦業務,減少交通往返時間與接觸感染風險,既安全又有效率。

國泰世華實現「手機分行」,打開 App 就像走進銀行

想像一下,再也不必臨櫃抽號碼牌,或在銀行門口大排長龍,只要一支手機在握即可完成許多需求。這樣方便又有效率的「手機分行」,正在實現當中。

早在 2020 年 12 月,國泰世華銀行即搶先各大純網銀推出視訊服務,打造突破空間限制的線上分行體驗。目前國泰世華的視訊服務領先同業已提供多達 7 項服務,讓客戶免臨櫃奔波快速於手機上完成申辦。

國泰世華銀行透過旗下國泰世華網銀 App、KOKO App ,為民眾提供視訊服務,意即無論身在何地,都可藉由視訊一站式完成申辦業務。(使用國泰世華視訊服務,客戶須露臉提供客服核驗身分)/Photo Credit:TNL Brand Studio

國泰世華銀行視訊服務項目細節包括:申請重設網銀密碼、人臉辨識註冊、修改手機號碼、KOKO 網銀密碼升級、開啟約定帳號服務/設定約定帳號、數位存款帳戶升級 1-1 類,與數位存款 1-1 類開戶(1-1 類的帳戶功能較完整,有最高的轉帳與提款額度)等。

以客戶最常用到的變更手機號碼為例,過去如果要「修改手機號碼」,需要到臨櫃或線上使用晶片金融卡插卡驗證後才能變更。而國泰世華視訊修改手機號碼服務,除了更新銀行資料,在客戶同意授權後還可同步更新國泰金控旗下子公司的資料(如國泰優惠、國泰人壽、國泰投信)。一站式就完成辦理。另外,過去想要「約定轉帳」,必須先親自臨櫃開啟約定帳號服務,才可線上設定台幣約定帳號,且需配合晶片金融卡插讀卡機驗證。現在透過國泰世華視訊服務,在家就可以一次辦理完成,所有需求一次到位。

國泰世華銀行陳衍文副總表示,國泰世華銀行以「客戶體驗」及「Mobile First」為核心,為了滿足客戶即時的金融服務,致力以技術力搭配服務場景規劃力,快速地推出多元新穎的數位服務,未來的視訊服務項目亦會持續擴增,提供更多便民的服務。


國泰世華銀行視訊服務項目,還能夠在家同時開啟與設定約定帳號。/Photo Credit:國泰世華銀行

視訊服務結合生物辨識技術,帳戶安全性再強化

如何用視訊服務快速確認客戶的身分並維持資訊安全要求,對金融業者來說是很大的考驗。為了提升身分確認的準確度,國泰世華視訊後台結合生物辨識技術與多項驗證機制,層層把關、強化身分辨識的嚴謹性。

客戶進入視訊前,首先要完成手機簡訊 OTP 並上傳身分證影像檔;進入視訊服務後,客服會同時比對系統內留存的客戶影像與資料;若客戶有註冊國泰世華銀行人臉辨識服務,將同時使用人臉辨識技術進行比對,確保使用者為客戶本人。

國泰世華打造專屬視訊客服團隊,每月破萬人使用,服務品質領先業界

國泰世華銀行黃琮萌副總表示,疫情加速改變了銀行的服務模式,國泰世華銀行超前部屬,率先業界在台中與台北打造專屬的視訊客服團隊,讓客戶不用出門也能申辦臨櫃業務,同時享有溫暖的服務,我們也從客戶使用量觀察到對視訊服務的喜愛;從一開始推出時,每月使用人數從不到 2 千人,到現在每月平均使用人數超越 2 萬人,使用人數疾速增長,單日進線最高近 3 千通。

國泰世華銀行超前部屬,率先業界在台中與台北打造專屬的視訊客服團隊,為客戶提供專業服務。/Photo Credit:國泰世華銀行

國泰世華銀行表示,視訊客服團隊不僅提供專業服務,更會依不同客群調整最適宜的服務方式,且持續關心客戶的使用狀況。例如:曾經有旅居海外的身障客戶進線視訊,只能使用寫字的方式與客服同仁對話,在一筆一劃的書寫表達中最終順利滿足客戶需求;在服務結束前,客戶面露滿意微笑並豎起大拇指,以最直接的方式讚許國泰提供令人滿意的服務。另外,曾有位 70 多歲的客戶進線申請網銀密碼,在服務過程當中,客服耐心地逐步帶領客戶完成設定,客服於數日後致電客戶關心使用情況,也讓客戶感到十分溫暖。

為了實現「手機分行」的服務目標,國泰世華不只運用新興科技成為全台視訊服務高使用量的銀行業者,更以溫暖、人性化的客服服務,成為客戶生活中無可取代的存在。 

Photo Credit:國泰世華銀行