資料科學家最常使用的十大演算法

本文來自於 KDnuggets 所做的十大演算法調查,對於資料科學家常用的演算法進行排名,並對其在 2011-2016 年間的變化進行介紹。
評論
評論

本文來自於 KDnuggets 所做的 十大演算法調查 ,對於資料科學家常用的演算法進行排名,並對其在 2011-2016 年間的變化進行介紹。INSIDE 獲合作媒體 雷鋒網 授權轉載。

 

基於調查,KDnuggets 總結出了資料科學家最常使用的十大演算法,它們分別是:

  1. Regression 回歸法
  2. Clustering 聚類法
  3. Decision Trees/Rules 決策樹
  4. Visualization 視覺化
  5. K-Nearest Neighbor 最近鄰接法
  6. PCA (Principal Component Analysis) 主成分分析法
  7. Statistics 統計算法
  8. Random Forests 隨機森林法
  9. Time series/Sequence 時間序列
  10. Text Mining 文本探勘

 

其中,受訪者表示平均使用了 8.1 個演算法,相比 2011 年類似的調查大幅提高了。與 2011 年的類似調查比較,我們發現最流行的演算法還是回歸法、聚類法、決策樹和視覺化。相對來說最大的成長是以下演算法:

Boosting,從 2011 年的 23.5% 至 2016 年的 32.8%,成長 40%

文本探勘 ,從 2011 年的 27.7% 至 2016 年的 35.9%,成長 30%

視覺化 ,從 2011 年的 38.3% 至 2016 年的 48.7%,成長 27%

時間序列 ,從 2011 年的 29.6% 至 2016 年的 37.0%,成長 25%

異常/偏差檢測(Anomaly/Deviation detection),從 2011 年的 16.4% 至 2016 年的 19.5%,成長 19%

集成方法(Ensemble Method),從 2011 年的 28.3% 至 2016 年的 33.6%,成長 19%

支持向量機(Support Vector Machine,SVM),從 2011 年的 28.6% 至 2016 年的 33.6%,成長 18%

回歸法 ,從 2011 年的 57.9% 至 2016 年的 67.1%,成長 16%

2016 年最流行的新演算法分別是:

最近鄰接法 ,46%

主成分分析 ,43%

隨機森林法 ,38%

優化(Optimization),24%

神經網路-深度學習(Neural networks -- Deep Learning),19%

奇異值分解(Singular Value Decomposition),16%

下降最多的分別是:

關聯規則(Association rules),從 2011 年的 28.6% 至 2016 年的 15.3%,下降 47%

增量模型(Uplift modeling),從 2011 年的 4.8% 至 2016 年的 3.1%,下降 36%

因素分析(Factor Analysis),從 2011 年的 18.6% 至 2016 年的 14.2%,下降 24%

生存分析(Survival Analysis),從 2011 年的 9.3% 至 2016 年的 7.9%,下降 15%

不同領域使用的算法比例

 

我們注意到幾乎所有人都在使用監督學習演算法(Supervised learning)。政府和工業界資料科學家比學生或者學術研究機構使用更多不同的演算法,而且工業界資料科學家更傾向於使用共通式演算法(Meta-algorithm)。

下面,我們繼續通過僱員的類型來分析最流行的 10 個算法和深度學習。

 為了讓這些差異更容易觀看,KDnuggets 針對特定僱員類型相關的平均算法使用量設計了一個算法。

Bias(Alg,Type)=Usage(Alg,Type)/Usage(Alg,All) -- 1.

 

這是一些 KDnuggets 分析之後發現的重點:

工業界資料科學家 更傾向於使用回歸法、視覺化、統計法、隨機森林法以及時間序列。

政府 / 非盈利組織 更傾向於使用視覺化、主成分分析以及時間序列

學術界研究人員 更傾向於使用主成分分析和深度學習

學生 一般使用的算法較少,但是他們會做更多的文本探勘以及深度學習

 另外,參與投票的讀者主要來自於

美國/加拿大,40%

歐洲,32%

亞洲,18%

拉丁美洲,5.0%

非洲 / 中東,3.4%

澳洲 / 紐西蘭, 2.2%

在 2011 年的調查中,KDnuggets 將產業 / 政府分在了同一組,將學術研究人員 / 學生分在了第二組,另外通過算法對於業界 / 政府的“親切度”進行了計算:

N(Alg,Ind_Gov) / N(Alg,Aca_Stu)

------------------------------- -- 1

N(Ind_Gov) / N(Aca_Stu)

親切度為 0 的算法表示其在產業 / 政府和學術研究人員 / 學生之間的使用情況對等。IG(Industry/Government)親切度越高,表示該演算法越被產業界普遍使用,反之則越「學術」。 

其中,最“ 產業 ”的演算法是:

增量模型 Uplift modeling,2.01

異常檢測 Anomaly Detection,1.61

生存分析 Survival Analysis,1.39

因子分析 Factor Analysis,0.83

時間序列 Time series/Sequences,0.69

關聯規則 Association Rules,0.5

其中增量模型(Uplift modeling)又一次成了最「產業」的演算法,但是令人驚訝的是其使用率卻很低,只有 3.1%,幾乎是這次調查中使用率最低的算法。

最「  學術  」的演算法是:

神經網路 Neural networks -- regular,-0.35

單純貝式 Naive Bayes,-0.35

支持向量機 SVM,-0.24

深度學習 Deep Learning,-0.19

集成方法 EM,-0.17

下圖是所有算法以及它們在產業界/學術界的親切度:

數據科學家最常使用的算法,工業界 vs 學術界

 

2016 數據科學家使用的算法調查匯總

匯總表格中各項含義分別是:

N:根據使用度排名

Algorithm:算法名稱,

類型:S -- 監督,U -- 無監督,M -- 元,Z -- 其他,

% 指代調查中使用這種算法的調查者比例

Change—變動(%2016 年/2011% -- 1),

Industry Affinity—產業親切度(前文中提到)

 


傑思·愛德威攜手玩藝國際開創直播電商 2.0 ,首創 「LINE+1 」、跨境出海直播

傑思·愛德威與玩藝國際共同經營直播電商的發展,並提供廣告主和直播主更完整的直播解決方案。
評論
Photo Credit:傑思·愛德威
評論

在疫情的侵襲下,居家防疫已是新的生活型態,透過「直播」互動或娛樂,更成為大家的日常。因此,「直播導購」的市場與熱度也在這樣的背景下急速成長中。

傑思·愛德威與玩藝國際( 168 money )共同深度經營直播電商的發展,並提供廣告主更完整的直播解決方案。今年上半年他們不僅和 LINE 購物合作了「直播電商 on LINE 」的發表活動,更於下半年首創「直播 LINE+1 」。消費者在觀看 LINE 直播的同時,只要回覆「品項+1 」,即可匯入系統訂單,透過技術升級優化消費者購物體驗。

除此之外,傑思·愛德威整合了中、港、台三地直播主、直播平台等資源,幫助品牌供應商和直播主們進行跨境出海的直播導購。透過豐富的經驗、專業的技術與團隊、國際資源的整合,傑思·愛德威和玩藝國際攜手共創了直播電商 2.0 時代。

Photo Credit:LINE購物

直播導購新戰場:LINE 

社群平台觀看直播下單,是品牌和供應商不可忽視的消費者趨勢,而擁有 2,100 萬台灣用戶的 LINE ,更成為直播導購的下一個紅利平台。 LINE 直播服務具有三大優勢:「穩」定的直播環境、「準」確的通知觸及、以及消費者邊買邊「賺」的 LINE POINTS 回饋。

為因應不同的產業型態及需求, LINE 還可分為三大直播導購區,若主要行銷目標為品牌知名度擴散,可選擇搭配「 LINE 購物官方公域帳號」進行直播導購。 LINE 購物上的強大流量,可以在短時間內導入幾十萬觀看人數,例如美國知名保健食品品牌,即看中 LINE 購物的瞬間導流效益,於今年六月與傑思·愛德威合作,透過 LINE 購物官方帳號直播,並結合 618 檔期宣傳,當月 ROAS 達到 6 以上,總營業額更直逼 700 萬。

若品牌已創立自有的「品牌 LINE 官方帳號」,且經營了一段時間,即可在自有的 LINE 官方帳號內開啟直播吸引忠誠客戶進行回購。若品牌有相關需求,傑思·愛德威還可提供導購專家、直播團隊到場地器材等直播一條龍式的客製化服務。

最後,「 LINE 群組」也能開啟直播導購。相較於官方帳號的公開性, LINE 群組類似小型社團,透過群組內發起人的強大號召力,可進行例如團購的集單方式達到快速直播轉單。

首創直播「 LINE+1 」,優化消費者體驗

玩藝國際在社群平台和直播市場深耕已久,也藉由其深厚的技術背景造就許多百萬營業額直播主,例如天后闆妹、富發牌等。

玩藝國際不僅快速察覺直播新戰場 LINE 的紅利機會,協助許多直播主發展 LINE OA 的打造和系統建置,日前更首創推出了「 LINE+1 」功能。消費者於直播中留言+1 搶購下單,即時的購物車瀏覽就可查看搶單結果,不需等結單。此外還結合 LINE 獨有的 POINTS 發送、 LINE Bank 回饋、 LINE Pay 刷卡回饋等一系列優惠組合。透過系統升級和回饋機制,不僅優化了整體消費者的購物體驗,也幫助直播主在轉往 LINE 的新戰場可以無痛接軌且擁有更多優勢。

Photo Credit:傑思·愛德威

整合中、港、台三地資源,協助直播跨境出海

在疫情的推波助瀾下,「跨境直播電商」已席捲全球,在亞洲區更為風行。因應各個國家地區,在風俗民情、生活習慣、偏好等都有所不同,在直播導購的經營上也有其眉角秘訣。

傑思·愛德威在跨國集團的背景資源下,整合了中、港、台三地的藝人和 KOL ,如曾志偉、應采兒、余文樂等;以及直播平台,如擁有 5.5 億月活躍用戶的抖音、網美匯集的小紅書、二次元最愛的 bilibili 、快手短視頻等。透過名人的聲量搭配平台的流量,打造最大綜效的直播視頻,像是曾志偉於抖音平台擔任飲品的帶貨主播,單場直播累積觀看超過千萬人數、成交額突破千萬人民幣。品牌或供應商擁有高 CP 值的「貨」,透過傑思·愛德威即可搭配跨國最有力、最適合的「人」、「場」元素,進行「跨境直播導購」。

現今「直播」不再只是趨勢,更是不得不擁抱的熱潮,直播電商 2.0 時代也已經開啟。傑思·愛德威身為 LINE 鑽石級的合作夥伴和玩藝國際持續深度結盟合作,將會持續運用自身的資源、專業、經驗,共同協助品牌客製專屬的直播專案,未來將一起開設教學課程,培養直播新手們,致力打造直播電商共榮的生態圈。

本文章內容由「傑思·愛德威」提供,經關鍵評論網媒體集團廣編企劃編審。