發明驗證碼的天才讓全世界心甘情願幫他工作

更棒的是這種想法還可以在各種各樣的應用程式當中使用,就像 Luis 現在工作的公司,提供免費在線學習語言服務的 Duolingo。對不熟悉的人而言,這是一個通過在網頁端或 App 中通過翻譯遊戲來學習語言的服務。想知道這些被翻譯的文字是哪來的? Duolingo 跟 BuzzFeed 和 CNN 合作,翻譯他們的內容。
評論
評論

本文來自於 theHUSTLE《reCAPTCHA: The Genius Who’s Tricking the World Into Doing His Work》,TECH2IPO 翻譯

在你購買高價愛黛兒巡迴演唱會門票時,那些奇怪扭曲符號就是驗證碼;你知道它們,我知道它們,大家都知道它們是什麼,但是沒有人喜歡這些東西。它們存在有好一陣子了,但直到不久之前,我才認為這些為了對付機器人以及詐騙的符號是惱人的。但這帶來了意外的驚喜:很多時候,驗證碼是具有實際意義的文字,我花在打驗證碼上面的五秒鐘加上其他人花在這上面的五秒鐘,在不知不覺中會構成強大的計算能力。

這是舊聞,但我相信大部分人完全不知道這故事,這是一個有關驗證碼如何產生,以及發明它的人為什麼是個天才的故事。

問題

2000 年的時候, Luis von Ahn 還是卡內基梅隆大學的研究生。他和他的教授 Manuel Blum 一起進行一項只有人類可以通過,電腦不能通過的測試,用來防止黃牛用電腦程序自動購票然後以更高的價格轉手賣出去。

他們得到的解決方案是 CAPTCHA ,也就是初級的驗證碼,被稱為「用來區分人類與電腦的全自動圖靈測試」。人們通過識別系統顯示的扭曲字母序列和復雜的縮寫來證明自己是人類。

問題解決了對嗎?可能吧。

雖然這種驗證碼對於識別詐騙機器人有效,但 von Ahn 有意識到了一個有關效率的新問題。在接受 The Walrus 採訪時, Luis 說他在無意中創造了一個會浪費人類最重要資源——由一個又一個十秒鐘累積而成的數萬小時的人類大腦循環。

具體來說,這種驗證碼每天都會讓大家看 2 億個單字,每個單詞大約 10 秒鐘,也就是每天會浪費大約 50 萬小時的人力資源。

解決方法

故事是這樣的。在開車從華盛頓到匹茲堡的路上, von Ahn 想到了將那些被浪費掉的人力利用起來的

方法,就是將雜亂無章的單詞轉換成有意願的詞語。用這種方法,那些被「浪費」掉的人類大腦運轉時間又一次被利用了。

他將兩種低效用腦的方法結合起來,產生了一個雙贏的方案。這是個天才的想法,他因此獲得了 2006 年的麥克阿瑟天才獎,獎金 50 萬美元。

在光學字符識別(OCR)中,有大約 20% 的掃描材料是不能被讀取印刷材料的電腦程式識別的。von Anh 利用進階版驗證碼程序做的第一件事就是去幫助紐約時報的檔案館數位化,檔案館建立於 1851 年,有超過 1300 萬篇文章。現在,這些文章都已經被識別完可以從網上搜索到了。

以下是維基百科對於驗證碼工作原理的介紹:

不能識別的字符將會被單獨找出來,和一些能夠識別的字符同時顯示。如果填寫驗證碼的人將能識別的字符回答正確,那麼他們對於不能被識別的字符也會被判定為正確,他們對於不能識別字符的判定結果就會被認為是有效的。 OCR 程式自己識別出的字將會得到 0.5 分的分值,而每個人對於這個字的判斷都會得到 1 分。當一個字的分數超過 2.5 分,這個字就會被認為是有效的。那些被人們得出過一致結論的詞就又會被認為是「可識別的詞語」來判別其他詞語。如果前三個人類用戶識別結果一致,但他們的結果與 OCR 得出的結果不一致,那麼人類的結論將被採納,這個詞會被認為是可識別詞。如果一個詞語被六個用戶得出不同的結論,那麼它將會被認為是不可識別的而被棄置。
顯而易見, Luis 將兩個看似無關的事情放在了一起,讓很多人通過少量工作共同努力完成一件有意義的事情,並能達到 99.1% 的準確率。

Facebook 、 TicketMaster 、 Twitter 、 4chan 、 CNN.com 、 StumbleUpon, 以及 Craigslist 這些網站每天都會顯示超過一億次驗證碼,這些驗證碼正在幫助網路訊息的數位化。

Google 也看到了驗證碼的價值,雄心勃勃地宣稱要講全世界每一本書都收錄在內的 Google Books 也在使用驗證碼來掃描書籍。目前他們已經掃描了超過 2500 萬本書,在全世界範圍內使用了 1 億 3000 萬條驗證碼。

注:你是否曾經遇到過看上去像是房子門牌號的驗證碼? Google 2012 年開始在驗證碼系統中投入街道截圖,用來識別地址、街道名稱和交通標誌。

啟示

儘管驗證碼在區分人和機器這件事上十分重要,它依然曾經因為沒有向幫助他們轉錄的人付勞動薪水而被批評,就像是亞馬遜的 Mechanical Turk 沒有向工人付薪水一樣。

事實上,驗證碼的詞語是雜亂無章的還是一個有意義的詞真的重要嗎?從用戶的角度看,其實沒什麼區別。但我很願意幫助到別人,就像我們在 2002 年都回去下載 SETI 的螢幕保護程式來幫助他們尋找外星人一樣。(譯註:「SETI」是英文:Search for Extra-terrestrial Intelligence 的縮寫,意思是搜尋外星文明, [email protected] 是加州大學伯克利分校發起的目的在利用全球網路共同搜尋地球外文明的計劃,志願者可以通過下載他們的軟體,在螢幕保護程式或後台模式等不影響用戶使用他們電腦的情況下,利用多餘的處理器系統下載並分析從射電望遠鏡傳來的數據幫助該項目尋找外星文明。)

無論你在不知情勞動這件事上持什麼立場,你都不得不佩服 von Ahn 利用運算來完成一個偉大的想法,幫助人類完成雙贏的行為。

Kickstarter 是個做群眾募資的網站,眾包共同完成工作在商業上並不是什麼新鮮事。但這在基於人類的運算當中尚未得到廣泛應用。 Mechanical Turk 在被正確使用時,就是一個能夠將大量工作分散到成千上萬人的有力工具。就好像是一個人只花了 200 美元就得到了一萬張羊皮。

更棒的是這種想法還可以在各種各樣的應用程式當中使用,就像 Luis 現在工作的公司,提供免費在線學習語言服務的 Duolingo。對不熟悉的人而言,這是一個通過在網頁端或 App 中通過翻譯遊戲來學習語言的服務。想知道這些被翻譯的文字是哪來的? Duolingo 跟 BuzzFeed 和 CNN 合作,翻譯他們的內容。

通過 Duolingo 上到 2015 年 6 月為止的一億活躍用戶的努力,巴西人們將會跟我們看到同樣的新聞。

 

歡迎加入「Inside」Line 官方帳號,關注最新創業、科技、網路、工作訊息

好友人數

你的企業只是 e 化,還是真的數位轉型?Google《2021 台灣企業數位轉型調查》帶領企業檢視自身「數位化成熟度」

企業步入雲端、使用數位科技已是必要趨勢,但數位轉型的三大面向「獲客、科技、文化」你都做到了嗎?Google《2021 企業數位轉型關鍵報告》提出數位轉型地圖,並提供線上評估服務,幫助企業快速了解目前的數位成熟度與下一步。
評論
Photo Credit:Pawel Czerwinski on Unsplash
評論

根據 Google 與 BCG 管理顧問公司、Ipsos 市場研究公司合作的《2021 台灣企業數位行銷成熟度調查》與《2021 台灣企業數位轉型調查》發現,相較於數位成熟度起步的企業,成熟度較領先的企業在疫情衝擊之下營收仍能逆勢成長,平均高出 11%。

其實近年來,已有愈來愈多企業開始重視數位轉型,也認同數位轉型是一個必要進行式,而非未來式,不過在導入數位工具以及有了轉型意識後,究竟自己的企業正處在數位轉型的哪一個階段?數位行銷成熟度又發展到哪裡?大多數企業恐怕還是一知半解。對此,Google 最新的《2021 企業數位轉型關鍵報告》中,提出值得參考的見解。

你的企業只是在數位化,還是真的數位轉型?

十年前,我們都在談數位化、企業 e 化,主要從公司營運角度出發,導入數位工具與資訊系統,以降低營運成本為目標。約莫到了 2017 年,數位轉型浪潮正式來襲,企業認知到數位轉型是一個無止盡的進程,因為真正的數位轉型意味著要從消費者角度出發、以提升營收為目標,數位轉型再也不只是少數部門的工作,而是企業全體都必須具備的基本思維與素養。

據 Google《2021 企業數位轉型關鍵報告》顯示,多項市調指出,新興科技應用正在顛覆傳統、帶動產業升級。預估到了 2023 年,全球 63% 的企業將使用 AI 技術;到了 2025 年,全球 85% 的企業會採用雲端優先的策略、70% 的企業會增加雲端投資,而運用在製造的物聯網產值將翻倍成長。種種未來趨勢,都在提醒企業必須做好數位轉型的準備。

數位科技帶動企業轉型,雲端工具成為一大推手

當數位轉型是以企業營收成長為目標,那麼要做的事情便不只是資料 e 化、網路協作而已。Google《2021 企業數位轉型關鍵報告》分析歸納出,數位轉型所應用的「數位科技」解決方案,大致可分為 5 種類型,從早期發展到成熟發展的階段,分別為:員工協作平台、基礎設施架構、數據應用、應用服務開發、機器學習。由此可見,除了使用數位生產力工具提升工作效能,終極目標還包括善用數據分析,逐步做到應用服務開發、AL/ML 等,幫助企業即時回應市場與客戶需求。

Photo Credit:Google

而要完成上述的目標,讓數位科技為企業提供助力,最重要的第一步就是邁入「雲端」。不只善用雲端協作平台提高團隊生產力,也要建設以雲端為核心的現代化廠房與基礎設施,盡可能讓有助於企業發展的項目數據化、雲端化。在做好基礎建設的任務,並累積龐大的資料量後,便能期待透過管理平台與分析工具,從數據中辨識出具備商業價值的洞察。最終,在數位科技的全面應用下,企業能優化營運流程、保持業務敏捷性,並且快速回應市場,彷彿內建一座動力源源不絕的自轉器,讓企業能穩定成長,邁向永續經營。

Photo Credit:Google
Photo Credit:Google

一步一腳印,跟著 Google 展開數位轉型之旅

當然,數位轉型不能只是導入工具,它是一段冒險與創新的旅程,也包含對企業本質與精神的挑戰。為了實踐企業的商業目標,Google《2021 企業數位轉型關鍵報告》中提到,推動數位轉型必須從「獲客、科技、文化」三大面向切入,意思是運用數位科技,為企業提供數位服務、數位營運的可能性,同時因應消費者數位黏著度增加,藉此調整調整獲客模式,擴大數位轉型為企業帶來的商業價值。

更重要的是,為企業建構良好的數位文化,從思維與工作模式、企業文化等面向,建立互信、開放、創新的氛圍,才能為數位轉型打下真正紮實的基礎。

Photo Credit:Google

數位轉型牽涉的面向很廣,如果不知道如何展開第一步,或是想知道企業目前還有哪些面向尚未數位轉型, Google 在《2021 企業數位轉型關鍵報告》整理了一張非常明確的數位轉型地圖,企業不妨參照這些路徑,逐步檢視企業現況並擬定策略。

Photo Credit:Google

每一個偉大的旅程都始於腳下的第一步,數位轉型也是如此。無論你的企業已經登上雲端、或是還在仰望雲端,了解企業現況在數位轉型旅程的位置,以及目前的數位成熟度,是絕對必要的。對此,Google 也提供了數位行銷成熟度的線上評估服務,企業的數位轉型之旅不妨就從這裡開始。


一場疫情,讓許多行業意識到「數位轉型,不轉不行」的危機,尤其是轉型腳步相對緩慢的製造業、零售流通業,在疫情當下更是受創嚴重的兩大業態。對此,Google Cloud 舉辦的 Industry Summit Recap 線上研討會中有很好的解答,延伸閱讀立即免費了解多元豐富的主題▶Google 開創雲端運算新時代,Industry Summit Recap 線上研討會聚焦製造、零售業加速轉型