AI 與律師比賽審保密協議書,人類輸了

但會因為這樣,不久的將來律師就會被機器取代嗎?這真的是多慮了。
評論
評論

本文來自合作媒體 雷鋒網 ,INSIDE 授權轉載

昨天,一間以色列新創公司 Lawgeex 舉行了一場人機比賽:AI v.s. 人類律師,在 4 個小時內審查五項(共 14 頁)保密協議,結果 20 名經驗豐富的人類律師無論從時間還是準確度上都遠遜於 AI,被機器完敗。

機遇與挑戰

人工智慧對商業產生的變革顯而易見,在全球有 6000 億美元的法律服務市場當然也不能幸免。據咨詢公司 McKinsey 估計,22% 的律師工作和 35% 的律師助理工作都可以通過自動化來完成。顯然對於某些非核心的法律任務來說,機器應該比律師處理的更快且更好,例如合約審核工作。

2014 年成立的人工智慧合約審查自動化解決方案公司 LawGeex 在這方面做得尤為出色。他們認為合約審查是現在每個公司都會需要,且數量龐大。例如典型的 1000 強企業,差不多任何時候都會維持 2 萬到 4 萬個的活躍合約。但是據國際合約和商業管理協會(IACCM)調查,有 83% 的企業對其合約流程不滿意,因為例如交易中常見的保密協議(NDA)一般需要一周或更長的時間才能批准下來,這大大降低交易速度。

而從另一方面對律師來說,審核這些合約大多只是重複性體力勞動,浪費了大量的時間,而又不得不做。

這樣的市場需求似乎是在召喚著人工智慧的到場,但事實並不是那麼容易,在法律文件方面訓練人工智慧模型其實還有蠻多獨特挑戰之處。

首先是法律術語——通常這些法律語言複雜且違反直覺,這讓訓練變得十分困難。對於合約審查和批准,自然語言處理(NLP)和現成的解決方案根本不起作用,沒有現有的計算語言模型能夠連貫地閱讀法律術語。

其次是高精度的要求——律師的主要職責是控制甚至降低其公司或客戶的風險,準確性至關重要。在法律人工智慧的訓練中,單一文檔分析要求的準確性要高得多,比如大數據「情感」分析(使用文本分析挖掘不同數據來源以獲得意見以預測趨勢的過程)。

針對第一個問題,LawGeex 創建了新的法律「語言」——專有的法律語言處理(LLP)和法律語言理解(LLU)模型。律師和工程師團隊通過給 AI 展示大量的法律文件,教授了 LawGeex AI 相關的法律文獻。當 AI 學習法律術語時,法律訓練人員會指出它需要識別的概念。LLP 技術允許算法識別這些概念,即使這些詞組它從來沒有見過。

另一方面他們採用監控概念,而不是關鍵字 -- LawGeex AI 的操作方式要比遲鈍的「關鍵字搜索」複雜得多。關鍵字搜索可能過多或過少,因為相關文檔中可能沒有相關文字,或出現在不相關的文檔中。但是真正的人工智慧應該能夠識別出一個概念,不管它是什麼樣的詞組或出現在文檔中的什麼地方。

比賽

這次比賽的內容為四小時審查五項保密協議(NDA),並確定 30 個法律問題,包括仲裁、關係保密和賠償等。如何準確界定每個問題是比賽的得分要點。

需要說的是參加比賽的這些律師都是擁有十幾年從業經驗的律師,而 LawGeex AI 也不是從頭開始學習。按照 LawGeex 的介紹,LawGeex AI 已經接受了足夠的訓練,不光是 NDAs,它還可以檢測十幾種不同的法律合約,從軟體協議到服務協議到採購訂單。但在這項具體的比賽中,它僅關注 NDAs-- 最常見的商業合約形式。

比賽的結果預料之中,人類律師輸了。

人類律師的平均準確率僅為 85%,而 AI 的準確率達到了 95%。時間上,AI 僅僅用了 26 秒就完成了任務,而人類律師平均需要 92 分鐘。值得注意的是,人工智慧在這些合約中最高可以達到 100%的準確率,而其中人類律師的最高得分僅為 97%。

意義

儘管這並不是法律領域人類與 AI 對抗第一次比賽(也不會是最後一次),但它是 AI 首次與真實的有經驗的律師之間的 PK。這使得比賽的結果在一定程度上可以說明,法律領域的某些工作,AI 可以比從業多年的人類專家完成的更好。

這可能會引起法律從業者的恐慌——難道在不久的將來律師要被機器所取代了嗎?但這真的是多慮了。目前來看,AI 在各個領域中還只能從事部分重複性工作。對於律師來說,AI 的出現其實是一種福音,它可以幫助自己處理掉大量重複性勞動工作,這一方面可以加快自己的工作速度,另一方面也能夠給自己足夠多的時間專注於那些真正有創造性的工作當中。