你知道中國的裁判查詢系統比台灣進步多少嗎?

身為一個法律系統開發團隊以及熱愛科技的律師,對法律科技相關服務深入研究是必須的工作,其中同屬使用中文的中國是最好的研究素材,雖然我們認為在法律的操作和應用,中國還落後台灣不少,但在法律科技的應用,中國無論從技術面和開發思惟,卻是整整領先台灣一大截,而且這個差距還在持續擴大。
評論
評論

原文來自 幫法律加點新科技 ,作者 Barry 為律師暨 Lawsnote 創辦人。

身為一個法律系統開發團隊以及熱愛科技的律師,對法律科技相關服務深入研究是必須的工作,其中同屬使用中文的中國是最好的研究素材,雖然我們認為在法律的操作和應用,中國還落後台灣不少,但在法律科技的應用,中國無論從技術面和開發思惟,卻是整整領先台灣一大截,而且這個差距還在持續擴大,如果我們不努力追趕,五到十年後,台灣的律師用中國製造裁判書查詢系統這件事也許會發生。

中國在媒合律師的 O2O 業務發展得很興盛,叫得出名字的就有贏了網、法鬥士、磚家寶、法幫幫、一號團購(現改名為一號律師),以及再早的中顧網,華律網。這種媒合服務的商業模式著重於市場文化,技術層面比較沒有那麼高,台灣曾有評律網嘗試切入這個領域,但發展並不理想,所以我們今天主要不是介紹這個。

我們今天要介紹的是市場相對 niche 的法律線上工具,主要是給法律工作者用的,以裁判書和法規查詢為本體,並且根據裁判書結構化以及數據化的進階處理。中國除了官方的查詢系統 裁判文書網 之外,主要還有三家在做判決書的結構化分析的線上服務: Openlaw無訟 理脈 ,其中無訟和理脈則是分別由金杜和天同兩家事務所支持。我們來看看他們和台灣有什麼不同的地方:

一個醜醜的首頁,看起來沒什麼…嗎?

從介面設計上我們可以發現,這個官方的裁判查詢系統已經採用 2013 年之後廣為流行的 landing page 概念,並且把最主要的功能,也就是搜尋,以明顯的 search bar 呈現在畫面最中間,並加入了許多 user friendly 的元素(例如『搜尋』是放在 bar 後面,而不是網頁下方)。

如果你對網頁介面的歷史有興趣,可以參考  A decade of Web Design,大致了解每個時期的主流網頁發展和趨勢。

相較之下我們的司法院裁判查詢系統,在介面上還是沿用 2000 年之前的主流設計,台灣的政府官方網站,除了少數較新架設的網站(如 青年創業圓夢網 採用的 material design)外,清一色還維持著 20 世紀的設計風格。

兩者在設計上的差異大概差了 10 年

或許你認為不過就是設計而已,沒什麼了不起。但事實上是,為了達成這樣的設計,搜尋引擎也必須從新打造。

司法院裁判查詢收錄的資料量大約是 1200 萬筆,只能區分法院和類別來搜尋,表示資料被拆分開來放在不同的資料庫中。以台北地院民事類裁判而言,資料量級在 55 萬筆左右,實測系統吐回資料的時間大約在 6-7 秒,我們猜測司法院是基於 SQL-base 語法的搜尋(根據司法院的招標文件,猜測是 MS SQL-base)。而這樣的搜尋引擎會隨著資料量的成長而越來越慢(也因此必須強迫使用者選定法院和類別以減少資料量)。

而裁判文書網收納了 2 千萬筆的文件(中國裁判並非全部公開),但只提供了一個搜尋 bar,不用選取法院,代表這是一個支援 2 千萬資料量級的搜尋引擎,每次使用者輸入關鍵字,都會在 2 千萬筆資料中查找一次。實際測試的結果,系統吐回資料的時間大約落在 1 秒內,我們猜測這個搜尋引擎至少導入了類似平行運算的概念。

兩種搜尋在技術上的差異大約差了 5 年

當然以現在的技術成熟度不一定要花到 5 年才能更新到下一代的引擎,但僅是打造加上最佳化可能也要花個 1-2 年的時間來調整。

OpenLaw 是一個 NGO 的產品,獲利模式不詳,功能也相對單純,除了查詢裁判書以外的功能外,大致上就是透過關鍵字的擷取並且做關聯性處理,例如:

將判決引用到的法條建立連結方便查閱,並且建立當事人列表:

除了設計和搜尋引擎,基本上和裁判文書網差異不大。

Landing page 設計和一欄式搜尋就不再重複說了,無訟的特色其實是判決的 Index。

例如點選『裁判理由』系統可以直接跳到裁判書裡裁判理由的位置,讓裁判書更容易閱讀。

還有推薦關鍵字:

這兩個技術都不太容易做到,我們無法判斷無訟是用什麼技術來達成這樣的成果的。

依然是 landing page 和一欄式搜尋。

不過理脈主要的服務並非裁判搜尋,而是實體(entity)搜尋,例如輸入阿里巴巴,我們可以看到這樣的畫面:

還可以查律師和法官:

這些資料都是透過相關的裁判書結構化資料後所做出的分析,技術不算很難,事實上之前評律網也有做過,只是商業價值並不清楚。不過這在新服務是很正常的,只有不斷去嘗試才能知道市場究竟要什麼。

儘管如此,我們還是可以發現,在法律領域導入科技應用的層次上,光是在搜尋技術的運用上,中國已經領先台灣許多,而介面設計、文本探勘的嘗試,還有不斷運用現有科技去摸索新的應用的心態上,也已經贏過台灣現有服務許多,然而身在台灣,大多數法律人並沒有感受到什麼危機感。

也因為這樣,我們更不敢懈怠,Lawsnote 創辦至今 4 個多月,我們做了法典筆記,做了裁判搜尋引擎、接下來我們會做的更多、更快、更好,雖然我們只是一家小小的新創,但根據我們的評估,要做到中國那些裁判查詢的服務對我們來說其實不難,難的是之後深度的應用,也就是,當上面這些公司被 BAT 收購後導入的 text mining, machine learning 和、NLP,所進一步衍生出來的服務,那會一下子拉開中國和台灣的距離,而且只會越拉越遠。

我們不知道這件事情什麼時候會發生,但希望發生的時候,我們已經走在他們的前面。