AI 也能看懂黃色小說!日本新論文公開引用 18 禁文章惹議

立命館大學情報理工學科的三名研究人員發表了一篇關於 AI 辨識涉黃文章的論文。 論文的主要內容是,如何利用 AI 來辨識那些 「使用隱喻手法」 來表現 「少兒不宜」 的文章。也就是說,即使作者只是在小說裡遮遮掩掩地進行了某些暗示,也會被 AI 給揪出來。
評論
REUTERS/John Kolesidis
REUTERS/John Kolesidis
評論

原文《鑒黃師要下崗了!日本人教你花式識別「小黃文」》刊登於 PingWest,作者喃酱,INSIDE 獲授權轉載。

中國棋手們努力迎戰 AlphaGo 的同時,日本也舉辦了第 31 屆全國人工智慧大會。在這次大會上,立命館大學情報理工學科的三名研究人員發表了一篇關於 AI 辨識涉黃文章的論文。

論文的主要內容是,如何利用 AI 來辨識那些 「使用隱喻手法」 來表現 「少兒不宜」 的文章。也就是說,即使作者只是在小說裡遮遮掩掩地進行了某些暗示,也會被 AI 給揪出來。

研究人員為什麼要做這種奇怪的研究我們不得而知,但使用的研究樣本對同人文化、腐文化非常不友善,在日本國內也引發了激烈的爭論。

▲論文引用文章網址截圖

爭論之一是,這篇對全年齡段讀者公開發表的論文,引用了網站分級為 R18 的小說內容,而且還沒有提前取得網站和小說作者的同意。

論文使用了 pixiv 網站上, 2016 年十月 R18 分類下人氣最高的 10 篇 BL 同人小說。論文將這些小說作為研究樣本,在 「小說內有不健康內容」 的前提下,來說明 「AI 如何辨識出透過隱喻手段表達的不健康內容」。

為了說明 AI 的辨識方法,論文裡引用了不少 「兒童不宜」 的內容。論文作者在引用前沒有取得作者或 pixiv 網站的授權,還私自公佈了小說的題目、作者和 URL 網址。

pixiv 是一家日本同人插畫和小說網站,對內容有嚴格的分級制度,它有一個中文名字 「插畫交流網站」。pixiv 上分類為 R18 的內容只有年齡設定在 18 歲以上的註冊用戶才能查看。

這篇論文公開發表後,所有年齡段的人都可以看到被引用的少兒不宜內容,也都可以透過論文中的 URL 地址找到被引用的 R18 小說。一些小說作者只能將被引用的小說刪除或設成不公開狀態。

除了會被小朋友看見,在未經網站和作者允許的情況下,使用這些小說作為研究對象在日本還有版權問題。

被引用的小說在 pixiv 網站上只有註冊用戶能夠查看,並且不對 18 歲以下用戶公開。這樣的內容是否可以被判定為 「網路公開內容」 加以引用和公開發表,在日本法律界還沒有定論。

日本網友們的另一個爭論點是,把這些有分級的小說划為不健康內容真的合適嗎?

被引用的小說在 pixiv 網站已經被分級在 R18 類型下,未成年人不能閱讀。研究中依然將這些小說歸為 「內容不健康文章」,還公佈了小說作者和 URL 地址,一些日本網友認為這是對小說作者的誹謗,有違研究倫理。

這篇論文 5 月 24 日在大會上發表, 5 月 25 日, pixiv 就公開表示:

我們已經要求發表論文者所在學校對這件事加以調查和解決,也希望大家以後能夠繼續安心使用 pixiv。

學校方面則表示正在著手調查這件事。這篇論文在此之前已經在日本人工智慧學會的網站上發表,不過目前已經被隱藏。論文作者之一、立命館大學助理教授山西良典在接受日本媒體採訪時表示,論文確實存在一些問題,之後是否會繼續發表還有待研究。

雖然這項利用 AI 判斷隱晦涉黃文章的研究存在問題,但用 AI 來辨識網路內容的研究方向實在讓人不寒而慄。如果將來 AI 真的開始監督網上發表的內容,我們在網路上說話的時候是不是要更小聲了呢?

感背後的寒意了嗎?Big AI is watching you.



精選熱門好工作

公關活動企劃專員

八方采整合行銷有限公司
新北市.台灣

獎勵 NT$15,000

UX 數據分析師

長青資訊有限公司
臺中市.台灣

獎勵 NT$15,000

SAP BASIS 工程師

晟德大藥廠股份有限公司
臺北市.台灣

獎勵 NT$15,000