從日本看台灣,華文電子書產業的「破」與「立」

致力於發展EPUB電子書排版設計、現為汪達數位出版股份有限公司創辦人的董福興,為華文電子書的排版規格問題奔走多年,透過他對國際公眾事務的參與,以及EPUB電子書製作的經歷與堅持,分享日本電子書的發展過程與成效,藉此反應台灣電子書產業的問題,並找出可學習之處。
評論
評論

本文作者周怡伶,出自《能力雜誌》2015 年 2 月號

自 2010 年「華文電子書元年」以來,台灣談電子書發展談了許多年,卻一直沒有明顯的獲利模式,不僅是因為台灣讀者的消費習慣尚未改變,某部分原因是由於產業生態鏈與電子書排版規格的不成熟所致。

相較於台灣,日本的電子書產業起步得算早,現今的市場表現也較為熱絡,其在過去透過政府主導所訂定的電子書排版規格,使得他們在作業流程上更為順暢。而事實上,打開台灣出版界常用的排版軟體,可見許多來自日文的影子,而非華文的排版設定;因此若欲談論台灣的電子書產業現況與突破方法,也許可以借鏡日本的電子書產業發展。

致力於發展 EPUB 電子書排版設計、現為汪達數位出版股份有限公司創辦人的董福興,為華文電子書的排版規格問題奔走多年,近年來更以「邀請專家 (Invited Expert)」的身分參與「全球資訊網協會」(World Wide Web Consortium, W3C) 在美國、中國、日本、法國各地所舉辦的國際化工作坊與「技術大會及顧問委員會會議」(Technical Plenary / Advisory Committee, TPAC),與參會者共同協調未來中文應用於 Web 與數位出版的技術方向。透過他對國際公眾事務的參與,以及 EPUB 電子書製作的經歷與堅持,分享日本電子書的發展過程與成效,藉此反應台灣電子書產業的問題,並找出可學習之處。

政府主導,日本電子書跟上國際

董福興表示,日本的電子書發展可分為三個階段。第一階段是 90 年代時,日本開始將所謂的活字印刷、照片排版(日本稱之為「寫植」)轉向使用電腦排版時,有些電子產品公司與技術商同時推行電子書,稱為第一波電子書發展期;第二階段是 90 年代至 2010 年,此階段為日本電子書的沈悶期,但手機小說漫畫走在熱潮上,到 2010 年達到 656 億日圓產值,占電子書市場規模 80%;第三階段則是 2010 年至今,被稱為第二波電子書發展階段,為國家所主導的產業轉型。

日本由國家所主導的電子書產業轉型,是由文部科學省(等同於台灣的教育部)、總務省(等同於台灣的內政部+國家通訊傳播委員會)、經濟產業省(等同於台灣的經濟部)三部會聯合產業代表開會,其會議全名為「數位網路社會推動出版品流通懇談會」。

透過三部會聯合產業代表在此會議的討論,最終得出以下結論,並執行於日本電子書產業界:1. 採用國際標準格式 EPUB;2. 技術上實現日本排版需求;3. 保障方便性 (Accessibility);4. 讓書籍資料能夠共通;5. 讓印刷與電子書產生綜效;6. 整頓數位出版製作與流通的基礎。

針對國際標準格式 EPUB 這點而論,當時日本為了與國際接軌, 將過去常用的 2 種私有格式,即夏普 (Sharp) 公司的 XMDF(eXtensible Model Data Format) 格式及 Voyager 公司的 dotBook 格式,轉換為中間格式,以方便轉成 EPUB3,而此時正好是 EPUB3 的制定期,直到 2012 年 EPUB3 規範全部制定完成,日本國內的電子書店紛紛趕著支援如:樂天 Kobo、BookLive! 等,而國際服務,如:Amazon、iBooks store、Google Play Books 也陸續支援,且拓展至亞洲,使得日本出版產業在與這些國際電子書店合作時,能夠將電子書上架、無縫接軌。

另外,董福興指出,針對排版文化,從傳統印刷出版到桌上出版 (DeskTop Publishing, DTP) 時代,日本有一份工業標準 JISX-4051「日本語文書の組版方法」來加速排版數位化轉型;而從桌上出版到數位出版時代,日本的專家們在 W3C 也制定了一份包含直排文字等需求的 JLREQ「日本語組版處理の要件」以便於 CSS 等規範制定,讓 Web 與電子書能達成日文書排版的需求。這些明文訂下的標準讓日本產業界,幾乎都能在 1、2 年內跟上國際進度。

再者,日本有公版書書庫, 即「青空文庫」。青空文庫的倡議者富田倫生,受到 Voyager 公司影響而開始做電子書,一開始也使用 dotBook 格式的他,後來決定重新以純文字作為青空文庫的標準,並且留下清楚的排版規範,因而使得青空文庫的內容可以被重新再利用、轉成 EPUB 3 格式。10 年累積的 1 萬 2 千部公共領域作品,也加速了日本讀者接納電子書的速度。

綜觀以上,由於日本產業界有國際標準格式、明訂的排版標準,也有公版書書庫的文字,因此在電子書產業發展上更具有發展優勢。

剖析台灣電子書 3 大困境

反觀台灣。董福興表示,台灣政府其實早在 2009 年就投入補助 EPUB2,但由於 EPUB2 當時以支援西方文字為主,造成無法直排、指定字型等書籍排版表現不佳,影響讀者對於電子書的觀感,更遑論帶來實質收益,當然也無法投入更多資金持續研發,與國際市場的標準越來越遠。而 2011 年,資策會 EPUB 小組解散,台灣遇到了一段空窗期,一直到 2014 年一些台灣的電子書店才開始嘗試性支援 EPUB3。

董福興認為,2015 年對於台灣電子書產業而言,隨著本土電子書店在技術上的跟進,以及國際電子書平台進入亞洲,將會是第二波機會,台灣是否能掌握這次的機會,徹底改善電子書的產業環境,則有賴於現存問題的解決,並透過大型通路新服務進駐海外市場。董福興指出台灣的電子書困境有以下 3 點:

困境 1:使用者體驗不佳

日本過去在制定電子書格式,如上述的 XMDF、dotBook 時,皆強調使用者的閱讀經驗,即關注紙本書在轉換成電子書之後的樣貌,例如︰dotBook 已經可以做到日文直排與各種排版細節的呈現,讓電子書讀起來就像是紙本書一樣。董福興表示,不論是在日本或是美國,業者在製作電子書的當下,皆思考一個議題:「怎麼讓電子書排起來更像紙本書?」

董福興也指出,中文電子書第一不是沒有設計,要不就是花花綠綠,或者不重視細節,像是段落頭尾不對齊、加入不必要的段落間距、段首沒有縮排、全部使用黑體等。電子書的排版應該要從過往紙書的編排學習,雖然目前沒有人以科學實驗研究易讀性,但過去排版的積累,自然有其道理。這些細節若能做好,就能讓閱讀更為順暢,提供更好的使用者體驗,讓讀者願意付費購買。這也不限於電子書,現在有不少印刷書反而照著網頁常見的排版,犯了相同的問題,這是整個出版業界都需要在意的事情。

同時也必須重視近用性 (Accessibility) 問題,盲人不能閱讀印刷書,但 EPUB 電子書可以透過文字轉語音 (Text to speech, TTS) 等協助讓他們也能「讀」到內容。電子書讓無法閱讀的人不再是社會福利所「照顧」的接受者,而是與常人一樣的消費者。

BOX:解決方案:

針對華文電子書的標準排版方法,董福興正參與 W3C 的中文排版需求特別任務組 (Chinese Text Layout Task Force),與其他專家共同撰寫「中文排版需求」(包含簡體中文、繁體中文、蒙古文、藏文、維吾爾文等文字),預計於 2016 年底完成。

困境 2:產製流程不合理

董福興指出,事實上不論是台灣或是日本,同樣都有這個問題:由於出版產業是成熟的產業,且出版社仍舊把紙本書視為首要,因此工作流程固定、不易變更。現在的編輯工作流程為,編輯透過 word 檔撰寫原稿(即具有編輯指示的結構化內容),接著經過美編編排成印刷用製版(即擁有內容與樣式的圖像化版面),最後再印刷成書。然而,在印刷成書後,這些原本有結構的內容,便成為無結構的圖像。雖然出版社都能提供印刷用的 PDF 檔案,但 PDF 不符合行動時代讀者對電子書的想像。而此時若欲把紙本書數位化做成 EPUB,則必須重造結構,再運用 CSS 設計版面,成為電子書,不但耗時也無法節省校對與編輯成本。可想而知,這是一個不合理的產製流程。

BOX:解決方案:

董福興說明,真正理想的產製流程為,編輯不論在編輯原稿、網頁文章或是部落格時,就應該使用 Markdown 或 HTML 將內容結構化,並且將校對過程提前,原稿完成後便可在後端選擇排版印刷成書或是加上 CSS 設計做成電子書,當然也可以發表網頁,減少重作工的過程;而這需要透過職業訓練,成為編輯的必備技能,進而讓產業鏈上下產生連結。

困境 3:資訊流通繁瑣費時

董福興舉例說明,一家出版社若有 1 百本電子書要上架電子書店,目前的做法只能一本本慢慢上架,等於要重複 1 百次相同的過程,此時若要再上架另一電子書店,則必須再重複做同樣的動作,勞神費時。而在電子書上架販售之後,也同樣要經過繁複的結帳過程。

而如何使用制式化的資料格式 (metadata) 跟供應方式,快速地將內容建檔、自動上架、結帳,對於出版社而言,才能相對節省人力與時間成本。

BOX:解決方案:

董福興提及美國經驗說明,EDItEUR 組織(http://www.editeur.org/)訂定了 ONIX (Online Information Exchange) 標準,即線上資訊交換標準。出版社基於 ONIX 輸出書籍資料後,可以提供經銷商與書店直接輸入。ONIX 檔案包含了許多商業交易欄位,就像是平常使用的經銷商表格,但更為共通、便利與數位化;先應用於印刷書,也應用於電子書。事實上,美國的亞馬遜 (Amazon) 與最大零售連鎖書店 Barnes&Noble 都利用 ONIX 檔案作為輸入資料的來源,只可惜台灣尚未走到這一步。

華文電子書的未來:擴大海外市場

不論是紙本書或是電子書,其存在於世上的意義是被人閱讀,因此它必須以知識保存與流通便利的前提下,被製作出來。在數位便利的時代,電子書是未來的閱讀趨勢,為了跟上國際的腳步,台灣出版產業除了必須解決現有的產業困境之外,還得製作出量多且符合數位閱讀習慣的電子書站穩本土市場,最終再以拓展海外華文電子書市場為目的。

董福興說明,國際性的電子書平台,如 Google Play Books 已經針對整個華語區開放,可以看見來自印尼、馬來西亞、澳門、香港等地的訂單,Apple 的 iBooks store 雖然尚未拓展到東南亞,也有來自居住於澳洲、日本、美國、加拿大等地,且有富裕經濟能力的華文讀者所下的訂單,另外樂天 Kobo 也打算於近年拓展在東南亞市場的業務。

當這些國際性電子書平台的觸角可以延伸到世界各地的華文讀者時,過去以海外華文紙本書市場為重要業務之一的台灣出版社,便能再次透過這些國際性平台將華文電子書擴散出去,不僅提升海外讀者取得並閱讀華文書的便利性,更能夠減少過去因紙本書國際運送、退貨等問題所產生的成本。

另外,董福興提到,國際電子書平台能夠協助出版社、甚至是作者直接走出國際。例如:哆拉 A 夢作者藤子.F.不二雄的第二代與電子書製作商合作,申請日本國家協助數位內容走出國際的 Cool Japan 計畫補助,提供彩色化的數位漫畫,並將作品翻譯成英文、簡體中文等,直接在 Amazon、iBooks store 內販售,直接走出國際,不像過去得靠版權經紀尋求合作出版社,才能讓作品以其他語文在海外上市。

透過 Cool Japan 計畫,創作者將作品直接送上國際舞台,已經逐漸在日本發酵,未來台灣若能跨越產業門檻,也能讓數位內容廣為流傳於國際。當然這中間需要強力的電子書製作及翻譯團隊,台灣數位出版若要真正走出去,仍有待全產業鏈「動」起來改革。

【本文出自《能力雜誌》2015 年 2 月號;訂 能力電子雜誌 ;非經同意不得轉載、刊登】


Cookie 消失?試試看全新 AI 影像內容辨識:讓用戶看的內容決定看到的廣告

Google Chrome 即將淘汰幫助廣告主的工具—— Cookie ,它的離去將再一次地影響數位廣告產業。
評論
Photo Credit:<a href="https://www.shutterstock.com/zh/image-photo/ai-artificial-intelligence-big-data-internet-1075853384" target="_blank">shutterstock</a>
評論

透過GA分析進站者發現, Safari的新客數越來越多,難道這表示 iOS 的用戶數也跟著增加了嗎?注意了,這有可能是 Apple 封鎖第三方 Cookie 帶來的影響。隨著 Google 即將淘汰 Chrome 上的 Cookie ,這個幫助廣告主記住用戶受眾的小工具,將要再一次地影響數位廣告產業。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

後 Cookie 時代的廣告受眾如何鎖定?

各大廣告平台在過去幾年不斷地透過 Cookie 以及其它方式,悄悄收集使用者的用戶數據,隨著這幾年用戶的隱私權意識抬頭, Apple 與 Google 對於藉由 Cookie 辨識用戶資料的廣告投遞方式,持有不同的態度,這也將是所有廣告主的極大挑戰。當 Cookie 不復存在,要如何辨識使用者資料?

Cookie 消失了,或許會有新的數據辨識工具來取代,但是任何試圖跟蹤受眾的方式,都難以符合大眾對於保護隱私權的期望。另一方面,也極有可能無法再通過日趨嚴格的媒體監管限制。無論如何,數位廣告不能像過去一樣,無條件地使用類似 Cookie 的追蹤方式,來達到與現在同樣的廣告效果。

後 Cookie 時代內容辨識類型的廣告鎖定方式,將成為未來具指標性的投放策略。廣告與瀏覽平台或內文主題的高相關性,不僅能顯著提高受眾的互動度,更重要的是,完全不需要收集任何個人數據。

FreakOut Taiwan 不斷嘗試更友善的廣告投遞形式, 自 2016 年進入台灣市場的原生廣告,到 2020 年末引進「 Mirrors 」 AI 影像視覺內容辨識系統,都是以網路使用者的角度出發。「 Mirrors 」不需要使用傳統的受眾興趣設定,即可針對「目標受眾在觀看的影像內容」、「品牌自身競爭對手或相關指定系列產品出現的影片」來投遞 YouTube 上的影音廣告。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

AI 人工智慧影像技術突破,推動新一代內容辨識功能

傳統的內容比對廣告皆為自然語言處理 NLP 中心,基於「純文字」的比對來顯示相關廣告,如大家很熟悉的 Google AdSense 。但是,結合新興的 AI 演算和複雜的圖像辨識,已然能夠達到「影片」的內容偵測,透過增加多個比對層和基於自然語言處理 NLP 的基準定位,可深度學習並提供更精細的辨識洞察力。

舉例來說,若想要將汽車廣告投放給對汽車有興趣的人,我們要先從可能對汽車感興趣的受眾中開始推估,並且根據過去的經驗加入不同的興趣條件,最後針對素材更進一步地測試。透過 Mirrors ,我們可以讓廣告出現在有滿足特定條件的影片內,例如:在消費者觀看的影片中,出現汽車評測報告、自家品牌或競爭對手的 LOGO 、代言人等指定條件,再依照不同廣告主設定的預算判斷是否露出廣告。

藉由這樣的影像比對方式,可以更有效地根據消費者行為觸發廣告投遞條件,而不再是現行的用戶受眾數據。人的興趣是多樣且多變的,當對汽車有興趣的用戶在完成汽車的選購後,短期內將不會再瀏覽相關資訊,轉而瀏覽其他更具時效性的內容。透過消費者當下正在觀看的影片內容,取代消費者身上被貼上的數位標籤,將更貼近消費者本身的使用行為。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

Mirrors AI 影像辨識:用消費者看的內容決定廣告

2021 年台灣數位報告指出,台灣人在各網路內容服務中,最愛「網路影片」的比例高達 97.9%,遠超過 Vlog、串流音樂、網路廣播、Podcast 。

影音廣告早已是品牌經營的趨勢:根據 DMA 2019 年台灣數位廣告量統計報告指出,台灣各類型廣告中,影音廣告以 37.2% 的成長比例大幅領先奪冠。其中 YouTube 持續蟬聯台灣最常被造訪網站第 2 名(僅次於 Google ) ,在台灣各大影音平台中的觸及率及影響力不容小覷。

2021 年 FreakOut Taiwan 已與客戶合作,進行搭載新系統的 YouTube 串流內廣告投遞,在針對品牌及產品客製化的多層鎖定策略建議下,房地產廣告的 CTR 表現高於平均,並發現「人臉」群組辨識表現為佳,其中多為財經、名嘴等名人。而美妝品牌廣告 VTR 表現優異,則以品牌「 Logo 」、「人臉」群組有最出色的表現。

本文章內容由「驚點股份有限公司( FreakOut Taiwan )」提供,經關鍵評論網媒體集團廣編企劃編審。