Twitter 開放 API,疫情相關推文變成資料集

自從疫情全球大流行,有賴社群媒體普及之賜,社群上的相關討論也成為重要的第一手資訊。Twitter 因此宣布開放 API,讓平台上的疫情相關推文能成為可應用的資料集。
根據 TechCrunch 報導,Twitter 成立「Covid-19 Stream」,可以讓通過審核的開發者取用 Twitter 上與疫情相關的各種語言推文內容。這些推文每天高達數千萬條,可形成資料集,將對外開放給參與 Twitter Developer Labs 的開發者。
開發人員可以用來進行與疫情全球大流行的相關研究,例如:疾病傳播、假消息傳播、社區危機處理等等。也可以用資料集打造機器學習平台或數據工具,讓科學家可以破解與疫情相關的各種問題。
Twitter 會先排除垃圾郵件和低品質的內容,再從大量推文中進行篩選。如果使用到相關詞語,例如:Covid-19、coronavirus 等,或是推文有與疫情相關的主題標籤(hashtag),就會列入資料集。
不過,雖然 Twitter 宣稱可以免費查看,但如果開發人員、研究人員希望取用資料集,還是得向官方報告計畫內容、過往數據應用經驗等,並得說明將如何保障個資隱私,才會通過官方審核。
此外,也得擁有受批准的開發人員帳戶,並遵守 Twitter 所規定的「開發人員協議政策條款」(Developer Agreement and Policy),以確保數據能夠被安全應用。詳細的內容,可以參考「Covid-19 Stream」官方網頁以及數據應用的申請條件。
核稿編輯:Mia
延伸閱讀: