Google 開源音效合成器!NSynth Super 用機器學習創造新聲音

將 16 種原始音源輸入到 NSynth 演算法中,最終生成了超過 10 萬種新的音色。
評論
▲NSYNTH SUPER 實驗原型,photo credit: Google NSynth
評論

原文刊登於 GeekPark,INSIDE 獲授權轉載。

將 16 種原始音源輸入到 NSynth 演算法中,最終生成了超過 10 萬種新的音色。

技術的進步會給藝術創作帶來啓發。Google 發表了一個零門檻的音樂製作工具,讓普通人也能進行創作。最近,Google 推出了 NSynth Super(神經合成器),這次他們想用機器學習來創造全新的樂器音色。

2017 年 4 月,Google Brain 團隊推出了 NSynth(神經合成演算法),利用神經網路來學習聲音特徵,然後根據這些特徵生成一種全新的聲音。NSynth Super 是這項技術的硬體版本,利用這個帶觸控的合成器,音樂創作者可以用超過 10 萬種新聲音來進行創作。

NSynth 並不是簡單地將幾種聲音混合在一起,而是將原有聲音的聲學特性提取出來,合成一種全新的聲響,比如 25% 鼓+75% 笛子。

NSynth Super 把這項技術帶到了實際的工具上,讓聲音的輸入和播放更加容易。NSynth Super 的觸控螢幕上有 XY 軸,每個象限可以放置一個樂器,創作者可以使用由四種音源生成的全新聲音來進行音樂創作,只要在觸控螢幕上滑動手指即可。藝術創作需要靈感的觸動,這種全新的聲音合成在可玩性、創意性上都可以給創作者帶來不一樣的啓發。

在實驗中,長笛和軍鼓的聲音合成在一起,所生成的新聲音聽起來變得尖銳了很多,沒有了鼓的沈悶感。研究人員將包含 15 級音高的 16 種原始音源輸入到 NSynth 演算法中,最終生成了超過 10 萬種新的音色。雖然這個產品目前還處於實驗階段,但演算法和設計是開源的(Github),它本來就起源於 Google 的機器學習專案 Magenta。

Magenta 專案一直在探索機器學習在藝術創作中的作用,利用演算法來生成歌曲、圖像,讓藝術家利用這些技術來啓發自己的創作。先前 Magenta 專案寫過詩、譜過曲,這次的神經合成器更是把技術真正帶到了藝術創作中,除了啓發專業人員外,將藝術創作變得更易上手也是目標之一。

和 AlphaGo 的發展有點像,機器學習工具在學習完現有樂器之後,下一步就是生成新的聲音,然後啓發音樂創作。未來也許真的可以看到這個擁有彩虹螢幕的特殊合成器,我們聽到的音樂也將更多樣化。

 


Cookie 消失?試試看全新 AI 影像內容辨識:讓用戶看的內容決定看到的廣告

Google Chrome 即將淘汰幫助廣告主的工具—— Cookie ,它的離去將再一次地影響數位廣告產業。
評論
Photo Credit:<a href="https://www.shutterstock.com/zh/image-photo/ai-artificial-intelligence-big-data-internet-1075853384" target="_blank">shutterstock</a>
評論

透過GA分析進站者發現, Safari的新客數越來越多,難道這表示 iOS 的用戶數也跟著增加了嗎?注意了,這有可能是 Apple 封鎖第三方 Cookie 帶來的影響。隨著 Google 即將淘汰 Chrome 上的 Cookie ,這個幫助廣告主記住用戶受眾的小工具,將要再一次地影響數位廣告產業。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

後 Cookie 時代的廣告受眾如何鎖定?

各大廣告平台在過去幾年不斷地透過 Cookie 以及其它方式,悄悄收集使用者的用戶數據,隨著這幾年用戶的隱私權意識抬頭, Apple 與 Google 對於藉由 Cookie 辨識用戶資料的廣告投遞方式,持有不同的態度,這也將是所有廣告主的極大挑戰。當 Cookie 不復存在,要如何辨識使用者資料?

Cookie 消失了,或許會有新的數據辨識工具來取代,但是任何試圖跟蹤受眾的方式,都難以符合大眾對於保護隱私權的期望。另一方面,也極有可能無法再通過日趨嚴格的媒體監管限制。無論如何,數位廣告不能像過去一樣,無條件地使用類似 Cookie 的追蹤方式,來達到與現在同樣的廣告效果。

後 Cookie 時代內容辨識類型的廣告鎖定方式,將成為未來具指標性的投放策略。廣告與瀏覽平台或內文主題的高相關性,不僅能顯著提高受眾的互動度,更重要的是,完全不需要收集任何個人數據。

FreakOut Taiwan 不斷嘗試更友善的廣告投遞形式, 自 2016 年進入台灣市場的原生廣告,到 2020 年末引進「 Mirrors 」 AI 影像視覺內容辨識系統,都是以網路使用者的角度出發。「 Mirrors 」不需要使用傳統的受眾興趣設定,即可針對「目標受眾在觀看的影像內容」、「品牌自身競爭對手或相關指定系列產品出現的影片」來投遞 YouTube 上的影音廣告。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

AI 人工智慧影像技術突破,推動新一代內容辨識功能

傳統的內容比對廣告皆為自然語言處理 NLP 中心,基於「純文字」的比對來顯示相關廣告,如大家很熟悉的 Google AdSense 。但是,結合新興的 AI 演算和複雜的圖像辨識,已然能夠達到「影片」的內容偵測,透過增加多個比對層和基於自然語言處理 NLP 的基準定位,可深度學習並提供更精細的辨識洞察力。

舉例來說,若想要將汽車廣告投放給對汽車有興趣的人,我們要先從可能對汽車感興趣的受眾中開始推估,並且根據過去的經驗加入不同的興趣條件,最後針對素材更進一步地測試。透過 Mirrors ,我們可以讓廣告出現在有滿足特定條件的影片內,例如:在消費者觀看的影片中,出現汽車評測報告、自家品牌或競爭對手的 LOGO 、代言人等指定條件,再依照不同廣告主設定的預算判斷是否露出廣告。

藉由這樣的影像比對方式,可以更有效地根據消費者行為觸發廣告投遞條件,而不再是現行的用戶受眾數據。人的興趣是多樣且多變的,當對汽車有興趣的用戶在完成汽車的選購後,短期內將不會再瀏覽相關資訊,轉而瀏覽其他更具時效性的內容。透過消費者當下正在觀看的影片內容,取代消費者身上被貼上的數位標籤,將更貼近消費者本身的使用行為。

Photo Credit:驚點股份有限公司( FreakOut Taiwan )

Mirrors AI 影像辨識:用消費者看的內容決定廣告

2021 年台灣數位報告指出,台灣人在各網路內容服務中,最愛「網路影片」的比例高達 97.9%,遠超過 Vlog、串流音樂、網路廣播、Podcast 。

影音廣告早已是品牌經營的趨勢:根據 DMA 2019 年台灣數位廣告量統計報告指出,台灣各類型廣告中,影音廣告以 37.2% 的成長比例大幅領先奪冠。其中 YouTube 持續蟬聯台灣最常被造訪網站第 2 名(僅次於 Google ) ,在台灣各大影音平台中的觸及率及影響力不容小覷。

2021 年 FreakOut Taiwan 已與客戶合作,進行搭載新系統的 YouTube 串流內廣告投遞,在針對品牌及產品客製化的多層鎖定策略建議下,房地產廣告的 CTR 表現高於平均,並發現「人臉」群組辨識表現為佳,其中多為財經、名嘴等名人。而美妝品牌廣告 VTR 表現優異,則以品牌「 Logo 」、「人臉」群組有最出色的表現。

本文章內容由「驚點股份有限公司( FreakOut Taiwan )」提供,經關鍵評論網媒體集團廣編企劃編審。