聽 1961 年的機器人歌手,唱一首兩個世紀前的老情歌

說起電腦模擬人聲唱歌,相信大家的第一反應都是日本的萌妹虛擬偶像初音。但其實在初音誕生很久很久很久以前,就有公司嘗試過讓電腦開口唱歌——世界上第一段由電腦模擬人聲的歌曲是IBM704在1961年演唱的。
評論
Photo Credit: NASA
Photo Credit: NASA
評論

本文來自合作媒體 Pingwest,INSIDE 授權轉載

說起電腦模擬人聲唱歌,大家的第一反應都是日本的萌妹虛擬偶像初音了。

但其實在初音誕生很久很久很久以前,就有公司嘗試過讓電腦開口唱歌——世界上第一段由電腦模擬人聲的歌曲是 IBM704 在 1961 年演唱的,名字叫 Daisy Bell:

這首歌本身創作於 1892 年,傳說中它的作者 David Ewen 是一位英國流行作曲家,當他第一次抵達美國的時候因為隨行李攜帶的一輛自行車而被要求額外繳納關稅。他的另一位作曲家朋友對他說:「還好你帶的不是二人自行車,否則你要付出雙倍的代價」(It’s lucky you didn’t bring a bicycle built for two , otherwise you’d have to pay double duty.)

不久之後,Dacre 就開始用「bicycle built for two」為主要歌詞創造了這首歌曲,因此 Daisy Bell 的另外一個名字也叫 bicycle built for two。這首歌的曲調明快,歌詞押韻且使用了大量的雙關語。描述了一個租不起馬車,但願意與女友一同騎自行車的年輕小伙子和他仰慕對象 Daisy·Bell 的愛情故事,有著 19 世紀美國特色的浪漫色彩。

這首歌第一次在大眾中流行,源於在倫敦音樂廳的成功首演。由音樂廳歌手凱蒂·勞倫斯(Katie Lawrence)演出。不過,Daisy Bell 與機器人結緣卻是在歌曲被創作出來半個世紀以後——在貝爾實驗室裡。

1957 年,美國國家航空咨詢委員會的 IBM704,雖然沒有「一個屋子」那麼大,但是還是挺大的。

這一次把 Daisy Bell 唱紅的歌手是 IBM 在 1954 年推出的電腦 IBM 704,這是世界上第一台內建浮點數運算功能的電腦。它由前代 IBM 701 改良而成,使用磁帶記憶取代真空管作為儲存體,並增加了三組索引暫存器(類似記憶體的東西)。為了實現更多的功能,它的 CPU 採用了全新的指令集,並在程式語言上支持 Fortran 和 LISP。在當時,IBM704 被認為是唯一可以處理複雜數學計算的電腦。

總之,如果你如果不懂的話,只要知道這個東西就是當時人類科技的巔峰就好了。由於價格昂貴且產量較低,IBM 累計只賣出了 140 台 IBM704——大多數是軍方和學術機構。比如被用於史密森天文觀測台幫助科學家對觀測到的衛星進行軌道計算。

然而讓 IBM704 更為知名的,還是因為它在電腦音樂史上的貢獻。

世界上第一位電腦音樂大師 Max Mathews 在 IBM 704 上開發出第一個電腦音樂程式——MUSIC,並用這款軟體創作了一個 17 秒的音樂,雖然效果並不十分理想但這讓大家看到了電腦合成音樂的可能性。

隨後在 1961 年,Max 在貝爾實驗室,與科學家 John Kelly 等人對 MUSIC 進行了一些優化,並實現了第一首由電腦模擬人聲進行演唱的歌曲 Daisy Bell。最終的錄音其實分為兩部分,一部分是由電子合成樂程式 MUISC 演奏的伴奏,另一部分是由人聲合成器演唱的歌詞部分。

為了讓 Max 可以更好的用電腦製作音樂,貝爾實驗室甚至在 1967 年製作了一個名為 Graphics 1 的巨大硬體。它為當時已經更新到第四版的 MUSIC 程式提供了一個可以快速查看、修改、複製、擦除的圖形前端——這東西甚至是個觸摸螢幕,上圖就是貝爾實驗室的研究員 Lawrence Losler,正手持一根「手寫筆」幫助 Max(右)修改他的音樂。

之後,Graphics 系列的第二代被商用化推廣,並可用於手繪電路圖、邏輯線框圖和 CAD 圖等當時其它電腦做不到的高端功能。

並沒有資料顯示為什麼當時會選擇 Daisy Bell 這首老歌作為實驗曲,但顯然當時的效果是令人震撼的。科幻小說家約翰·皮爾斯由於正好在貝爾實驗室拜訪朋友,而有機會見證了歷史上電腦第一次唱歌這一幕。因此在他之後的作品《2001:太空漫遊》中,HAL 9000 超級電腦瀕臨死亡的時候唱起了 Daisy Bell,將整個電影推向了高潮。

儘管當時的 IBM704 還完全沒有可能實現一丁點人工智慧,但它對人聲的模擬卻讓當時的人們在感性上認為「機器人」距離我們又近了一點。

另一位誤打誤撞進入電腦領域的明星「萊娜」是一位《花花公子》的封面女郎,因為照片被寫入 70 年代的一篇電腦論文,而因此在之後的 30 年成為了電腦視覺領域的一張「基準圖片」。其本人,於 1997 年獲邀出席圖像科學學會的週年大會。

從此之後,Daisy Bell 彷彿成了一個電腦音頻領域的「萊娜圖」,許多公司和研究在從事相關開發的時候都會選擇 Daisy Bell 進行嘗試,1974 年,聲學研究人員用 Daisy Bell 嘗試立體聲編碼,而不是簡單的將兩個單聲道分別給到雙耳。1985 年,有人寫了一個程式讓 Commodore 64 電腦可以用磁帶以發出 Daisy Bell 的曲調。

相比之下,在影視作品中,Daisy Bell 更成為了機器人們玩梗的代表:比如 2005 年的動畫電影《機器人》、電視劇集《Dr.Who》、《邪惡力量》中都有出現這段音樂。另外,還出現在了 2012 年的霍金傳記體電影《萬物理論》中——無法行動的霍金在輪椅上寫下 Daisy Bell 中的歌詞「Daisy Daisy give me your answer.」

在現實世界中,開頭提到的大家比較熟悉的初音家族(vocaloid)中的巡音ルカ也在十週年祭的時候演唱過一首相關的歌,叫 D a i s y。而當你要求微軟的語音助手小娜(英文版)唱一首歌的時候,她也有一定機率唱這首 Daisy Bell。

隨著技術的進步,電腦已經幾乎可以完美的模擬樂器,並逐漸的在模擬人聲的模擬上盡善盡美。

也許有一天,我們會再也分辨不出哪首歌是機器唱的,哪首歌是人唱的吧。