讓機器“看圖譜曲” 百度意欲何為?
許多年之前,在一次講座中,人工智能先驅侯世達為臺下音樂(lè )專(zhuān)業(yè)的師生播放了兩首作品:一首來(lái)自肖邦,一首來(lái)自機器創(chuàng )作的“偽肖邦”,并讓他們判斷哪首是真肖邦,他們受過(guò)專(zhuān)業(yè)音樂(lè )訓練,但多數人選擇了后者。
本文引用地址:http://dyxdggzs.com/article/201607/294389.htm這算是圖靈測試在音樂(lè )領(lǐng)域的鏡像。直覺(jué)上看,音樂(lè )與計算分列認知體系的兩極,前者關(guān)乎感性甚至靈性,后者則被多數人歸為“死理性派”,窺不見(jiàn)半點(diǎn)美感,但必須承認,倘若打穿知識邊界,在更本質(zhì)的意義上,音樂(lè )與計算共享同一套底層邏輯:某種抽象事物的形式組合——我個(gè)人聽(tīng)到過(guò)關(guān)于音樂(lè )最好的定義來(lái)自數學(xué)家萊布尼茨:音樂(lè )是人類(lèi)精神通過(guò)無(wú)意識計算獲得的愉悅。
正因如此,人類(lèi)一直試圖讓機器擁有“譜寫(xiě)”音樂(lè )的能力——最早的算法作曲(Algorithmic Composition)甚至可追溯到1957年化學(xué)家和音樂(lè )家Lejaren Hiller用算法生成了弦樂(lè )四重奏伊利亞組曲。如今幾十年過(guò)去,在大數據“喂養”下,機器學(xué)習技術(shù)的發(fā)展讓機器譜曲這件事愈加成熟,且與其他技術(shù)的嫁接也讓機器譜曲邁向應用層面。
最近一個(gè)例子來(lái)自百度深度學(xué)習實(shí)驗室,他們發(fā)明了一種基于輸入圖片生成曲譜的自動(dòng)化系統:輸入一張圖片,系統會(huì )自動(dòng)生成一段符合該圖片內容和意境,且符合韻律和節拍的曲譜——換句話(huà)說(shuō),試圖用機器視角理解一張圖片,然后創(chuàng )作一段音樂(lè )。
技術(shù)也正在落地。7月19日晚,百度聯(lián)手尤倫斯當代藝術(shù)中心(UCCA)舉辦了一場(chǎng)主題為“AI科技與藝術(shù)之夜”的跨界活動(dòng)?;顒?dòng)現場(chǎng),百度人工智能根據藝術(shù)家勞森伯格“四分之一英里”畫(huà)作中的兩個(gè)部分,分別生成了與畫(huà)作元素相對應的鋼琴曲。在隨后播放的視頻中,百度還展示了人工智能根據梵高的《星夜》和徐悲鴻的《奔馬圖》創(chuàng )作的曲子。這是百度首次嘗試將人工智能技術(shù)與藝術(shù)創(chuàng )作相結合。

那么問(wèn)題來(lái)了,探究這樣一個(gè)看起來(lái)頗具藝術(shù)氣質(zhì)的技術(shù),百度意欲何為?
機器“看圖譜曲”
拆解來(lái)看,讓機器“看圖譜曲”的技術(shù)實(shí)現分兩部分:第一是訓練過(guò)程,用海量數據對機器進(jìn)行飼養(如你所知,近些年來(lái),大規模計算能力,各種復雜模型和算法的誕生,讓深度學(xué)習的訓練數據不斷增長(cháng)),輸入數據是帶有語(yǔ)義標簽的圖片庫,曲譜和對應歌詞的曲庫,輸出是語(yǔ)義標簽提取模型和曲譜生成模型;第二部分是測試過(guò)程,當機器智慧覓得規律,輸入一張圖片,則可輸出一曲音樂(lè )。
先說(shuō)訓練。訓練的第一階段即是利用圖片庫訓練學(xué)習,得到語(yǔ)義標簽提取模型,訓練圖片則由人工標注關(guān)鍵詞,包含兩種類(lèi)型:第一,圖片中出現的物體,譬如高山,大海,天空等;第二,圖片色調和意境,譬如灰暗的,晴朗的,憤怒的,壓抑的等。訓練的第二階段是學(xué)習得到曲譜生成模型,具體則通過(guò)局部曲譜聚類(lèi)(對所有曲庫中每半個(gè)小節作為一個(gè)曲譜單元,將所有相似曲譜聚集到同一個(gè)聚類(lèi)上),統計語(yǔ)義標簽與曲譜單元相關(guān)性,統計局部曲譜單元聚類(lèi)的相鄰概率等步驟實(shí)現。
再說(shuō)測試。這一過(guò)程同樣包含兩個(gè)階段,第一階段是給定一張圖片,根據語(yǔ)義標簽提取模型判斷其是否可提取得到該語(yǔ)義標簽;第二個(gè)階段則是曲譜生成——總之可以看出,作為一項復合型技術(shù),讓機器“看圖譜曲”的實(shí)現路徑委實(shí)不易。
不是替代,是合作
當然,即便如此——即便機器譜寫(xiě)的曲目聲音悅耳,由于“藝術(shù)”長(cháng)久以來(lái)的某種蠱惑性(其實(shí)藝術(shù)形式的演進(jìn)從來(lái)都與技術(shù)進(jìn)步息息相關(guān)),也一定會(huì )有人覺(jué)得,這種聲音不是“人工”而是“合成”的,從而構建鄙視鏈。但如前所述,作為一門(mén)課題,探尋音樂(lè )與數學(xué)的關(guān)系一直存在,不少作曲家都對二者的結合進(jìn)行過(guò)大膽實(shí)驗。
評論