(相關(guān)資料圖)
繼文字生成AI模型Wordcraft、視頻生成AI模型Imagen Video后,日前谷歌方面公布了對音樂(lè )生成AI模型MusicLM的研究成果,該模型可以根據文本或圖片生成任何類(lèi)型的高保真音樂(lè )。
在相關(guān)聲明中,谷歌方面展示了大量生成作品的案例,例如輸入文本“雷鬼和電子舞曲的融合,帶有空曠的、超凡脫俗的聲音,引發(fā)迷失在太空中的體驗,音樂(lè )的設計旨在喚起一種驚奇和敬畏的感覺(jué),同時(shí)又適合跳舞”,MusicLM便可生成一段時(shí)長(cháng)30秒的電子音樂(lè );又如以世界名畫(huà)《跨越阿爾卑斯山圣伯納隘口的拿破侖》為題,MusicLM生成的音樂(lè )便莊重典雅,體現出冬日的凌厲肅殺和英雄主義色彩。
據悉,在MusicLM之前,同類(lèi)產(chǎn)品還包括Riffusion、Dance Diffusion、人工智能研究機構OpenAI旗下的Jukebox,以及谷歌自家的AudioML等。雖然MusicLM并非首個(gè)可以根據文本生成音樂(lè )的AI模型,但得益于集成了MuLan+AudioLM和MuLan+w2b-Bert+Soundstream等多個(gè)模型的優(yōu)勢,以及龐大的訓練數據庫(280000小時(shí)的音樂(lè )),其能制作出作曲特別復雜或保真度特別高的歌曲。
據了解,MusicLM不僅具備強大的輔助功能,可設定具體的樂(lè )器、地點(diǎn)、流派、年代、音樂(lè )家演奏水平等“參數”,從而對生成的音樂(lè )質(zhì)量進(jìn)行調整,還能使用計算機通常難以掌握的抽象概念編寫(xiě)曲目。此外MusicLM還具有“故事模式”,可編程特定時(shí)間內的音樂(lè )風(fēng)格、氛圍和節奏的轉變,例如可采用幾個(gè)按順序編寫(xiě)的文本描述來(lái)創(chuàng )建一種“故事”的敘事旋律。
但需要注意的是,MusicLM也有生成式AI普遍面臨共同的風(fēng)險,即技術(shù)不完善、素材侵權、道德?tīng)幾h等。例如在要求MusicLM生成人聲時(shí),雖然技術(shù)上可行,但結果卻可能不如人意,有時(shí)會(huì )出現歌詞意義不明的情況,并且MusicLM生成的音樂(lè )中,約有1%是直接從訓練集的歌曲中復制而來(lái)。
因此谷歌方面暫未向公眾發(fā)布MusicLM,并且該公司表示,“我們承認需要在未來(lái)開(kāi)展更多工作來(lái)應對這些與音樂(lè )生成相關(guān)的風(fēng)險,目前沒(méi)有發(fā)布該模型的計劃?!?/p>
權威!全面!便捷!行業(yè)人都在關(guān)注的視頻號 ——
責任編輯:房家輝
分享到:版權聲明:凡注明來(lái)源“流媒體網(wǎng)”的文章,版權均屬流媒體網(wǎng)所有,轉載需注明出處。非本站出處的文章為轉載,觀(guān)點(diǎn)供業(yè)內參考,不代表本站觀(guān)點(diǎn)。文中圖片均來(lái)源于網(wǎng)絡(luò )收集整理,僅供學(xué)習交流,版權歸原作者所有。如涉及侵權,請及時(shí)聯(lián)系我們刪除!關(guān)鍵詞: 輔助功能 跨越阿爾卑斯山圣伯納隘口的拿破侖 責任編輯