Mureka O1模型與Mureka V6模型自3月底發(fā)布以來,收獲了全球用戶的廣泛好評,新增注冊用戶近300萬。
7月23日,昆侖萬維為全球用戶帶來最新音樂模型Mureka V7,以及全新的音頻模型Mureka TTS V1——支持Voice Design音色設(shè)計能力。
Mureka V7是一座24小時不打烊的私人錄音棚,它懂得旋律的呼吸,也懂得你偶爾的情緒化。只需要敲下一個主題、幾行歌詞、想要的風(fēng)格,兩分鐘后就能在電腦中聽到一首完整且愿意立刻分享給好友的音樂作品。
01
Mureka V7 :給你更好聽的音樂旋律
過去制作一首歌,從靈感到成品需要很多步:寫詞 → 作曲 → 編曲 → 約棚 → 混音 → 成品。而今天,我們使用Mureka V7,用戶只需要輸入歌詞或選擇風(fēng)格、主題,再點擊「生成」,即可生成一首歌。
Mureka V7全新升級后,將用戶的音樂靈感折疊成了一次「點擊」,這不僅是一次效率的大幅躍遷,更是音樂品質(zhì)的質(zhì)變:
1. Mureka V7帶來的音樂品質(zhì)更好:大幅提升旋律動機與編曲質(zhì)量,人聲與樂器真實度進一步增強,做出來的每一首歌都好聽;
2. Mureka V7的音樂創(chuàng)新性更強:生成的歌曲對于音樂從業(yè)者更具啟發(fā)。
當(dāng)然,這些聽感上的提升,是背后技術(shù)指標(biāo)的提升:
1. 良品率從V6的43.4%提升到57.7%,這意味著輸入歌詞生成后獲得好聽歌曲的概率;
2. 人聲真實度和表達力提升44%,讓人不禁感嘆“這真是AI做的?”;
3. 整體音質(zhì)提升近一倍,告別“AI味”的千篇一律。

圖丨Mureka V7歌曲質(zhì)量評估(主觀評價指標(biāo))
為什么Mureka能做到讓音樂這么好聽?
因為傳統(tǒng)的自回歸(Autoregressive, AR)模型雖然已經(jīng)具備較強的音頻保真能力,但其基于逐 token 預(yù)測的范式,本質(zhì)上并不符合人類在音樂創(chuàng)作中「先規(guī)劃整體,再填充細(xì)節(jié)」的思維過程,這種不匹配往往導(dǎo)致生成音樂缺乏連貫的結(jié)構(gòu)性與藝術(shù)性。
為此,我們在Mureka V7版本大幅優(yōu)化了 MusiCoT (Analyzable Chain-of-Musical-Thought Prompting) 技術(shù)(https://musicot.github.io/),專為音樂生成而設(shè)計的鏈?zhǔn)剿季S(Chain-of-Thought, CoT)提示方法。該方法顯著提升了模型生成結(jié)果的整體性與發(fā)聲表現(xiàn),具體體現(xiàn)在以下三方面創(chuàng)新:
???? 先結(jié)構(gòu),后生成:擬合人類創(chuàng)作邏輯
MusiCoT 技術(shù)在正式生成音頻 token 之前,先引導(dǎo)模型生成一份全局音樂結(jié)構(gòu)規(guī)劃,明確整體的段落、情緒、編配等布局。這一過程有效解決了傳統(tǒng) AR 模型中「只顧局部,不顧全局」的問題,使生成作品具備更自然的樂章推進與情緒遞進。
可解釋的音樂思維鏈,兼容參考樣式
通過結(jié)合 CLAP(對比式語言 – 音頻預(yù)訓(xùn)練模型),MusiCoT 構(gòu)建出一條具備明確語義指向的「音樂思維鏈」,不僅讓整體結(jié)構(gòu)更可分析與可控,更允許輸入任意長度的參考音頻作為風(fēng)格提示,從而提升模型在復(fù)刻、變奏等創(chuàng)作需求中的靈活性,規(guī)避直接復(fù)制的風(fēng)險。
???? 從主觀到客觀,全面驗證效果領(lǐng)先
基于大量實驗,MusiCoT 技術(shù)在主觀與客觀雙重指標(biāo)下均展現(xiàn)出卓越效果。無論是結(jié)構(gòu)完整性、旋律連貫性還是整體音樂性,均優(yōu)于傳統(tǒng)方法,且在多項評測中表現(xiàn)已達到行業(yè)一流水準(zhǔn)。
在本版本,MusiCoT技術(shù)不僅在結(jié)構(gòu)層面實現(xiàn)了對音樂創(chuàng)作思維的擬合與對齊,更通過Mureka團隊數(shù)據(jù)的scale-up以及Embedding信息粒度的細(xì)化,完善了強可控性與可擴展性,最終實現(xiàn)了文本-音頻模態(tài)之間的差距進一步減小。未來,我們將持續(xù)迭代該技術(shù),進一步提升AI音樂生成的創(chuàng)意性與工業(yè)化能力。
02
Mureka TTS V1:無限音色,零門檻定制
此外,還首次推出Mureka TTS V1 ,支持 Voice Design 能力,用戶可以通過文本輸入想要的語音特征獲得對應(yīng)的音色。
不論是真實人物、虛擬人物還是配音角色,都能夠通過文本來控制,擺脫了過去只能通過現(xiàn)有音色庫實現(xiàn)音色克隆,或是只能使用已經(jīng)存在的音色形式。
Mureka TTS V1 的 Voice Design 功能技術(shù)指標(biāo)上也獲得了提升。

圖丨Mureka TTS V1 的 Voice Design 質(zhì)量評估(主觀評價指標(biāo))
整體而言,Mureka V7 的誕生,標(biāo)志著AI音樂生成從“工具化”走向“人性化”。它不再局限于技術(shù)的進步,而是真正理解人類對音樂的渴望——用旋律傳遞情感,用節(jié)奏講述故事。
音樂從來不是少數(shù)人的特權(quán)。
從洞穴里的骨笛到流媒體時代的數(shù)字音樂工作站,再到今天的AI音樂平臺Mureka,技術(shù)的每一次進步,都在讓每一位音樂愛好者能夠享受創(chuàng)作音樂的樂趣。
今天,Mureka V7把個人專屬錄音棚放進口袋。明天,我們希望聽到你用它在臥室、廚房、地鐵寫出下一首音樂流行榜的Top 1。
打開Mureka,即刻體驗!