ACE Studio 2 在其核心的「人聲合成(Vocal Synthesis)」基礎上,展開了極具野心的擴張。

 

 ACE Studio 已經展現了不俗的實力:這款虛擬樂器能根據 MIDI 訊號與歌詞數據,產出極其自然的人聲,在許多應用場景中已完全達標。

 

到了 ACE Studio 2.0,人聲合成依據是核心亮點,但第 2 代已進化為「全方位 AI 音樂工作室」,加入了更接近 DAW(數位音訊工作站)的工作流程、創新的樂器合成技術、人聲複製(Voice Cloning)以及多種生成式 AI 音樂選項。

 

合乎倫理的訓練

 

在深入介紹這些擴充功能之前,先談談大家關心的問題。ACE Studio 的各種 AI 功能顯然需要訓練資料來源。母公司 Timedomain 明確表示,他們以符合倫理的方式處理這件事,與參與的音樂人與演出者合作並提供合理報酬。無論你對人聲合成或生成式音樂的立場如何,至少在版權或智慧財產權方面的疑慮,已經獲得妥善處理。

 

人聲處理

 

人聲合成仍然是 ACE Studio 2.0 的核心功能,操作方式與初版大致相同。在類似 DAW 的 Canvas 工作區中,你可以建立 MIDI 軌,為音符加入歌詞,選擇音色庫(voicebank),ACE Studio 就會依據這些資料合成對應的人聲演唱。

 

MIDI 片段可透過手動編輯、即時錄製、匯入 MIDI 檔案,或是匯入/錄製自己的「草稿人聲」音訊後使用 Vocal To MIDI 功能產生。這項功能能從你的錄音中擷取音高與歌詞內容,轉換為適用於合成引擎的 MIDI 片段。雖然可能仍需些微修正,但若錄音乾淨、沒有和聲或殘響延遲等效果,轉換效率相當高,即使你不自認為是歌手也能輕鬆使用。

 

 

人聲合成可透過雲端運算完成,而具備足夠 CPU/GPU 的電腦則可使用本地「Turbo」模式,加快處理速度。

 

2.0 版本大幅擴充音色庫,涵蓋更多音樂風格、性別、年齡與母語。全新的 Verse25 合成引擎提供四個可自動化參數:Power、Soft、Breathy、Chest,並可加入呼吸聲,讓表現更具變化。舊版音色庫也可選擇使用舊版引擎。

 

 

兩個重要新功能為 Choir Mode(合唱模式)與 Blend Voices(混合音色)。Blend Voices 可在同一軌加入多個音色庫並調整比例,合成時會融合音色特性。Choir Mode 則能從同一組 MIDI/歌詞生成多個聲部,可控制時間偏移(Offset)、立體聲寬度(Spread)與音量,無論是製作真正的合唱團效果,或是單一聲音的雙軌堆疊都相當實用。

 

此外,你現在也能克隆自己的聲音(或你錄製的其他歌手聲音)。不過這並非簡單任務,需要大量且乾淨的多樣化演唱素材,才能達到接近內建音色庫的品質。

 

類 DAW 工作環境

 

新版 Canvas 提供熟悉的 DAW 介面,可建立音訊與 MIDI 軌道,在時間軸上錄製與編排片段。編輯功能雖未達主流 DAW 的完整程度,但足以應付 AI 人聲與樂器創作需求。

 

 

音訊片段新增 Stem Splitter(分軌工具),提供三種分離模式,效果不錯且整合便利。

 

另有和弦軌(Chord Track)與節奏/拍號變化軌(Tempo & Signature Change Track)。MIDI 會跟隨變化調整,但音訊尚未支援時間伸縮。和弦軌可播放基本鋼琴伴奏作為創作參考,但不會自動重新編配既有素材。

 

混音功能相對簡單,但可透過 ACE Bridge 2 外掛或支援 ARA 的 DAW 進行整合。

 

樂器的人聲式合成

 

2.0 最吸引人的新功能之一,是 AI 樂器合成。首波樂器包括小提琴、大提琴、小號、薩克斯風等單音樂器。這些樂器同樣以真人演奏建立音色庫,合成引擎能加入自然演奏表情,並自動判斷適當的運弓或吹奏法。錄製 MIDI 時會提供即時基本音色,方便演奏。

 

這種以真人演奏資訊驅動虛擬演奏的方式潛力巨大,未來主流取樣樂器開發商很可能也會投入類似技術。

 

 

生成式音樂功能

 

ACE Studio 的生成式功能包括 Inspire Me、Add A Layer 與 Music Enhancer。

 

Inspire Me 可從提示文字或歌詞生成完整歌曲(包含或不包含人聲,但此人聲為獨立生成,非 ACE 自家合成引擎)。

 

Add A Layer 可依指定長度生成新段落,最新版本已能參考既有專案內容新增元素。整體品質尚稱不錯,雖略顯公式化。

 

Music Enhancer 可將現有內容轉換為不同風格,但目前仍屬 Beta,穩定性尚待提升。

 

另有 Generative Kits 範例專案,可作為創作起點,並展示人聲合成能力。

 

整體評價

 

人聲合成依舊是 ACE Studio 最亮眼的功能,非常適合製作人聲 Hook、和聲、Demo 主唱等。若要作為正式主唱,則視作品需求而定。聲音克隆與樂器合成皆展現可觀潛力。

 

Canvas 仍未達完整 DAW 水準(例如尚未支援第三方 VST/AU),生成式音樂品質仍偏通用化。且生成的人聲為音訊而非 MIDI,若未來能與自家人聲合成引擎深度整合,將更具優勢。

 

優點

• 人聲合成具實用價值
• 新樂器合成技術潛力可期
• 聲音克隆表現良好

缺點

• 人聲與生成式音樂整合尚待加強
• Canvas 尚未取代完整 DAW
• 無限時免費試用