曲をボーカル、ドラム、ベースなどに分離させるツールが凄い!カラオケも作れる

音楽制作や編集などをしない方は音楽ツールにふれることはなかなか無いですが、ここ最近は音楽の世界にもAIが入り込んで今までできなかった夢のような事も現実になってきています。そんな中で導入したソフトが「AUDIONAMIX XTRAX STEMS」という音楽ソフト。これ一言でどんなソフトか紹介すると、CDなどから取り込んだ音楽を分析してボーカルとかドラムを分離/抜き出すという凄いソフトです。実際どんなソフトなのかを紹介していきますね。

XTRAX STEMS

AUDIONAMIXという海外の企業が発売している音楽加工ソフトで、普段聞いている音楽をソフトへ取り込むと、ボーカル、ドラム、ベース、その他(ギターやシンセなど)の4つに音楽が分離されそれぞれのパートをミュートしたりボリュームを調整したりすることが可能になる魔法のようなツールです。

例えばいつも聞いている曲のボーカルを消して楽器演奏だけにしたり、逆に楽器演奏を消してボーカルのみにしたり、ドラムだけを消したりなんてことができてしまうのです。これ料理で例えるとコーンスープから水とトウモロコシと牛乳とバターを別々に取り出すみたいな凄いことをやっているわけですよ。

処理は専用サーバーで

音声処理は高度な計算が必要になるのですが、読み込まれた音楽はネットで専用サーバーに送信されAIを用いた音声分析を用いて分離処理され、処理された音声データが再びソフトで受信されます。この一連の処理はバックグラウンドで自動処理されるので、サーバー設定とか難しい設定や操作は無し。まるでそのソフトの中で処理されているような感覚で使えるのはユーザーフレンドリーなところ。それに高度な計算処理をGPU搭載の専用サーバーで担ってもらえるのでPCのパワーを食わないのはありがたい限りです。

かつては類似ソフトも

実はこういった音楽トラックからボーカルのみを取り出すというソフトはけっこう昔からありました。CDの歌入りの曲とカラオケバージョンの曲をソフトに読み込ませ、逆相という処理を行いボーカルを取り出すという仕組みのもので、それぞれの曲に時間のズレや音量、何かしらの違いがあると全然機能しないという賭けに近いソフトでしたし、なによりも歌入りと歌なしの両方が揃わないといけないので「どんな曲でも」というわけにはいきませんでした。

対応PC

対応PCはWindows、mac共に利用可能で、DAWソフトなどを必要としないスタンドアロン(ソフト単独)での動作が可能です。

日本での価格は6,556円(現地価格60$)で、ソフトは買い切りではなく1年間ごとに支払いが必要なサブスクリプション契約となります。買い切りでないのは不便かもしれませんが、そのぶんサーバーや機能のアップグレードなども見込め、1年のみの契約であれば買い切りよりもお安くなるのもメリットです。

使ってみました

こういうソフトって専門知識が必要なのですが、使ってみた感想は「超簡単」。3ステップくらいでできてしまうこのソフトの操作を紹介していきます。

曲の読み込み

分離させたい曲を読み込ませるのはそのままファイルをソフトに突っ込めばOK。

対応ファイルは少なめ

対応するファイルはこういった音楽ソフトにしては少なめです。読み込み可能な形式は「WAV, MP3, FLAC, AIFF, OGG」のモノラルでもステレオでもOKで、周波数は192kHzの32-bitまで読み込み可能です。サーバーの処理負荷を抑えるためあえて形式を狭めているのかもしれませんし、圧縮処理された音源を分析する上で不得意な分野があるのかもしれません。ただiTunesで扱うm4aのファイル形式が読み込めずわざわざ変換する必要があったのは不便でした。iTunesに取り込んだ楽曲を使うニーズは一定数あるはずなので、例えばサーバー上の処理は無理でもソフト上で変換処理してから送信などの仕組みをもたせてほしいところです。

分離処理

楽曲を読み込ませたら操作はたったひとつだけで、下にある「4 Stems」を押すだけ。

あとは待つだけで、右下に処理状況がプログレスバーで表示されるので確認可能です。

この処理の間にほかの曲をどんどん入力して行くことができますが処理は1曲ずつとなります。

変換にかかる時間は5分位で、そのままPCを見つめながら変換を待つには時間を持て余す感じです。なので必要な曲を一気に読み込んで変換中は別の事をやるほうがおすすめです。

処理終了

処理が終了すると分離された4パートが波形として表示されます。

波形は5つ表示されていますが一番上はオリジナルの波形、その下から順番にボーカル、ドラム、ベース、Otherとなります。

パート編集

抜き出されたパートは簡単な編集が可能で、再生時のソロとミュート、ボリューム調整、分離効果の強弱を行う事ができ、最終的に音声ファイルとして書き出す事が可能です。

使い方としては特定のパートを抜き出すこともできるし、特定のパートを消す、特定のパートの音量を変えるなどけっこう色々な事ができます。

クオリティは?

実際のところどれくらいのクオリティで分離されるかというと、100を上限だとすると70〜90くらい。完璧な100はなかなか難しいものの、逆にいうと50以下の低クオリティでもないというところで、ボーカルは不自然な部分も感じられますが驚くほど分離はされます。一番分離が難しいのがベースで、思ったほどのボリュームが無くどの楽曲もモコモコした感じで分離されていました。

一つにまとまったものを周波数を解析して取り出しているわけですが、ボーカルとかドラムとかちゃんとパートを認識しているのが凄いです。埋もれた中から取り出してくるので、ボーカルなどはモワッとした感じがあったりドップラー効果のような部分があったりする時もありますが、それでもこのクオリティは凄いと感じました。

ファイル形式で左右される

現在の音楽購入は配信形式が主流になっていますが、配信される音楽のほとんどがMP3などに代表される圧縮フォーマットです。仕組みとしてはマスキングという他の音で消されて耳で聞こえない音はカットして音声データ量を減らすという仕組みで、聴感上では普通の曲でも音楽データの成分としては様々にカットされていることになります。なのでCD音源から抜き出した無圧縮ファイルと圧縮形式のファイルを比べたところクオリティの違いが現れました。もし高クオリティで作業をしたい方は面倒でも無圧縮のWAVファイルを用意したほうがより希望に近い音になるはずです。

使いみちは?

こういうソフトなのでニーズとしては音楽制作プロデューサーやエンジニア、DJ、ミュージシャンなどが想定されていますが、個人の趣味などでも使えそうですよ。

カラオケ制作

ボーカルだけをカットしたら本物の演奏を用いたカラオケが作れます。キー調整などもそういったソフトがあるので活用すればより本格的に。オリジナルアーティストと同じ演奏をバックに歌えるなんて夢のようです。他にも結婚式の余興用にカラオケを作るとかで活躍しそうです。

ボーカル抜き出し

ボーカルを抜き出すメリットは幾つもあります。趣味の範囲なら好きなアーティストの生声のみを堪能できますし、歌い方の練習をするための参考にしたり、リミックス楽曲を制作するための素材や、サンプリング用の声ネタを作るとかもできますね。

ブレイクビーツ

曲中でかっこよいドラムパターンがあったら抜き出してブレイクビーツを作る事もできます。昔はドラムだけ独立したパートがなければ難しかった作業も、無限の可能性が広がる時代となりました。

楽器演奏の練習

ドラムパートだけをミュートしてドラムの練習をするなど、特定のパートをカットして練習素材にすることもできます。プロの演奏とセッションするので上達も早くなりそう。

多くの人が使うツールではないのですが、個人ユースでも結婚式の音源だったり、自作ビデオのBGMに歌無しを使いたいとかちょっとした時にも効果を発揮してくれるソフトです。ただそれ以前にズバッと抜き出してくれる技術の凄さに驚いてしまうので、色んな楽曲を試してみたくなりますよ。