画像生成AIを代表するStable Diffusionでお馴染みStability AI社より、音楽生成AIサービス「Stable Audio」がリリースされました。
今後の進化が楽しみなサービスではありますが、現在の音楽生成AIがどのような立ち位置にいるのか、映像クリエイターでもあり作曲家でもある僕なりの視点で、仕事道具としてどの程度使えるのかを考察します。
【目次】
音楽生成AIは音楽を作れない人の助けとなるか
こちらがStable Audioの画面です。左上にテキストエリアがあり、プロンプトを入力するだけで楽曲が生成されます。
アカウントを作ればどなたでも無料で20曲生成できるため、どのような楽曲ができるかはぜひ実際に触っていただきたいんですが、YouTubeの動画で使うBGMであれば問題なく使えそうなクオリティです。
ジャンルの指定をするとちゃんとそのジャンルっぽい楽曲を作ってくれて、楽器・雰囲気・BPMなどをプロンプトに加えることで好みの楽曲へ近づけることができます。
とはいえ、細かい調整は効きにくいため求めている楽曲に近づけるのはなかなか難しく、生成された後に修正したい箇所があっても直せないですし、再生成してもまた違った楽曲が生成されてしまいます。
この辺りは画像生成AIサービスと同じですね。「テキストを入力するだけ」なのは手軽である一方で、プロンプト入力の技術・知識が問われます。
自分が求めているレベルの楽曲が作れるかどうかは、プロンプト入力と運次第だと思いますが、ひたすらガチャを回せば好みの楽曲と出会える可能性は十分あります。
音楽生成AIは音楽家から仕事を奪うか
現時点でのStable Audioでは、頭に描いているイメージ通りの曲を生み出すことはできません。
さきほど触れた通り、下記のようなデメリットがあります。
- プロンプトによる細かい調整が効きにくい
- 生成後に部分的な修正ができない
- 再生成するとまったく違った楽曲になってしまう
楽曲を作っていると「部分的にメロディを変更したい」とか「構成を調整したい」とか「特定の楽器を差し替えたい」といった要望が頻繁に出てきますが、Stable Audioではこのような修正はまったくできません。
トークのうしろでうっすら流れているBGMなら雰囲気的にそれっぽければ問題なくても、映画や舞台の劇伴音楽のような細かい要望に応える必要がある作品づくりには不向きですね。
プロの音楽家の多くは「受けた要望を具現化する」ことを仕事としていると思いますので、現時点でのStable Audioのクオリティでは、音楽家の仕事を奪うことはできそうにありません。
音楽生成AIは音楽家の作業を手助けできるか
Stable Audioを使って生成した楽曲をそのまま作品とすることは難しくても、作曲作業をサポートする役割としては十分活躍してくれそうです。
ジャンル指定して生成された楽曲を参考資料としたり、アイデアのたたき台として使うなど、作編曲をサポートするツールとして活用できると思います。
ただし、音楽生成AIが作り出した曲を素材として、これから作ろうとしている楽曲に組み込むのは難しそうな印象です。
例えばパーカッションのループ素材を作ろうとしたときに音程を持った楽器の音が入ってしまうなど、プロンプトを何パターンか試してみても音素材として使えるものは作れませんでした。
楽器のソロ演奏素材などが作れると楽曲の一部として使えるようになるので、ダイレクトに楽曲制作の手助けになってくれるんですが、このような使い方は現状では難しいです。
僕は普段ロイヤリティーフリーの音素材を楽曲に組み込むことが多く、その素材の一つとして音楽生成AIが生み出したものを使えるようになるとありがたいので、今後の進化に期待しています。
まとめ
音楽を作ってくれるAIはこれまでにもいくつか触ってきまして、他社サービスと比較するとStable Audioはかなりクオリティが高いと思います。
そのようなクオリティが高いStable Audioでも、音楽制作者にとって仕事が奪われるほどのレベルではない印象でした。
とはいえ、つい先日まで人間の指をきちんと描けなかった画像生成AIは写真と見間違えるほどリアルに再現できるようになりましたし、音楽生成AIも気がついたら実践レベルまで進化する可能性があるので、音楽制作者として仕事を奪われないために存在感を出せるように頑張ります。
(文:大谷大)
「paizaラーニング」では、未経験者でもブラウザさえあれば、今すぐプログラミングの基礎が動画で学べるレッスンを多数公開しております。
詳しくはこちら