KNOWLEDGE - COLUMN ナレッジ - コラム

日本発の音楽生成AI「SOUNDRAW」で作曲してみる

コラムイメージ

関連するソリューション

業務改革

AI

株式会社IDデータセンターマネジメント
ICTサービス第5部
テクニカルスペシャリスト 水谷 知彦顔写真

IDデータセンターマネジメント所属テクニカルスペシャリスト水谷です。
みなさん、ChatGPTなど生成系AIを活用されていますでしょうか?

弊社では、社員向けにAzure OpenAI Serviceを利用した対話型AI「ID AI コンシェルジュ」が提供されており、私もコード解析などでよく利用しています。例えば、過去に作成したExcelマクロを解析するのに、今まで数時間かかっている状況でしたが、今は「ID AI コンシェルジュ」にコードを貼り付ければ処理の内容を詳細に説明してくれるので、Excelマクロの解析は数十分で済んでしまいます。

もうコードを解析する際は、「ID AI コンシェルジュ」が手放せません。

さて、今までのコラムでは、ChatGPT(文書生成AI)DALL・E(画像生成AI)と触れてきましたが、今回のコラムは音楽生成AIに触れていきたいと思います。テレビ番組や、ネットニュースなどで何となく音楽生成AIが凄いらしいと言うことは知っているのですが、今回も実際に体験しながらその凄さを見ていきたいと思います。

音楽生成AIを使ってみる

ChatGPTによる選定補助

それでは早速、ChatGPTにおすすめの音楽生成AIを教えてもらいましょう。(※最新の情報も取得できるよう、PluginのNowを有効にしています。)


ChatGPT


世の中には多くの音楽生成AIがあるようです。なかなか絞り込めないので、ネットを利用してサービスを調べていると国産の音楽生成AIがあることを見つけました。

SOUNDRAW

折角の機会なので、今回は国産のSOUNDRAWを利用してみたいと思います。


まずは、「無料で作ってみる」をクリックします。
SOUNDRAW


SOUNDRAWを利用するためには、無料の会員登録が必要になります。パスワードを設定する際は、他のサービスでパスワードが漏洩した際に影響を受けないようにするため、他のサービスとパスワードが同じにならないよう注意します。
SOUNDRAW


作曲画面が表示されました。作曲経験がゼロの私でも何となく作曲ができそうです。
SOUNDRAW


まず曲の長さを決めます。初めてなので短めの1分で曲を作成してみたいと思います。
SOUNDRAW


次にジャンルを選びます。ジャンルが豊富過ぎて悩みます。今の季節にピッタリな「Christmas」を選んでみます。
SOUNDRAW


次にムードを選びます。こちらの豊富に選択肢があり悩みます。「Happy」でいきましょう。
SOUNDRAW


最後にテーマを選びます。ここまで来ると、どのような曲が作成されるか想像がつかなくなってきました。「Cinematic」を選んでみましょう。
SOUNDRAW


数秒で15曲作成されました...早い。
SOUNDRAW


左側のアイコンをクリックして曲を聞いてみましょう。クリスマスのイメージに合った素敵な曲が流れきました。実際にお聞かせできないのが残念です。
SOUNDRAW


SOUNDRAWでは、有料プランに入ると作成した曲をダウンロード可能となり、商用利用できるようになります。

AIで作曲した曲を、月2千円弱のお金を払えば、SNSや動画、店舗で流す曲など、様々なシチュエーション、サービスで利用できるようになります。さらにアーティストに向けたプランでは、AIで作曲した曲にボーカルを乗せ、楽曲として提供することが可能になります。

音声クローン生成AI

文章、画像を含め、表現をするためのハードルがここ数年で急激に下がってきていることを感じます。音楽生成AI以外にも音に関する生成AIは、音声、音声クローンなどを対象にしたものがあります。音声では、テキストに入力したものを自然な日本語で読み上げてくれるものや、入力した音声を他の音声に変換してくれるものがあります。

また、音声クローンでは、入力された音声と同じ声で指定した言葉を喋ってくれるものがあります。有名なところでマイクロソフトが開発したVALL-Eがあり、こちらは、3秒程度の音声ファイルを読み込ませることで、テキストで入力した内容を、読み込ませた音声で喋ってくれると言ったものになります。
 
このVALL-Eで作成された音声のクオリティは、大変高いレベルにあり本人が喋っているのかAIが喋っているのかなかなか判断がつきません。細かなイントネーションの違いなどでAIかどうか判断できることもありますが、事前にAIで作成されていることを言われていないと、違和感なく本人の声と信じてしまうことも多いと思います。
 
VALL-Eの活用事例の一つとして、VALL-EとSOUNDRAW、ChatGPTを組み合わせることで、AIで作曲した曲にAIで作詞した歌詞を乗せて、お気に入りのアーティストに歌ってもらうことが可能です。

もちろんアーティストの方の著作権などがありますから、世の中に配布はできませんが、個人で楽しむ分には大変面白い創作活動になると思われます。

今後も成長が楽しみな音声クローン生成AIですが、ネガティブな面もあります。例として、音声クローン生成AIを利用して、あたかも本人が実際に喋っているかのような動画でフェイクニュースを作成することが可能になります。

また、本人が喋っているのか、AIが喋っているのか判断がつかないため、特殊詐欺などで相手を信じ込ませる手段の一つとして利用できてしまいます。


イメージ画像

最後に

生成AIは大変便利なものですが、悪用されてしまうと大変厄介なものになってしまいます。今後、フィッシングメール、フィッシングサイト、フェイクニュース、特殊詐欺など多くのサイバー犯罪が生成AIなどを活用してより巧妙化していくと考えられます。

被害者にならないためは、常に最新のサイバー犯罪の動向にアンテナを張りながら生活する必要があるかもしれません。

最後までお読みいただきありがとうございました。それではまた、次のコラムでお会いしましょう。



当サイトの内容、テキスト、画像等の転載・転記・使用する場合は問い合わせよりご連絡下さい。

エンジニアによるコラムやIDグループからのお知らせなどを
メルマガでお届けしています。

メルマガ登録ボタン


水谷 知彦

株式会社IDデータセンターマネジメント テクニカルスペシャリスト

この執筆者の記事一覧

関連するソリューション

業務改革

AI

関連するナレッジ・コラム

ブロードコムのVMware買収 ~利益の追求と混乱

次世代ソフトウェア開発で広がる地平線

AI処理を高速化する「NPU」とは