AIは人を代替しない
AIは人を代替しない by kotamiyazono (@kotamiyazono). Listen and make your own on Suno.
https://suno.com/embed/165ecdeb-35b0-4958-a4a7-f0bc2bbebc46
音楽とデジタルマーケティングとAIを愛する皆さま、こんにちは!
普段は、トランスコスモス株式会社のデジタルインタラクティブ(DI)事業本部で「生成AI」の活用推進に携わっている宮園です。
私、学生時代にバンド活動に明け暮れていまして、その流れで今年の忘年会でバンド演奏をすることになったのですが、「楽曲制作」においてAIとガッツリ向きあったので、その時の話を書いてみました。
全面的に生成AIを活用しましたが、想いが強すぎてこの過程で1000曲以上は生成するという途方も無い時間やお金?も掛けましたので、まずはぜひ聴いていただけますと…!
どうでしょうか…!?
今回、本部内の組織長で企画バンドを結成しまして、この2曲を演奏しました。
「BEHIND THE SCREEN」は業界あるあるを歌詞にし、「404」はリンク切れを表すエラーコードを恋愛に掛けて曲にしています。
(ちなみに、忘年会で生演奏したかったのですが、残念ながら会場での音出しは難しく…本動画を流す形となりました)
結果、多くの方に好評の声をいただき、何よりも依頼主のみなさんが本当に喜んでくれてたのが印象的でした。
生成AIにより
「人の想像力・創造力・可能性を拡げることができる。」
「心動かせる瞬間がつくれる。」
と確信するきっかけにもなりました。
以降は、具体的な利用ツールやプロンプトなどを紹介していこうと思います。
ただ、先に謝っておきます!
この記事には有用なプロンプトエンジニアリング論は含まれておりません。
抽象度の高い指示 × 数多の試行により「偶然、良いものができた!」という、「AI時代の新しい根性論」となってしまっているかもしれません!
バンド結成のきっかけ
どんな曲やる?
音楽生成AIツール「suno」
1000曲以上の試行錯誤
Styles(楽曲イメージ)
Lyrics(歌詞)
生成AIの難しさ
レコーディングとミックスとマスタリング
まとめ:生成AIは人の「意思」を形にする手段
<AIを活用できる環境がここに。新たなキャリアを築きませんか?>
毎年、DI事業本部では500名規模での忘年会を実施しています。今年は「フェス感を出したい!」という若手企画メンバーからの希望があり、組織長の中でもバンド経験者に相談がありました。
とりあえず「組織長のうちバンド経験者」というセグメントで抽出されたわけですが、実はバンドって難しいんです…!
人によって結構好きな音楽は違くて、これが合わないとバンドは組めません。いわゆる「音楽性の違い」ってやつですね。
J-POPを中心に候補曲はあったのですが、音楽性の違いに加え、生演奏でもない状況も考えると、なかなかこれという曲を決めきれないままでいました。
そんな時に、ちょうど世間を賑わせていたのが、音楽AI生成ツール「suno」がv5へバージョンアップし、とんでもないクオリティになっているというニュースでした。
音楽AI生成サービス「suno」
私は社内で生成AI推進担当もしながら、ずっと作曲していたこともあり、この辺りの情報は常にアンテナを張っていました。
曲作りにこだわりがありすぎて、オリンピックみたいに4年に1曲しか書けない自分にとっては、以前一度触ったときは「言うて…玩具かな…」という感想だったのですが、生成AIはバージョンアップにより格段に進化することは理解していたので、v5も触ってみました。
試しに、
「AIは人を代替しない」というテーマでロックンロールを作って
プロンプトはこれだけ
という、皮肉めいたプロンプトで生成してみました。
思わず体が動いてしまうこのロックンロールナンバー。
その時に思いました。「こ、これはいける…」と。
そこからは、4年間貯めてきた作曲欲が爆発。
寝るのも忘れて、ひたすら曲を生成し続けました。(お金も飛びました)
sunoは、前述のような一言プロンプトでも完成度の高い曲を生成してくれるのですが、「カスタム」モードでは、「Lyrics(歌詞)」と「Styles(楽曲イメージ)」をそれぞれ入力することで、自分が想像している曲にぐんと近づけることができるんです。
sunoのCreate(制作)画面
今回の状況から、もともと下記の最小要件が頭の中にありました。
sunoには最小限のキーワードから、プロンプト強化機能により具体的なプロンプトを生成してくれる機能が備わっています。
ちなみに私の経験上、AIアプリに備わっている「プロンプト強化ボタンは押した方が良い」です。
↓これが
melodic, distorted guitar, female vocals, j-rock
初期のプロンプト
↓こうなります!
High-speed J-rock kicks in with energetic drums and driving electric guitars, dominated by power chords and crisp melodic phrases, Female vocals cut through, agile and expressive, leading to a towering, catchy chorus with layered harmonies and dynamic guitar hooks for maximum impact
プロンプト強化後
こちらは実際に冒頭の「BEHIND THE SCREEN」の楽曲生成のプロンプトです。日本語訳は下記になります。
高速のJ-rockが炸裂する。エネルギッシュなドラムと疾走感あふれるエレキギターが、パワーコードと鮮烈なメロディックフレーズを主体に展開。女性ボーカルが鋭く切り込み、機敏で表現力豊かに歌い上げる。重層的なハーモニーとダイナミックなギターフックが最大級のインパクトを生む、圧倒的でキャッチーなコーラスへと導く。
プロンプト日本語訳
…これでなぜ良い感じになるのか、正直、私にもわかりません。
システムプロンプト(最初から組み込まれてるプロンプト)や歌詞の影響が大きいのだと思います。
歌詞はAnthropic社の「Claude」を利用しました。
生粋のO型である私と、比較的堅物なClaudeとの相性が良くて日頃から愛用してます。
こちらも下記の最小要件が頭の中にありました。
一番最初のやりとり
ちなみに「oneokrock風」というのは著作権的にも大丈夫という理解です。
※スタイルや表現手法は著作権保護の対象外
何度も何度も、調整をかけました。
「ダサかっこいい」を目指したチューニング
もはや一つひとつの指示が面倒になり放った、衝撃の一言。
ヒドイこと言われても素直なClaude
ただ!この指示が良かったんです!
生成AIの良いところは、「破壊と創造を何度も繰り返すことができる」こと。
ほら、イノベーションは破壊からと言うじゃないですか!(焦)
なお、手修正も加えて完成した歌詞は、冒頭のYouTubeの概要欄に載せているので、興味のある方はぜひご覧ください!
歌詞とスタイルを入れて生成、歌詞とスタイルを入れて生成、
…納得のいくまで、何度も何度も繰り返しました。
好きなことですが、さすがに体力もしんどくなってきます。
Logicというソフトでミックス
曲を生成した後は、ボーカル、ギター、ベースをレコーディングして差し替えました。(ドラムはレコーディングが非常に大変なので今回はパス)
レコーディング後は、ミックスやマスタリングという工程を経て最終化しています。
もちろん、ここでもAIを活用してます。
例えばミックスでは、iZotope社の「Nectar 4」というボーカル特性をもとに自動的に調整してくれるプラグインを使ったり、マスタリングでは「LANDR」という音圧やバランスを一瞬で整えてくれるサービスも活用しています。
時短はもちろん、そもそも私のスキルでは実現できないクオリティに引き上げてもらっています。
ここまで色々と書かせていただきましたが、
「自分一人だったら、このクオリティのものは出来なかった」
というのは紛れもない事実かなと思います。
また今回演奏したのは2曲でしたが、実は全9曲こだわり抜いて制作してます。(全部お気に入り!)
生成AIにはハルシネーションや著作権の課題などはありますが、私としては「こういうことを実現したい」という意思をもっている限り、非常に強力なツールになると考えてます。
精度やコスト効率の最適化を中心とした方法論も日々研究されていますが、とりわけクリエイティブ文脈においては、まずはたくさん試行錯誤が大事かなと考えてます。
最近のAIは推論性能が上がっているので、雑なプロンプトでも意図を汲んでくれますし、逆にAIの創造性を引き出すためには細かく書きすぎないというのもポイントかと思います。
長くなりましたが最後に、
AI時代に必要なマインドセットとは:
1. 何百という試行を厭わない根性
2. 不確実性を楽しむ心
3. 上記の原動力となる「こうありたい」という意思
宮園康太
と結論づけて締めくくらせていただきます(笑)
2025年大忘年会の様子も後日アップいたしますので、お楽しみに!
現在、以下職種を募集しております。少しでもご興味のある方はカジュアル面談でお話してみませんか?お気軽にご連絡ください。