[PR]音声合成技術を活用して、Unityゲーム開発のイテレーションを高速化。「A.I.VOICE for GAMES」開発の背景と今後の展望
――「ユースケース」では、ゲームに向けて様々な使い方が示されています。もう少し具体的にご紹介いただければと思います。
遠藤:インディーゲームでは企業が複数人で開発するゲームと比較して、ゲーム開発のスケジュールに柔軟なところがあると思います。作ってみて試してみて、大幅な改修を加えるとか。そうした開発スタイルに対して、セリフ音声が音声合成技術によって手軽に扱えるようになることは、インディーならではの柔軟な開発スタイルにフィットしていると思っています。
また、先の質問でもお答えしたのですが、音声合成はまだまだ人の演技には及ばないところがあります。そこで、ゲームの開発途中での仮当て音声として使っていただいて、ゲーム開発中に音声の尺や雰囲気を確認する用途としての活用をひとつのユースケースとして考えています。。音声合成のデータを元に開発を進め、どこかのタイミングで声優様の音声に置き換えてもよいと思っています。
ゲームのカットシーンの開発でもプレスコ(Prescoring 、アニメなどにおいてセリフや音楽を先に収録して絵を合わせる方針)的な作り方ができるようになりますので、演出を作ったあとに声を撮ってみたらうまく合わなかった…みたいなことが防止でき、リテイクの確率を減らすことができます。
本多:ゲーム開発における声優様の活用がいくら身近になったとはいえ、Unity 1週間ゲームジャムなどの超短期間の開発イベントですと、声優様を雇用して収録するような時間的コストをかけることが難しいこともあります。
そういうシチュエーションでも「A.I.VOICE for GAMES」があれば、たとえばアクションゲームなどにも「とうっ!」とか「やられた!」みたいなひとことセリフを入れることができ、ゲームが華やかになると思います。音声合成なら、声のバリエーションもたくさん作ることができます。
遠藤:ユースケースのポイントとしまして、「A.I.VOICE」はそれぞれの製品にキャラクターが設定されているのですが、そのキャラクターの声として使う必要はなく、ゲームオリジナルキャラクターの声として活用していただけるという点があります。「A.I.VOICE」のファンの皆様からはキャラクターも含めた二次創作活用もたくさんしていただいていますが、一次創作への利用も歓迎しています。ただし、ゲームへのクレジット表記については一般的な声優様のケースとは異なりますので、「クレジット表記について」のページを確認していただければと思います。( https://aivoice.jp/games/function/ )
――今後の機能追加や拡張、ゲーム向け全般のチャレンジ展望がありましたらお教えください。
本多:現在リリースされているバージョンでは、まだまだ改良の余地があります。Unityエディター拡張でのパラメーター調整では、「A.I.VOICE」のWindowsツールと比較して細かい読み方の修正はできませんので、ノベルゲームなどにも使っていただくにはまだまだ難しいです。この点は、Unityエディター拡張側と「A.I.VOICE」のツールを連動させるなどの方針を実装予定です。
個人的に面白いなと思っているのはキャラクターの口の動き、リップシンク関係との連携です。たとえばテキストから音声データの出力時に音素の情報を同時に出力し、そのデータをリップシンク制御用に渡せないか…と調査をしています。
遠藤:「A.I.VOICE」には文書や単語ごとに読み方を編集できるユーザー辞書があります。たとえば「例えば「人間」と書いて「ヒト」と読ませたい、といったこだわりや、ゲームの世界観に基づく造語を開発者が意図したように読ませたい、などの修正が可能です。これをA.I.VOICE for GAMESでも使えるようにする予定です。ただ今後もUnityエディター側でできることを増やしつつ、本格的なチューニングをしたい場合は、「A.I.VOICE」を購入いただいて、そちらのツールで作っていただくアプローチを考えています。
本多:開発者様向けの情報として、現在配布されているバージョンの「A.I.VOICE for GAMES」では、プラグインのほとんどのコード部分をライブラリ化しており、ユーザーが触れる領域が小さいです。これを改良して、GUIを制御している部分のC#コードを見えるようにし、ある程度のユーザーによる改造を許可する予定です。ただし、改造はUnityのほかのアセットとの連携動作などの範囲を想定しているもので、音声合成のコア技術の中身を見ることはできません。改造にあたっては、EULAを良く読んだうえで行っていただければと思います。
たとえば、「A.I.VOICE for GAMES」 によって生成される AudioClip およびセリフオブジェクトには、「AIVOICE:セリフ無し」や「AIVOICE:キャラクター:ユニティちゃん」のようなラベルが自動で付与されます。ラベルはセリフの更新に合わせて自動で設定され、Unity Editor のアセット検索機能と組み合わせれば、「多数のセリフオブジェクトの中から特定のキャラクターのセリフだけを抽出する」といった処理が簡単に行えます。GUI部分のC#コードを触れるようにすることで、このラベル設定についてもユーザーが任意のものをつける改造が将来可能になります。
そして、Unityにはゲーム開発を更に便利にするさまざまなシステム系アセットが提供されていますから、そういったものと「A.I.VOICE for GAMES」が組み合わさって使われると面白いと思います。
中谷:将来的な展望としてですが、現在研究中のものとして「テキストの感情データをChatGPTなどのAIに解析させて、感情パラメータをある程度自動的に決められる」というものを実験しています。感情を推定させた上でプリセットとしてパラメータをAIが与えて、人間が手動で調整する、というアプローチができたら面白いなと思っています。
――最後に、本製品に興味があるゲーム開発者向けにメッセージをお願いします。
遠藤:「A.I.VOICE for GAMES」はすぐにダウンロードして使用できますので、とにかくまずは使ってほしいと思います。趣味でゲームを作ってたり、専門学校生のみなさんで作品制作をする際などでも、手軽に音声を乗せてほしいです。もちろん、業務で使う場合もライセンスをご用意しています。お気に入りの声があればそれを使ってぜひゲームを作ってほしいと思います。
中谷:当社としてはゲーム向け製品が初めてですので、リリースしたばかりでまだまだ製品としては赤ちゃん段階だと思っています。もし使いにくいところがあったり、要望があったら、ぜひX(Twitter)のアカウント宛にフィードバックをいただければと思っています。ユーザーの声に合わせてどんどん製品を進化させていきたいと思っています。
本多:Unityを知らない状態からスタートして初回リリースを迎えていますので、まだまだUnityの開発文化やワークフローに最適化していないところもあるかと思います。実際の使われ方に寄り添うようにアップデートしていきますので、「ここ、わかっていないなぁ?」と感じるところがあったら、お気軽にフィードバックをいただければと思います。
遠藤:最後に、「A.I.VOICE for GAMES」ではサンプルゲームも現在用意中で、これも追って公開する予定です。サンプルを見てもらって好きに台詞を変更して、遊び倒してほしいと思います。
――ありがとうございました。
――――
ゲーム開発者向けに特化し、音声合成を手軽に使えることを追求した「A.I.VOICE for GAMES」は、ゲーム開発体験の向上を目指したアプローチが光る製品です。最初のバージョンが出たばかりですので、今後の展開にも期待がかかります。ゲームにセリフ音声を入れてみたいと思う開発者は、ぜひ「A.I.VOICE for GAMES」を試してみてはいかがでしょうか。