[PR]音声合成技術を活用して、Unityゲーム開発のイテレーションを高速化。「A.I.VOICE for GAMES」開発の背景と今後の展望
セリフ音声込みでイテレーションが高速化する開発体験
遠藤:「A.I.VOICE for GAMES」を導入すると、開発者がUnityエディターの中でテキストから音声のAudio Clipアセットを作ることができます。Unityエディターと一体化していることで、セリフ音声データがゲーム開発のパイプラインにより融合されたと考えています。技術者向けの言葉を使うと、イテレーションを早く回せる、という感覚でしょうか。ゲームのカットシーンやアドベンチャーパートをボイス入りで動かしてみて、「なんかちょっと違うな」と思ったらセリフそのものを変える、または感情パラメーターを触って言い方を変える、というこれまでと全く違う開発体験が可能になります。
――「A.I.VOICE for GAMES」の開発において、技術的なチャレンジはありましたか?
遠藤:実は計画開始当初、Unityユーザーが社内にほぼいなかったので、全てが手探りの状態から始まりました。後ほどお話ししますが、Unityユーザーに親しまれているユニティちゃんの搭載に絡んで、ユニティ・テクノロジーズ・ジャパン様から多数のご助言を頂けたことが非常に大きかったです。
本多:開発で大変だったのは、しっかりUnityのアセットとして使い勝手が良くなるように、インポートまわりのエディタ拡張をがんばったところです。Scripted Importerを実装で活用しましたが、こういったエディター拡張周りは情報が少なくて苦労しました。ゲームそのものの開発はUnityでは個人ブログなどでたくさん情報発信している方が多いのですが、エディターに手を入れるとなると、関連情報が少なくなってしまうんですよね。
――「ユニティちゃん」ボイス開発のきっかけについてお教えいただければ幸いです。
遠藤:当社の音声合成技術をもっとゲームで活用してもらいたいと考える中で、まずは開発者さまのなかで浸透させるために、ゲーム開発者が良く知っているキャラクターをA.I.VOICEに搭載したいと考えました。そうして「ユニティちゃん」に白羽の矢が立ったという経緯があります。Unityユーザーに親しまれているユニティちゃんの音声が搭載できるのなら、より広く認知いただけるのではと考えました。
プラグイン開発にあたっては、ユニティ・テクノロジーズ・ジャパン様からのご助言も同時並行的に頂けたので非常に助かりました。A.I.VOICE用のデータは角元明日香さんに新規で収録していただいています。
ユニティちゃんそのものも「個人や小規模ゲーム開発者が手軽に利用できる素材を提供する」というプロジェクトであり、「A.I.VOICE for GAMES」でやりたいこととマッチしていたという背景もあります。ユニティ・テクノロジーズ・ジャパン様は3Dモデルや2Dイラスト、音声データなど、様々なユニティちゃんデータを配布していて、ゲームにある程度自由に使える規約で展開されています。我々としてはそこに加えて「ユニティちゃん」を含む音声合成技術を提供することで、「なにか無料で小さなゲームを作ってみよう、キャラクターはユニティちゃんで」となったときに、自由にセリフを喋らせることができるツールとして一緒に使っていただけるようになればと思っています。
補足ですが、すでに別の「A.I.VOICE」製品シリーズをお持ちの場合は、その音声を「A.I.VOICE for GAMES」で読み込んで使用することができます。ツールで作るだけでなく、Unity エディター上でも普段使っている話者の音声が手軽に生成できます。
まずはユニティちゃんの音声で触っていただいて、声色を増やしたいと思ったら「A.I.VOICE」の製品を買っていただくことで、男女はもちろん、関西弁風、おしとやか、元気、大人な声などさまざまな話者をゲームで使用することができるようになります。
――製品を発表してからの反響はいかがですか?
遠藤:X(旧Twitter)などでエゴサをして調べたのですが、まずは従来から「A.I.VOICE」を使っていただいたユーザーさまからの反響が大きかったですね。ゲームと音声合成は相性がいいよねと。プレスリリースでの発表からは、Unity開発者層から「エディター上で操作できるのは大きい」とのコメントがありました。また、ユニティちゃんを初期搭載するという事もかなり反響が大きかったですね。
遠藤:ユニティちゃんに関しては他社さまから歌唱ソフトが以前から出ていたのですが、今回の発表で「会話音声も行けるんだ!」という肯定的な反応がありました。やはり、ゲーム開発者からの認知度が高い事を実感しましたね。
反響の中では、「無料の範囲で使えるところを明確にしてほしい」という意見もあったので、今後の情報公開でわかりやすくしていきたいと思っています。(編集注:公式サイトの規約にて利用範囲の情報が公開されました。https://aivoice.jp/games/ )
――A.I.VOICEの技術は「音声合成AITalk®の技術を利用」とあります。技術についてより詳しいお話をお聞かせください。
遠藤:当社の「A.I.VOICE」シリーズは、20年以上に渡り自社開発してきた音声合成エンジン「AITalk」を搭載している音声合成ソフトです。「AITalk」は防災行政無線やJアラートといった緊急放送用の音源でご利用頂いている他、ロボット、Eラーニング教材、動画の説明音声など、皆さんの身近で幅広い用途にご活用頂いております。
この「AITalk」や「A.I.VOICE」シリーズは、声優様・ナレーター様の収録音声を基に構築しています。開発の際は、まず当社の方で専用の収録を行います。同じ音でも、発音の強い弱い、長い短い、前後の文脈によって発音の機微が異なってくるので、それらを網羅できるように収録し、音声合成用の辞書として構築します。人によっても話す際のニュアンスが変わってくるので、そのあたりを汲み取るようにつくっています。
なお、昨今はゲーム分野において、AI生成物についての取り扱いが議論されており、一部のゲームストアでは「学習元データの権利関係がクリアになっていないもの」について制限も発生しうると聞いております。「A.I.VOICE」シリーズの場合は元の音声をゼロから収録しており、声優様や音声合成化するキャラクターの権利元様とご契約の上で開発・販売していますので、こうしたルールに抵触しません。ゲームにも安心してご利用いただけます。
(参考:ValveがSteam販売ゲームにおいて「学習元アセットの権利が明らかでないAI生成アートアセット」を利用禁止に)