UE5向けリアルタイム音声認識プラグイン「WhisperRealtime」が販売開始
UnrealEngine5向け、OpenAIのWhisperをベースにしたリアルタイム音声認識プラグインがマーケットプレイスで販売開始されました。

「WhisperRealtime」は、Unreal Engineでマイク入力からの文字起こしや、指定フレーズのどれが話されたかを判定することができるプラグインです。ブループリントから呼び出し可能で、Pythonや専用サーバーなどは必要ないということです。実際にどんなことができるかは、紹介動画をご覧いただくのが早いでしょう。
「WhisperRealtime」の紹介動画はこちらです。
デモ動画では、音声によってキャラクターが前進・後退・左右移動などを行います。もちろん他の操作にも応用が利くと思いますので、新たな入力装置として想像が膨らみます。ロボットのアクションを声で操作したり、恋愛ゲームのやりとりを実際のボイスで行う……といったこともできそうです。
「WhisperRealtime」の必要スペック、環境は以下の通りです。
- 対応プラットフォーム:Windows 10 64bit
- 対応UEバージョン:5.1
- CUDAによるGPUアクセラレーションには、対応するNVIDIA GPUが必要
(また、マニュアルに記載の特定バージョンのCUDA、cuDNNのインストールが必要)
本製品はUnrealEngine関連製品ではお馴染みのマーケットプレイスで販売中です。