このスライドは以下のGitHubリポジトリのREADMEを元に作成されました
https://github.com/NVIDIA/personaplex
概要
概要
PersonaPlexは、テキストベースの役割プロンプトと音声ベースのボイスコンディショニングにより、フルデュプレックス会話モデルです。合成および実データでトレーニングされており、自然で低レイテンシな対話と一貫性のあるペルソナを生成します。Moshiアーキテクチャとウェイトに基づいています。
主な機能・特徴
主な機能・特徴
-
リアルタイムでのフルデュプレックス会話
-
テキストベースの役割プロンプトによるペルソナ制御
-
音声ベースのボイスコンディショニング
-
合成および実データでトレーニング
-
自然で低レイテンシな対話
使い方・はじめ方
使い方・はじめ方
-
Opusオーディオコーデックのインストール(Ubuntu/DebianまたはFedora/RHEL)
-
リポジトリのダウンロードと`pip install moshi/.`によるインストール
-
Huggingfaceアカウントでのモデルライセンスの受け入れ
-
Huggingface認証の設定 (
export HF_TOKEN=) -
SSL証明書を使用したサーバーの起動
-
CPUオフロード(GPUメモリが不足する場合)
-
Web UIへのアクセス(ローカルまたはスクリプトで表示されるURL)
-
オフライン評価のためのスクリプトの使用
関連スライド