/a/オープンソース
Published on

「Retrieval-based-Voice-Conversion-WebUI」のインストール・使い方

1123文字2分で読めます–––
閲覧数
Authors
  • avatar
    Name
    章 有坂
    short bio
    オープンソースソフトウェアのトレンドを追いかけてます。

Retrieval-based-Voice-Conversion-WebUIは、VITSベースの簡単で使いやすい音声変換フレームワークです。このプロジェクトは、高品質のオープンソースVCTKトレーニングセットを使用して訓練されたモデルを使用しており、著作権に関する懸念はありませんSource 0

※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。

インストール・導入方法

このプロジェクトを使用するためには、Pythonのバージョンが3.8以上の環境が必要です。以下の手順でインストール・導入を行います:

  1. 依存関係のインストール:
  • pipを使用して依存関係をインストールする場合:
    pip install torch torchvision torchaudio
    pip install -r requirements.txt # NVIDIA GPUの場合
    pip install -r requirements-dml.txt # AMD GPUの場合
    
  • poetryを使用して依存関係をインストールする場合:
    curl -sSL https://install.python-poetry.org | python3 -
    poetry install
    
  1. 必要な資源の準備:
  • アセットのダウンロード
  • ffmpegのインストール
  • RMVPE人声音高提取アルゴリズムの必要なファイルのダウンロード
  • AMD GPUを使用する場合、AMDのRocmをインストール

具体的な手順はGitHubのページに詳細が記載されています。

使い方

このプロジェクトを使用するには、以下の手順を実行します:

  1. WebUIを起動する:
python infer-web.py

また、このプロジェクトは統合パッケージも提供しています。WindowsユーザーはRVC-beta.7zをダウンロードして解凍し、go-web.batを実行します。MacOSユーザーはrun.shを実行しますSource 0

※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。
avatar

章 有坂

オープンソースソフトウェアのプロ / ベテランのソフトウェア技術者 / Github専門家
オープンソースソフトウェアが好きな編集部が、GithubやGitlabなどの新着リポジトリやトレンドのプロジェクトを分かりやすく紹介。