/a/オープンソース
Published on

「so-vits-svc」のインストール・使い方

1290文字3分で読めます–––
閲覧数
Authors
  • avatar
    Name
    章 有坂
    short bio
    オープンソースソフトウェアのトレンドを追いかけてます。

so-vits-svcは、歌声変換(Singing Voice Conversion: SVC)に焦点を当てたオープンソースプロジェクトです。このプロジェクトはテキストから音声への変換(Text-to-Speech: TTS)ではなく、特に歌声変換に重点を置いています。このプロジェクトでは、TTS機能はサポートされておらず、VITSはSVCタスクを実行することはできません。これら2つのプロジェクトで使用されるモデルは交換可能ではなく、全ての状況で適用可能ではありませんSource 0

※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。

インストール・導入方法

このプロジェクトの具体的なインストール・導入手順は公式のREADMEファイルに記述されていますが、以下に主な手順を示します:

  1. 必要なモデルファイルをダウンロードし、指定のディレクトリに配置します。例えば、事前学習済みのモデルファイル(G_0.pth、D_0.pth)はlogs/44kディレクトリに、事前学習済みの拡散モデルのベースモデルファイル(model_0.pt)はlogs/44k/diffusionディレクトリに配置します。

  2. 使用する音声エンコーダを選択します。例えば、contentvecを音声エンコーダとして使用する場合は、それに関連する設定を行います。

  3. データセットの準備を行います。これには、音声のスライス、44100Hzとモノにリサンプリング、データセットの自動分割、ハブルトとf0の生成などが含まれます。

  4. モデルの訓練を行います。例えば、Sovitsモデルを訓練する場合は、以下のコマンドを実行します:

python train.py -c configs/config.json -m 44k

注意点として、このプロジェクトは完全にオフラインで動作し、ユーザー情報を収集したり、ユーザー入力データを収集したりすることはありません。また、このプロジェクトは学術的な目的であり、本番環境でのデプロイメントは想定されていませんSource 0

使い方

このプロジェクトの具体的な使い方は、公式のREADMEファイルに記述されていますが、以下に主な手順を示します:

  1. データセットの準備を行います。これには、音声のスライス、44100Hzとモノにリサンプリング、データセットの自動分割、ハブルトとf0の生成などが含まれます。

  2. モデルの訓練を行います。例えば、Sovitsモデルを訓練する場合は、以下のコマンドを実行します:

python train.py -c configs/config.json -m 44k
  1. 推論を行います。このプロジェクトは、自動的なf0予測、クラスタベースの
※ NordVPNにこちらから新規登録すると、最大73%オフの割引になります。
avatar

章 有坂

オープンソースソフトウェアのプロ / ベテランのソフトウェア技術者 / Github専門家
オープンソースソフトウェアが好きな編集部が、GithubやGitlabなどの新着リポジトリやトレンドのプロジェクトを分かりやすく紹介。