注意: 初期からあるjvnvのモデルは、JVNVコーパス(言語音声と非言語音声を持つ日本語感情音声コーパス)で学習されたモデルです。ライセンスはCC BY-SA 4.0です。
下のようにmodel_assetsディレクトリの中にモデルファイルたちを置いてください。
model_assets
model_assets ├── your_model │ ├── config.json │ ├── your_model_file1.safetensors │ ├── your_model_file2.safetensors │ ├── ... │ └── style_vectors.npy └── another_model ├── ...
各モデルにはファイルたちが必要です:
config.json
*.safetensors
style_vectors.npy
上2つはTrain.batによる学習で自動的に正しい位置に保存されます。style_vectors.npyはStyle.batを実行して指示に従って生成してください。
Train.bat
Style.bat
改行で分けない場合のみ使えます。万能ではありません。
このテキストの読み上げと似た声音・感情になりやすくなります。ただ抑揚やテンポ等が犠牲になる傾向があります。