簡單寫一個Colab記事本,方便來使用 Colab 訓練 Bert-VITS2
https://colab.research.google.com/github/ADT109119/Bert-VITS2-colab/blob/main/Bert-VITS2.ipynb
此專案提供一個可以簡單、易於操作的 Colab 記事本,讓大家可以輕鬆的訓練 Bert-VITS2
目前支援以下幾種功能:
- 無須手動配置環境
 - 自動下載 Bert 等需要的模型
 - 可快速處理資料集
 - 支援使用 Whisper 自動標註音檔
 - 支援 TensorBoard 監看訓練狀況
 - 一鍵部屬到 HuggingFace Spaces(現已支援一般版與中文特化版)
 - 支援中文特化版
 
待完成項目:
- 日文特化版(不知道要不要做???
 
操作示意 安裝函式庫>上傳資料集>訓練時監看 TensorBoard
本專案內有一個以srt切割音檔並生成標註的程式 processing.py,若要使用請依照以下的檔案命名方式 (對應的音檔與字幕取相同的名字 僅副檔名不同):
{說話者}_{語言}_{隨編一個編號}.wav
以及將檔案用以下方式存放,音檔存在 audio 資料夾,字幕檔存放在 srt 資料夾,再執行 processing.py。便可以生成 esd.list 檔案,以及切分音檔(切分好的音檔放在 raw 資料夾中)
├── audio
│   ├── ****.wav
│   ├── ...
├── srt
│   ├── ****.srt
│   ├── ...
├── processing.py
2024/01/16更: 考量到訓練資料最好大於2秒 所以新增判斷需大於2秒才會被切分
2024/02/05更: 現在音檔可以使用wav、mp3等格式
- Python
 - Jupyter Notebook
 
你可以透過以下方式與我聯絡



