Skip to content

ADT109119/Bert-VITS2-Colab

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Bert-VITS2-Colab

簡單寫一個Colab記事本,方便來使用 Colab 訓練 Bert-VITS2

Open In Colab

https://colab.research.google.com/github/ADT109119/Bert-VITS2-colab/blob/main/Bert-VITS2.ipynb

image

專案用途

此專案提供一個可以簡單、易於操作的 Colab 記事本,讓大家可以輕鬆的訓練 Bert-VITS2

目前專案功能及進度

目前支援以下幾種功能:

  • 無須手動配置環境
  • 自動下載 Bert 等需要的模型
  • 可快速處理資料集
  • 支援使用 Whisper 自動標註音檔
  • 支援 TensorBoard 監看訓練狀況
  • 一鍵部屬到 HuggingFace Spaces(現已支援一般版與中文特化版)
  • 支援中文特化版

待完成項目:

  • 日文特化版(不知道要不要做???

畫面

操作示意 安裝函式庫>上傳資料集>訓練時監看 TensorBoard

安裝函式庫 上傳資料集 訓練時監看 TensorBoard

音檔切割程式

本專案內有一個以srt切割音檔並生成標註的程式 processing.py,若要使用請依照以下的檔案命名方式 (對應的音檔與字幕取相同的名字 僅副檔名不同):

{說話者}_{語言}_{隨編一個編號}.wav

以及將檔案用以下方式存放,音檔存在 audio 資料夾,字幕檔存放在 srt 資料夾,再執行 processing.py。便可以生成 esd.list 檔案,以及切分音檔(切分好的音檔放在 raw 資料夾中)

├── audio
│   ├── ****.wav
│   ├── ...
├── srt
│   ├── ****.srt
│   ├── ...
├── processing.py

2024/01/16更: 考量到訓練資料最好大於2秒 所以新增判斷需大於2秒才會被切分

2024/02/05更: 現在音檔可以使用wav、mp3等格式

專案技術

  • Python
  • Jupyter Notebook

聯絡作者

你可以透過以下方式與我聯絡

About

簡單寫一個Colab記事本,方便來使用 Colab 訓練 Bert-VITS2

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published