Bert-VITS2-Colab

簡單寫一個Colab記事本，方便來使用 Colab 訓練 Bert-VITS2

https://colab.research.google.com/github/ADT109119/Bert-VITS2-colab/blob/main/Bert-VITS2.ipynb

專案用途

此專案提供一個可以簡單、易於操作的 Colab 記事本，讓大家可以輕鬆的訓練 Bert-VITS2

目前專案功能及進度

目前支援以下幾種功能:

無須手動配置環境
自動下載 Bert 等需要的模型
可快速處理資料集
支援使用 Whisper 自動標註音檔
支援 TensorBoard 監看訓練狀況
一鍵部屬到 HuggingFace Spaces(現已支援一般版與中文特化版)
支援中文特化版

待完成項目:

日文特化版(不知道要不要做???

畫面

操作示意安裝函式庫>上傳資料集>訓練時監看 TensorBoard

音檔切割程式

本專案內有一個以srt切割音檔並生成標註的程式 processing.py，若要使用請依照以下的檔案命名方式 (對應的音檔與字幕取相同的名字僅副檔名不同):

{說話者}_{語言}_{隨編一個編號}.wav

以及將檔案用以下方式存放，音檔存在 audio 資料夾，字幕檔存放在 srt 資料夾，再執行 processing.py。便可以生成 esd.list 檔案，以及切分音檔(切分好的音檔放在 raw 資料夾中)

├── audio
│   ├── ****.wav
│   ├── ...
├── srt
│   ├── ****.srt
│   ├── ...
├── processing.py

2024/01/16更: 考量到訓練資料最好大於2秒所以新增判斷需大於2秒才會被切分

2024/02/05更: 現在音檔可以使用wav、mp3等格式

專案技術

Python
Jupyter Notebook

聯絡作者

你可以透過以下方式與我聯絡

Email: [email protected] ...

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
audio		audio
srt		srt
Bert-VITS2.ipynb		Bert-VITS2.ipynb
README.md		README.md
processing.py		processing.py
train_ms_backup.py		train_ms_backup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Bert-VITS2-Colab

專案用途

目前專案功能及進度

畫面

音檔切割程式

專案技術

聯絡作者

About

Uh oh!

Releases

Packages

Languages

ADT109119/Bert-VITS2-Colab

Folders and files

Latest commit

History

Repository files navigation

Bert-VITS2-Colab

專案用途

目前專案功能及進度

畫面

音檔切割程式

專案技術

聯絡作者

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages