RVC⚡ZERO là một mô hình AI chuyển đổi văn bản thành giọng nói (Text-to-Speech - TTS) . Công cụ này cho phép bạn tạo ra giọng nói tự nhiên và biểu cảm từ văn bản, với khả năng tùy chỉnh cao để phù hợp với nhu cầu của bạn.
Trải nghiệm công cụ (Free) ⤵🎳
(Xem hướng dẫn bên dưới nếu bạn chưa biết cách)
Lưu ý:
- Bản demo này chỉ dành cho mục đích giáo dục và nghiên cứu.
- Các tác giả và đóng góp cho dự án không chịu trách nhiệm về việc sử dụng sai hoặc không đúng mục đích của phần mềm này.
🐓🦚🦜 Hướng dẫn sử dụng RVC⚡ZERO chi tiết:
1️⃣ TTS (Chuyển văn bản thành giọng nói):
- Audio files (Tệp âm thanh):
- Kéo và thả tệp âm thanh bạn muốn chuyển đổi (.ogg, .wav, .mp3) vào khu vực "Drop File Here" (Thả tệp tại đây).
- Hoặc nhấp vào "Click to Upload" (Nhấp để tải lên) để chọn tệp từ máy tính.
- URL-to-Model (Đường dẫn đến mô hình):
- Model file (Tệp mô hình): Kéo và thả tệp mô hình (.pth) vào khu vực "Drop File Here" hoặc nhấp để tải lên. Bạn cũng có thể dán liên kết trực tiếp đến tệp mô hình vào trường "model_link.txt".
- Index file (Tệp chỉ mục): Kéo và thả tệp chỉ mục (.index) vào khu vực "Drop File Here" hoặc nhấp để tải lên. Bạn cũng có thể dán liên kết trực tiếp đến tệp chỉ mục vào trường "index_link.txt".
- Nếu mô hình và tệp chỉ mục của bạn được nén trong một tệp zip, hãy dán liên kết trực tiếp đến tệp zip vào trường "zip_link.txt".
2️⃣ Cài đặt tham số:
- Pitch algorithm (Thuật toán cao độ): Chọn thuật toán xử lý cao độ giọng nói. Mỗi thuật toán có ưu nhược điểm riêng. Bạn có thể thử nghiệm để tìm ra thuật toán phù hợp nhất.
- Pitch level (Mức độ cao độ): Điều chỉnh độ cao của giọng nói (cao hơn hoặc thấp hơn). Giá trị 0 là mặc định.
- Index influence (Ảnh hưởng chỉ mục): Điều chỉnh mức độ ảnh hưởng của tệp chỉ mục lên giọng nói. Giá trị càng cao thì giọng nói càng giống với giọng trong tệp chỉ mục. Giá trị 0.75 là mặc định.
- Respiration median filtering (Lọc trung vị hơi thở): Giúp giảm thiểu tiếng ồn và âm thanh thở trong giọng nói.
- Envelope ratio (Tỷ lệ bao phủ): Điều chỉnh độ mượt của giọng nói. Giá trị càng cao thì giọng nói càng mượt mà, nhưng có thể mất đi một số chi tiết âm thanh.
- Consonant breath protection (Bảo vệ hơi thở phụ âm): Giúp giữ lại âm thanh thở tự nhiên khi phát âm các phụ âm.
- Denoise (Giảm tiếng ồn): Giảm thiểu tiếng ồn nền trong giọng nói.
- Reverb (Độ vang): Thêm hiệu ứng vang cho giọng nói.
3️⃣ Nhấn "Submit" (Gửi):
- Công cụ sẽ bắt đầu xử lý tệp âm thanh của bạn và tạo ra giọng nói AI mới.
4️⃣ Nghe và tải xuống:
- Sau khi xử lý xong, bạn có thể nghe thử giọng nói AI đã tạo.
- Nếu hài lòng, bạn có thể tải xuống tệp âm thanh mới.
Ví dụ:
Để tạo giọng nói của một nhân vật anime, bạn có thể sử dụng mô hình giọng nói anime và điều chỉnh các tham số như Pitch level và Index influence để giọng nói trở nên cao hơn và biểu cảm hơn.
Mẹo sử dụng:
- Sử dụng tệp âm thanh chất lượng cao: Chất lượng tệp âm thanh đầu vào sẽ ảnh hưởng đến chất lượng giọng nói AI đầu ra.
- Thử nghiệm với các cài đặt khác nhau: Mỗi tham số có thể ảnh hưởng đến giọng nói AI theo cách khác nhau.Hãy thử nghiệm để tìm ra cài đặt phù hợp nhất với nhu cầu của bạn.
Lưu ý: RVC⚡ZERO là một công cụ mạnh mẽ, nhưng kết quả phụ thuộc vào chất lượng của tệp âm thanh đầu vào và cài đặt tham số. Hãy dành thời gian để thử nghiệm và khám phá các khả năng của công cụ này!