SoniTranslate là ứng dụng web mạnh mẽ giúp dịch và lồng tiếng video dễ dàng. Bạn có thể dịch video, tệp âm thanh, tệp phụ đề (.srt) hoặc thậm chí nhập liên kết video. Bài hướng dẫn này sẽ giúp bạn sử dụng hiệu quả các tính năng của SoniTranslate.
Trải nghiệm công cụ (Free) ⤵🎳
(Xem hướng dẫn bên dưới nếu bạn chưa biết cách)
🌎🌟🌐 Hướng dẫn chi tiết cách sử dụng SoniTranslate:
1️⃣ Video translation (Dịch video):
- Chọn nguồn video (Choose Video Source): Kéo thả tệp video hoặc nhập liên kết URL.
- Ngôn ngữ nguồn (Source language): Chọn ngôn ngữ gốc của video.
- Ngôn ngữ đích (Translate audio to): Chọn ngôn ngữ bạn muốn dịch sang.
- Số lượng người nói (Max speakers): Xác định số lượng người nói tối đa trong video.
- Chọn giọng nói TTS (Text-to-Speech) cho mỗi người nói: Chọn giọng đọc bạn muốn cho từng người nói. Ứng dụng hỗ trợ đa dạng giọng nói và ngôn ngữ.
Tùy chọn nâng cao:
- Voice Imitation (Bắt chước giọng nói): Cho phép tái tạo giọng nói gốc sang ngôn ngữ đích. Lưu ý rằng tính năng này chỉ sao chép giọng nói, không bao gồm giọng điệu và cảm xúc.
- Tạo TTS tùy chỉnh: Tải lên tệp âm thanh ngắn (tối đa 10 giây) để tạo giọng TTS mới tương tự giọng nói trong tệp.
- Tăng tốc âm thanh tối đa (Max Audio acceleration): Điều chỉnh tốc độ phát âm thanh đã dịch để tránh chồng chéo.
- Điều chỉnh tỷ lệ tăng tốc (Acceleration Rate Regulation): Điều chỉnh để đảm bảo tính liên tục của giọng nói.
- Giảm chồng chéo (Overlap Reduction): Đảm bảo các đoạn âm thanh không bị chồng lên nhau, tuy nhiên có thể ảnh hưởng đến độ đồng bộ.
- Trộn âm thanh (Audio Mixing Method): Điều chỉnh âm lượng và trộn âm thanh gốc và âm thanh đã dịch.
- Loại phụ đề (Subtitle type): Chọn "Phụ đề mềm" (Soft Subtitles) hoặc "Phụ đề cứng" (Burn Subtitles).
- Cấu hình phiên âm: Sử dụng các tùy chọn như "Literalize Numbers" và "Sound Cleanup" để cải thiện độ chính xác của phiên âm.
- Thời lượng đoạn (Segment Duration Limit): Xác định độ dài tối đa cho mỗi đoạn âm thanh.
- Mô hình ASR Whisper (Whisper ASR model): Chọn mô hình chuyển đổi giọng nói thành văn bản. Bạn có thể chọn mô hình tùy chỉnh từ Hugging Face.
- Kiểu tính toán: Chọn kiểu dữ liệu (int8, float16, float32) ảnh hưởng đến hiệu suất và độ chính xác.
- Kích thước lô (Batch size): Giảm kích thước lô nếu GPU của bạn có ít VRAM hơn để tránh lỗi tràn bộ nhớ.
- Tải lên tệp phụ đề SRT: Sử dụng tệp phụ đề SRT thay vì phiên âm từ Whisper.
- Chia đoạn văn bản: Chia văn bản thành các đoạn theo câu, từ hoặc ký tự.
- Mô hình phân chia: Chọn mô hình để phân chia người nói trong video.
- Tên tệp: Đặt tên cho tệp đầu ra.
- Âm thanh trạng thái tác vụ: Bật hoặc tắt âm thanh thông báo khi hoàn thành hoặc gặp lỗi.
- Lấy lại tiến trình: Tiếp tục quá trình từ điểm dừng cuối cùng.
- Xem trước: Cắt video thành 10 giây để kiểm tra trước khi xử lý toàn bộ video.
- Chỉnh sửa phụ đề: Chạy dịch hai bước để có thể chỉnh sửa phụ đề trước khi tạo video cuối cùng.
2️⃣ Document translation (Dịch tài liệu):
- Chọn nguồn tài liệu: Tải lên tệp PDF, DOCX, TXT hoặc nhập văn bản trực tiếp.
- Chọn giọng nói TTS và ngôn ngữ đích: Tương tự như phần dịch video.
Cấu hình Videobook:
- Số trang bắt đầu và kết thúc: Chọn phạm vi trang bạn muốn dịch.
- Kích thước, màu viền: Tùy chỉnh giao diện của videobook.
- Số lượng ký tự tối đa trên mỗi đoạn: Điều chỉnh số lượng ký tự tối đa cho mỗi đoạn văn bản được TTS xử lý.
3️⃣ Custom voice R.V.C. (Giọng nói tùy chỉnh):
- Tải xuống mô hình R.V.C.: Nhập URL từ Google Drive để tải xuống mô hình giọng nói tùy chỉnh.
- Thay thế giọng nói: Chọn giọng nói TTS và giọng nói R.V.C. tương ứng cho từng người nói.
- Kiểm tra R.V.C.: Nhập văn bản và chọn mô hình, độ cao giọng để kiểm tra chất lượng giọng nói trước khi áp dụng.
Sau khi hoàn thành tất cả các bước tùy chỉnh, bạn có thể nhấn nút "TRANSLATE" (Dịch) để bắt đầu quá trình dịch video hoặc tài liệu.
Lưu ý: SoniTranslate sử dụng các công nghệ AI như Whisper, TTS, R.V.C. và nhiều mô hình khác để xử lý video và âm thanh.
Chúc bạn thành công trong việc sử dụng SoniTranslate để dịch và lồng tiếng video một cách chuyên nghiệp!