Quy trình 4 bước tạo KOC ảo chuyên nghiệp từ con số không năm 2026

Blog AI 01/06/2026 Hoàng Nhật Mai

Câu hỏi tôi nhận được nhiều nhất khi nói về KOC ảo là: “Tôi không có nền tảng kỹ thuật — tôi có tự làm được không?” Câu trả lời ngắn gọn là: Có. Và quy trình 4 bước dưới đây đã được kiểm chứng thực tế trong nhiều dự án triển khai.

Bước 1: Chuẩn bị ảnh chân dung đạt chuẩn kỹ thuật

Chất lượng ảnh đầu vào quyết định 70% chất lượng video đầu ra. Yêu cầu tối thiểu:

  • Góc chụp: Trực diện hoặc nghiêng không quá 15 độ.
  • Biểu cảm: Nét mặt trung tính, miệng khép hờ.
  • Ánh sáng: Đều hai bên khuôn mặt, không có bóng đổ mạnh.
  • Độ phân giải: Tối thiểu 1024×1024 pixel.
  • Nền ảnh: Đơn sắc hoặc phẳng giúp HeyGen phân tách khuôn mặt chính xác hơn.
Hoàng Nhật Mai trong studio thiết kế người mẫu ảo và clone giọng nói AI
Hoàng Nhật Mai trong studio thiết kế người mẫu ảo và clone giọng nói AI

Bước 2: Tạo giọng nói trên <a href="https://deaitinh.com/danh-gia-chi-tiet-elevenlabs-dinh-cao-cong-nghe-chuyen-van-ban-thanh-giong-noi-bang-ai/” style=”color: #0088EE; font-weight: 600; text-decoration: none;”>ElevenLabs

Đăng nhập ElevenLabs, vào “My Voices” → “Add Voice”. Tải lên 5–10 phút âm thanh mẫu (WAV hoặc MP3, không có nhạc nền). Điều chỉnh Stability 50–60% và Similarity 70–80%. Xuất kịch bản thành file WAV 48kHz.

Bước 3: Tạo nhân vật và ghép giọng nói trong HeyGen

Vào HeyGen → “Avatars” → “Photo Avatar” → tải ảnh lên. Chọn “Upload Audio” và tải file WAV từ ElevenLabs. Hoặc kết nối trực tiếp ElevenLabs qua API key trong phần Settings. Điều chỉnh chuyển động đầu ở mức Medium. Xem trước và kết xuất video Full HD 1080p.

Bước 4: Tự động hóa sản xuất với Make.com

Đây là bước biến quy trình thủ công thành dây chuyền tự động:

  1. Nhập kịch bản mới vào Google Sheets.
  2. Make.com tự động gửi văn bản lên API ElevenLabs để tạo file âm thanh.
  3. Make.com lưu file âm thanh vào Google Drive.
  4. Make.com gửi file âm thanh + Avatar ID lên API HeyGen để tạo video.
  5. Video hoàn chỉnh được lưu tự động vào thư mục đã định sẵn.

Sau khi thiết lập, toàn bộ bước 2–5 chạy tự động mà không cần can thiệp thủ công.

Lỗi phổ biến và cách khắc phục

LỗiNguyên nhânKhắc phục
Khẩu hình không khớpFile WAV không đúng 48kHz hoặc có tiếng ồnXuất lại WAV 48kHz sạch từ ElevenLabs
Khuôn mặt biến dạngẢnh đầu vào nghiêng quá hoặc ánh sáng không đềuDùng ảnh trực diện, ánh sáng mềm
Giọng nghe như robotStability đặt quá caoGiảm xuống 45–55%
Video bị giậtKhoảng lặng đầu/cuối file âm thanhCắt bỏ khoảng lặng trước khi tải lên

Nguồn: HeyGen Documentation 2025; ElevenLabs Documentation 2025; Voiceover-Captions-AI.com 2025; Make.com Automation Blueprint

Hoàng Nhật Mai

Hoàng Nhật Mai

Founder hệ thống Để AI Tính. Tư vấn và đào tạo doanh nghiệp & cá nhân ứng dụng AI thực chiến vào Marketing và vận hành