MAR8 - AI chuyển văn bản thành giọng nói của CAMB.AI

    Nhóm mô hình AI chuyển văn bản thành giọng nói đầu tiên

    Media MAR8 - AI chuyển văn bản thành giọng nói của CAMB.AI - Nhóm mô hình AI chuyển văn bản thành giọng nói đầu tiên 1

    Mô Tả

    Hầu hết các hệ thống giọng nói AI trông bề ngoài đều giống nhau: một mô hình Chuyển văn bản thành giọng nói duy nhất ẩn đằng sau một API.Dễ sử dụng, khó tùy chỉnh và gần như không thể mở rộng quy mô một cách hiệu quả.

    CAMB.AI đã thực hiện một cách tiếp cận khác.Được xây dựng bởi Apple và các nhà nghiên cứu AI của Carnegie Mellon, MARS8 là dòng TTS đầu tiên được thiết kế cho sản xuất thực tế - không phải cho các bản demo trong phòng thí nghiệm.

    Thay vì buộc phải đánh đổi một kích cỡ phù hợp cho tất cả, MARS8 cung cấp 4 kiến trúc được tối ưu hóa cho các trường hợp sử dụng trong thế giới thực:

    1. MARS-Flash: TTFB dưới 150ms dành cho các tác nhân thời gian thực.

    2. MARS-Pro: Cân bằng tốc độ và độ trung thực cho lồng tiếng và truyền thông.

    3. MARS-Instruct: Kiểm soát chi tiết ở cấp độ đạo diễn đối với việc sản xuất phim.

    4. MARS-Nano: Mô hình tham số 50M cực kỳ hiệu quả cho hiệu suất trên thiết bị.

    MARS8 cũng thay đổi tính kinh tế của Voice AI, chuyển từ mô hình định giá “trả cho mỗi ký tự” sang cách tiếp cận ưu tiên điện toán, nơi các nhà phát triển có thể triển khai trên cơ sở hạ tầng của riêng họ trên AWS, Google Cloud, Modal, Baseten và 25 nền tảng điện toán GPU khác.Bắt đầu xây dựng ngay bây giờ!

    Thẻ

    Sản Phẩm Được Đề Xuất