MAR8 - ข้อความเป็นคำพูด AI โดย CAMB.AI
กลุ่มข้อความเป็นคำพูดชุดแรกของโมเดล AI

คำอธิบาย
เมื่อดูเผินๆ ระบบเสียง AI ส่วนใหญ่มีลักษณะเหมือนกัน นั่นคือโมเดลการอ่านออกเสียงข้อความเพียงรูปแบบเดียวที่ซ่อนอยู่หลัง APIใช้งานง่าย ปรับแต่งได้ยาก และแทบเป็นไปไม่ได้เลยที่จะปรับขนาดได้อย่างมีประสิทธิภาพ
CAMB.AI ใช้แนวทางที่แตกต่างออกไปMARS8 สร้างขึ้นโดย Apple ซึ่งเป็นนักวิจัยด้าน AI ของ Carnegie Mellon และเป็นตระกูล TTS แรกที่ออกแบบมาเพื่อความเป็นจริงในการผลิต ไม่ใช่การสาธิตในห้องปฏิบัติการ
แทนที่จะบังคับให้มีการแลกเปลี่ยนขนาดเดียวที่เหมาะกับทุกคน MARS8 นำเสนอสถาปัตยกรรม 4 แบบที่ปรับให้เหมาะกับกรณีการใช้งานในโลกแห่งความเป็นจริง:
1. MARS-Flash: TTFB ต่ำกว่า 150ms สำหรับตัวแทนแบบเรียลไทม์
2. MARS-Pro: ความเร็วและความเที่ยงตรงที่สมดุลสำหรับการพากย์และสื่อ
3. MARS-Instruct: การควบคุมการผลิตภาพยนตร์ที่มีความละเอียดระดับผู้กำกับ
4. MARS-Nano: โมเดลพารามิเตอร์ 50M ประสิทธิภาพสูงเป็นพิเศษสำหรับประสิทธิภาพบนอุปกรณ์
MARS8 ยังเปลี่ยนแปลงเศรษฐศาสตร์ของ Voice AI โดยเปลี่ยนจากรูปแบบการกำหนดราคาแบบ "จ่ายต่อตัวอักษร" ไปเป็นแนวทางที่เน้นการประมวลผลเป็นอันดับแรก ซึ่งนักพัฒนาสามารถปรับใช้บนโครงสร้างพื้นฐานของตนเองทั่วทั้ง AWS, Google Cloud, Modal, Baseten และแพลตฟอร์มประมวลผล GPU อีก 25 รายการเริ่มสร้างทันที!