TEN VAD 企业级别的语音检测器开源啦
发布日期:2025/7/5 8:45:17 浏览量:
TEN VAD 企业级别的语音检测器开源啦
TEN VAD开源了! 一款企业级实时语音活动检测器,能精确到帧级别的语音活动检测,性能优于WebRTC VAD、Silero VAD TEN VAD和TEN Turn Detection搭配使用,构建AI实时对话语音助手无敌了。
代码地址:
https://github.com/ten-framework/ten-vad
亮点:
它使AI可以快速且更好的把控对话节奏,避免插嘴情况,智能中断处理,使得整个对话过程可以更自然顺畅。让开发者可以在任何支持 ONNX 的平台和硬件架构上部署 TEN VAD,大大增强了其灵活性和兼容性。此外,WASM+JS 支持也同步发布,进一步扩展了 Web 端应用的可能性
介绍:
TEN Turn Detection,是一个具备上下文感知的语轮检测器,支持全双工语意检测,支持中英文 Turn Detection会把说话内容分成三种情况: finished,用户表达了完整的想法,期待回应 wait,模棱两可的语句,系统无法确定用户是否会继续说 unfinished,用户暂时停顿但打算继续发言
TEN VAD,是实时语音活动检测器,比WebRTC VAD和Silero VAD准确度更高,速度快,300ms
ten-agent是目前见过的实时语音开源项目里做的最好的,相比之前介绍过一个livekit-agent+realtime,ten-agent工程化和可用性集成的更好,可以称之为构建实时语音领域的coze,可构建智能音箱、ai外呼等实时语音交互应用,个性化可视化定制工作流。
TEN 生态系统
TEN VAD 是 TEN 框架的一部分,TEN 生态还包括:
• TEN Framework:用于构建实时多模态对话 AI
• TEN Turn Detection:支持全双工对话
• TEN Agent:展示 TEN 框架的语音智能体能力
• TMAN Designer:低代码/无代码语音智能体设计工具


马上咨询: 如果您有业务方面的问题或者需求,欢迎您咨询!我们带来的不仅仅是技术,还有行业经验积累。
QQ: 39764417/308460098 Phone: 13 9800 1 9844 / 135 6887 9550 联系人:石先生/雷先生