Orpheus TTS 是一款刚刚发布的开源 TTS 模型,它以其接近人类的自然情感表达、超低延迟的实时输出以及强大的零样本语音克隆能力,迅速成为开源社区关注的焦点。 不仅能生成流畅自然、充满情感的声音,还将延迟压缩到令人惊叹的 25-50 毫秒,完美适配实时对话场景。 并且提供了从 150M 到 3B 参数的四种型号。支持零样本语音克隆和灵活的情感控制,可让每个人都能轻松定制专属音色。
阶跃星辰开源的Step-Audio 2 mini模型,以真端到端架构实现音频到语音的直出,能精准捕捉情绪、语调等副语言信息,支持多语言翻译与工具调用,在多项国际测试中刷新开源语音模型纪录,为智能客服、内容创作等场景带来更自然的交互体验。