Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别和自动语音识别 (ASR)
最近更新: 6天前基于funsar的asr模型-SenseVoiceSmall(model_dir="iic/SenseVoiceSmall", punc_model="ct-punc");优点:(1)中文方言效果好;(2)句子标点效果好;(3)英语识别效果也不错;
最近更新: 6天前---基于Dolphin的高性能方言语音识别系统 ---基于dolphin的asr识别,支持方言-识别效果好;功能:(1)asr:由wav文件识别文字;(2)录音:从麦克风录音为音频文件;(3)识别麦克风语音为文字-websocket连接;
最近更新: 6天前这是一个使用Fun-ASR-Nano-2512模型转写的API接口,可私有化部署,无需联网,支持国内外多种语言,中文包括7种方言(吴语、粤语、闽语、客家话、赣语、湘语、晋语)和26种地方口音(河南、山西、湖北、四川、重庆、云南、贵州、广东、广西及其他20多个地区)英文和日文涵盖多种地方口音。此外还支持歌词识别和说唱语音识别。
最近更新: 6天前A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
最近更新: 6天前免费,本地化,开箱即用的WebAI离线训练识别平台:人脸识别&数字人 &OCR&语音识别平台不仅限于( 图片和各种视频流(rtsp、rtmp、flv)识别,可自主训练任意场景一键训练,融合了AI图像识别opencv、yolo3-26、ocr、;AI智能客服、AI语音模型、 无任何第三方API接口可自主离线化部署并自主化行业化使用
最近更新: 6天前🔥🔥🔥基于websocket实现浏览器端文本、视频、语音的即时通讯,以及实时语音转文字
最近更新: 6天前AI拟声: 克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
最近更新: 6天前