Qwen3-ASR 系列包括 Qwen3-ASR-1.7B 和 Qwen3-ASR-0.6B,支持 52 种语言和方言的语言识别和自动语音识别 (ASR)
基于funsar的asr模型-SenseVoiceSmall(model_dir="iic/SenseVoiceSmall", punc_model="ct-punc");优点:(1)中文方言效果好;(2)句子标点效果好;(3)英语识别效果也不错;
---基于Dolphin的高性能方言语音识别系统 ---基于dolphin的asr识别,支持方言-识别效果好;功能:(1)asr:由wav文件识别文字;(2)录音:从麦克风录音为音频文件;(3)识别麦克风语音为文字-websocket连接;
这是一个使用Fun-ASR-Nano-2512模型转写的API接口,可私有化部署,无需联网,支持国内外多种语言,中文包括7种方言(吴语、粤语、闽语、客家话、赣语、湘语、晋语)和26种地方口音(河南、山西、湖北、四川、重庆、云南、贵州、广东、广西及其他20多个地区)英文和日文涵盖多种地方口音。此外还支持歌词识别和说唱语音识别。
A Deep-Learning-Based Chinese Speech Recognition System 基于深度学习的中文语音识别系统
免费,本地化,开箱即用的WebAI离线训练识别平台:人脸识别&数字人 &OCR&语音识别平台不仅限于( 图片和各种视频流(rtsp、rtmp、flv)识别,可自主训练任意场景一键训练,融合了AI图像识别opencv、yolo3-26、ocr、;AI智能客服、AI语音模型、 无任何第三方API接口可自主离线化部署并自主化行业化使用
AI拟声: 克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
🎤 微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建,将文字转为语音MP3。
一个简单易用的java日志系统,解放你的日志查询困难问题,方便快速追踪问题,安装配置简单,性能优秀 演示视频地址:https://v.qq.com/x/page/g3308uxlcnw.html
Cloud Kernel 是龙蜥操作系统(Anolis OS)内核,目前已经达到 600 多万部署规模. 它基于Linux社区主线稳定版. 致力于打造更稳定, 更可靠, 更安全, 特性更丰富, 性能更优化的 Linux 系统内核. 为 Anolis OS 以及下游生态合作 OS 发行版提供坚实的内核支持, 更好的支撑和扩展上层业务应用.
短信转发器——监控Android手机短信、来电、APP通知,并根据指定规则转发到其他手机:钉钉机器人、企业微信群机器人、飞书机器人、企业微信应用消息、邮箱、bark、webhook、Tele****机器人、Server酱、PushPlus、手机短信等。包括主动控制服务端与客户端,让你轻松远程发短信、查短信、查通话、查话簿、查电量等。(V3.0 新增)PS.这个APK主要是学习与自用,如有BUG请提
该项目将常用短信协议CMPP、SGIP、SMGP、SMPP进行封装,提供http接口发送短信,使刚接触短信的用户,只需要简单配置通道,即可快速发送短信
使用spring boot打造文件文档在线预览项目解决方案,支持doc、docx、ppt、pptx、wps、xls、xlsx、zip、rar、ofd、xmind、bpmn 、eml 、epub、3ds、dwg、psd 、mp4、mp3以及众多类文本类型文件在线预览