# KIA_AI_SYS **Repository Path**: EricPL/kia_ai_sys ## Basic Information - **Project Name**: KIA_AI_SYS - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-23 - **Last Updated**: 2026-01-16 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 离线语音关键词触发与 UDP 广播 ## 依赖与模型 - Python 3.10+ - 依赖:`pip install -r requirements.txt` - 若网络慢,可使用镜像:`pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple` - 模型:下载 Vosk 中文模型到 `models/cn`,英文模型到 `models/en`。 - 下载地址示例(任选 small 版本以加快加载): - 中文:https://alphacephei.com/vosk/models (如 `vosk-model-small-cn-0.22`) - 英文:https://alphacephei.com/vosk/models (如 `vosk-model-small-en-us-0.15`) ## 功能特性 - **离线语音识别**: 基于 Vosk,支持中英文模型动态切换。 - **状态管理**: 包含 Idle(休眠)和 Active(唤醒)状态,支持 "Hey KIA" 唤醒。 - **语音反馈**: 集成 Pygame 音频播放,支持指定输出设备(如 Realtek USB Audio)。 - **硬件联动**: 支持 UDP 广播控制 UE5 界面及氛围灯颜色。 - **音频优化**: - 自动静音保活 (Keep-Alive) 防止声卡休眠。 - 预卷静音 (Pre-roll Silence) 解决首字吞音问题。 - 缓冲区优化 (Buffer Optimization) 解决播放重音/结巴问题。 ## 运行 1. **一键启动(推荐)**: - 双击 `start.bat` 或在命令行运行:`python app.py` - 启动后会列出麦克风设备,输入索引或直接回车使用推荐设备 - 同一窗口同时运行监听器与识别,无需打开多个终端 2. **手动启动(老流程)**: - 监听器:`python listener.py` - 识别主程序:`python main.py` 启动后如提示“未加载识别模型”,请先将模型解压到 `models/cn` 与 `models/en`。 ## 配置 - **核心配置 (`config.py`)**: - `WAKE_WORDS`: 修改唤醒词。 - `AUDIO_OUTPUT_DEVICE`: 指定音频输出设备名称(例如 "扬声器 (Realtek USB Audio)")。 - `BROADCAST_ADDR`: 广播地址与端口。 - `SAMPLE_RATE`: 采样率设置(建议 16000)。 ## 文件结构 - `core/`: 核心逻辑模块 (State Manager, Audio Player, etc.) - `mp3/`: 语音反馈音频文件 - `models/`: Vosk 语音模型 - `tools/`: 硬件调试工具 (如 `list_sd_devices.py`) ## 验证 - 在同一局域网内,监听器应打印包含关键词的 JSON 载荷。 - 唤醒后应听到 "I'm here with you" 等语音反馈。