# KIA_AI_SYS

**Repository Path**: EricPL/kia_ai_sys

## Basic Information

- **Project Name**: KIA_AI_SYS
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-12-23
- **Last Updated**: 2026-01-16

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 离线语音关键词触发与 UDP 广播

## 依赖与模型
- Python 3.10+
- 依赖：`pip install -r requirements.txt`
- 若网络慢，可使用镜像：`pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple`
- 模型：下载 Vosk 中文模型到 `models/cn`，英文模型到 `models/en`。
  - 下载地址示例（任选 small 版本以加快加载）：
    - 中文：https://alphacephei.com/vosk/models （如 `vosk-model-small-cn-0.22`）
    - 英文：https://alphacephei.com/vosk/models （如 `vosk-model-small-en-us-0.15`）

## 功能特性
- **离线语音识别**: 基于 Vosk，支持中英文模型动态切换。
- **状态管理**: 包含 Idle（休眠）和 Active（唤醒）状态，支持 "Hey KIA" 唤醒。
- **语音反馈**: 集成 Pygame 音频播放，支持指定输出设备（如 Realtek USB Audio）。
- **硬件联动**: 支持 UDP 广播控制 UE5 界面及氛围灯颜色。
- **音频优化**: 
  - 自动静音保活 (Keep-Alive) 防止声卡休眠。
  - 预卷静音 (Pre-roll Silence) 解决首字吞音问题。
  - 缓冲区优化 (Buffer Optimization) 解决播放重音/结巴问题。

## 运行
1. **一键启动（推荐）**：
   - 双击 `start.bat` 或在命令行运行：`python app.py`
   - 启动后会列出麦克风设备，输入索引或直接回车使用推荐设备
   - 同一窗口同时运行监听器与识别，无需打开多个终端
2. **手动启动（老流程）**：
   - 监听器：`python listener.py`
   - 识别主程序：`python main.py`

启动后如提示“未加载识别模型”，请先将模型解压到 `models/cn` 与 `models/en`。

## 配置
- **核心配置 (`config.py`)**:
  - `WAKE_WORDS`: 修改唤醒词。
  - `AUDIO_OUTPUT_DEVICE`: 指定音频输出设备名称（例如 "扬声器 (Realtek USB Audio)"）。
  - `BROADCAST_ADDR`: 广播地址与端口。
  - `SAMPLE_RATE`: 采样率设置（建议 16000）。

## 文件结构
- `core/`: 核心逻辑模块 (State Manager, Audio Player, etc.)
- `mp3/`: 语音反馈音频文件
- `models/`: Vosk 语音模型
- `tools/`: 硬件调试工具 (如 `list_sd_devices.py`)

## 验证
- 在同一局域网内，监听器应打印包含关键词的 JSON 载荷。
- 唤醒后应听到 "I'm here with you" 等语音反馈。