小项目基于TDOA多站定位原理,通过MATLAB仿真生成融合时延几何特征的MTR图像及对应的多通道双曲线掩码标签;设计通道-空间注意力U-Net网络,实现端到端语义分割,采用加权BCE-Dice-SSIM混合损失函数进行训练;经自适应热点检测与物理坐标反演后处理,实现多源多天线场景下的高精度定位。
基于 F5-TTS 与 Faster-Whisper 的全栈语音交互系统,支持语音增强与降噪,活动切分(VAD),实时流式语音识别(ASR)、声纹识别、唤醒词检测与语音合成(TTS),提供 WebSocket/HTTP 双协议与 Opus/PCM 多格式编解码能力。