# ai_virtual_mate_comm **Repository Path**: XDaydreamer/ai_virtual_mate_comm ## Basic Information - **Project Name**: ai_virtual_mate_comm - **Description**: No description available - **Primary Language**: Unknown - **License**: GPL-3.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-28 - **Last Updated**: 2026-04-28 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 枫云AI虚拟伙伴社区版 ![GitHub license](https://img.shields.io/github/license/MewCo-AI/ai_virtual_mate_comm?style=flat-square) ![GitHub stars](https://img.shields.io/github/stars/MewCo-AI/ai_virtual_mate_comm?style=flat-square) ![GitHub forks](https://img.shields.io/github/forks/MewCo-AI/ai_virtual_mate_comm?style=flat-square) **枫云AI虚拟伙伴社区版**是一个由**MewCo-AI**开源的高自由度的网页二次元AI数字人框架,现已升级至4.0版本。支持声纹识别语音交互、文本对话、语音合成、图像识别、桌宠模式、Live2D/MMD/VRM 3D角色展示、多智能体助手等功能。用户可以通过Web界面或桌宠与虚拟伙伴进行互动,虚拟伙伴能够根据用户的输入进行智能回复,并支持多种语言模型和语音合成引擎。 ![](data/image/logo.png) ## 功能特性 - **高自由度与模块化扩展性**:面向开发者的开源框架,支持修改代码二次开发以实现高度个性化的AI伙伴。 - **广泛的开源AI生态**:对接多种云端/本地大语言模型、多模态模型、语音合成大模型。支持GLM-4、通义千问、DeepSeek-R1推理模型、Qwen-VL多模态模型等,并兼容OpenAI标准API。 - **声纹识别语音交互**:通过SenseVoice本地ASR引擎实现实时语音识别,支持流畅的语音交流。语音合成功能支持打断,用户可通过语音、按钮或按键方式中断过长的回复。还支持声纹识别功能,虚拟伙伴只应答特定用户的声音。 - **多模态图像识别**:支持电脑屏幕画面/摄像头内容/手动上传图片的多模态图像识别。 - **本地知识库**:对接本地AnythingLLM、Dify聊天助手提升虚拟伙伴的理解与回应精度。 - **多设备全平台访问**:在Windows电脑上运行后,局域网内的设备(如电脑、手机、平板、车机)可通过浏览器展示虚拟伙伴。 - **桌宠模式**:支持Live2D桌面宠物模式,虚拟伙伴以悬浮窗形式显示在桌面上。 - **多智能体助手模式**:支持音乐播放、语音输入、软件控制、文本写作、屏幕翻译、智能家居控制、天气查询、新闻搜索、系统状态监控、联网搜索、视频生成等丰富功能。 - **丰富的自定义设置**:用户可自定义虚拟伙伴的名称、语音、人设、Live2D/MMD/VRM 3D角色模型等,并个性化配置ASR、TTS、LLM、VLM等模块。 - **主动感知对话**:支持根据时间、屏幕内容、摄像头内容等主动发起对话,提供更自然的交互体验。 - **角色扮演聊天**:基于所选的大语言模型、虚拟伙伴人设、语音合成引擎和图像识别引擎,可与用户进行自然语言交流。 ![](data/docs/mateweb.jpg) ![](data/docs/mindmap.png) ## 安装与使用 ### 环境要求 - **操作系统**:Windows 10或更高版本 - **处理器**:Intel Core i5 8th / AMD R5 3000 系列 - **内存**:8GB RAM - **显卡**:Intel UHD 620 核显 / AMD Vega 7 核显 - **存储空间**:至少3GB可用空间 - **网络**:支持联网使用,也支持下载本地AI引擎DLC离线使用 - **麦克风**:0.5米拾音(语音输入需求) - **摄像头**:720P彩色(多模态图像识别需求) ### 安装步骤 #### 方法一(推荐):下载安装整合包(简单易上手) 1. **下载整合包** 从官方网站下载整合包:[下载链接](https://mewco-ai.github.io/2024/07/09/matecomm/) 2. **解压并运行** 使用7-Zip或Bandizip软件智能解压已下载的安装包,双击运行"枫云AI虚拟伙伴社区版.bat"文件即可启动软件。 3. **本地AI引擎(可选)** 如果您希望实现软件的本地运行,可以下载AI虚拟伙伴插件-本地端侧AI引擎DLC:[下载链接](https://mewco-ai.github.io/2024/03/13/engine/) #### 方法二:通过源码安装(面向开发者) 1. **克隆仓库** 首先,确保您已经安装了Git和Anaconda/Miniconda。然后,打开命令行窗口并运行以下命令来克隆仓库: ```bash git clone https://github.com/MewCo-AI/ai_virtual_mate_comm.git cd ai_virtual_mate_comm ``` 2. **安装依赖** 在项目根目录下,运行以下命令安装所需的Python依赖: ```bash conda create -n aivmw python==3.12 conda activate aivmw pip install -r requirements.txt ``` 3. **配置环境** - 如果需要使用云端免费API,请在 `data/set/cloud_ai_key_set.json` 中填写相应的API密钥。 - 从 [网盘模型整合包(推荐)](https://pan.baidu.com/s/1xjOBFyVQro3klnobfbYIMQ?pwd=aivm) 或 [sherpa_onnx项目地址](https://github.com/k2-fsa/sherpa-onnx?tab=readme-ov-file#links-for-pre-trained-models) 下载语音识别(sherpa-onnx-sense-voice-zh-en-ja-ko-yue)、声纹识别(3dspeaker_speech_campplus_sv_zh_en_16k-common_advanced)、语音合成(sherpa-onnx-vits-zh-ll)模型,解压后放入或替换 `data/model` 文件夹。 4. **运行应用** 在项目根目录下,运行以下命令启动应用: ```bash python main.py ``` 应用启动后,可以通过浏览器访问 `http://127.0.0.1:5260` 进入Web界面。 ### 使用说明 - **启动软件**:双击运行程序,软件主界面将自动弹出。首次使用建议阅读软件使用文档并同意GPL-3.0开源协议。请将屏幕缩放比例调整为100%或125%,以获得最佳视觉体验。 - **首次使用初始化配置**:双击枫云AI虚拟伙伴社区版.bat打开软件 → 点击右上角软件设置按钮 → 点击右侧云端AI Key设置按钮 → 记事本修改填入对应云端LLM平台的Key → 点击记事本左上角菜单文件,保存 → 关闭记事本和软件,重新运行上述bat文件 → 完成初始化配置 - **桌面端操作**:软件默认关闭实时语音交互,按下"Alt+x"可切换实时语音开关。打开实时语音交互后,可在任意界面和虚拟伙伴聊天。用户也可以在输入框内输入文本与虚拟伙伴进行对话。 - **网页端操作**:点击主界面"网页对话"按钮或通过浏览器访问 `http://127.0.0.1:5260` 打开对话网页。 - **多智能体助手**:在运行模式切换中选择"多智能体助手",即可使用音乐播放、语音输入、软件控制、文本写作、屏幕翻译、智能家居控制、天气查询、新闻搜索、系统状态监控、联网搜索、视频生成等丰富功能。 - **Live2D角色互动**:点击主界面"L2D角色"按钮,将打开Live2D角色展示网页。用户可在网页上通过滑动鼠标或手指实时与虚拟伙伴互动,虚拟伙伴视线持续跟随鼠标或手指。 - **MMD 3D角色展示**:点击主界面"MMD角色"按钮,将打开MMD 3D角色展示网页,虚拟伙伴嘴部会跟随语音输出动起来。 - **VRM 3D角色展示**:点击主界面"VRM角色"按钮,将打开VRM 3D角色展示网页,支持触摸互动。 - **MMD 3D动作展示**:点击主界面的"MMD动作"按钮,将打开MMD 3D动作展示网页。用户可前往资源管理便捷更换MMD 3D的vmd动作。 - **桌面宠物**:点击主界面"L2D桌宠"按钮,可在桌面上显示Live2D桌宠,支持拖拽、缩放、右键菜单操作。桌宠仅支持Live2D,不支持MMD/VRM 3D。 ## 项目结构 ``` ai_virtual_mate_comm/ ├── data/ # 数据文件 │ ├── cache/ # 缓存文件 │ ├── db/ # 配置文件 │ ├── image/ # 图片资源 │ ├── model/ # AI模型资源 │ │ ├── ASR/ # 语音识别模型 │ │ ├── TTS/ # 语音合成模型 │ │ └── SpeakerID/ # 声纹识别模型 │ ├── music/ # 音乐目录 │ └── set/ # 设置文件 ├── dist/ # 静态资源 │ └── assets/ # Live2D/MMD/VRM模型和Web资源 ├── agent.py # 智能体功能模块 ├── ase.py # 主动感知模块 ├── asr.py # 语音识别模块 ├── chat_web.py # Web聊天界面 ├── function.py # 功能函数 ├── gui.py # GUI主界面 ├── gui_qt.py # Qt桌面宠物 ├── gui_sub.py # GUI子模块 ├── llm.py # 语言模型模块 ├── live2d.py # Live2D模块 ├── main.py # 主程序 ├── main_sub.py # 主程序子模块 ├── mmd.py # MMD 3D模块 ├── sys_init.py # 系统初始化 ├── tts.py # 语音合成模块 ├── vlm.py # 图像识别模块 ├── vrm.py # VRM 3D模块 └── requirements.txt # 依赖文件 ``` ## 配置说明 ### 主要配置文件 - **data/db/config.json**:主配置文件,包含虚拟伙伴名称、语音识别灵敏度、语音合成引擎等配置项。 - **data/set/cloud_ai_key_set.json**:云端AI密钥配置文件,包含GLM智谱、SiliconCloud、百度文心、腾讯混元、讯飞星火等平台的API密钥。 - **data/set/more_set.json**:更多配置文件,包含摄像头编号、麦克风编号、本地服务端口等设置。 - **data/set/home_assistant_set.txt**:Home Assistant智能家居配置。 - **data/set/custom_tts_set.txt**:自定义云端OpenAI标准兼容格式TTS API配置。 ### 支持的大语言模型 - **云端模型**:智谱GLM、通义千问、DeepSeek、文心一言、腾讯混元、讯飞星火 - **本地模型**:Ollama LLM框架、LM Studio框架、Transformers框架、Dify聊天助手知识库、AnythingLLM知识库 - **自定义API**:支持任何兼容OpenAI API标准的LLM模型 ### 支持的语音合成引擎 - **云端引擎**:edge-tts、Paddle-TTS - **本地引擎**:GPT-SoVITS、CosyVoice、Index-TTS、VoxCPM - **内置引擎**:低延迟VITS、系统自带TTS - **自定义API**:支持任何兼容OpenAI API标准的TTS模型 ### 支持的图像识别引擎 - **云端引擎**:智谱GLM-V - **本地引擎**:Ollama VLM框架、LM Studio框架、QwenVL整合包、Janus整合包 - **自定义API**:支持任何兼容OpenAI API标准的VLM模型 ### 支持的图像生成引擎 - **云端引擎**:CogView-3、Kolors、文心Web - **本地引擎**:Janus整合包、Stable Diffusion API ## 常见问题解答 1. **软件启动闪退怎么办?** - 对于整合包用户,该问题原因为极少数电脑系统Python环境冲突。可前往C:\Users(用户)\用户名\AppData\Roaming\Python文件夹,把其中的Python312(也可能是其他版本号)文件夹重命名为Python312_backup。然后再次启动软件,正常进入。对于从源码安装的用户,请检查安装步骤确保Python版本正确以及库安装完整。 2. **点击打开桌宠/角色但不显示怎么办?** - 如果是默认的角色不显示,则是Windows系统渲染库的问题,可能是因为Windows更新出错导致,如果有条件可在另一台电脑上使用本软件。如果是更换后的模型不显示,可能是模型兼容性问题或模型路径配置错误,可尝试其它模型或恢复默认设置。 3. **服务不可用怎么办?** - 请首先检查您的API Key是否配置正确以及网络连接是否稳定。若网络无问题,请尝试在设置中更换另一个对话语言模型或语音合成引擎。也可选择下载DLC并开启对应的本地AI引擎,实现离线使用。 4. **语音识别不完整/没反应怎么办?** - 软件默认使用中灵敏度语音识别,可前往软件设置根据电脑麦克风实际情况调高/调低语音识别灵敏度,也可能需要调节电脑麦克风音量,保存设置后重启软件即可。 5. **伙伴语音自我打断/自言自语怎么办?** - 推荐选择自定义唤醒词,避免自我打断;也可以戴耳机使用,或者调低扬声器的音量。还可进入软件设置录制个人声纹,这样虚拟伙伴只会回复主人语音。 6. **MMD/VRM 3D角色网页卡顿怎么办?** - 谷歌浏览器右上角三个点→设置→左侧栏"系统",打开使用图形加速功能(如果可用),之后MMD/VRM模型会在GPU上加载,动作更加流畅。 7. **被杀毒软件清理了怎么办?** - 该情况属于误报毒行为,本软件为绿色软件,请放心使用。从杀毒软件隔离区恢复软件并加入白名单(信任区)即可。 ## 开源协议 本项目采用 **GPL-3.0** 开源协议,详情请参阅 [LICENSE](LICENSE) 文件。本软件公益开源免费,严禁商用、套壳和倒卖,请遵守开源协议使用。 ## 致谢 - 感谢所有贡献者和用户的支持! - 虚拟伙伴[小月]Live2D模型版权:Live2D inc. - 感谢以下等开源项目的支持: - GPT-SoVITS: https://github.com/RVC-Boss/GPT-SoVITS - opencv: https://github.com/opencv/opencv-python - FunAudioLLM: https://github.com/FunAudioLLM - edge-tts: https://github.com/rany2/edge-tts - Qwen3-VL: https://github.com/QwenLM/Qwen3-VL - ollama: https://github.com/ollama/ollama - flask: https://github.com/pallets/flask - live2d: https://github.com/nladuo/live2d-chatbot-demo - three.js: https://github.com/mrdoob/three.js - sherpa-onnx: https://github.com/k2-fsa/sherpa-onnx ## 联系开发者团队 如有任何问题或建议,请联系开发者团队: - **Email**: mewcoai@foxmail.com - **GitHub**: [MewCo-AI](https://github.com/MewCo-AI) - **项目主页**: https://mewco-ai.github.io/2024/07/09/matecomm/ - **GitHub仓库**: https://github.com/MewCo-AI/ai_virtual_mate_comm