# VCPChat

**Repository Path**: ckiss58/VCPChat

## Basic Information

- **Project Name**: VCPChat
- **Description**: No description available
- **Primary Language**: Python
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-10-28
- **Last Updated**: 2025-10-28

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# VCPChat 聊天客户端

这是一个为 VCP (Variable & Command Protocol) 服务器打造的 AI 聊天桌面客户端。

*请立刻在全局设置里设置用户名，以避免众多依赖功能报错！*

后端链接：https://github.com/lioensky/VCPToolBox

请下载壁纸包以避免元素窗口异常：https://github.com/lioensky/VCPChat/releases

请下载音频解码包：https://github.com/lioensky/VCPChat/releases/tag/%E8%A7%A3%E7%A0%81%E5%99%A8core

[![Ask DeepWiki](https://deepwiki.com/badge.svg)](https://deepwiki.com/lioensky/VCPChat)

## 安装与部署

1.  **克隆仓库**

    克隆此项目到您的本地计算机：
    ```bash
    git clone https://github.com/lioensky/VCPChat.git
    cd VCPChat
    ```

2.  **安装依赖**

    本项目需要 Node.js 和 Python 环境。

    *   **安装 Node.js 依赖:**
        ```bash
        npm install
        ```

    *   **安装 Python 依赖** (用于音频引擎、高级插件等):
        ```bash
        pip install -r requirements.txt
        ```
    *   **安装高性能音频重采样模块 (可选, 推荐)**:
        本项目包含一个用 Rust 编写的高性能音频重采样模块，用于提升升频和 WASAPI 模式下的音质。
        如果您的环境是 **64位 Windows** 且使用 **Python 3.13**，可直接安装预编译好的模块：
        ```bash
        pip install audio_engine/rust_audio_resampler-0.1.0-cp313-cp313-win_amd64.whl
        ```
        如果您的环境不同，则需要进入 `rust_audio_engine` 目录，自行编译。

3.  **启动应用**

    *   **常规启动:**
        ```bash
        npm start
        ```

    *   **静默启动 (可选):**
        您也可以使用 `run_silent.vbs` 脚本来实现无控制台窗口的静默启动。
## 前后端深度协同：释放 AI 的无限潜能

VChat 不仅仅是一个聊天界面，它是强大的 VCP 后端生态（VCPToolBox）的“眼睛”和“画板”。两者深度结合，旨在释放 AI 的无限潜能：

*   **高级能力渲染**: VChat 专为渲染 VCP 协议的复杂输出而设计。无论是 AI 主动记录和反思的“日记”，还是多媒体内容，都能以最直观的方式呈现。Vchat的Agent输出气泡拥有近乎怪物级的渲染能力，可以渲染几乎所有主流动画和文档。
*   **重型异步任务**: 后端可以执行如视频生成、数据分析等耗时很长的重型任务。AI 发起任务后可立即响应用户，任务完成后，VChat 会通过后端推送，将结果（如生成的视频）实时展现在对话流中，整个过程流畅不卡顿。
*   **Agent 群体智能**: 后端支持多个 AI Agent 协同工作，甚至实现 Agent 主动分配任务给子 Agent。VChat 的群聊模式和清晰的发言标记系统，为这种高级的“AI 女仆团”协作流提供了完美的交互界面。
*   **丰富的多媒体交互**: AI 可以通过后端调用 VCP 工具，在对话中发送表情包、播放音乐、展示视频。VChat 拥有强大的多媒体渲染引擎和高级的窗口气泡动画、流式动画，确保了极致的视听体验。
*   **VCP 核心多模态能力**: 这使得例如 FluxGen 或 SunoGen 这样的插件生成的多媒体，AI 真的可以看到和听到。
    *   **Base64 直通车**: 允许 AI 在 `tool` 字段中直接引入 Base64 数据，极大地简化了多媒体内容的即时调用。
    *   **全局文件 API (`VCPFileAPI` v4.0 超栈追踪版)**: 实现了革命性的全URL超栈追踪。现在，AI在任何分布式节点上提交本地文件路径（如 `H:\MCP\123.txt`），主服务器都能智能解析其来源并自动向源节点请求文件的Base64数据，实现无缝的跨服务器文件调用。
    *   **跨模态智能转译**: 实现高阶模型对低阶模型的“能力赋能”。例如，能识别音频的模型可以帮助纯文本模型，将其无法处理的音频 Base64 数据智能转译为文字描述，反哺给请求方。
    *   **分布式多模态传输 (v4.0 核心升级)**: 借助**全 URL 超栈追踪**，任意节点上的 AI 都能直接使用本地文件路径进行跨服调用。主服务器会自动追踪并拉取数据，彻底打通了分布式网络中的文件孤岛，让多模态数据在星型网络中无缝流转。
    *   **智能响应路由**: VCP 核心能够智能判断插件返回的是传统的 stdio 文本信息，还是包含 Base64 的结构化数据，并自动选择正确的渠道进行转发和处理。
    *   **多 Agent 协作共享**: 在多 Agent 协同任务中，实现 Base64 数据的智能共享，并能根据需要将其动态转译为临时的 `fileurl`，方便其他 Agent 或前端应用访问。

## 主要功能

*   **VCP 服务器集成**: 客户端的核心聊天功能依赖于 VCP 服务器。它通过 HTTP(S) 与 VCP 服务器通信，发送用户消息并接收 AI 的响应，支持流式传输以实现实时交互。
*   **VCP 工具调用**: 完美支持 VCP 服务器定义的各类工具调用，包括需要立即返回结果的**同步工具**（如计算、查询）和可后台执行的**异步工具**（如视频生成、网站长文抓取），让 AI 的能力边界无限扩展。VChat 对工具调用流程进行了深度优化，提供了更强大的交互能力：
    *   **智能交互气泡**: 工具调用气泡经过精心设计，鼠标悬停时会自动展开，清晰展示 AI 发起的完整指令集，方便用户理解和调试。
    *   **多样化回调机制**: 任务完成后，结果可通过多种方式通知用户：
        *   **WebSocket 实时通知**: 适合需要即时反馈的场景。
        *   **上下文嵌入式气泡**: 将结果无缝整合到对话流中。
        *   **系统级多设备推送通知**: 即使用户不在应用内，也能收到重要任务的完成提醒。
    *   **协同式指令优化**: 在执行工具调用前，AI 可以主动向用户征求意见，或邀请用户及其他 Agent 共同协作，对即将执行的指令进行修改和完善，实现了人机/多 Agent 协同决策。
    *   **可靠的中止机制**: 当用户中止 AI 回复时，系统会同步中止正在执行的 VCP 工具调用链，并彻底终止相关的后台进程，确保资源被及时释放。
*   **用户端 VCP 工具调用器**:
    *   现在，强大的 VCP 工具不再是 AI 的专属。VChat 为用户提供了一个完整、直观的图形用户界面（GUI），让用户也能轻松调用和执行 VCP 工具。
    *   **无需指令**: 用户无需记忆和手动输入复杂的命令，只需在 GUI 界面中选择工具、点击参数预设按钮，即可像 AI 一样利用 VCP 生态的强大能力。
    *   **透明执行**: 调用过程和结果会清晰地展示在界面上，方便用户监控和调试。
*   **ComfyGen 插件面板**: 为 ComfyGen 这个强大的图像生成插件提供了丰富的管理和配置面板。这包括对工作流（Workflows）、LoRA 模型、以及其他模型文件的精细化管理。此外，它还集成了一个类似于 Stable Diffusion WebUI 的前端管理界面，允许用户和 AI 通过图形化界面，直观、精确地控制图像生成的每一个参数和内容细节，极大地提升了创作的灵活性和深度。
    *   这一功能打破了人与 AI 在工具使用上的界限，让用户也能成为 VCP 生态的直接参与者和创造者。

*   **VCP 日记渲染**: 能够渲染和显示 VCP 日记内容。这不仅是查看日志，更是观察 AI 如何形成长期记忆、实现自我进化的窗口。
*   **Agent 管理**:
    *   创建、删除和配置多个 AI Agent。
    *   为每个 Agent 设置名称、系统提示、模型参数（如温度、上下文Token限制、最大输出Token）。
    *   管理 Agent 的头像。
    *   支持每个 Agent 拥有多个独立的聊天话题 (Topics)，包括话题的创建、删除、重命名、排序和**导出**（支持导出为 Markdown 或 HTML 格式）。
    *   支持 Agent 列表的自定义排序。
*   **高级上下文管理 (兼容 SillyTavern)**: VChat 基于后端服务器节点实现了与 SillyTavern 高度兼容的上下文管理机制，为精细化、可复用的对话背景设定提供了强大支持。
    *  **预设、角色卡与世界书**: 现在VCP系统完全兼容并支持挂载 SillyTavern 的 `预设 (Preset) `、 `角色卡 (Character Card) ` 和  `世界书 (World Book)`。您可以无缝导入和使用已有的 SillyTavern 资源，或在 VCP 内直接创建和管理。
    *  **可视化预设编辑器**: 内置强大的可视化编辑器，允许您创建和编辑上下文预设。支持设置复杂的注入规则，如 `深度注入 (Deep Injection) ` 和  `相对注入 (Relative Injection) `，精确控制每一条上下文在对话历史中的位置和行为。
    *  **拖拽式上下文排序**: 在聊天界面中，所有注入的上下文（如系统提示、角色设定、世界信息等）都清晰可见，并支持通过 `拖拽 `方式实时调整它们的相对顺序，直观地改变 AI 的行为优先级。
    *  **Agent 独立挂载**: 每个 Agent 都可以独立挂载不同的预设和世界书组合。这意味着您可以为“写作助手”Agent 配置一套专业的写作背景资料，同时为“聊天伴侣”Agent 设置另一套完全不同的角色扮演设定，实现高度个性化的 AI 体验。
*   **群聊模式 (Agent Groups)**:
    *   允许多个已配置的 Agent 在同一个聊天会话中进行协作或角色扮演。
    *   支持创建、配置和管理 Agent 群组，包括设置群组名称、头像。
    *   每个群组可以包含多个从现有 Agent 列表中选择的成员。
    *   **发言模式**:
        *   **顺序发言 (`sequential`)**: 成员按预定顺序轮流发言（当前实现为按成员列表顺序，每次一个，具体高级轮换逻辑可后续增强）。
        *   **自然随机 (`naturerandom`)**: 根据用户输入中的 `@角色名`、`@角色标签` 或消息内容中与成员预设标签匹配每个Agent的关键词/描述词，来智能产生上下文权重决定哪些成员响应。此模式在构建自然权重回复序列时还保留有一定的随机性，并可能在没有明确触发时选择一个保底发言者。
        *   **邀约模式 (`inviteonly`)**:根据用户点击Agent的按钮来决定谁来发言。
    *   **群组设定 (`groupPrompt`)**: 可以为整个群聊定义一个共同的背景、规则或系统级指令，影响群内所有 Agent 的行为。
    *   **发言邀请 (`invitePrompt`)**:
        *   这是一个模板字符串，用于在群聊中由系统（或协调者Agent）提示特定 Agent 发言。
        *   模板中应使用 `{{VCPChatAgentName}}` 作为占位符，系统在实际邀请时会自动将其替换为目标 Agent 的名称。
        *   **默认 `invitePrompt` 示例**：`现在轮到你{{VCPChatAgentName}}发言了。系统已经为大家添加[xxx的发言：]这样的标记头，以用于区分不同发言来自谁。大家不用自己再输出自己的发言标记头，讨论时不要讨论这个标记头系统，专注正常聊天即可。`
        *   这个提示旨在引导 Agent 自然地开始其回合，同时告知它们关于发言标记的规则。
    *   **发言标记系统**:
        *   为了在包含多个 Agent 和用户的群聊中清晰地标识每一条消息的来源，系统会自动在每条消息（无论是用户还是 Agent 的）前添加发言者标记，格式通常为 `[发言者名称的发言]: 实际消息内容`。
        *   **重要提示**：用户和配置的 Agent 在聊天时**无需手动输入或模仿**这些标记头。Agent 的系统提示和 `invitePrompt` 也应引导它们专注于对话内容，而不是讨论或生成这些标记。
    *   群组同样支持独立的话题管理，包括话题的创建、删除、重命名和排序。
*   **群文件/工作区**: 为每个群组提供一个专属的共享文件空间和工作区。
    *   **集中存储**: 所有与群组任务相关的文件（文档、代码、素材等）都可以上传并存储在这里，群内所有成员（用户和 Agent）均可访问。
    *   **协同编辑**: 支持对工作区内的文件进行实时协同编辑，类似于在线文档，极大地促进了团队合作和项目迭代。
*   **跨端记忆与无缝同步**: VChat 的记忆系统以 VCP 后端为核心，构建了一个统一的、持久化的 Agent 记忆库。这意味着，无论您在哪个前端（如网页、移动端或另一台电脑上的 VChat 客户端）与 Agent 互动，所有的对话历史、学习到的知识和形成的用户偏好都会被实时同步到这个中心记忆库。当您打开 VChat 客户端时，它会自动从后端拉取最新的记忆状态，确保您的 Agent 拥有完整、连贯的上下文。这种设计打破了设备之间的壁垒，实现了真正的“一次对话，处处同步”，让您无论身在何处，都能与同一个“老朋友”无缝沟通。
*   **心流锁模式 (Flow Lock)**:
    *   **专注交互**: 当针对某个话题开启此功能后，用户将暂时无法切换 Agent 或话题，窗口会被锁定，确保对话的深度和连续性。
    *   **AI 主动性**: 在该模式下，AI 不再仅仅被动等待用户输入，而是可以主动发起对话、继续执行任务、汇报进度或提出想法，实现真正的自主工作。
    *   **双向控制**:
        *   **用户**: 可以设置触发 AI 主动说话的引导语 (Prompt)、AI 主动说话的最短冷却时间 (CD)，并随时手动开启或关闭心流锁。
        *   **AI**: 也可以根据任务需求，自主开启或关闭心流锁，并能自行设置触发下一次主动行为的引导语。
    *   **全新工作范式**: 结合 VChat 已有的主动弹窗交互 UI，心流锁模式让 Agent 能够独立进行长期、复杂的任务。AI 只在关键节点或需要决策时才征求用户建议，彻底摆脱了传统的一问一答模式，适用于需要持续思考和执行的多种场景，如研究、编程、创作等。
*   **Agent 正则表达式**:
    *   引入了强大的正则表达式功能，允许对 Agent 的行为进行更深度的控制。
    *   支持多种正则应用场景，包括：**聊天历史内容正则**、**渲染器正则**、**深度正则**和**content 数组正则**。
    *   提供完整的图形用户界面（GUI），方便用户进行正则表达式的编辑、测试和管理，极大地提升了易用性。
*   **人类工具箱工作流增强**:
    *   工作流引擎得到全面升级，提供了更精细化的节点控制和更强大的逻辑构建能力。
    *   **节点输入输出细化**: 增强了对节点输入输出数据的控制。
    *   **新增高级节点**:
        *   **数据转换器**: 方便在不同节点间进行数据格式转换。
        *   **高级条件判断**: 支持更复杂的逻辑判断分支。
        *   **计时器/延时器**: 用于控制工作流的执行时序。
        *   **编辑器/循环节点**: 提供了更灵活的数据处理和流程控制能力。
    *   **URL 渲染器升级**: 现在可以直接渲染 PDF、音频和视频文件，丰富了内容的呈现方式。
*   **Canvas 协同模块：实时、交互式的代码与文档工作区**:
    *   **功能定位**: 一个革命性的实时协同空间，用户或 Agent 可随时创建。它不仅仅是一个文本编辑器，而是一个集成了完整开发与渲染环境的“活文档”和“交互式白板”。
    *   **无缝协同编辑**: 在这个工作区内，用户与 AI 可以像使用 Google Docs 一样，对代码（如 `.js`, `.py`, `.html`）或文档（`.md`）进行**零延迟**的共同编辑。每一处改动都会实时同步给对方。
    *   **群组协同与文件区集成**: Canvas 现已深度整合进群聊模式。用户和多个 Agent 可以在群组中共同打开和编辑同一个 Canvas，并与群文件区的文档实时同步。这使得 AI 团队能够像人类开发团队一样，围绕一个共享的、可执行的文档或代码库进行无缝协作，共同完成复杂的编码和文档撰写任务。
    *   **内置全功能 IDE**:
        *   **沙盒化编译与执行**: 提供一个安全的沙盒环境，可直接编译和运行工作区内的代码，并实时显示结果。
        *   **即时调试**: 代码执行过程中的错误、日志和输出会立刻在旁边显示，方便 AI 和用户共同诊断问题。
        *   **VChat 超级渲染器集成**: 工作区内的代码（如 HTML, Mermaid 图表, Python 数据可视化）可以直接调用 VChat 强大的渲染引擎进行预览，实现“所见即所得”。
    *   **文档类型归类与工作区管理**: Canvas 不再是零散文件的集合，而是结构化的项目空间。支持为不同类型的文档（如代码、Markdown笔记、设计图）进行分类和归档，或通过文件夹/标签系统进行管理，让复杂项目中的多文件协作变得井然有序。
    *   **版本回溯与可视化节点线**: 每一次重要的保存或提交都会在时间轴上创建一个“变动节点”。Canvas 会以直观的节点线图谱形式，清晰记录文档的每一次演变历史。用户可以轻松浏览、对比不同版本之间的差异，并一键回溯到任意历史节点，为协同开发和创意迭代提供了强大的安全保障和追溯能力。
    *   **核心应用场景**:
        *   **AI 概念验证 (PoC)**: AI 可以不再仅仅发送静态代码片段，而是直接在 Canvas 中创建一个可运行的、交互式的项目原型来向用户展示其想法。
        *   **人机结对编程**: 用户可以粘贴自己的代码，邀请 AI 进行重构、优化或添加新功能。双方可以一边讨论，一边实时修改和测试代码。
        *   **交互式学习与教学**: AI 可以作为导师，手把手地在 Canvas 中引导用户学习编程，每一步操作都清晰可见，并可立即运行验证。
    *   基于VCP后端实现了Agent永久记忆/跨端记忆/时间轴记忆。
    *   AI拥有完整的跨话题唯一标识化认知，并会对所有工具调用不断反思、优化与学习。
*   **聊天界面**:
    *   提供用户友好的聊天界面进行 AI 交互。
    *   支持 Markdown/Katex/Html/Mermaid/VCPTool/manim/matplotlib/Anime.js/Three.js/Latex/交互式按钮/交互式弹窗/div/src/draw.io/csv/pdf…等21种渲染器 渲染聊天消息，包括代码块高亮。
    *   **强大的多媒体与文件处理**:
        *   支持通过文件选择器、粘贴（文件路径或多媒体数据）、拖放操作添加附件。
        *   能够从剪贴板读取和粘贴多媒体(兼容几乎市面上所有多媒体文件和文档文件)，并直接在聊天中发送。
        *   支持将过长的文本粘贴内容自动保存为文本文件附件。
        *   内置高级图片查看器，方便在独立窗口预览聊天中的图片进行操作，支持复制和外部打开。
        *   **@附加笔记**: 在输入框中输入 `@` 符号并跟上关键词，即可快速搜索并附加 `AppData/Notemodules` 目录下的笔记文件，实现知识的无缝调用。
    *   **高级动态渲染**: VChat 不仅能渲染静态文本，更能无缝展示由后端 AI 生成或调用的丰富多媒体内容，如**音乐、视频、动态表情包、交互文档**等，为 VCP 协议的强大能力提供一个表现力丰富的舞台。
    *   **DIV 元素流式渲染**: 针对 AI 输出的复杂 DIV 气泡主题内容，VChat 实现了创新的流式渲染机制。它不仅仅是简单地展示内容，而是完美兼容 VChat 内置的21种渲染器（如Markdown、Python、Mermaid等）的流式实现，并新增了对Anime.js的流式渲染兼容，实现了和md渲染器的优雅竟态处理。VChat优雅地处理了各种极端复杂的渲染竞态问题，例如：当DIV中包裹着需要实时执行的Python代码块（气泡会动态渲染出代码的运行结果），当Python代码中又包含了需要加载的`src`图片标签，当表格中需要内嵌一篇完整的Markdown文档，或者当表格单元格里需要显示一张图片时，VChat的渲染引擎都能智能地、按正确的依赖顺序进行渲染，确保这些复杂的、互相嵌套的内容被准确、流畅地拼接成一个完整的动态气泡，提供了业界领先的复杂内容呈现能力。
    *   **跨聊天消息转发**: 极大地简化了信息和文件的流转。
        *   **一键操作**: 在任意聊天（无论是与单个 Agent 还是在群组中）中，右键点击任何消息气泡，即可选择“转发”。
        *   **完整内容保留**: 转发时会完整保留原始消息的所有内容，包括文本、代码块、渲染的卡片，以及所有附加文件（图片、文档等）。
        *   **灵活的目标选择**: 您可以轻松地将消息转发给任何其他的 Agent 或群组，实现信息的无缝分享和跨上下文讨论。    
    *   **气泡评论**: 右键点击消息气泡，可以为其添加评论。评论会附加在原始消息下方，方便进行针对性的讨论和备注。尤其是在转发气泡时添加评论，可以方便Agent理解你的转发意图。

    *   **高级气泡主题**: Vchat 允许每一个主题文件独立设计聊天气泡样式和动画，允许Agent为自己的每一个输出气泡设置独立的气泡样式和内部动画，允许气泡交互性元素，支持agent对自身气泡的div/js/canvas自定义，使得Agent可以输出完整2D/3D的气泡元素内容。
    *   **AI 气泡交互增强：可点击按钮**:
        *   AI 输出的气泡渲染能力得到进一步提升，现在可以在 `div` 内容中动态渲染可交互的 `<button>` 元素。
        *   这不仅仅是显示一个按钮，Vchat 建立了一套完整的事件回调机制。当用户点击气泡中的某个按钮时，AI 能立刻知道用户点击了哪个按钮（通过按钮的 `id` 或其他标识符）。
        *   此功能极大地增强了人机交互的动态性和可能性，使得 AI 可以提供选项、发起确认或引导对话流程，创造出类似“互动小说”或“流程引导”的全新体验。
    *   **高级阅读模式**: 对 AI 发送的长内容提供功能丰富的沉浸式阅读体验。
        *   **多格式渲染**:
            *   支持 **Markdown** 全功能渲染，包括表格、列表、引用等。
            *   支持 **LaTeX** 数学公式渲染 (KaTeX)，完美显示复杂公式。
            *   支持 **Mermaid** 图表渲染，可将代码块直接转换为流程图、序列图等。
            *   实现了对Anime.js的渲染兼容，HTML播放中也实现了对Anime.js渲染的兼容。
        *   **交互式代码块**:
            *   所有代码块均支持语法高亮 (Highlight.js)、一键复制和**块内编辑**。
            *   **HTML 渲染**: `html` 代码块右上角提供“预览”按钮，可直接在应用内渲染和查看 HTML 效果。
            *   **Python 执行**: `python` 代码块右上角提供“运行”按钮，利用 **Pyodide (WASM)** 技术直接在客户端执行 Python 代码并显示输出，非常适合代码演示和数据操作。
            *   **Python 穿透执行** `python` 代码块在信任模式下直接调用win底层库来直接执行，允许直接操作系统内容，基于系统底层编译环境。
            *   **Three.js 3D 预览**: `javascript` 或 `js` 代码块若包含 `three.js` 代码，将提供“预览”按钮，可在沙箱环境中实时渲染和交互 3D 动画。
            *   **自动代码补全**：对代码格式拥有一定的自动补全功能。
        *   **便捷的全局操作**:
            *   支持对整个阅读内容进行**一键编辑**或快速**分享到笔记**模块。
            *   提供强大的自定义上下文菜单（复制、剪切、删除、编辑全文、复制全文）。
            *   **分享截图**: 在右键菜单中提供“分享截图”功能，可将当前渲染精美的DIV卡片（如AI日报）完整截取为一张图片，并在图片查看器中预览，方便用户分享到社交媒体或进行保存。
    *   聊天分支功能，可以基于现有对话创建新的聊天分支。
    *   **收藏到笔记**: Agent气泡右键提供“收藏”按钮，可一键将当前消息内容（包括复杂的渲染格式）完整保存到指定的笔记文件中，方便知识沉淀和后续查阅。
*   **革命性的实时差分渲染：让对话“活”起来**:
    *   **技术核心**: VChat 引入了业界前所未有的“流式聊天历史文件差分渲染器”。当底层聊天记录（无论是本地文件还是数据库）发生任何变动，VChat 不会粗暴地刷新整个界面或重构DOM，而是通过精密的差分算法，将“变动”本身流式地、实时地渲染到前端，实现了对UI的“外科手术式”更新，极致流畅且稳定。
    *   **释放无限可能**: 这一机制彻底颠覆了传统的“一次性”对话模式，赋予了AI和用户前所未有的能力：
        *   **AI的“自我进化”**: AI可以在持续输出（打字）的过程中，动态修改、重塑自己已经说出的话，实现真正的“思考与修正”同步进行。
        *   **“上帝视角”的编辑**: 用户或开发者可以直接在 `VchatManager` 或任何数据库工具中编辑历史记录，前端的聊天气泡会像被施了魔法一样，实时、动态地更新内容，而无需刷新。
        *   **非线性对话**: AI不再局限于“追加”新回复，而是可以直接返回“过去”，在任意一个已经存在的历史气泡中流式地编辑、更新甚至追加内容，实现真正意义上的“对话上下文修改”。
        *   **协同创作新范式**: 想象一下，AI 可以在一个共享的代码块或文档气泡中与用户协同工作，双方的每一次修改都实时差分同步，如同在同一个“活文档”上进行创作。

## AI表情包URL修复器

VChat 现在内置了一个强大且智能的AI表情包URL修复器，旨在解决AI在发送表情包时可能出现的各种URL错误问题。

### 功能简介

AI在生成表情包的`<img>`标签时，有时会因为模型幻觉或数据偏差，导致URL中的IP地址、端口、密码、表情包分类目录或文件名出现错误。此功能可以：
*   **自动检测**: 智能识别消息中指向表情包的图片链接。
*   **模糊匹配**: 当检测到URL无法访问(404)时，它会利用内置的表情包“知识库”，通过模糊匹配算法，从错误的URL中提取关键信息（如文件名），并找到最相似的正确表情包。
*   **无缝修复**: 如果找到一个高置信度的匹配项，它会自动替换为正确的URL进行渲染，整个过程对用户透明。
*   **智能放行**: 如果URL完全正确，或者错误得离谱以至于无法匹配任何已知表情包，修复器会放弃修复，按原样渲染，避免错误干预。

### 如何配置

要启用此功能，您需要从后端的 VCPToolbox 项目中同步表情包列表缓存到VChat客户端。

1.  **复制表情包列表**:
    *   找到您的 VCPToolbox 后端项目。
    *   将其中的 `Vcptoolbox/plugin/EmojiListGenerator/generated_lists` 整个文件夹复制。
    *   粘贴到 VChat 项目的 `AppData/` 目录下。最终路径应为 `VChat/AppData/generated_lists`。

2.  **配置图床密码**:
    *   在刚刚复制的 `VChat/AppData/generated_lists/` 文件夹内，手动创建一个名为 `config.env` 的文本文件。
    *   打开 `config.env` 文件，并写入您的图床密码，格式如下：
        ```
        file_key=你的图床密码
        ```
        例如: `file_key=123456`

完成以上步骤后，重启VChat客户端，修复器即可自动开始工作。    


*   **聊天历史/用户数据管理器 (VchatManager)**:
    *   新增一个独立的、基于 Electron 的可视化管理工具 (`VchatManager/`)，用于查看和编辑 `AppData` 中的用户数据。
    *   **聊天记录查看与编辑**: 直观地浏览所有 Agent 和群组的聊天历史，并支持直接在界面中编辑消息内容。
    *   **JSON 编辑器**: 提供原始 JSON 格式的聊天记录视图，方便高级用户进行检查和修改。
    *   **附件浏览器**: 集中展示 `UserData/attachments` 目录下的所有附件，并按图片、音频、视频等类型进行分类，展示其与聊天历史文件中的FileAPI字段绑定依赖关系。
    *   **全局聊天记录搜索**: 内置强大的全局搜索功能 (`Ctrl+F`)，可以快速在所有历史记录中查找特定内容，并直接定位到对应的消息气泡。
*   **主程序全局聊天搜索**:
    *   现在，主聊天程序同样内置了强大的全局搜索功能 (`Ctrl+F`)。
    *   可以快速、高效地在所有 Agent 和群组的所有话题中搜索聊天内容。
    *   搜索结果会以列表形式清晰展示，并支持翻页。
    *   点击任意搜索结果，即可自动跳转到对应的聊天窗口和话题，并高亮显示该条消息，实现了无缝的上下文追溯。
*   **翻译模块**:
    *   独立的翻译窗口，方便快速翻译。
    *   支持全语种互翻。
    *   支持通过自然语言定义翻译格式，例如Latex布局，CSV布局，MD布局等等。
*   **笔记模块**:
    *   独立的笔记管理窗口，方便记录和整理信息。
    *   支持创建、读取、更新和删除 TXT/MD/Latex/RTF/pdf 格式的笔记。
    *   支持创建笔记文件夹管理。
    *   笔记编辑器支持 Markdown 语法，并提供实时预览功能（包括代码高亮和 LaTeX）。
    *   支持在笔记中粘贴图片，图片将作为附件保存并自动插入 Markdown 链接。
    *   笔记支持Html/Latex/Mermaid/CSV渲染。
    *   提供笔记搜索功能，快速定位所需内容。
    *   自动保存机制，防止笔记内容丢失。
    *   支持从聊天消息或其他应用内容“分享到笔记”，快速创建新笔记。
    *   支持分享笔记到AI知识库。
    *   可在聊天窗口@任意笔记库的笔记发送给AI。
    *   **深度知识库集成**: 允许直接编辑和管理 Agent 的核心知识库与长期记忆。
    *   **云端同步**: 支持接入并同步云端笔记数据库（如 Obsidian 类）。
 *   **数据存储**:
    *   聊天记录、Agent 配置、笔记内容和附件等数据安全地存储在项目内的 `AppData` 目录中。
    *   支持基于VCP后端的数据同步。
 *   **VCPLog 集成**:
    *   通过 WebSocket 连接到 VCPLog 服务，实时接收和显示来自 VCP 服务器的日志信息，方便调试和监控。
    *   支持完整的VCP通知与VCP异步任务回调。
    *   支持重要信息的邮件/Win系统级通知广播。
 *   **自定义设置**:
    *   允许用户配置应用程序的一些基本设置，如用户名、VCP 服务器地址、VCPLog 服务地址等。
    *   服务器地址为 `http://yourip:6005/v1/chat/completions`，通知地址通常为 `ws://yourip:6005`。Https则对应wss。
 *   **窗口与交互**:
    *   自定义窗口框架和控制按钮（最小化、最大化/还原、关闭）。
    *   提供全局快捷键，例如 `Control+Shift+I` 快速打开开发者工具。
    *   打开外部链接前进行安全检查，提升安全性。
 *   **划词小助手 (Selection Assistant)**:
    *   **全局文本监听**: 在设置中启用后，可在任何应用程序中通过鼠标划选文本来激活。
    *   **悬浮动作条**: 划选文本后，会在鼠标附近出现一个悬浮工具条，提供快捷操作按钮（如翻译、总结、解释、搜索、配图等）。
    *   **调用内部 Agent**: 所有快捷操作都会调用在设置中预先指定的 VCP Agent 来执行，充分复用现有 AI 能力。
    *   **独立对话窗口**: 点击快捷操作后，会弹出一个独立的、轻量的聊天窗口，显示该 Agent 对划选文本的处理过程和结果。
    *   **无缝体验**: 整个过程无需离开当前工作窗口，实现了高效的即时信息处理。
    *   **分享笔记**：允许将任意圈选内容或窗口分享到笔记。
 *   **VCP 分布式服务器兼容**:
    *   内置一个与 VCP 后端兼容的分布式服务器功能。
    *   启用后，允许 VCP 后端调用并利用此客户端（前端设备）的算力来执行任务。
    *   支持 VCP 后端调用在客户端本地加载的 VCP 插件，扩展了工具执行的能力。
    *   此功能可在“全局设置”中方便地开启或关闭。
 *   **专业级音频引擎**:
    *   **原创解码核心**: 面对 Electron 环境下 `Audio Worklet` 的跨域限制和 `naudiodon` 等原生模块对现代音频设备支持不足的挑战，我们最终实现了完全原创的音频解码器。它使用独立的 Python 引擎构建，彻底突破了前端环境的束缚，达到了不输 Foobar 的专业级音频播放效果。
    *   **Hi-Res 音频支持**:
        *   **WASAPI 独占模式**: 支持通过 WASAPI 进行音频输出，确保信号无损直通，带来最纯净的听感。
        *   **DSD 硬解码**: 具备 DSD 256bit 硬解码能力，完美呈现母带级高解析度音乐的每一个细节。
    *   **高级算法实现**:
        *   **64位双精度解码**: 引擎核心采用64位双精度浮点数进行解码运算，确保了无与伦比的计算精度，从根本上杜绝了音质损失。
        *   **高品质数字重采样 (Rust-powered)**: 核心的重采样算法（包括手动升频和智能重采样）现在由一个专门构建的、基于 `f64` 双精度浮点数运算的 **Rust** 模块来执行。这确保了在进行 96kHz/192kHz 升频或 WASAPI 模式下的智能适配时，都能获得最高的计算精度和执行效率，从根本上提升了音质。
    *   **安装提示**: 为确保音频引擎正常工作，请在启动前务必安装所需的 Python 依赖。在项目根目录下运行命令：`pip install -r requirements.txt`。
 *   **音乐播放器与控制**:
    *   内置一个功能完善的音乐播放器，支持播放本地音乐文件，支持WASPI光纤同轴输出。
    *   提供播放、暂停、上一曲、下一曲、音量控制等基本功能。
    *   **智能歌词引擎**:
        *   **多源歌词，无缝体验**: 自动加载本地歌词文件，当本地无歌词时，会立刻从云端歌词库进行智能匹配并下载，确保每首歌都有精准的歌词陪伴。
        *   **AI 歌词创作**: 业界首创！当一首歌完全没有歌词时，可以召唤 Agent 来“听歌识曲”。AI 会实时聆听正在播放的音乐，并即时生成带时间轴的 `.lrc` 歌词文件，精度媲美卡拉OK，甚至能为纯音乐创作意境歌词。
    *   **IIR级联滤波EQ**: 引入原创数字算法，通过高精度浮点运算和Zi状态参数管理，实现了一个精准且稳定的IIR级联滤波均衡器。
    *   **Agent 音乐控制**: 允许 AI Agent 通过 VCP 服务器调用客户端的音乐控制功能，实现 AI 驱动的音乐播放和管理。此功能可在“全局设置”中开启或关闭。
    *   **音乐互动**: Agent 不仅能控制播放，还能“听懂”音乐内容（现在音乐播放器播放的音乐会实时的被agent听到），或通过歌词文件进行翻唱，与用户进行卡拉OK互动。在聊天过程中，Agent还会主动为你点歌活跃氛围。
 *   **文件系统集成**:
    *   **文件管理器**: Agent 能够读取本地任意路径下或者URL下的文件，包括纯文本、富文本文档（如 PDF、Office 文件）、扫描件以及常见多媒体文件（图片、音频、视频等），并在用户设定的信任目录下拥有完整的读写权限，支持批量创建、编辑和调试文件。
    *   **多媒体操作**:
            *   Agent 能够对多媒体文件进行处理，例如从视频里提取图片、提取音频，以及对音频进行切割分段。
    *   **全局文件搜索**: 集成强大的全局快速搜索功能（基于 EverythingAPI魔改），允许 Agent 在整个电脑范围内查找文件，允许检索图片，音频内部多媒体内容。
 *   **深度回忆功能**:
    *   允许 Agent 根据关键词和请求的上下文窗口大小，检索其过去所有完整聊天历史记录，实现精准、深入的长期记忆回顾。
    *   **回忆流程可视化**: 新增了一个极其精细的UI界面，可以实时、动态地展示AI进行深度回忆的全过程。用户可以清晰地看到AI是如何根据当前对话触发回忆、检索了哪些具体的记忆片段、如何通过语义网络（捕网）和时间轴（时间召回）进行寻道，以及Tag系统在其中扮演的角色。整个过程如同科幻电影中的数据流图谱，将AI复杂的内部思考过程直观地呈现在用户面前。
 *   **强大的主题系统**:
    *   **主题选择器**: 主界面新增主题选择器，可以实时预览 VChat 的多主题渲染效果和布局动画，方便用户进行个性化选择和配置。
    *   **主题生成器**: 用户可通过自然语言与专门的“主题管理 Agent”对话，直接生成 VChat 主题。支持用户上传壁纸或素材，由 Agent 辅助创建包含复杂 UI 和动画的自定义主题文件。
 *   **超级浏览器控制 (需要 VCP 浏览器遥控器插件)**: 这并非简单的远程控制，而是一项革命性的技术。该引擎能将**任意**浏览器标签页实时“翻译”成一个动态的、可交互的 Markdown 文档，并建立了一种 Agent 与用户协同浏览的全新交互模式，让 AI 真正成为您的智能上网伴侣。
     *   **实时感知与理解**: 具备智能刷新机制，能实时将页面上的可交互元素、图片、视频、脚本等内容以自然语言形式同步给 Agent，让 AI 能“看懂”和“理解”网页。
     *   **网页截图**: 允许AI获取网页截图，用于视觉分析或存档。
     *   **Base64数据抓取**: 允许AI抓取网页多媒体的Base64数据进行阅览。
     *   **反向精确操控**: AI 只需使用简单的 Markdown 语法，如 `![搜索:XXX]` 或 `[点击按钮: 登录]`，即可精确操控页面上的任意元素。
*   **高级流媒体编辑器插件 (Advanced Streaming Media Editor Plugin)**:
    *   这是一个专门为 AI 设计的强大插件，旨在提供全面的流媒体内容交互和编辑能力，极大地增强了 AI 处理视觉和听觉信息的能力。
    *   **核心功能**:
        *   **任意窗口高精度截图**: 允许 AI 捕捉屏幕上任何可见窗口的精确图像。
        *   **基础图像内容编辑**: 在捕获的图片上进行高级编辑，包括添加文本标注、插入自定义形状、高亮特定区域等。
        *   **专业级滤镜与色彩调整**: 允许 Agent 为图片和视频添加各种专业滤镜效果，精确调整色温、对比度、饱和度、亮度、曝光度等参数，实现电影级的视觉效果处理。
        *   **革命性语义化图像编辑引擎**: 集成了极其强大的 AI 驱动图像语义编辑能力，突破传统像素级编辑的局限：
            *   **风格转换大师**: 将真实图片智能转化为手办风格、油画风格、水彩风格、动漫风格等多种艺术表现形式。
            *   **智能元素提取与合成**: 精准识别并提取多张图片中的不同元素（如 A 图的背景、B 图的人物、C 图的物体），智能合成为一张全新的、逻辑合理的图片。
            *   **3D 打印图纸生成**: 将 2D 图片智能转换为可用于 3D 打印的技术图纸和模型文件，支持多种 3D 打印格式输出。
            *   **三维空间元素操控**: 对图片内部的元素进行 3D 化处理，支持任意角度的旋转、缩放、位移，甚至可以调整元素在画面中的前后层次关系。
            *   **智能场景重构**: 基于语义理解，重新排列图片中的元素布局，改变物体位置、调整光影关系，创造全新的视觉构图。
            *   **深度学习驱动的内容感知编辑**: 利用先进的 AI 算法，实现内容感知的智能修复、对象移除、背景替换等高级编辑功能。
        *   **音视频文件提取**: 从视频文件中智能提取独立的音频流。
        *   **音视频剪辑与拼接**: 对音频和视频文件进行精确的剪辑、分割、合并等操作。
        *   **视频帧级内容修改**: 在视频的特定帧上叠加文字、绘制图形（如圈出关键目标）、添加箭头指示等，实现细致入微的视频内容修改。
        *   **视频帧截屏**: 从视频流中精确截取单帧图像，并保存为图片文件。
        *   **增强 AI 交互**: 这些功能共同使得 AI 能够更深入地理解、分析和创造流媒体内容，从而实现更高级别的多模态交互。
*   **VchatCLI：内置全功能终端**:
    *   **前端原生集成**: 与后端的 VCPPowerShell 不同，VChat 前端集成了一个功能完整的 VchatCLI 插件。它拥有独立的终端界面，UI 与 VChat 整体风格无缝统一，提供了远超外部终端的便捷性和一致性体验。
    *   **多协议语法兼容**: VchatCLI 不仅支持 VCP 协议的内部专用语法，还完全兼容标准的 PowerShell 和 WSL 语法。这使得 AI 和用户可以在同一个终端内无缝切换，执行从简单的文件操作到复杂的系统级脚本。
    *   **安全的管理员提权**: 内置一键式“管理员指令授权”按钮。当 AI 需要执行高权限操作时，会向用户请求授权，用户只需点击即可安全地授予临时管理员权限，既赋予了 AI 强大的能力，又保证了系统的最终控制权在用户手中。
    *   **解决 AI 交互核心痛点**: 传统的 AI 命令行工具调用是“一次性”的，无法维持状态。VchatCLI 的独立内置界面从根本上解决了 AI 连续执行多条指令时的上下文丢失问题。AI 可以在一个持久化的会话中执行一系列相互关联的命令，实现复杂的、需要上下文记忆的自动化任务流。
*   **Vchat超级骰子插件**:
    *   **真实3d物理骰子**: 允许用户或者Agent丢出任意骰子组合，支持"d4","d6","d8","d10","d12","d20","d100"。
    *   **骰子主题**: 允许用户或者Agent定义自己的骰子的材质包和主题色，目前预置十多种骰子主题。
    *   **同步返回结果**: Agent 可以真实观看自己丢出的骰子的结果和主题效果。
    *   **物理魔法**: 允许Agent对骰子进行“物理施法”，例如打滑骰子，黏着骰子，磁铁骰子等等3D附加物理效果。
*   **V日报插件**: 这不仅是一个新闻聚合器，更是一个全自动的AI新闻编辑部。它将每日全球资讯转化为一份精美的、可交互的个性化日报，直接送达您的聊天窗口。
    *   **工作流程**:
        1.  **全球信息扫描**: 首先，Agent会启动一个强大的信息雷达，扫描全球超过100个主流门户网站，从科技、财经到文化、生活等20个不同领域捕获最新的新闻热点，形成一个包含超过2000条新闻线索的庞大初始信息池。
        2.  **AI编辑筛选与深度挖掘**: 接着，Agent会像一位资深编辑，根据预设或用户的兴趣，从信息池中筛选出最具价值的议题。然后，它会启动VChat内置的“超级爬虫”，对选定的新闻进行深度内容抓取，获取全文、关键图片和相关数据。
        3.  **期刊级排版与生成**: 最后，Agent会将处理好的素材进行智能排版，自动划分版块、配置图片、撰写摘要，最终生成一份媲美专业网页期刊的、高度动态化的DIV气泡。
    *   **用户体验**: 您收到的不是一堆链接，而是一份结构完整、图文并茂的动态报纸。您可以在其中自由滚动、点击交互，享受沉浸式的新闻阅读体验，仿佛拥有一个专属的AI团队为您每日打造私人资讯简报。

*   **塔罗占卜插件 (Tarot Divination Plugin)**:
    *   **作用**: 提供一个极致复杂的、基于“世界状态”的塔罗牌占卜功能。它并非一个随机抽牌工具，而是一个能真正模拟“天时、地利、人和”的综合性占卜引擎。该插件不使用任何随机函数，所有占卜结果都是基于海量现实世界变量精密计算得出的确定性结论。
    *   **核心能力**:
        *   **天时 (Cosmic Timing)**:
            *   **实时天文数据**: 每次占卜前，都会读取由 `Celestial.py` 生成的天体数据库，获取太阳系内完整的行星位置、倾角与轨道数据。
            *   **天相呈现**: 结果会以神秘学语言描述当前天相，如“水星：升于黄道之上...”。
            *   **行星亲和力与动态权重**: 特定的塔罗牌（如“恋人”与金星）被赋予行星守护。当守护行星在天文学上位置“凸显”时，对应卡牌的能量（抽中概率）会增强。
            *   **宇宙不稳定指数**: 根据所有行星偏离黄道平面的程度计算“天体不稳定指数”，该指数越高，卡牌出现逆位的概率也随之增加。
        *   **地利 (Geographical & Environmental Factors)**:
            *   **地球物理数据**: 综合考量占卜发生地的**天气**（晴雨、温湿度）、**气候**、**海拔**、**月相**（阴晴圆缺）乃至**中国农历**（节气、节日）等多种地理与环境因素。
            *   **环境影响权重**: 这些变量会共同影响卡牌的出现权重与正逆位概率。例如，在阳光明媚的节日里，“太阳”牌更容易出现；而在风雨交加的深夜，“高塔”的概率则会提升。
        *   **人和 (User State)**:
            *   **用户状态感知**: 插件能够接入并考量用户的个人状态，例如**日程安排**等信息，将占卜与个体紧密联系。
        *   **宿命论计算核心**:
            *   **确定性结果**: 所有的随机性都被排除。占卜的最终结果（包括抽牌顺序和正逆位）源于一个由上述所有“天时、地利、人和”变量共同生成的、在特定时空下独一无二的“命运种子”，确保了每一次占卜都是对当前世界状态的精确反映。
            *   **结果透明化**: 占卜结果会清晰地展示所有影响此次牌局的关键变量，以及每张牌最终的“逆位倾向”百分比，让用户能直观地感受到“天时地利人和”是如何共同作用于牌面的。
        *   **科学计算接口**: 同时，该插件也允许 Agent 调用其脚本和数据库来计算真正的天文数据，用于科学生产和天文观测。

*   **闪电深度研究插件 (Flash DeepSearch)**:
    *   **描述**: 将Agent或你提出的研究想法，在2分钟内变为一篇引经据典的学术级论文。
    *   **工作原理**: 这不是简单的搜索+总结。当Agent发出研究指令后，将瞬间激活一个由VCP模型驱动的“AI研究员军团”：
        *   **全球信息猎手**: 多领域论文研究专家Agent，基于AI提出的课题进行多领域交叉分析，动态生成研究计划。
        *   **全球信息猎手**: 多个并发的AI探针，闪电般扫描Google、Google学术以及指定网页，精准捕获最相关、最权威的信息。
        *   **知识蒸馏核心**: VCP内部的多个高级分析模型协同工作，对海量原始数据进行交叉验证、深度分析、提炼核心论点并构建逻辑框架。
        *   **学术写作大师**: 最终，多领域论文研究专家Agent会将所有分析结果和证据，组织成一篇结构严谨、格式规范、引证详实的Markdown学术论文。
    *   **核心优势**: Agent只需提出“研究什么”和“研究多深”，剩下的繁重工作全部交给VCP-AI。从信息搜集到最终成文，全程自动化，为你节省数小时甚至数天的时间。

*   **米家生态联动 (Mijia Smart Home Integration)**:
    *   **描述**: 将您的 AI Agent 变成真正的智能家居管家。通过 VCP 后端强大的插件生态，VChat 实现了与米家（Mijia）智能家居平台的深度集成，让您能用最自然的方式与物理世界互动。
    *   **核心能力**:
        *   **自然语言万能遥控**: 无需打开米家 App，直接通过对话向 Agent 下达指令，如“把客厅的灯调成暖白色”、“让扫地机器人开始清扫”、“空调调到 26 度”。Agent 能够理解并精确执行这些复杂指令。
        *   **全屋状态感知**: Agent 能实时获取并理解所有米家设备的状态。您可以随时提问“卧室的空气净化器滤芯还剩多少？”或“昨晚的用电量是多少？”，Agent 会为您提供准确的答案。
        *   **AI 驱动的自动化场景**: Agent 不再只是被动执行命令。它可以成为您生活的智能编排者。例如，当 Agent 通过插件“看”到您正在播放电影时，它可以主动执行“关闭主灯、调暗氛围灯、拉上窗帘”的“影院模式”场景。
        *   **主动服务与提醒**: 基于对设备状态的持续监控，Agent 能够提供前瞻性的贴心服务。例如，它会在检测到空气质量下降时自动开启净化器，在洗衣机洗完衣服后提醒您及时晾晒，在发现冰箱门未关严时发出警报，从穿戴式设备获取您的健康运动信息，或在各种设备耗材即将用尽时提醒您更换。
*   **语音聊天 (Voice Chat)**:
    *   **实时语音输入**: 新增独立的语音聊天窗口，允许用户通过麦克风与 AI 进行实时语音对话。
    *   **“神秘方法”实现**: 由于 Electron 环境的限制，我们采用了一种创新的“野路子”方案。通过在后台启动一个由 Puppeteer 控制的、拥有完整浏览器权限的“隐形”浏览器实例来处理语音识别，再将识别结果通过内部通信桥接回 Electron 窗口，完美解决了原生 API 无法在Electron中被调用的问题。
    *   **自动发送**: 实现了语音流检测，当用户说完话停顿片刻后，识别到的文本会自动发送，提供了流畅的对话体验。
*   **语音朗读 (TTS)**:
    *   **集成 [GPT-SoVITS](https://github.com/AI-Hobbyist/GPT-SoVITS-Inference)**: 客户端深度集成了强大的 GPT-SoVITS 推理 API，允许将 AI Agent 的回复实时转换为高质量的语音。
    *   **个性化语音配置**: 允许为每一个 Agent 单独配置所使用的语音模型和语速，让不同的 AI 拥有独特的“声音”。
    *   **即时朗读**: 在任意 AI 消息气泡上通过右键菜单选择“朗读气泡”，即可触发语音播放。
    *   **智能队列与缓存**:
        *   长文本会自动按句子切分，并采用“预合成”技术（播放当前句时，后台已开始合成下一句），确保了长篇回复的流畅播放，极大减少了停顿感。
        *   已合成的音频会被自动缓存，重复朗读同一内容时可实现“秒播”，无需再次请求 API。
    *   **交互式控制**: 朗读期间，AI 的头像会呈现呼吸灯特效。用户可随时点击发光的头像来立即终止当前的朗读队列。
    *   **下载与使用**：[引擎下载链接](https://modelscope.cn/models/aihobbyist/GPT-SoVITS-Inference/files)，20-40的N卡下载124版本，50的N卡下载128版本。使用`gsvi.bat`启动引擎。
    *   **下载模型**：[下载模型](https://www.modelscope.cn/models/aihobbyist/GPT-SoVITS_Model_Collection/files) ,将模型下载到`/models/v2proplus`文件夹。
    *   **优化输出接口**：Vchat使用自创的流式剪枝算法以提高流式输出中tts渲染的延迟降低卡顿(该算法会将音频合成速度提升600%，实现语音输入和输出延迟都降低至毫秒级)，因此需要Sovits输出引擎兼容。请用Vchat仓库源码中提供的魔改版文件来替换原始项目的核心渲染程序代码。将VCPChat源码目录中的sovitstest/GSVI.py替换Sovits目录中的gsvi_server/GSVI.py；将sovitstest/my_infer.py替换Sovits目录中的tools/my_infer.py。
    *   **业界首创的双语混合朗读引擎**:
        *   VChat 实现了一套强大的、基于正则表达式的文本切片算法，允许实现**无缝的中日、中英等多语言混合朗读**。
        *   **如何使用**: 在 Agent 设置中，您可以分别设置“主语言模型”和“副语言模型”，并为它们指定不同的正则表达式。
        *   **应用场景**: 例如，您可以将一个中文模型设为主语言，一个日文模型设为副语言，并为副语言设置正则 `\[(.*?)\]`。这样，当 AI 说出 `你好，[[こんにちは]]，今天天气不错` 时，客户端会自动用中文模型朗读“你好，今天天气不错”，并用日文模型朗读“こんにちは”，整个过程流畅自然，真正实现了“AI教你说外语”的场景。
## 技术栈

*   **Electron**: 用于构建跨平台的桌面应用程序。
*   **Node.js**: 作为后端运行环境。
*   **HTML, CSS, JavaScript**: 构建用户界面。
*   **核心依赖库**:
    *   `fs-extra`: 用于增强的文件系统操作。
    *   `marked`: 用于 Markdown 解析和渲染。
    *   `ws`: 用于 WebSocket 通信 (VCPLog)。
    *   `pdf-parse`: 用于解析 PDF 文件内容以提取文本。
    *   `mammoth`: 用于解析 DOCX 文件内容以提取文本。
    *   `glob` & `minimatch`: 用于支持文件系统中的模式匹配（由分布式插件使用）。
    *   `node-schedule`: 用于任务调度（由分布式插件使用）。
*   **Python 音频引擎依赖**:
    *   `flask` & `flask_cors` & `flask_socketio`: 提供Web服务框架。
    *   `soundfile` & `sounddevice`: 核心音频处理与播放库。
    *   `numpy`: 用于高性能科学计算和音频数据处理。
    *   `pydub`: 用于高级音频操作。
    *   `gevent` & `gevent-websocket`: 提供异步网络支持。
*   **前端特性支持**:
    *   `highlight.js`: 用于代码块的语法高亮（通过 CDN 或本地集成）。
    *   `KaTeX`: 用于 LaTeX 数学公式的渲染（通过 CDN 或本地集成）。
    *   `Pyodide`: 用于在客户端通过 WebAssembly 执行 Python 代码（通过 CDN 加载）。
    *   `three.js`: 用于在客户端渲染和交互 3D 内容（通过 CDN 加载）。

## 示例截图

以下是一些客户端界面的示例截图：

![示例图1](assets/E1.jpg)![示例图2](assets/E2.jpg)![示例图3](assets/E3.jpg)![示例图4](assets/E4.jpg)![示例图5](assets/E6.jpg)![示例图6](assets/E5.jpg)![示例图7](assets/E7.png)
![示例图10](assets/E10.png)
![示例图11](assets/E11.jpg)

## 客户端职责

本客户端主要负责提供与 VCP-AI 进行聊天的用户界面、窗口渲染、Agent 管理、笔记管理、本地数据存储以及与 VCP 服务器和 VCPLog 服务的通信。它是一个为后端强大AI能力提供丰富交互与可视化能力的智能渲染终端，而大部分核心 AI 处理逻辑和工具执行由连接的 VCP 服务器实现。

---

## 开源协议与免责声明

### 许可协议

本作品采用 **知识共享署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)** 许可协议。

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="知识共享许可协议" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a>

这意味着您可以自由地共享和修改本作品，但必须遵守以下条款：
*   **署名 (Attribution)** — 您必须给出适当的署名，提供指向本许可协议的链接，并指出是否对原始作品进行了更改。
*   **非商业性使用 (NonCommercial)** — 您不得将本作品用于商业目的。
*   **相同方式共享 (ShareAlike)** — 如果您基于本作品进行修改、转换或二次创作，您必须以与原始作品相同的许可协议分发您的贡献。

更多信息请访问 [Creative Commons 网站](http://creativecommons.org/licenses/by-nc-sa/4.0/)。

### 免责声明

本软件按“原样”提供，不提供任何明示或暗示的保证，包括但不限于对适销性、特定用途适用性和非侵权性的保证。

在任何情况下，作者或版权持有人均不对因使用本软件或与本软件相关的其他行为所产生的任何索赔、损害或其他责任承担任何责任，无论是在合同、侵权或其他诉讼中。