Papers We Love (PWL) 是一个围绕阅读、讨论和学习更多计算机科学学术论文而建立的社区
InfinityStar 是一个统一的时空自回归框架,用于高分辨率图像和动态视频合成
Step-Audio-EditX 是一个功能强大的基于3B 参数LLM 的音频模型,它擅长表现力强且可迭代的音频编辑,涵盖情感、说话风格和副语言信息,并具备强大的零样本文本转语音
LongCat-Audio-Codec 是一款专为语音大型语言模型设计的音频 tokenizer 和 detokenizer 解决方案
PULPino是一个开源的微型控制系统,基于一个小32位RISC-V核心,由瑞士苏黎世联邦理工学院开发
The LK kernel is an SMP-aware kernel designed for small systems ported to a variety of platforms and cpu architectures.
使用Verilog实现的SHA1/SHA224/SHA256/SHA384/SHA512计算器。
Verilog Ethernet components for FPGA implementation
适用于通用MCU和Linux系统的W25QXX(W25Q80, W25Q16, W25Q32, W25Q64, W25Q128, W25Q256, W25Q512, W25Q01, W25Q02)全功能驱动
FireRedTTS2 是面向多说话人对话生成的长篇流式语音合成系统,旨在为播客和聊天机器人提供稳定、自然的语音输出
音乐点阵频谱显示,基于STM32单片机,通过ADC实时采集音频信号并进行傅里叶变换处理,最后将频率谱显示到点阵屏上。
RIL是一款专门为嵌入式平台开发的无线通信模块(GSM/GPRS/CatM1/NB)管理框架,适用于资源受限物联网终端设备(单片机+无线蜂窝模组的方案),并提供物联网通信所需的基本功能,包含网络注册、连接管理、短信收发及Socket通信。
一款管理AT命令通信交互组件, 适用于Modem、WIFI模块、蓝牙等使用AT命令或者ASCII命令行通信的场景。
GPGPU processor supporting RISCV-V extension, developed with Chisel HDL
Chatterbox TTS 是开源 TTS 模型,基于 0.5B Llama 架构训练,不仅支持零样本语音克隆,还独创了情感夸张控制功能,能够让合成语音更生动有趣