DeepSeek-V3 是一个强大的 Mixture-of-Experts (MoE) 语言模型,它拥有671B个总参数,每个 token 有37B个激活参数
最近更新: 4天前Garnet 是微软开源的远程缓存存储系统,据称拥有强大的性能(高吞吐量和低延迟)、可扩展性、存储、恢复、集群分片、密钥迁移和复制功能,并支持接入现有的 Redis 客户端
最近更新: 4天前混元文生图大模型(下称:混元DiT,Scalable Diffusion Models with Transformers)由腾讯开源,包含模型权重、推理代码、模型算法等完整模型,
最近更新: 4天前Gödel Scheduler 是一个能统一调度在线和离线业务的分布式调度器,能在满足在离线业务功能和性能需求的前提下,提供良好的扩展性和调度质量
最近更新: 4天前