🎉 为 Android 设计的精美本地图片和视频选择器
基于 React 的网页视频播放器
Kids Is Data Stream 一个日志采集系统
Rust 版本的 Lucene
高度优化的 LLM 推理加速引擎,适用于Llama及其变种。
BERT推理在 NVIDIA(CUDA,CUBLAS)和 Intel MKL 上的快速实现
Protocol Buffers - Google's data interchange format
TLLM_QMM 剥离了 Nvidia 的 TensorRT-LLM 中量化内核的实现,去除了对 NVInfer 的依赖,并提供了易于使用的 Pytorch 模块。我们修改了去量化和权重预处理,以与流行的量化算法(如 AWQ 和 GPTQ)对齐,并将它们与新的 FP8 量化结合在一起。
A collection of PHP utility classes