SrcLog.com

tsuyu122

👤 Developer

1 repository on SrcLog

View on GitHub

1 Repos

3 Stars

0 Forks

3 Watchers

Repositories (1)

TurboQuant-Vulkan tsuyu122/TurboQuant-Vulkan C++

TurboQuant Vulkan: 3-bit KV cache quantization for llama.cpp using Lloyd-Max Gaussian codebooks. 4.57x compression, Vulkan GPU support (AMD/Intel/NVIDIA). Hobby project.

3 0