Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

yzhaiustc

Optimizing SGEMM kernel functions on NVIDIA GPUs to a close-to-cuBLAS performance.

optimization

View on GitHub

413 Stars

52 Forks

413 Watchers

Cuda Language

gpl-3.0 License

100 SrcLog Score

Cost to Build

$63.1K

Market Value

$171.5K

How is this calculated?

Growth over time

7 data points · 2022-01-01 → 2026-04-01

Stars Forks Watchers

💬

How do you feel about this project?

Ask AI about Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

Question copied to clipboard

What is the yzhaiustc/Optimizing-SGEMM-on-NVIDIA-Turing-GPUs GitHub project? Description: "Optimizing SGEMM kernel functions on NVIDIA GPUs to a close-to-cuBLAS performance.". Written in Cuda. Explain what it does, its main use cases, key features, and who would benefit from using it.

Question is copied to clipboard — paste it after the AI opens.

How to clone Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

Clone via HTTPS

git clone https://github.com/yzhaiustc/Optimizing-SGEMM-on-NVIDIA-Turing-GPUs.git

Clone via SSH

[email protected]:yzhaiustc/Optimizing-SGEMM-on-NVIDIA-Turing-GPUs.git

Download ZIP

Download master.zip

Found an issue?

Report bugs or request features on the Optimizing-SGEMM-on-NVIDIA-Turing-GPUs issue tracker:

Open GitHub Issues

Similar to Optimizing-SGEMM-on-NVIDIA-Turing-GPUs

prepack svgo closure-compiler llvm clean-css simplify imagemin game-programming-patterns webpackmonitor reactopt BayesianOptimization nnvm MTuner webdnn easyengine gosl soot scikit-optimize DietPi faster incubator-kie-optaplanner search-engine-optimization react-ssr-optimization opticss wheels owl meshoptimizer MLBox JuMP.jl eaopt