vgoklani

Vishal Goklani vgoklani

Interested in Deep Learning (self-supervised learning & LLMs), Astrophysics (exoplanets), and Cosmology (CMB).... I like to build things

Pinned Loading

pytorch/pytorch pytorch/pytorch Public

Tensors and Dynamic neural networks in Python with strong GPU acceleration

Python 87.9k 23.6k
NVIDIA/TransformerEngine NVIDIA/TransformerEngine Public

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilizatio…

Python 2.3k 380
RedisTimeSeries/RedisTimeSeries RedisTimeSeries/RedisTimeSeries Public

Time Series data structure for Redis

C 1k 147
IST-DASLab/gptq IST-DASLab/gptq Public

Code for the ICLR 2023 paper "GPTQ: Accurate Post-training Quantization of Generative Pretrained Transformers".

Python 2.1k 162
fpgaminer/GPTQ-triton fpgaminer/GPTQ-triton Public

GPTQ inference Triton kernel

Jupyter Notebook 297 22
Dao-AILab/flash-attention Dao-AILab/flash-attention Public

Fast and memory-efficient exact attention

Python 16.3k 1.5k