[Kernel] Use call_jax to simplify the gmm pallas kernel wrapper #9180

yaochengji · 2025-05-16T00:21:29Z

No description provided.

yaochengji · 2025-05-16T00:23:27Z

The background is there's a PR vllm-project/vllm#18025 trying to enable torch_xla gmm kernel but encountered correctness issue.

Simplifying the wrapper to use call_jax can fix it.

yaochengji · 2025-05-16T00:25:54Z

also cc @bythew3i for visibility, seems I cannot add you as a reviewer.

torch_xla/core/xla_builder.py

torch_xla/experimental/custom_kernel.py

torch_xla/core/xla_builder.py

test/test_gmm.py

vanbasten23

Thanks Chengji. LGTM with one comment.

bhavya01 requested a review from miladm May 16, 2025 00:23

yaochengji requested review from tengyifei, qihqi, lsy323 and vanbasten23 May 16, 2025 00:23

vanbasten23 reviewed May 16, 2025

View reviewed changes

torch_xla/core/xla_builder.py Show resolved Hide resolved

vanbasten23 reviewed May 16, 2025

View reviewed changes

torch_xla/experimental/custom_kernel.py Outdated Show resolved Hide resolved

vanbasten23 reviewed May 16, 2025

View reviewed changes

torch_xla/core/xla_builder.py Show resolved Hide resolved

[Kernel] Use call_jax to simplify the gmm pallas kernel wrapper

27a4c0a

yaochengji force-pushed the chengji/gmm-use-call_jax branch from b796514 to 27a4c0a Compare May 16, 2025 02:19

Merge branch 'master' into chengji/gmm-use-call_jax

2d07b53

vanbasten23 reviewed May 16, 2025

View reviewed changes

test/test_gmm.py Show resolved Hide resolved

vanbasten23 approved these changes May 16, 2025

View reviewed changes

yaochengji merged commit f39434a into master May 16, 2025
27 of 29 checks passed

Provide feedback