Don't do a kernel search by mangled string every time #100

eyalroz · 2024-12-17T19:11:14Z

We shouldn't have to search for the kernel in the module every run; let's just find it once and keep it in the CUDA-specific member of the execution context, explicitly. This would probably let us avoid having to keep the mangled name there.

…rnel wrappers * Not search for the mangled kernel by name with every run * Execution context now explicitly holds a `cuda::kernel_t` * Execution context no longer holds the mangled kernel name * Now printing the kernel's amount of static shared memory used, after the build

eyalroz self-assigned this Dec 17, 2024

eyalroz added the task label Dec 17, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Don't do a kernel search by mangled string every time #100

Don't do a kernel search by mangled string every time #100

eyalroz commented Dec 17, 2024

Don't do a kernel search by mangled string every time #100

Don't do a kernel search by mangled string every time #100

Comments

eyalroz commented Dec 17, 2024