diff --git a/previews/PR551/.documenter-siteinfo.json b/previews/PR551/.documenter-siteinfo.json
index 301aa192..71d3ffc2 100644
--- a/previews/PR551/.documenter-siteinfo.json
+++ b/previews/PR551/.documenter-siteinfo.json
@@ -1 +1 @@
-{"documenter":{"julia_version":"1.11.2","generation_timestamp":"2025-01-08T12:43:39","documenter_version":"1.8.0"}}
\ No newline at end of file
+{"documenter":{"julia_version":"1.11.2","generation_timestamp":"2025-01-09T12:16:49","documenter_version":"1.8.0"}}
\ No newline at end of file
diff --git a/previews/PR551/api/index.html b/previews/PR551/api/index.html
index f1e86892..d131095c 100644
--- a/previews/PR551/api/index.html
+++ b/previews/PR551/api/index.html
@@ -7,16 +7,16 @@
 A = ones(1024)
 B = rand(1024)
 vecadd(CPU(), 64)(A, B, ndrange=size(A))
-synchronize(backend)</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL18-L51">source</a></section><section><div><pre><code class="language-julia hljs">@kernel config function f(args) end</code></pre><p>This allows for two different configurations:</p><ol><li><code>cpu={true, false}</code>: Disables code-generation of the CPU function. This relaxes semantics such that KernelAbstractions primitives can be used in non-kernel functions.</li><li><code>inbounds={false, true}</code>: Enables a forced <code>@inbounds</code> macro around the function definition in the case the user is using too many <code>@inbounds</code> already in their kernel. Note that this can lead to incorrect results, crashes, etc and is fundamentally unsafe. Be careful!</li></ol><ul><li><a href="#KernelAbstractions.@context"><code>@context</code></a></li></ul><div class="admonition is-category-warn"><header class="admonition-header">Warn</header><div class="admonition-body"><p>This is an experimental feature.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL56-L68">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@Const" href="#KernelAbstractions.@Const"><code>KernelAbstractions.@Const</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@Const(A)</code></pre><p><code>@Const</code> is an argument annotiation that asserts that the memory reference by <code>A</code> is both not written to as part of the kernel and that it does not alias any other memory in the kernel.</p><div class="admonition is-danger"><header class="admonition-header">Danger</header><div class="admonition-body"><p>Violating those constraints will lead to arbitrary behaviour.</p><p>As an example given a kernel signature <code>kernel(A, @Const(B))</code>, you are not allowed to call the kernel with <code>kernel(A, A)</code> or <code>kernel(A, view(A, :))</code>.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL95-L107">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@index" href="#KernelAbstractions.@index"><code>KernelAbstractions.@index</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@index</code></pre><p>The <code>@index</code> macro can be used to give you the index of a workitem within a kernel function. It supports both the production of a linear index or a cartesian index. A cartesian index is a general N-dimensional index that is derived from the iteration space.</p><p><strong>Index granularity</strong></p><ul><li><code>Global</code>: Used to access global memory.</li><li><code>Group</code>: The index of the <code>workgroup</code>.</li><li><code>Local</code>: The within <code>workgroup</code> index.</li></ul><p><strong>Index kind</strong></p><ul><li><code>Linear</code>: Produces an <code>Int64</code> that can be used to linearly index into memory.</li><li><code>Cartesian</code>: Produces a <code>CartesianIndex{N}</code> that can be used to index into memory.</li><li><code>NTuple</code>: Produces a <code>NTuple{N}</code> that can be used to index into memory.</li></ul><p>If the index kind is not provided it defaults to <code>Linear</code>, this is subject to change.</p><p><strong>Examples</strong></p><pre><code class="language-julia hljs">@index(Global, Linear)
+synchronize(backend)</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL18-L51">source</a></section><section><div><pre><code class="language-julia hljs">@kernel config function f(args) end</code></pre><p>This allows for two different configurations:</p><ol><li><code>cpu={true, false}</code>: Disables code-generation of the CPU function. This relaxes semantics such that KernelAbstractions primitives can be used in non-kernel functions.</li><li><code>inbounds={false, true}</code>: Enables a forced <code>@inbounds</code> macro around the function definition in the case the user is using too many <code>@inbounds</code> already in their kernel. Note that this can lead to incorrect results, crashes, etc and is fundamentally unsafe. Be careful!</li></ol><ul><li><a href="#KernelAbstractions.@context"><code>@context</code></a></li></ul><div class="admonition is-category-warn"><header class="admonition-header">Warn</header><div class="admonition-body"><p>This is an experimental feature.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL56-L68">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@Const" href="#KernelAbstractions.@Const"><code>KernelAbstractions.@Const</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@Const(A)</code></pre><p><code>@Const</code> is an argument annotiation that asserts that the memory reference by <code>A</code> is both not written to as part of the kernel and that it does not alias any other memory in the kernel.</p><div class="admonition is-danger"><header class="admonition-header">Danger</header><div class="admonition-body"><p>Violating those constraints will lead to arbitrary behaviour.</p><p>As an example given a kernel signature <code>kernel(A, @Const(B))</code>, you are not allowed to call the kernel with <code>kernel(A, A)</code> or <code>kernel(A, view(A, :))</code>.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL95-L107">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@index" href="#KernelAbstractions.@index"><code>KernelAbstractions.@index</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@index</code></pre><p>The <code>@index</code> macro can be used to give you the index of a workitem within a kernel function. It supports both the production of a linear index or a cartesian index. A cartesian index is a general N-dimensional index that is derived from the iteration space.</p><p><strong>Index granularity</strong></p><ul><li><code>Global</code>: Used to access global memory.</li><li><code>Group</code>: The index of the <code>workgroup</code>.</li><li><code>Local</code>: The within <code>workgroup</code> index.</li></ul><p><strong>Index kind</strong></p><ul><li><code>Linear</code>: Produces an <code>Int64</code> that can be used to linearly index into memory.</li><li><code>Cartesian</code>: Produces a <code>CartesianIndex{N}</code> that can be used to index into memory.</li><li><code>NTuple</code>: Produces a <code>NTuple{N}</code> that can be used to index into memory.</li></ul><p>If the index kind is not provided it defaults to <code>Linear</code>, this is subject to change.</p><p><strong>Examples</strong></p><pre><code class="language-julia hljs">@index(Global, Linear)
 @index(Global, Cartesian)
 @index(Local, Cartesian)
 @index(Group, Linear)
 @index(Local, NTuple)
-@index(Global)</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL336-L367">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@localmem" href="#KernelAbstractions.@localmem"><code>KernelAbstractions.@localmem</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@localmem T dims</code></pre><p>Declare storage that is local to a workgroup.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL186-L190">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@private" href="#KernelAbstractions.@private"><code>KernelAbstractions.@private</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@private T dims</code></pre><p>Declare storage that is local to each item in the workgroup. This can be safely used across <a href="#KernelAbstractions.@synchronize"><code>@synchronize</code></a> statements. On a CPU, this will allocate additional implicit dimensions to ensure correct localization.</p><p>For storage that only persists between <code>@synchronize</code> statements, an <code>MArray</code> can be used instead.</p><p>See also <a href="#KernelAbstractions.@uniform"><code>@uniform</code></a>.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL200-L211">source</a></section><section><div><pre><code class="language-julia hljs">@private mem = 1</code></pre><p>Creates a private local of <code>mem</code> per item in the workgroup. This can be safely used across <a href="#KernelAbstractions.@synchronize"><code>@synchronize</code></a> statements.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL221-L226">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@synchronize" href="#KernelAbstractions.@synchronize"><code>KernelAbstractions.@synchronize</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@synchronize()</code></pre><p>After a <code>@synchronize</code> statement all read and writes to global and local memory from each thread in the workgroup are visible in from all other threads in the workgroup.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL241-L247">source</a></section><section><div><pre><code class="language-julia hljs">@synchronize(cond)</code></pre><p>After a <code>@synchronize</code> statement all read and writes to global and local memory from each thread in the workgroup are visible in from all other threads in the workgroup. <code>cond</code> is not allowed to have any visible sideffects.</p><p><strong>Platform differences</strong></p><ul><li><code>GPU</code>: This synchronization will only occur if the <code>cond</code> evaluates.</li><li><code>CPU</code>: This synchronization will always occur.</li></ul></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL254-L264">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@print" href="#KernelAbstractions.@print"><code>KernelAbstractions.@print</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@print(items...)</code></pre><p>This is a unified print statement.</p><p><strong>Platform differences</strong></p><ul><li><code>GPU</code>: This will reorganize the items to print via <code>@cuprintf</code></li><li><code>CPU</code>: This will call <code>print(items...)</code></li></ul></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL294-L302">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@uniform" href="#KernelAbstractions.@uniform"><code>KernelAbstractions.@uniform</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@uniform expr</code></pre><p><code>expr</code> is evaluated outside the workitem scope. This is useful for variable declarations that span workitems, or are reused across <code>@synchronize</code> statements.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL231-L236">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@groupsize" href="#KernelAbstractions.@groupsize"><code>KernelAbstractions.@groupsize</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@groupsize()</code></pre><p>Query the workgroupsize on the backend. This function returns a tuple corresponding to kernel configuration. In order to get the total size you can use <code>prod(@groupsize())</code>.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL161-L167">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@ndrange" href="#KernelAbstractions.@ndrange"><code>KernelAbstractions.@ndrange</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@ndrange()</code></pre><p>Query the ndrange on the backend. This function returns a tuple corresponding to kernel configuration.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL174-L179">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.synchronize" href="#KernelAbstractions.synchronize"><code>KernelAbstractions.synchronize</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">synchronize(::Backend)</code></pre><p>Synchronize the current backend.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement this function.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL120-L127">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.allocate" href="#KernelAbstractions.allocate"><code>KernelAbstractions.allocate</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">allocate(::Backend, Type, dims...)::AbstractArray</code></pre><p>Allocate a storage array appropriate for the computational backend.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement <code>allocate(::NewBackend, T, dims::Tuple)</code></p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL474-L481">source</a></section></article><h2 id="Host-language"><a class="docs-heading-anchor" href="#Host-language">Host language</a><a id="Host-language-1"></a><a class="docs-heading-anchor-permalink" href="#Host-language" title="Permalink"></a></h2><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.zeros" href="#KernelAbstractions.zeros"><code>KernelAbstractions.zeros</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">zeros(::Backend, Type, dims...)::AbstractArray</code></pre><p>Allocate a storage array appropriate for the computational backend filled with zeros.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL485-L489">source</a></section></article><h2 id="Internal"><a class="docs-heading-anchor" href="#Internal">Internal</a><a id="Internal-1"></a><a class="docs-heading-anchor-permalink" href="#Internal" title="Permalink"></a></h2><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.Kernel" href="#KernelAbstractions.Kernel"><code>KernelAbstractions.Kernel</code></a> — <span class="docstring-category">Type</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">Kernel{Backend, WorkgroupSize, NDRange, Func}</code></pre><p>Kernel closure struct that is used to represent the backend kernel on the host. <code>WorkgroupSize</code> is the number of workitems in a workgroup.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement:</p><pre><code class="nohighlight hljs">(kernel::Kernel{&lt;:NewBackend})(args...; ndrange=nothing, workgroupsize=nothing)</code></pre><p>As well as the on-device functionality.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL573-L586">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.partition" href="#KernelAbstractions.partition"><code>KernelAbstractions.partition</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><p>Partition a kernel for the given ndrange and workgroupsize.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL600-L602">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@context" href="#KernelAbstractions.@context"><code>KernelAbstractions.@context</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@context()</code></pre><p>Access the hidden context object used by KernelAbstractions.</p><div class="admonition is-category-warn"><header class="admonition-header">Warn</header><div class="admonition-body"><p>Only valid to be used from a kernel with <code>cpu=false</code>.</p></div></div><pre><code class="nohighlight hljs">function f(@context, a)
+@index(Global)</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL336-L367">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@localmem" href="#KernelAbstractions.@localmem"><code>KernelAbstractions.@localmem</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@localmem T dims</code></pre><p>Declare storage that is local to a workgroup.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL186-L190">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@private" href="#KernelAbstractions.@private"><code>KernelAbstractions.@private</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@private T dims</code></pre><p>Declare storage that is local to each item in the workgroup. This can be safely used across <a href="#KernelAbstractions.@synchronize"><code>@synchronize</code></a> statements. On a CPU, this will allocate additional implicit dimensions to ensure correct localization.</p><p>For storage that only persists between <code>@synchronize</code> statements, an <code>MArray</code> can be used instead.</p><p>See also <a href="#KernelAbstractions.@uniform"><code>@uniform</code></a>.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL200-L211">source</a></section><section><div><pre><code class="language-julia hljs">@private mem = 1</code></pre><p>Creates a private local of <code>mem</code> per item in the workgroup. This can be safely used across <a href="#KernelAbstractions.@synchronize"><code>@synchronize</code></a> statements.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL221-L226">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@synchronize" href="#KernelAbstractions.@synchronize"><code>KernelAbstractions.@synchronize</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@synchronize()</code></pre><p>After a <code>@synchronize</code> statement all read and writes to global and local memory from each thread in the workgroup are visible in from all other threads in the workgroup.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL241-L247">source</a></section><section><div><pre><code class="language-julia hljs">@synchronize(cond)</code></pre><p>After a <code>@synchronize</code> statement all read and writes to global and local memory from each thread in the workgroup are visible in from all other threads in the workgroup. <code>cond</code> is not allowed to have any visible sideffects.</p><p><strong>Platform differences</strong></p><ul><li><code>GPU</code>: This synchronization will only occur if the <code>cond</code> evaluates.</li><li><code>CPU</code>: This synchronization will always occur.</li></ul></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL254-L264">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@print" href="#KernelAbstractions.@print"><code>KernelAbstractions.@print</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@print(items...)</code></pre><p>This is a unified print statement.</p><p><strong>Platform differences</strong></p><ul><li><code>GPU</code>: This will reorganize the items to print via <code>@cuprintf</code></li><li><code>CPU</code>: This will call <code>print(items...)</code></li></ul></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL294-L302">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@uniform" href="#KernelAbstractions.@uniform"><code>KernelAbstractions.@uniform</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@uniform expr</code></pre><p><code>expr</code> is evaluated outside the workitem scope. This is useful for variable declarations that span workitems, or are reused across <code>@synchronize</code> statements.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL231-L236">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@groupsize" href="#KernelAbstractions.@groupsize"><code>KernelAbstractions.@groupsize</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@groupsize()</code></pre><p>Query the workgroupsize on the backend. This function returns a tuple corresponding to kernel configuration. In order to get the total size you can use <code>prod(@groupsize())</code>.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL161-L167">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@ndrange" href="#KernelAbstractions.@ndrange"><code>KernelAbstractions.@ndrange</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@ndrange()</code></pre><p>Query the ndrange on the backend. This function returns a tuple corresponding to kernel configuration.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL174-L179">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.synchronize" href="#KernelAbstractions.synchronize"><code>KernelAbstractions.synchronize</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">synchronize(::Backend)</code></pre><p>Synchronize the current backend.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement this function.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL120-L127">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.allocate" href="#KernelAbstractions.allocate"><code>KernelAbstractions.allocate</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">allocate(::Backend, Type, dims...)::AbstractArray</code></pre><p>Allocate a storage array appropriate for the computational backend.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement <code>allocate(::NewBackend, T, dims::Tuple)</code></p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL474-L481">source</a></section></article><h2 id="Host-language"><a class="docs-heading-anchor" href="#Host-language">Host language</a><a id="Host-language-1"></a><a class="docs-heading-anchor-permalink" href="#Host-language" title="Permalink"></a></h2><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.zeros" href="#KernelAbstractions.zeros"><code>KernelAbstractions.zeros</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">zeros(::Backend, Type, dims...)::AbstractArray</code></pre><p>Allocate a storage array appropriate for the computational backend filled with zeros.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL485-L489">source</a></section></article><h2 id="Internal"><a class="docs-heading-anchor" href="#Internal">Internal</a><a id="Internal-1"></a><a class="docs-heading-anchor-permalink" href="#Internal" title="Permalink"></a></h2><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.Kernel" href="#KernelAbstractions.Kernel"><code>KernelAbstractions.Kernel</code></a> — <span class="docstring-category">Type</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">Kernel{Backend, WorkgroupSize, NDRange, Func}</code></pre><p>Kernel closure struct that is used to represent the backend kernel on the host. <code>WorkgroupSize</code> is the number of workitems in a workgroup.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>Backend implementations <strong>must</strong> implement:</p><pre><code class="nohighlight hljs">(kernel::Kernel{&lt;:NewBackend})(args...; ndrange=nothing, workgroupsize=nothing)</code></pre><p>As well as the on-device functionality.</p></div></div></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL573-L586">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.partition" href="#KernelAbstractions.partition"><code>KernelAbstractions.partition</code></a> — <span class="docstring-category">Function</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><p>Partition a kernel for the given ndrange and workgroupsize.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL600-L602">source</a></section></article><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.@context" href="#KernelAbstractions.@context"><code>KernelAbstractions.@context</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@context()</code></pre><p>Access the hidden context object used by KernelAbstractions.</p><div class="admonition is-category-warn"><header class="admonition-header">Warn</header><div class="admonition-body"><p>Only valid to be used from a kernel with <code>cpu=false</code>.</p></div></div><pre><code class="nohighlight hljs">function f(@context, a)
     I = @index(Global, Linear)
     a[I]
 end
 
 @kernel cpu=false function my_kernel(a)
     f(@context, a)
-end</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/KernelAbstractions.jl#LL271-L289">source</a></section></article></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../examples/atomix/">« Atomic operations with Atomix.jl</a><a class="docs-footer-nextpage" href="../extras/unrolling/">Unroll macro »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+end</code></pre></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/KernelAbstractions.jl#LL271-L289">source</a></section></article></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../examples/atomix/">« Atomic operations with Atomix.jl</a><a class="docs-footer-nextpage" href="../extras/unrolling/">Unroll macro »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/design/index.html b/previews/PR551/design/index.html
index 38471cef..32bf10f7 100644
--- a/previews/PR551/design/index.html
+++ b/previews/PR551/design/index.html
@@ -1,2 +1,2 @@
 <!DOCTYPE html>
-<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Design notes · KernelAbstractions.jl</title><meta name="title" content="Design notes · KernelAbstractions.jl"/><meta property="og:title" content="Design notes · KernelAbstractions.jl"/><meta property="twitter:title" content="Design notes · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li><a class="tocitem" href="../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Design notes</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Design notes</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/design.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Design-notes"><a class="docs-heading-anchor" href="#Design-notes">Design notes</a><a id="Design-notes-1"></a><a class="docs-heading-anchor-permalink" href="#Design-notes" title="Permalink"></a></h1><ul><li><p>Loops are affine</p></li><li><p>Operation over workgroups/blocks</p></li><li><p>Goal: Kernel fusion</p></li><li><p><code>@Const</code>:</p><ul><li><code>restrict const</code> in C</li><li><code>ldg</code> on the GPU</li><li><code>@aliasscopes</code> on the CPU</li></ul></li><li><p>Cartesian or Linear indicies supported</p><ul><li>`@index(Linear)</li><li>`@index(Cartesian)</li></ul></li><li><p><code>@synchronize</code> for inserting workgroup-level synchronization</p></li><li><p>workgroupsize constant</p><ul><li>may allow for <code>Dynamic()</code></li></ul></li><li><p>terminology – how much to borrow from OpenCL</p></li><li><p>http://portablecl.org/docs/html/kernel_compiler.html#work-group-function-generation</p></li></ul><h2 id="TODO"><a class="docs-heading-anchor" href="#TODO">TODO</a><a id="TODO-1"></a><a class="docs-heading-anchor-permalink" href="#TODO" title="Permalink"></a></h2><ul><li>Do we want to support Cartesian indices?<ul><li>Just got removed from GPUArrays</li><li>recovery is costly</li><li>Going from Cartesian to linear sometimes confuses LLVM (IIRC this is true for dynamic strides, due to overflow issues)</li></ul></li><li><code>@index(Global, Linear)</code></li><li>Support non-multiple of workgroupsize<ul><li>do we require index inbounds checks?<ul><li>Harmful for CPU vectorization – likely want to generate two kernels</li></ul></li></ul></li><li>Multithreading requires 1.3</li><li>Tests</li><li>Docs</li><li>Examples</li><li>Index calculations</li><li>inbounds checks on the GPU</li><li></li></ul></article><nav class="docs-footer"><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Design notes · KernelAbstractions.jl</title><meta name="title" content="Design notes · KernelAbstractions.jl"/><meta property="og:title" content="Design notes · KernelAbstractions.jl"/><meta property="twitter:title" content="Design notes · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/design/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li><a class="tocitem" href="../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Design notes</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Design notes</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/design.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Design-notes"><a class="docs-heading-anchor" href="#Design-notes">Design notes</a><a id="Design-notes-1"></a><a class="docs-heading-anchor-permalink" href="#Design-notes" title="Permalink"></a></h1><ul><li><p>Loops are affine</p></li><li><p>Operation over workgroups/blocks</p></li><li><p>Goal: Kernel fusion</p></li><li><p><code>@Const</code>:</p><ul><li><code>restrict const</code> in C</li><li><code>ldg</code> on the GPU</li><li><code>@aliasscopes</code> on the CPU</li></ul></li><li><p>Cartesian or Linear indicies supported</p><ul><li>`@index(Linear)</li><li>`@index(Cartesian)</li></ul></li><li><p><code>@synchronize</code> for inserting workgroup-level synchronization</p></li><li><p>workgroupsize constant</p><ul><li>may allow for <code>Dynamic()</code></li></ul></li><li><p>terminology – how much to borrow from OpenCL</p></li><li><p>http://portablecl.org/docs/html/kernel_compiler.html#work-group-function-generation</p></li></ul><h2 id="TODO"><a class="docs-heading-anchor" href="#TODO">TODO</a><a id="TODO-1"></a><a class="docs-heading-anchor-permalink" href="#TODO" title="Permalink"></a></h2><ul><li>Do we want to support Cartesian indices?<ul><li>Just got removed from GPUArrays</li><li>recovery is costly</li><li>Going from Cartesian to linear sometimes confuses LLVM (IIRC this is true for dynamic strides, due to overflow issues)</li></ul></li><li><code>@index(Global, Linear)</code></li><li>Support non-multiple of workgroupsize<ul><li>do we require index inbounds checks?<ul><li>Harmful for CPU vectorization – likely want to generate two kernels</li></ul></li></ul></li><li>Multithreading requires 1.3</li><li>Tests</li><li>Docs</li><li>Examples</li><li>Index calculations</li><li>inbounds checks on the GPU</li><li></li></ul></article><nav class="docs-footer"><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/atomix/index.html b/previews/PR551/examples/atomix/index.html
index 97b042db..2cffbea4 100644
--- a/previews/PR551/examples/atomix/index.html
+++ b/previews/PR551/examples/atomix/index.html
@@ -40,4 +40,4 @@
 end
 
 out_fixed = Array(index_fun_fixed(CuArray(img)));
-simshow(out_fixed)</code></pre><p>This image is free of artifacts.</p><p><img src="../../assets/atomix_correct.png" alt="Resulting image is correct."/></p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../numa_aware/">« NUMA-aware SAXPY</a><a class="docs-footer-nextpage" href="../../api/">API »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+simshow(out_fixed)</code></pre><p>This image is free of artifacts.</p><p><img src="../../assets/atomix_correct.png" alt="Resulting image is correct."/></p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../numa_aware/">« NUMA-aware SAXPY</a><a class="docs-footer-nextpage" href="../../api/">API »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/matmul/index.html b/previews/PR551/examples/matmul/index.html
index e401c908..fcfd1af3 100644
--- a/previews/PR551/examples/matmul/index.html
+++ b/previews/PR551/examples/matmul/index.html
@@ -34,4 +34,4 @@
 KernelAbstractions.synchronize(backend)
 
 @test isapprox(output, a * b)
-</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../performance/">« Measuring performance</a><a class="docs-footer-nextpage" href="../numa_aware/">NUMA-aware SAXPY »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../performance/">« Measuring performance</a><a class="docs-footer-nextpage" href="../numa_aware/">NUMA-aware SAXPY »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/memcopy/index.html b/previews/PR551/examples/memcopy/index.html
index 88ff1dce..fa5d7847 100644
--- a/previews/PR551/examples/memcopy/index.html
+++ b/previews/PR551/examples/memcopy/index.html
@@ -21,4 +21,4 @@
 mycopy!(A, B)
 KernelAbstractions.synchronize(backend)
 @test A == B
-</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../../kernels/">« Writing kernels</a><a class="docs-footer-nextpage" href="../memcopy_static/">Memcopy with static NDRange »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../../kernels/">« Writing kernels</a><a class="docs-footer-nextpage" href="../memcopy_static/">Memcopy with static NDRange »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/memcopy_static/index.html b/previews/PR551/examples/memcopy_static/index.html
index 3ce728a2..1b2c0179 100644
--- a/previews/PR551/examples/memcopy_static/index.html
+++ b/previews/PR551/examples/memcopy_static/index.html
@@ -21,4 +21,4 @@
 mycopy_static!(A, B)
 KernelAbstractions.synchronize(backend)
 @test A == B
-</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../memcopy/">« Memcopy</a><a class="docs-footer-nextpage" href="../naive_transpose/">Naive Transpose »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../memcopy/">« Memcopy</a><a class="docs-footer-nextpage" href="../naive_transpose/">Naive Transpose »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/naive_transpose/index.html b/previews/PR551/examples/naive_transpose/index.html
index 3759cad2..efaf0560 100644
--- a/previews/PR551/examples/naive_transpose/index.html
+++ b/previews/PR551/examples/naive_transpose/index.html
@@ -31,4 +31,4 @@
 naive_transpose!(a, b)
 KernelAbstractions.synchronize(backend)
 @test a == transpose(b)
-</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../memcopy_static/">« Memcopy with static NDRange</a><a class="docs-footer-nextpage" href="../performance/">Measuring performance »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../memcopy_static/">« Memcopy with static NDRange</a><a class="docs-footer-nextpage" href="../performance/">Measuring performance »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/numa_aware/index.html b/previews/PR551/examples/numa_aware/index.html
index e0061003..a1d16b76 100644
--- a/previews/PR551/examples/numa_aware/index.html
+++ b/previews/PR551/examples/numa_aware/index.html
@@ -69,4 +69,4 @@
 Compute (GFLOP/s): 5.46
 
 Memory Bandwidth (GB/s): 32.46 # backend = CPU(; static=true), init = :serial
-Compute (GFLOP/s): 5.41</code></pre><p>The key observations are the following:</p><ul><li>Serial initialization leads to subpar performance (at least a factor of 4.5) independent of the chosen CPU backend. This is a manifestation of remark 3 above.</li><li>The static CPU backend gives &gt;2x better performance than the one based on the dynamic <code>Threads.@spawn</code>. This is a manifestation of remark 2 (and, in some sense, also 1) above.</li></ul></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../matmul/">« Matmul</a><a class="docs-footer-nextpage" href="../atomix/">Atomic operations with Atomix.jl »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+Compute (GFLOP/s): 5.41</code></pre><p>The key observations are the following:</p><ul><li>Serial initialization leads to subpar performance (at least a factor of 4.5) independent of the chosen CPU backend. This is a manifestation of remark 3 above.</li><li>The static CPU backend gives &gt;2x better performance than the one based on the dynamic <code>Threads.@spawn</code>. This is a manifestation of remark 2 (and, in some sense, also 1) above.</li></ul></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../matmul/">« Matmul</a><a class="docs-footer-nextpage" href="../atomix/">Atomic operations with Atomix.jl »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/examples/performance/index.html b/previews/PR551/examples/performance/index.html
index 18e2e4c3..a68a3431 100644
--- a/previews/PR551/examples/performance/index.html
+++ b/previews/PR551/examples/performance/index.html
@@ -251,4 +251,4 @@
         end
     end
 end
-</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../naive_transpose/">« Naive Transpose</a><a class="docs-footer-nextpage" href="../matmul/">Matmul »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+</code></pre></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../naive_transpose/">« Naive Transpose</a><a class="docs-footer-nextpage" href="../matmul/">Matmul »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/extras/unrolling/index.html b/previews/PR551/extras/unrolling/index.html
index 494ca9e4..31c86ae9 100644
--- a/previews/PR551/extras/unrolling/index.html
+++ b/previews/PR551/extras/unrolling/index.html
@@ -1,2 +1,2 @@
 <!DOCTYPE html>
-<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Unroll macro · KernelAbstractions.jl</title><meta name="title" content="Unroll macro · KernelAbstractions.jl"/><meta property="og:title" content="Unroll macro · KernelAbstractions.jl"/><meta property="twitter:title" content="Unroll macro · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><script data-outdated-warner src="../../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL="../.."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../../assets/documenter.js"></script><script src="../../search_index.js"></script><script src="../../siteinfo.js"></script><script src="../../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../../">Home</a></li><li><a class="tocitem" href="../../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li class="is-active"><a class="tocitem" href>Unroll macro</a></li></ul></li><li><a class="tocitem" href="../../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li><a class="is-disabled">Extras</a></li><li class="is-active"><a href>Unroll macro</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Unroll macro</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/extras/unrolling.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Unroll-macro"><a class="docs-heading-anchor" href="#Unroll-macro">Unroll macro</a><a id="Unroll-macro-1"></a><a class="docs-heading-anchor-permalink" href="#Unroll-macro" title="Permalink"></a></h1><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.Extras.LoopInfo.@unroll" href="#KernelAbstractions.Extras.LoopInfo.@unroll"><code>KernelAbstractions.Extras.LoopInfo.@unroll</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@unroll expr</code></pre><p>Takes a for loop as <code>expr</code> and informs the LLVM unroller to fully unroll it, if it is safe to do so and the loop count is known.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/extras/loopinfo.jl#LL40-L45">source</a></section><section><div><pre><code class="language-julia hljs">@unroll N expr</code></pre><p>Takes a for loop as <code>expr</code> and informs the LLVM unroller to unroll it <code>N</code> times, if it is safe to do so.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/df8961d13d6b7b4950a5e248d0b8aeb7badbf74b/src/extras/loopinfo.jl#LL51-L56">source</a></section></article></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../../api/">« API</a><a class="docs-footer-nextpage" href="../../implementations/">Notes for implementations »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Unroll macro · KernelAbstractions.jl</title><meta name="title" content="Unroll macro · KernelAbstractions.jl"/><meta property="og:title" content="Unroll macro · KernelAbstractions.jl"/><meta property="twitter:title" content="Unroll macro · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/extras/unrolling/"/><script data-outdated-warner src="../../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL="../.."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../../assets/documenter.js"></script><script src="../../search_index.js"></script><script src="../../siteinfo.js"></script><script src="../../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../../">Home</a></li><li><a class="tocitem" href="../../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li class="is-active"><a class="tocitem" href>Unroll macro</a></li></ul></li><li><a class="tocitem" href="../../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li><a class="is-disabled">Extras</a></li><li class="is-active"><a href>Unroll macro</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Unroll macro</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/extras/unrolling.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Unroll-macro"><a class="docs-heading-anchor" href="#Unroll-macro">Unroll macro</a><a id="Unroll-macro-1"></a><a class="docs-heading-anchor-permalink" href="#Unroll-macro" title="Permalink"></a></h1><article class="docstring"><header><a class="docstring-article-toggle-button fa-solid fa-chevron-down" href="javascript:;" title="Collapse docstring"></a><a class="docstring-binding" id="KernelAbstractions.Extras.LoopInfo.@unroll" href="#KernelAbstractions.Extras.LoopInfo.@unroll"><code>KernelAbstractions.Extras.LoopInfo.@unroll</code></a> — <span class="docstring-category">Macro</span><span class="is-flex-grow-1 docstring-article-toggle-button" title="Collapse docstring"></span></header><section><div><pre><code class="language-julia hljs">@unroll expr</code></pre><p>Takes a for loop as <code>expr</code> and informs the LLVM unroller to fully unroll it, if it is safe to do so and the loop count is known.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/extras/loopinfo.jl#LL40-L45">source</a></section><section><div><pre><code class="language-julia hljs">@unroll N expr</code></pre><p>Takes a for loop as <code>expr</code> and informs the LLVM unroller to unroll it <code>N</code> times, if it is safe to do so.</p></div><a class="docs-sourcelink" target="_blank" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/6fa9ab5168c589b4db8b46afa61df842be4f813b/src/extras/loopinfo.jl#LL51-L56">source</a></section></article></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../../api/">« API</a><a class="docs-footer-nextpage" href="../../implementations/">Notes for implementations »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/implementations/index.html b/previews/PR551/implementations/index.html
index e013b3cf..f7f59a71 100644
--- a/previews/PR551/implementations/index.html
+++ b/previews/PR551/implementations/index.html
@@ -1,2 +1,2 @@
 <!DOCTYPE html>
-<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Notes for implementations · KernelAbstractions.jl</title><meta name="title" content="Notes for implementations · KernelAbstractions.jl"/><meta property="og:title" content="Notes for implementations · KernelAbstractions.jl"/><meta property="twitter:title" content="Notes for implementations · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li class="is-active"><a class="tocitem" href>Notes for implementations</a><ul class="internal"><li><a class="tocitem" href="#Semantics-of-KernelAbstractions.synchronize"><span>Semantics of <code>KernelAbstractions.synchronize</code></span></a></li></ul></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Notes for implementations</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Notes for implementations</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/implementations.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Notes-for-backend-implementations"><a class="docs-heading-anchor" href="#Notes-for-backend-implementations">Notes for backend implementations</a><a id="Notes-for-backend-implementations-1"></a><a class="docs-heading-anchor-permalink" href="#Notes-for-backend-implementations" title="Permalink"></a></h1><h2 id="Semantics-of-KernelAbstractions.synchronize"><a class="docs-heading-anchor" href="#Semantics-of-KernelAbstractions.synchronize">Semantics of <code>KernelAbstractions.synchronize</code></a><a id="Semantics-of-KernelAbstractions.synchronize-1"></a><a class="docs-heading-anchor-permalink" href="#Semantics-of-KernelAbstractions.synchronize" title="Permalink"></a></h2><p><a href="../api/#KernelAbstractions.synchronize"><code>KernelAbstractions.synchronize</code></a> is required to be <strong>cooperative</strong>, with that we mean it can not block inside an external library, but instead must implement a cooperative wait that will <code>yield</code> the current task and return the scheduling slice to the Julia runtime.</p><p>This is of particular import to allow for overlapping of communication and computation with MPI.</p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../extras/unrolling/">« Unroll macro</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Notes for implementations · KernelAbstractions.jl</title><meta name="title" content="Notes for implementations · KernelAbstractions.jl"/><meta property="og:title" content="Notes for implementations · KernelAbstractions.jl"/><meta property="twitter:title" content="Notes for implementations · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/implementations/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li><a class="tocitem" href="../kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li class="is-active"><a class="tocitem" href>Notes for implementations</a><ul class="internal"><li><a class="tocitem" href="#Semantics-of-KernelAbstractions.synchronize"><span>Semantics of <code>KernelAbstractions.synchronize</code></span></a></li></ul></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Notes for implementations</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Notes for implementations</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/implementations.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Notes-for-backend-implementations"><a class="docs-heading-anchor" href="#Notes-for-backend-implementations">Notes for backend implementations</a><a id="Notes-for-backend-implementations-1"></a><a class="docs-heading-anchor-permalink" href="#Notes-for-backend-implementations" title="Permalink"></a></h1><h2 id="Semantics-of-KernelAbstractions.synchronize"><a class="docs-heading-anchor" href="#Semantics-of-KernelAbstractions.synchronize">Semantics of <code>KernelAbstractions.synchronize</code></a><a id="Semantics-of-KernelAbstractions.synchronize-1"></a><a class="docs-heading-anchor-permalink" href="#Semantics-of-KernelAbstractions.synchronize" title="Permalink"></a></h2><p><a href="../api/#KernelAbstractions.synchronize"><code>KernelAbstractions.synchronize</code></a> is required to be <strong>cooperative</strong>, with that we mean it can not block inside an external library, but instead must implement a cooperative wait that will <code>yield</code> the current task and return the scheduling slice to the Julia runtime.</p><p>This is of particular import to allow for overlapping of communication and computation with MPI.</p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../extras/unrolling/">« Unroll macro</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/index.html b/previews/PR551/index.html
index 2ea8148a..faa265b9 100644
--- a/previews/PR551/index.html
+++ b/previews/PR551/index.html
@@ -1,3 +1,3 @@
 <!DOCTYPE html>
 <html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Home · KernelAbstractions.jl</title><meta name="title" content="Home · KernelAbstractions.jl"/><meta property="og:title" content="Home · KernelAbstractions.jl"/><meta property="twitter:title" content="Home · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/"/><script data-outdated-warner src="assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL="."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="assets/documenter.js"></script><script src="search_index.js"></script><script src="siteinfo.js"></script><script src="../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href>KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li class="is-active"><a class="tocitem" href>Home</a><ul class="internal"><li><a class="tocitem" href="#Supported-backends"><span>Supported backends</span></a></li><li><a class="tocitem" href="#Changelog"><span>Changelog</span></a></li><li><a class="tocitem" href="#Semantic-differences"><span>Semantic differences</span></a></li><li><a class="tocitem" href="#Contributing"><span>Contributing</span></a></li></ul></li><li><a class="tocitem" href="quickstart/">Quickstart</a></li><li><a class="tocitem" href="kernels/">Writing kernels</a></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="examples/matmul/">Matmul</a></li><li><a class="tocitem" href="examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="extras/unrolling/">Unroll macro</a></li></ul></li><li><a class="tocitem" href="implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Home</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Home</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/index.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="KernelAbstractions"><a class="docs-heading-anchor" href="#KernelAbstractions">KernelAbstractions</a><a id="KernelAbstractions-1"></a><a class="docs-heading-anchor-permalink" href="#KernelAbstractions" title="Permalink"></a></h1><p><a href="https://github.com/JuliaGPU/KernelAbstractions.jl"><code>KernelAbstractions.jl</code></a> (KA) is a package that allows you to write GPU-like kernels targetting different execution backends. KA intends to be a minimal and performant library that explores ways to write heterogeneous code. Although parts of the package are still experimental, it has been used successfully as part of the <a href="https://www.exascaleproject.org/">Exascale Computing Project</a> to run Julia code on pre-<a href="https://www.olcf.ornl.gov/frontier/">Frontier</a> and pre-<a href="https://www.alcf.anl.gov/aurora">Aurora</a> systems. Currently, profiling and debugging require backend-specific calls like, for example, in <a href="https://cuda.juliagpu.org/dev/development/profiling/"><code>CUDA.jl</code></a>.</p><div class="admonition is-info"><header class="admonition-header">Note</header><div class="admonition-body"><p>While KernelAbstraction.jl is focused on performance portability, it emulates GPU semantics and therefore the kernel language has several constructs that are necessary for good performance on the GPU, but serve no purpose on the CPU. In these cases, we either ignore such statements entirely (such as with <code>@synchronize</code>) or swap out the construct for something similar on the CPU (such as using an <code>MVector</code>  to replace <code>@localmem</code>). This means that CPU performance will still be fast, but might be performing extra work to provide a consistent programming model across GPU and CPU</p></div></div><h2 id="Supported-backends"><a class="docs-heading-anchor" href="#Supported-backends">Supported backends</a><a id="Supported-backends-1"></a><a class="docs-heading-anchor-permalink" href="#Supported-backends" title="Permalink"></a></h2><p>All supported backends rely on their respective Julia interface to the compiler backend and depend on <a href="https://github.com/JuliaGPU/GPUArrays.jl"><code>GPUArrays.jl</code></a> and <a href="https://github.com/JuliaGPU/GPUCompiler.jl"><code>GPUCompiler.jl</code></a>.</p><h3 id="CUDA"><a class="docs-heading-anchor" href="#CUDA">CUDA</a><a id="CUDA-1"></a><a class="docs-heading-anchor-permalink" href="#CUDA" title="Permalink"></a></h3><pre><code class="language-julia hljs">import CUDA
-using KernelAbstractions</code></pre><p><a href="https://github.com/JuliaGPU/CUDA.jl"><code>CUDA.jl</code></a> is currently the most mature way to program for GPUs. This provides a backend <code>CUDABackend &lt;: KA.Backend</code> to CUDA.</p><h2 id="Changelog"><a class="docs-heading-anchor" href="#Changelog">Changelog</a><a id="Changelog-1"></a><a class="docs-heading-anchor-permalink" href="#Changelog" title="Permalink"></a></h2><h3 id="0.9"><a class="docs-heading-anchor" href="#0.9">0.9</a><a id="0.9-1"></a><a class="docs-heading-anchor-permalink" href="#0.9" title="Permalink"></a></h3><p>Major refactor of KernelAbstractions. In particular:</p><ul><li>Removal of the event system. Kernel are now implicitly ordered.</li><li>Removal of backend packages, backends are now directly provided by CUDA.jl and similar</li></ul><h2 id="Semantic-differences"><a class="docs-heading-anchor" href="#Semantic-differences">Semantic differences</a><a id="Semantic-differences-1"></a><a class="docs-heading-anchor-permalink" href="#Semantic-differences" title="Permalink"></a></h2><h3 id="To-CUDA.jl/AMDGPU.jl"><a class="docs-heading-anchor" href="#To-CUDA.jl/AMDGPU.jl">To CUDA.jl/AMDGPU.jl</a><a id="To-CUDA.jl/AMDGPU.jl-1"></a><a class="docs-heading-anchor-permalink" href="#To-CUDA.jl/AMDGPU.jl" title="Permalink"></a></h3><ol><li>The kernels are automatically bounds-checked against either the dynamic or statically provided <code>ndrange</code>.</li><li>Kernels implictly return <code>nothing</code></li></ol><h2 id="Contributing"><a class="docs-heading-anchor" href="#Contributing">Contributing</a><a id="Contributing-1"></a><a class="docs-heading-anchor-permalink" href="#Contributing" title="Permalink"></a></h2><p>Please file any bug reports through Github issues or fixes through a pull request. Any heterogeneous hardware or code aficionados is welcome to join us on our journey.</p></article><nav class="docs-footer"><a class="docs-footer-nextpage" href="quickstart/">Quickstart »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+using KernelAbstractions</code></pre><p><a href="https://github.com/JuliaGPU/CUDA.jl"><code>CUDA.jl</code></a> is currently the most mature way to program for GPUs. This provides a backend <code>CUDABackend &lt;: KA.Backend</code> to CUDA.</p><h2 id="Changelog"><a class="docs-heading-anchor" href="#Changelog">Changelog</a><a id="Changelog-1"></a><a class="docs-heading-anchor-permalink" href="#Changelog" title="Permalink"></a></h2><h3 id="0.9"><a class="docs-heading-anchor" href="#0.9">0.9</a><a id="0.9-1"></a><a class="docs-heading-anchor-permalink" href="#0.9" title="Permalink"></a></h3><p>Major refactor of KernelAbstractions. In particular:</p><ul><li>Removal of the event system. Kernel are now implicitly ordered.</li><li>Removal of backend packages, backends are now directly provided by CUDA.jl and similar</li></ul><h2 id="Semantic-differences"><a class="docs-heading-anchor" href="#Semantic-differences">Semantic differences</a><a id="Semantic-differences-1"></a><a class="docs-heading-anchor-permalink" href="#Semantic-differences" title="Permalink"></a></h2><h3 id="To-CUDA.jl/AMDGPU.jl"><a class="docs-heading-anchor" href="#To-CUDA.jl/AMDGPU.jl">To CUDA.jl/AMDGPU.jl</a><a id="To-CUDA.jl/AMDGPU.jl-1"></a><a class="docs-heading-anchor-permalink" href="#To-CUDA.jl/AMDGPU.jl" title="Permalink"></a></h3><ol><li>The kernels are automatically bounds-checked against either the dynamic or statically provided <code>ndrange</code>.</li><li>Kernels implictly return <code>nothing</code></li></ol><h2 id="Contributing"><a class="docs-heading-anchor" href="#Contributing">Contributing</a><a id="Contributing-1"></a><a class="docs-heading-anchor-permalink" href="#Contributing" title="Permalink"></a></h2><p>Please file any bug reports through Github issues or fixes through a pull request. Any heterogeneous hardware or code aficionados is welcome to join us on our journey.</p></article><nav class="docs-footer"><a class="docs-footer-nextpage" href="quickstart/">Quickstart »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/kernels/index.html b/previews/PR551/kernels/index.html
index 68452eef..5a1ae81a 100644
--- a/previews/PR551/kernels/index.html
+++ b/previews/PR551/kernels/index.html
@@ -1,2 +1,2 @@
 <!DOCTYPE html>
-<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Writing kernels · KernelAbstractions.jl</title><meta name="title" content="Writing kernels · KernelAbstractions.jl"/><meta property="og:title" content="Writing kernels · KernelAbstractions.jl"/><meta property="twitter:title" content="Writing kernels · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li class="is-active"><a class="tocitem" href>Writing kernels</a><ul class="internal"><li><a class="tocitem" href="#Constant-arguments"><span>Constant arguments</span></a></li><li><a class="tocitem" href="#Indexing"><span>Indexing</span></a></li><li><a class="tocitem" href="#Local-memory,-variable-lifetime-and-private-memory"><span>Local memory, variable lifetime and private memory</span></a></li><li class="toplevel"><a class="tocitem" href="#Launching-kernels"><span>Launching kernels</span></a></li></ul></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li><a class="tocitem" href="../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Writing kernels</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Writing kernels</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/kernels.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Writing-kernels"><a class="docs-heading-anchor" href="#Writing-kernels">Writing kernels</a><a id="Writing-kernels-1"></a><a class="docs-heading-anchor-permalink" href="#Writing-kernels" title="Permalink"></a></h1><p>These kernel language constructs are intended to be used as part of <a href="../api/#KernelAbstractions.@kernel"><code>@kernel</code></a> functions and not valid outside that context.</p><h2 id="Constant-arguments"><a class="docs-heading-anchor" href="#Constant-arguments">Constant arguments</a><a id="Constant-arguments-1"></a><a class="docs-heading-anchor-permalink" href="#Constant-arguments" title="Permalink"></a></h2><p>Kernel functions allow for input arguments to be marked with the <a href="../api/#KernelAbstractions.@Const"><code>@Const</code></a> macro. It informs the compiler that the memory accessed through that marked input argument, will not be written to as part of the kernel. This has the implication that input arguments are <strong>not</strong> allowed to alias each other. If you are used to CUDA C this is similar to <code>const restrict</code>.</p><h2 id="Indexing"><a class="docs-heading-anchor" href="#Indexing">Indexing</a><a id="Indexing-1"></a><a class="docs-heading-anchor-permalink" href="#Indexing" title="Permalink"></a></h2><p>There are several <a href="../api/#KernelAbstractions.@index"><code>@index</code></a> variants.</p><h2 id="Local-memory,-variable-lifetime-and-private-memory"><a class="docs-heading-anchor" href="#Local-memory,-variable-lifetime-and-private-memory">Local memory, variable lifetime and private memory</a><a id="Local-memory,-variable-lifetime-and-private-memory-1"></a><a class="docs-heading-anchor-permalink" href="#Local-memory,-variable-lifetime-and-private-memory" title="Permalink"></a></h2><p><a href="../api/#KernelAbstractions.@localmem"><code>@localmem</code></a>, <a href="../api/#KernelAbstractions.@synchronize"><code>@synchronize</code></a>, <a href="../api/#KernelAbstractions.@private"><code>@private</code></a></p><h1 id="Launching-kernels"><a class="docs-heading-anchor" href="#Launching-kernels">Launching kernels</a><a id="Launching-kernels-1"></a><a class="docs-heading-anchor-permalink" href="#Launching-kernels" title="Permalink"></a></h1></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../quickstart/">« Quickstart</a><a class="docs-footer-nextpage" href="../examples/memcopy/">Memcopy »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+<html lang="en"><head><meta charset="UTF-8"/><meta name="viewport" content="width=device-width, initial-scale=1.0"/><title>Writing kernels · KernelAbstractions.jl</title><meta name="title" content="Writing kernels · KernelAbstractions.jl"/><meta property="og:title" content="Writing kernels · KernelAbstractions.jl"/><meta property="twitter:title" content="Writing kernels · KernelAbstractions.jl"/><meta name="description" content="Documentation for KernelAbstractions.jl."/><meta property="og:description" content="Documentation for KernelAbstractions.jl."/><meta property="twitter:description" content="Documentation for KernelAbstractions.jl."/><meta property="og:url" content="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><meta property="twitter:url" content="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><link rel="canonical" href="https://juliagpu.github.io/KernelAbstractions.jl/kernels/"/><script data-outdated-warner src="../assets/warner.js"></script><link href="https://cdnjs.cloudflare.com/ajax/libs/lato-font/3.0.0/css/lato-font.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/juliamono/0.050/juliamono.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/fontawesome.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/solid.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.2/css/brands.min.css" rel="stylesheet" type="text/css"/><link href="https://cdnjs.cloudflare.com/ajax/libs/KaTeX/0.16.8/katex.min.css" rel="stylesheet" type="text/css"/><script>documenterBaseURL=".."</script><script src="https://cdnjs.cloudflare.com/ajax/libs/require.js/2.3.6/require.min.js" data-main="../assets/documenter.js"></script><script src="../search_index.js"></script><script src="../siteinfo.js"></script><script src="../../versions.js"></script><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-mocha.css" data-theme-name="catppuccin-mocha"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-macchiato.css" data-theme-name="catppuccin-macchiato"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-frappe.css" data-theme-name="catppuccin-frappe"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/catppuccin-latte.css" data-theme-name="catppuccin-latte"/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-dark.css" data-theme-name="documenter-dark" data-theme-primary-dark/><link class="docs-theme-link" rel="stylesheet" type="text/css" href="../assets/themes/documenter-light.css" data-theme-name="documenter-light" data-theme-primary/><script src="../assets/themeswap.js"></script></head><body><div id="documenter"><nav class="docs-sidebar"><div class="docs-package-name"><span class="docs-autofit"><a href="../">KernelAbstractions.jl</a></span></div><button class="docs-search-query input is-rounded is-small is-clickable my-2 mx-auto py-1 px-2" id="documenter-search-query">Search docs (Ctrl + /)</button><ul class="docs-menu"><li><a class="tocitem" href="../">Home</a></li><li><a class="tocitem" href="../quickstart/">Quickstart</a></li><li class="is-active"><a class="tocitem" href>Writing kernels</a><ul class="internal"><li><a class="tocitem" href="#Constant-arguments"><span>Constant arguments</span></a></li><li><a class="tocitem" href="#Indexing"><span>Indexing</span></a></li><li><a class="tocitem" href="#Local-memory,-variable-lifetime-and-private-memory"><span>Local memory, variable lifetime and private memory</span></a></li><li class="toplevel"><a class="tocitem" href="#Launching-kernels"><span>Launching kernels</span></a></li></ul></li><li><span class="tocitem">Examples</span><ul><li><a class="tocitem" href="../examples/memcopy/">Memcopy</a></li><li><a class="tocitem" href="../examples/memcopy_static/">Memcopy with static NDRange</a></li><li><a class="tocitem" href="../examples/naive_transpose/">Naive Transpose</a></li><li><a class="tocitem" href="../examples/performance/">Measuring performance</a></li><li><a class="tocitem" href="../examples/matmul/">Matmul</a></li><li><a class="tocitem" href="../examples/numa_aware/">NUMA-aware SAXPY</a></li><li><a class="tocitem" href="../examples/atomix/">Atomic operations with Atomix.jl</a></li></ul></li><li><a class="tocitem" href="../api/">API</a></li><li><span class="tocitem">Extras</span><ul><li><a class="tocitem" href="../extras/unrolling/">Unroll macro</a></li></ul></li><li><a class="tocitem" href="../implementations/">Notes for implementations</a></li></ul><div class="docs-version-selector field has-addons"><div class="control"><span class="docs-label button is-static is-size-7">Version</span></div><div class="docs-selector control is-expanded"><div class="select is-fullwidth is-size-7"><select id="documenter-version-selector"></select></div></div></div></nav><div class="docs-main"><header class="docs-navbar"><a class="docs-sidebar-button docs-navbar-link fa-solid fa-bars is-hidden-desktop" id="documenter-sidebar-button" href="#"></a><nav class="breadcrumb"><ul class="is-hidden-mobile"><li class="is-active"><a href>Writing kernels</a></li></ul><ul class="is-hidden-tablet"><li class="is-active"><a href>Writing kernels</a></li></ul></nav><div class="docs-right"><a class="docs-navbar-link" href="https://github.com/JuliaGPU/KernelAbstractions.jl/blob/main/docs/src/kernels.md#L" title="Edit source on GitHub"><span class="docs-icon fa-solid"></span></a><a class="docs-settings-button docs-navbar-link fa-solid fa-gear" id="documenter-settings-button" href="#" title="Settings"></a><a class="docs-article-toggle-button fa-solid fa-chevron-up" id="documenter-article-toggle-button" href="javascript:;" title="Collapse all docstrings"></a></div></header><article class="content" id="documenter-page"><h1 id="Writing-kernels"><a class="docs-heading-anchor" href="#Writing-kernels">Writing kernels</a><a id="Writing-kernels-1"></a><a class="docs-heading-anchor-permalink" href="#Writing-kernels" title="Permalink"></a></h1><p>These kernel language constructs are intended to be used as part of <a href="../api/#KernelAbstractions.@kernel"><code>@kernel</code></a> functions and not valid outside that context.</p><h2 id="Constant-arguments"><a class="docs-heading-anchor" href="#Constant-arguments">Constant arguments</a><a id="Constant-arguments-1"></a><a class="docs-heading-anchor-permalink" href="#Constant-arguments" title="Permalink"></a></h2><p>Kernel functions allow for input arguments to be marked with the <a href="../api/#KernelAbstractions.@Const"><code>@Const</code></a> macro. It informs the compiler that the memory accessed through that marked input argument, will not be written to as part of the kernel. This has the implication that input arguments are <strong>not</strong> allowed to alias each other. If you are used to CUDA C this is similar to <code>const restrict</code>.</p><h2 id="Indexing"><a class="docs-heading-anchor" href="#Indexing">Indexing</a><a id="Indexing-1"></a><a class="docs-heading-anchor-permalink" href="#Indexing" title="Permalink"></a></h2><p>There are several <a href="../api/#KernelAbstractions.@index"><code>@index</code></a> variants.</p><h2 id="Local-memory,-variable-lifetime-and-private-memory"><a class="docs-heading-anchor" href="#Local-memory,-variable-lifetime-and-private-memory">Local memory, variable lifetime and private memory</a><a id="Local-memory,-variable-lifetime-and-private-memory-1"></a><a class="docs-heading-anchor-permalink" href="#Local-memory,-variable-lifetime-and-private-memory" title="Permalink"></a></h2><p><a href="../api/#KernelAbstractions.@localmem"><code>@localmem</code></a>, <a href="../api/#KernelAbstractions.@synchronize"><code>@synchronize</code></a>, <a href="../api/#KernelAbstractions.@private"><code>@private</code></a></p><h1 id="Launching-kernels"><a class="docs-heading-anchor" href="#Launching-kernels">Launching kernels</a><a id="Launching-kernels-1"></a><a class="docs-heading-anchor-permalink" href="#Launching-kernels" title="Permalink"></a></h1></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../quickstart/">« Quickstart</a><a class="docs-footer-nextpage" href="../examples/memcopy/">Memcopy »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
diff --git a/previews/PR551/quickstart/index.html b/previews/PR551/quickstart/index.html
index a193d622..4017d0db 100644
--- a/previews/PR551/quickstart/index.html
+++ b/previews/PR551/quickstart/index.html
@@ -27,4 +27,4 @@
     mul2_kernel(backend, 64)(B, ndrange=size(B))
     synchronize(backend)
     all(A .+ B .== 8.0)
-end</code></pre><h2 id="Using-task-programming-to-launch-kernels-in-parallel."><a class="docs-heading-anchor" href="#Using-task-programming-to-launch-kernels-in-parallel.">Using task programming to launch kernels in parallel.</a><a id="Using-task-programming-to-launch-kernels-in-parallel.-1"></a><a class="docs-heading-anchor-permalink" href="#Using-task-programming-to-launch-kernels-in-parallel." title="Permalink"></a></h2><p>TODO</p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../">« Home</a><a class="docs-footer-nextpage" href="../kernels/">Writing kernels »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Wednesday 8 January 2025 12:43">Wednesday 8 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>
+end</code></pre><h2 id="Using-task-programming-to-launch-kernels-in-parallel."><a class="docs-heading-anchor" href="#Using-task-programming-to-launch-kernels-in-parallel.">Using task programming to launch kernels in parallel.</a><a id="Using-task-programming-to-launch-kernels-in-parallel.-1"></a><a class="docs-heading-anchor-permalink" href="#Using-task-programming-to-launch-kernels-in-parallel." title="Permalink"></a></h2><p>TODO</p></article><nav class="docs-footer"><a class="docs-footer-prevpage" href="../">« Home</a><a class="docs-footer-nextpage" href="../kernels/">Writing kernels »</a><div class="flexbox-break"></div><p class="footer-message">Powered by <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> and the <a href="https://julialang.org/">Julia Programming Language</a>.</p></nav></div><div class="modal" id="documenter-settings"><div class="modal-background"></div><div class="modal-card"><header class="modal-card-head"><p class="modal-card-title">Settings</p><button class="delete"></button></header><section class="modal-card-body"><p><label class="label">Theme</label><div class="select"><select id="documenter-themepicker"><option value="auto">Automatic (OS)</option><option value="documenter-light">documenter-light</option><option value="documenter-dark">documenter-dark</option><option value="catppuccin-latte">catppuccin-latte</option><option value="catppuccin-frappe">catppuccin-frappe</option><option value="catppuccin-macchiato">catppuccin-macchiato</option><option value="catppuccin-mocha">catppuccin-mocha</option></select></div></p><hr/><p>This document was generated with <a href="https://github.com/JuliaDocs/Documenter.jl">Documenter.jl</a> version 1.8.0 on <span class="colophon-date" title="Thursday 9 January 2025 12:16">Thursday 9 January 2025</span>. Using Julia version 1.11.2.</p></section><footer class="modal-card-foot"></footer></div></div></div></body></html>