diff --git a/dev/_downloads/07fcc19ba03226cd3d83d4e40ec44385/auto_examples_python.zip b/dev/_downloads/07fcc19ba03226cd3d83d4e40ec44385/auto_examples_python.zip
index a5c7a48..a16f398 100644
Binary files a/dev/_downloads/07fcc19ba03226cd3d83d4e40ec44385/auto_examples_python.zip and b/dev/_downloads/07fcc19ba03226cd3d83d4e40ec44385/auto_examples_python.zip differ
diff --git a/dev/_downloads/082e73328a5caf8c1fe9ad7fe05cf68f/plot_incremental_FNO_darcy.ipynb b/dev/_downloads/082e73328a5caf8c1fe9ad7fe05cf68f/plot_incremental_FNO_darcy.ipynb
index eee271e..57d378a 100644
--- a/dev/_downloads/082e73328a5caf8c1fe9ad7fe05cf68f/plot_incremental_FNO_darcy.ipynb
+++ b/dev/_downloads/082e73328a5caf8c1fe9ad7fe05cf68f/plot_incremental_FNO_darcy.ipynb
@@ -197,7 +197,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/0ac9f102e4f1903984e3b4a7d517c88f/plot_darcy_flow.ipynb b/dev/_downloads/0ac9f102e4f1903984e3b4a7d517c88f/plot_darcy_flow.ipynb
index 7c1f97f..356d7d7 100644
--- a/dev/_downloads/0ac9f102e4f1903984e3b4a7d517c88f/plot_darcy_flow.ipynb
+++ b/dev/_downloads/0ac9f102e4f1903984e3b4a7d517c88f/plot_darcy_flow.ipynb
@@ -78,7 +78,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/0d78e075dd52a34e158d7f5f710dfe89/plot_incremental_FNO_darcy.zip b/dev/_downloads/0d78e075dd52a34e158d7f5f710dfe89/plot_incremental_FNO_darcy.zip
new file mode 100644
index 0000000..3aca227
Binary files /dev/null and b/dev/_downloads/0d78e075dd52a34e158d7f5f710dfe89/plot_incremental_FNO_darcy.zip differ
diff --git a/dev/_downloads/1a3050d57a180b92b424ce128dfe1d36/plot_FNO_darcy.py b/dev/_downloads/1a3050d57a180b92b424ce128dfe1d36/plot_FNO_darcy.py
index bccb871..780f857 100644
--- a/dev/_downloads/1a3050d57a180b92b424ce128dfe1d36/plot_FNO_darcy.py
+++ b/dev/_downloads/1a3050d57a180b92b424ce128dfe1d36/plot_FNO_darcy.py
@@ -1,18 +1,19 @@
 """
-Training an FNO on Darcy-Flow
+Training a TFNO on Darcy-Flow
 =============================
 
 In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package
-to train a Fourier-Neural Operator
+to train a Tensorized Fourier-Neural Operator
 """
 
 # %%
 # 
 
+
 import torch
 import matplotlib.pyplot as plt
 import sys
-from neuralop.models import FNO
+from neuralop.models import TFNO
 from neuralop import Trainer
 from neuralop.training import AdamW
 from neuralop.data.datasets import load_darcy_flow_small
@@ -33,13 +34,9 @@
 
 
 # %%
-# We create a simple FNO model
+# We create a tensorized FNO model
 
-model = FNO(n_modes=(16, 16),
-             in_channels=1, 
-             out_channels=1,
-             hidden_channels=32, 
-             projection_channels=64)
+model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)
 model = model.to(device)
 
 n_params = count_model_params(model)
diff --git a/dev/_downloads/20c43dd37baf603889c4dc23e93bdb60/plot_count_flops.zip b/dev/_downloads/20c43dd37baf603889c4dc23e93bdb60/plot_count_flops.zip
new file mode 100644
index 0000000..ce3a659
Binary files /dev/null and b/dev/_downloads/20c43dd37baf603889c4dc23e93bdb60/plot_count_flops.zip differ
diff --git a/dev/_downloads/2a3ecbdce9fd535c53d44cc373f6a228/checkpoint_FNO_darcy.py b/dev/_downloads/2a3ecbdce9fd535c53d44cc373f6a228/checkpoint_FNO_darcy.py
index 44c1797..5665d56 100644
--- a/dev/_downloads/2a3ecbdce9fd535c53d44cc373f6a228/checkpoint_FNO_darcy.py
+++ b/dev/_downloads/2a3ecbdce9fd535c53d44cc373f6a228/checkpoint_FNO_darcy.py
@@ -33,14 +33,7 @@
 # %%
 # We create a tensorized FNO model
 
-model = TFNO(n_modes=(16, 16),
-             in_channels=1, 
-             out_channels=1, 
-             hidden_channels=32, 
-             projection_channels=64, 
-             factorization='tucker', 
-             rank=0.42)
-
+model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)
 model = model.to(device)
 
 n_params = count_model_params(model)
diff --git a/dev/_downloads/3864a2d85c7ce11adeac9580559229ab/plot_darcy_flow.zip b/dev/_downloads/3864a2d85c7ce11adeac9580559229ab/plot_darcy_flow.zip
new file mode 100644
index 0000000..655bdf3
Binary files /dev/null and b/dev/_downloads/3864a2d85c7ce11adeac9580559229ab/plot_darcy_flow.zip differ
diff --git a/dev/_downloads/3faf9d2eaee5cc8e9f1c631c002ce544/plot_darcy_flow_spectrum.zip b/dev/_downloads/3faf9d2eaee5cc8e9f1c631c002ce544/plot_darcy_flow_spectrum.zip
new file mode 100644
index 0000000..ec544d4
Binary files /dev/null and b/dev/_downloads/3faf9d2eaee5cc8e9f1c631c002ce544/plot_darcy_flow_spectrum.zip differ
diff --git a/dev/_downloads/52640fe09fbb5b08e5a2370e57b3b066/checkpoint_FNO_darcy.ipynb b/dev/_downloads/52640fe09fbb5b08e5a2370e57b3b066/checkpoint_FNO_darcy.ipynb
index bf97b3d..38b4850 100644
--- a/dev/_downloads/52640fe09fbb5b08e5a2370e57b3b066/checkpoint_FNO_darcy.ipynb
+++ b/dev/_downloads/52640fe09fbb5b08e5a2370e57b3b066/checkpoint_FNO_darcy.ipynb
@@ -51,7 +51,7 @@
       },
       "outputs": [],
       "source": [
-        "model = TFNO(n_modes=(16, 16),\n             in_channels=1, \n             out_channels=1, \n             hidden_channels=32, \n             projection_channels=64, \n             factorization='tucker', \n             rank=0.42)\n\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
+        "model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
       ]
     },
     {
@@ -154,7 +154,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/5e60095ce99919773daa83384f767e02/plot_SFNO_swe.zip b/dev/_downloads/5e60095ce99919773daa83384f767e02/plot_SFNO_swe.zip
new file mode 100644
index 0000000..a7a7cb2
Binary files /dev/null and b/dev/_downloads/5e60095ce99919773daa83384f767e02/plot_SFNO_swe.zip differ
diff --git a/dev/_downloads/645da00b8fbbb9bb5cae877fd0f31635/plot_FNO_darcy.zip b/dev/_downloads/645da00b8fbbb9bb5cae877fd0f31635/plot_FNO_darcy.zip
new file mode 100644
index 0000000..918ad20
Binary files /dev/null and b/dev/_downloads/645da00b8fbbb9bb5cae877fd0f31635/plot_FNO_darcy.zip differ
diff --git a/dev/_downloads/6f1e7a639e0699d6164445b55e6c116d/auto_examples_jupyter.zip b/dev/_downloads/6f1e7a639e0699d6164445b55e6c116d/auto_examples_jupyter.zip
index 03cc577..84ff71c 100644
Binary files a/dev/_downloads/6f1e7a639e0699d6164445b55e6c116d/auto_examples_jupyter.zip and b/dev/_downloads/6f1e7a639e0699d6164445b55e6c116d/auto_examples_jupyter.zip differ
diff --git a/dev/_downloads/7296405f6df7c2cfe184e9b258cee33e/checkpoint_FNO_darcy.zip b/dev/_downloads/7296405f6df7c2cfe184e9b258cee33e/checkpoint_FNO_darcy.zip
new file mode 100644
index 0000000..195154a
Binary files /dev/null and b/dev/_downloads/7296405f6df7c2cfe184e9b258cee33e/checkpoint_FNO_darcy.zip differ
diff --git a/dev/_downloads/84c435865e4e2910253a980881498782/plot_count_flops.ipynb b/dev/_downloads/84c435865e4e2910253a980881498782/plot_count_flops.ipynb
index f599a65..3b0867c 100644
--- a/dev/_downloads/84c435865e4e2910253a980881498782/plot_count_flops.ipynb
+++ b/dev/_downloads/84c435865e4e2910253a980881498782/plot_count_flops.ipynb
@@ -15,7 +15,7 @@
       },
       "outputs": [],
       "source": [
-        "from copy import deepcopy\nimport torch\nfrom torchtnt.utils.flops import FlopTensorDispatchMode\n\nfrom neuralop.models import FNO\n\ndevice = 'cpu'\n\nfno = FNO(n_modes=(64,64), \n          in_channels=1, \n          out_channels=1, \n          hidden_channels=64, \n          projection_channels=64)\n\nbatch_size = 4\nmodel_input = torch.randn(batch_size, 1, 128, 128)\n\n\nwith FlopTensorDispatchMode(fno) as ftdm:\n    # count forward flops\n    res = fno(model_input).mean()\n    fno_forward_flops = deepcopy(ftdm.flop_counts)\n    \n    ftdm.reset()\n    res.backward()\n    fno_backward_flops = deepcopy(ftdm.flop_counts)"
+        "from copy import deepcopy\nimport torch\nfrom torchtnt.utils.flops import FlopTensorDispatchMode\n\nfrom neuralop.models import FNO\n\ndevice = 'cpu'\n\nfno = FNO(n_modes=(64,64), \n          in_channels=3, \n          out_channels=1, \n          hidden_channels=64, \n          projection_channels=64)\n\nbatch_size = 4\nmodel_input = torch.randn(batch_size, 3, 128, 128)\n\n\nwith FlopTensorDispatchMode(fno) as ftdm:\n    # count forward flops\n    res = fno(model_input).mean()\n    fno_forward_flops = deepcopy(ftdm.flop_counts)\n    \n    ftdm.reset()\n    res.backward()\n    fno_backward_flops = deepcopy(ftdm.flop_counts)"
       ]
     },
     {
@@ -71,7 +71,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/969baa48c90c32befa7c7d2590c8ca42/darcy_data_processor.ipynb b/dev/_downloads/969baa48c90c32befa7c7d2590c8ca42/darcy_data_processor.ipynb
deleted file mode 100644
index dec0ca4..0000000
--- a/dev/_downloads/969baa48c90c32befa7c7d2590c8ca42/darcy_data_processor.ipynb
+++ /dev/null
@@ -1,72 +0,0 @@
-{
-  "cells": [
-    {
-      "cell_type": "markdown",
-      "metadata": {},
-      "source": [
-        "\n# Data Processors\n\nIn this example, we demonstrate how to use neuralop.data.transforms.DataProcessor\nto preprocess and postprocess the small Darcy Flow example we ship with the package\nfor downstream use in training a neural operator model. \n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "collapsed": false
-      },
-      "outputs": [],
-      "source": [
-        "import torch\nimport matplotlib.pyplot as plt\nimport sys\nfrom neuralop.models import TFNO\nfrom neuralop import Trainer\nfrom neuralop.training import CheckpointCallback\nfrom neuralop.data.datasets import load_darcy_flow_small\nfrom neuralop.utils import count_model_params\nfrom neuralop import LpLoss, H1Loss\n\ndevice = 'cpu'\n\n\"\"\"\nFirst, let's load the small Darcy Flow dataset:\n\"\"\""
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {},
-      "source": [
-        "Loading the Navier-Stokes dataset in 128x128 resolution\n\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "collapsed": false
-      },
-      "outputs": [],
-      "source": [
-        "train_loader, test_loaders, data_processor = load_darcy_flow_small(\n        n_train=1000, batch_size=32, \n        test_resolutions=[16, 32], n_tests=[100, 50],\n        test_batch_sizes=[32, 32],\n        data_root=\"../neuralop/data/datasets/data/\"\n)"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "collapsed": false
-      },
-      "outputs": [],
-      "source": [
-        "\"\"\"\nNext let's visualize the data in its raw form.\n\"\"\""
-      ]
-    }
-  ],
-  "metadata": {
-    "kernelspec": {
-      "display_name": "Python 3",
-      "language": "python",
-      "name": "python3"
-    },
-    "language_info": {
-      "codemirror_mode": {
-        "name": "ipython",
-        "version": 3
-      },
-      "file_extension": ".py",
-      "mimetype": "text/x-python",
-      "name": "python",
-      "nbconvert_exporter": "python",
-      "pygments_lexer": "ipython3",
-      "version": "3.10.14"
-    }
-  },
-  "nbformat": 4,
-  "nbformat_minor": 0
-}
\ No newline at end of file
diff --git a/dev/_downloads/af3a515d2684655c6a5a8e0df87a4cf9/plot_SFNO_swe.ipynb b/dev/_downloads/af3a515d2684655c6a5a8e0df87a4cf9/plot_SFNO_swe.ipynb
index 678da75..e66e6b2 100644
--- a/dev/_downloads/af3a515d2684655c6a5a8e0df87a4cf9/plot_SFNO_swe.ipynb
+++ b/dev/_downloads/af3a515d2684655c6a5a8e0df87a4cf9/plot_SFNO_swe.ipynb
@@ -51,7 +51,7 @@
       },
       "outputs": [],
       "source": [
-        "model = SFNO(n_modes=(32, 32),\n             in_channels=3,\n             out_channels=3,\n             hidden_channels=32,\n             projection_channels=64,\n             factorization='dense')\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
+        "model = SFNO(n_modes=(32, 32), in_channels=3, out_channels=3, hidden_channels=32, projection_channels=64, factorization='dense')\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
       ]
     },
     {
@@ -172,7 +172,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/b84984d89c00aa83f7c56c96a61b8aee/darcy_data_processor.py b/dev/_downloads/b84984d89c00aa83f7c56c96a61b8aee/darcy_data_processor.py
deleted file mode 100644
index 14cce33..0000000
--- a/dev/_downloads/b84984d89c00aa83f7c56c96a61b8aee/darcy_data_processor.py
+++ /dev/null
@@ -1,39 +0,0 @@
-"""
-Data Processors
-=============================
-
-In this example, we demonstrate how to use neuralop.data.transforms.DataProcessor
-to preprocess and postprocess the small Darcy Flow example we ship with the package
-for downstream use in training a neural operator model. 
-"""
-
-# %%
-# 
-import torch
-import matplotlib.pyplot as plt
-import sys
-from neuralop.models import TFNO
-from neuralop import Trainer
-from neuralop.training import CheckpointCallback
-from neuralop.data.datasets import load_darcy_flow_small
-from neuralop.utils import count_model_params
-from neuralop import LpLoss, H1Loss
-
-device = 'cpu'
-
-"""
-First, let's load the small Darcy Flow dataset:
-"""
-# %%
-# Loading the Navier-Stokes dataset in 128x128 resolution
-train_loader, test_loaders, data_processor = load_darcy_flow_small(
-        n_train=1000, batch_size=32, 
-        test_resolutions=[16, 32], n_tests=[100, 50],
-        test_batch_sizes=[32, 32],
-        data_root="../neuralop/data/datasets/data/"
-)
-
-# %%
-"""
-Next let's visualize the data in its raw form.
-"""
\ No newline at end of file
diff --git a/dev/_downloads/be42c4c413e9b89016fa3a4984cb9758/plot_SFNO_swe.py b/dev/_downloads/be42c4c413e9b89016fa3a4984cb9758/plot_SFNO_swe.py
index 64cd52c..cdafa52 100644
--- a/dev/_downloads/be42c4c413e9b89016fa3a4984cb9758/plot_SFNO_swe.py
+++ b/dev/_downloads/be42c4c413e9b89016fa3a4984cb9758/plot_SFNO_swe.py
@@ -31,12 +31,7 @@
 # %%
 # We create a tensorized FNO model
 
-model = SFNO(n_modes=(32, 32),
-             in_channels=3,
-             out_channels=3,
-             hidden_channels=32,
-             projection_channels=64,
-             factorization='dense')
+model = SFNO(n_modes=(32, 32), in_channels=3, out_channels=3, hidden_channels=32, projection_channels=64, factorization='dense')
 model = model.to(device)
 
 n_params = count_model_params(model)
diff --git a/dev/_downloads/c628421a5214dc8f1b3bde8be930715f/plot_darcy_flow_spectrum.ipynb b/dev/_downloads/c628421a5214dc8f1b3bde8be930715f/plot_darcy_flow_spectrum.ipynb
index a422a26..057afa9 100644
--- a/dev/_downloads/c628421a5214dc8f1b3bde8be930715f/plot_darcy_flow_spectrum.ipynb
+++ b/dev/_downloads/c628421a5214dc8f1b3bde8be930715f/plot_darcy_flow_spectrum.ipynb
@@ -107,7 +107,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/cefc537c5730a6b3e916b83c1fd313d6/plot_UNO_darcy.zip b/dev/_downloads/cefc537c5730a6b3e916b83c1fd313d6/plot_UNO_darcy.zip
new file mode 100644
index 0000000..2f9149d
Binary files /dev/null and b/dev/_downloads/cefc537c5730a6b3e916b83c1fd313d6/plot_UNO_darcy.zip differ
diff --git a/dev/_downloads/de69282d3144c5a2b675c6f6338237c1/plot_count_flops.py b/dev/_downloads/de69282d3144c5a2b675c6f6338237c1/plot_count_flops.py
index 804156a..b8336de 100644
--- a/dev/_downloads/de69282d3144c5a2b675c6f6338237c1/plot_count_flops.py
+++ b/dev/_downloads/de69282d3144c5a2b675c6f6338237c1/plot_count_flops.py
@@ -19,13 +19,13 @@
 device = 'cpu'
 
 fno = FNO(n_modes=(64,64), 
-          in_channels=1, 
+          in_channels=3, 
           out_channels=1, 
           hidden_channels=64, 
           projection_channels=64)
 
 batch_size = 4
-model_input = torch.randn(batch_size, 1, 128, 128)
+model_input = torch.randn(batch_size, 3, 128, 128)
 
 
 with FlopTensorDispatchMode(fno) as ftdm:
diff --git a/dev/_downloads/e81e8f640b2a3cda84c542bbc8f36a54/plot_FNO_darcy.ipynb b/dev/_downloads/e81e8f640b2a3cda84c542bbc8f36a54/plot_FNO_darcy.ipynb
index 4e68904..50ffcf5 100644
--- a/dev/_downloads/e81e8f640b2a3cda84c542bbc8f36a54/plot_FNO_darcy.ipynb
+++ b/dev/_downloads/e81e8f640b2a3cda84c542bbc8f36a54/plot_FNO_darcy.ipynb
@@ -4,7 +4,7 @@
       "cell_type": "markdown",
       "metadata": {},
       "source": [
-        "\n# Training an FNO on Darcy-Flow\n\nIn this example, we demonstrate how to use the small Darcy-Flow example we ship with the package\nto train a Fourier-Neural Operator\n"
+        "\n# Training a TFNO on Darcy-Flow\n\nIn this example, we demonstrate how to use the small Darcy-Flow example we ship with the package\nto train a Tensorized Fourier-Neural Operator\n"
       ]
     },
     {
@@ -15,7 +15,7 @@
       },
       "outputs": [],
       "source": [
-        "import torch\nimport matplotlib.pyplot as plt\nimport sys\nfrom neuralop.models import FNO\nfrom neuralop import Trainer\nfrom neuralop.training import AdamW\nfrom neuralop.data.datasets import load_darcy_flow_small\nfrom neuralop.utils import count_model_params\nfrom neuralop import LpLoss, H1Loss\n\ndevice = 'cpu'"
+        "import torch\nimport matplotlib.pyplot as plt\nimport sys\nfrom neuralop.models import TFNO\nfrom neuralop import Trainer\nfrom neuralop.training import AdamW\nfrom neuralop.data.datasets import load_darcy_flow_small\nfrom neuralop.utils import count_model_params\nfrom neuralop import LpLoss, H1Loss\n\ndevice = 'cpu'"
       ]
     },
     {
@@ -40,7 +40,7 @@
       "cell_type": "markdown",
       "metadata": {},
       "source": [
-        "We create a simple FNO model\n\n"
+        "We create a tensorized FNO model\n\n"
       ]
     },
     {
@@ -51,7 +51,7 @@
       },
       "outputs": [],
       "source": [
-        "model = FNO(n_modes=(16, 16),\n             in_channels=1, \n             out_channels=1,\n             hidden_channels=32, \n             projection_channels=64)\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
+        "model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
       ]
     },
     {
@@ -172,7 +172,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/ecc34f03fb30bee651bda959149422c4/plot_UNO_darcy.ipynb b/dev/_downloads/ecc34f03fb30bee651bda959149422c4/plot_UNO_darcy.ipynb
index 009da75..d004b54 100644
--- a/dev/_downloads/ecc34f03fb30bee651bda959149422c4/plot_UNO_darcy.ipynb
+++ b/dev/_downloads/ecc34f03fb30bee651bda959149422c4/plot_UNO_darcy.ipynb
@@ -33,7 +33,7 @@
       },
       "outputs": [],
       "source": [
-        "train_loader, test_loaders, data_processor = load_darcy_flow_small(\n        n_train=1000, batch_size=32, \n        test_resolutions=[16, 32], n_tests=[100, 50],\n        test_batch_sizes=[32, 32],\n)\n\nmodel = UNO(in_channels=1, \n            out_channels=1, \n            hidden_channels=64, \n            projection_channels=64,\n            uno_out_channels=[32,64,64,64,32],\n            uno_n_modes=[[16,16],[8,8],[8,8],[8,8],[16,16]],\n            uno_scalings=[[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],\n            horizontal_skips_map=None,\n            channel_mlp_skip=\"linear\",\n            n_layers = 5,\n            domain_padding=0.2)\n\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
+        "train_loader, test_loaders, data_processor = load_darcy_flow_small(\n        n_train=1000, batch_size=32, \n        test_resolutions=[16, 32], n_tests=[100, 50],\n        test_batch_sizes=[32, 32],\n)\n\n\n\nmodel = UNO(in_channels=1, out_channels=1, hidden_channels=64, projection_channels=64,uno_out_channels = [32,64,64,64,32], \\\n            uno_n_modes= [[16,16],[8,8],[8,8],[8,8],[16,16]], uno_scalings=  [[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],\\\n            horizontal_skips_map = None, n_layers = 5, domain_padding = 0.2)\nmodel = model.to(device)\n\nn_params = count_model_params(model)\nprint(f'\\nOur model has {n_params} parameters.')\nsys.stdout.flush()"
       ]
     },
     {
@@ -154,7 +154,7 @@
       "name": "python",
       "nbconvert_exporter": "python",
       "pygments_lexer": "ipython3",
-      "version": "3.10.14"
+      "version": "3.9.19"
     }
   },
   "nbformat": 4,
diff --git a/dev/_downloads/f9c1e50d48828a746410d5400feb61f7/plot_UNO_darcy.py b/dev/_downloads/f9c1e50d48828a746410d5400feb61f7/plot_UNO_darcy.py
index f941551..a91cb27 100644
--- a/dev/_downloads/f9c1e50d48828a746410d5400feb61f7/plot_UNO_darcy.py
+++ b/dev/_downloads/f9c1e50d48828a746410d5400feb61f7/plot_UNO_darcy.py
@@ -31,18 +31,11 @@
         test_batch_sizes=[32, 32],
 )
 
-model = UNO(in_channels=1, 
-            out_channels=1, 
-            hidden_channels=64, 
-            projection_channels=64,
-            uno_out_channels=[32,64,64,64,32],
-            uno_n_modes=[[16,16],[8,8],[8,8],[8,8],[16,16]],
-            uno_scalings=[[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],
-            horizontal_skips_map=None,
-            channel_mlp_skip="linear",
-            n_layers = 5,
-            domain_padding=0.2)
 
+
+model = UNO(in_channels=1, out_channels=1, hidden_channels=64, projection_channels=64,uno_out_channels = [32,64,64,64,32], \
+            uno_n_modes= [[16,16],[8,8],[8,8],[8,8],[16,16]], uno_scalings=  [[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],\
+            horizontal_skips_map = None, n_layers = 5, domain_padding = 0.2)
 model = model.to(device)
 
 n_params = count_model_params(model)
diff --git a/dev/_images/sphx_glr_plot_FNO_darcy_001.png b/dev/_images/sphx_glr_plot_FNO_darcy_001.png
index b2375ab..2b56d68 100644
Binary files a/dev/_images/sphx_glr_plot_FNO_darcy_001.png and b/dev/_images/sphx_glr_plot_FNO_darcy_001.png differ
diff --git a/dev/_images/sphx_glr_plot_FNO_darcy_thumb.png b/dev/_images/sphx_glr_plot_FNO_darcy_thumb.png
index 06497d0..6d50e89 100644
Binary files a/dev/_images/sphx_glr_plot_FNO_darcy_thumb.png and b/dev/_images/sphx_glr_plot_FNO_darcy_thumb.png differ
diff --git a/dev/_images/sphx_glr_plot_SFNO_swe_001.png b/dev/_images/sphx_glr_plot_SFNO_swe_001.png
index 80668fd..c4e7f0e 100644
Binary files a/dev/_images/sphx_glr_plot_SFNO_swe_001.png and b/dev/_images/sphx_glr_plot_SFNO_swe_001.png differ
diff --git a/dev/_images/sphx_glr_plot_SFNO_swe_thumb.png b/dev/_images/sphx_glr_plot_SFNO_swe_thumb.png
index 8225626..cb54f81 100644
Binary files a/dev/_images/sphx_glr_plot_SFNO_swe_thumb.png and b/dev/_images/sphx_glr_plot_SFNO_swe_thumb.png differ
diff --git a/dev/_images/sphx_glr_plot_UNO_darcy_001.png b/dev/_images/sphx_glr_plot_UNO_darcy_001.png
index 627b188..c8a2a58 100644
Binary files a/dev/_images/sphx_glr_plot_UNO_darcy_001.png and b/dev/_images/sphx_glr_plot_UNO_darcy_001.png differ
diff --git a/dev/_images/sphx_glr_plot_UNO_darcy_thumb.png b/dev/_images/sphx_glr_plot_UNO_darcy_thumb.png
index 13a6cea..00e8f86 100644
Binary files a/dev/_images/sphx_glr_plot_UNO_darcy_thumb.png and b/dev/_images/sphx_glr_plot_UNO_darcy_thumb.png differ
diff --git a/dev/_images/sphx_glr_plot_count_flops_thumb.png b/dev/_images/sphx_glr_plot_count_flops_thumb.png
index b06c4e6..8a5fed5 100644
Binary files a/dev/_images/sphx_glr_plot_count_flops_thumb.png and b/dev/_images/sphx_glr_plot_count_flops_thumb.png differ
diff --git a/dev/_images/sphx_glr_plot_darcy_flow_001.png b/dev/_images/sphx_glr_plot_darcy_flow_001.png
index d2c951f..00fb270 100644
Binary files a/dev/_images/sphx_glr_plot_darcy_flow_001.png and b/dev/_images/sphx_glr_plot_darcy_flow_001.png differ
diff --git a/dev/_images/sphx_glr_plot_darcy_flow_spectrum_001.png b/dev/_images/sphx_glr_plot_darcy_flow_spectrum_001.png
index f64ec42..6391301 100644
Binary files a/dev/_images/sphx_glr_plot_darcy_flow_spectrum_001.png and b/dev/_images/sphx_glr_plot_darcy_flow_spectrum_001.png differ
diff --git a/dev/_images/sphx_glr_plot_incremental_FNO_darcy_001.png b/dev/_images/sphx_glr_plot_incremental_FNO_darcy_001.png
index 5ca6b9b..bd21717 100644
Binary files a/dev/_images/sphx_glr_plot_incremental_FNO_darcy_001.png and b/dev/_images/sphx_glr_plot_incremental_FNO_darcy_001.png differ
diff --git a/dev/_images/sphx_glr_plot_incremental_FNO_darcy_thumb.png b/dev/_images/sphx_glr_plot_incremental_FNO_darcy_thumb.png
index 0376d5d..dfa2561 100644
Binary files a/dev/_images/sphx_glr_plot_incremental_FNO_darcy_thumb.png and b/dev/_images/sphx_glr_plot_incremental_FNO_darcy_thumb.png differ
diff --git a/dev/_modules/index.html b/dev/_modules/index.html
index 9700acb..849ca00 100644
--- a/dev/_modules/index.html
+++ b/dev/_modules/index.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -115,7 +115,6 @@
   <h1>All modules for which code is available</h1>
 <ul><li><a href="neuralop/data/datasets/darcy.html">neuralop.data.datasets.darcy</a></li>
 <li><a href="neuralop/data/transforms/data_processors.html">neuralop.data.transforms.data_processors</a></li>
-<li><a href="neuralop/layers/embeddings.html">neuralop.layers.embeddings</a></li>
 <li><a href="neuralop/layers/integral_transform.html">neuralop.layers.integral_transform</a></li>
 <li><a href="neuralop/layers/neighbor_search.html">neuralop.layers.neighbor_search</a></li>
 <li><a href="neuralop/layers/padding.html">neuralop.layers.padding</a></li>
diff --git a/dev/_modules/neuralop/data/datasets/darcy.html b/dev/_modules/neuralop/data/datasets/darcy.html
index 7b00334..e9a025b 100644
--- a/dev/_modules/neuralop/data/datasets/darcy.html
+++ b/dev/_modules/neuralop/data/datasets/darcy.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/data/transforms/data_processors.html b/dev/_modules/neuralop/data/transforms/data_processors.html
index e33ab1d..1daa7b6 100644
--- a/dev/_modules/neuralop/data/transforms/data_processors.html
+++ b/dev/_modules/neuralop/data/transforms/data_processors.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/layers/embeddings.html b/dev/_modules/neuralop/layers/embeddings.html
deleted file mode 100644
index 1e69657..0000000
--- a/dev/_modules/neuralop/layers/embeddings.html
+++ /dev/null
@@ -1,455 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>neuralop.layers.embeddings &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../../index.html">
-            <img src="../../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../../../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-
-      <div class="container content main-content">
-        
-  <h1>Source code for neuralop.layers.embeddings</h1><div class="highlight"><pre>
-<span></span><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">List</span>
-
-<span class="kn">import</span> <span class="nn">torch</span>
-<span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
-
-<div class="viewcode-block" id="GridEmbedding2D">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D">[docs]</a>
-<span class="k">class</span> <span class="nc">GridEmbedding2D</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;A simple positional embedding as a regular 2D grid</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">grid_boundaries</span><span class="o">=</span><span class="p">[[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">]]):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;GridEmbedding2D applies a simple positional </span>
-<span class="sd">        embedding as a regular 2D grid</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        grid_boundaries : list, optional</span>
-<span class="sd">            coordinate boundaries of input grid, by default [[0, 1], [0, 1]]</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">grid_boundaries</span> <span class="o">=</span> <span class="n">grid_boundaries</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="o">=</span> <span class="kc">None</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="kc">None</span>
-
-<div class="viewcode-block" id="GridEmbedding2D.grid">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D.grid">[docs]</a>
-    <span class="k">def</span> <span class="nf">grid</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">spatial_dims</span><span class="p">,</span> <span class="n">device</span><span class="p">,</span> <span class="n">dtype</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;grid generates 2D grid needed for pos encoding</span>
-<span class="sd">        and caches the grid associated with MRU resolution</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        spatial_dims : torch.size</span>
-<span class="sd">             sizes of spatial resolution</span>
-<span class="sd">        device : literal &#39;cpu&#39; or &#39;cuda:*&#39;</span>
-<span class="sd">            where to load data</span>
-<span class="sd">        dtype : str</span>
-<span class="sd">            dtype to encode data</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        torch.tensor</span>
-<span class="sd">            output grids to concatenate </span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># handle case of multiple train resolutions</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">!=</span> <span class="n">spatial_dims</span><span class="p">:</span> 
-            <span class="n">grid_x</span><span class="p">,</span> <span class="n">grid_y</span> <span class="o">=</span> <span class="n">regular_grid_2d</span><span class="p">(</span><span class="n">spatial_dims</span><span class="p">,</span>
-                                      <span class="n">grid_boundaries</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">grid_boundaries</span><span class="p">)</span>
-            <span class="n">grid_x</span> <span class="o">=</span> <span class="n">grid_x</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">dtype</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-            <span class="n">grid_y</span> <span class="o">=</span> <span class="n">grid_y</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">dtype</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="o">=</span> <span class="n">grid_x</span><span class="p">,</span> <span class="n">grid_y</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">spatial_dims</span>
-
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span></div>
-
-
-<div class="viewcode-block" id="GridEmbedding2D.forward">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">,</span> <span class="n">batched</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">batched</span><span class="p">:</span>
-            <span class="k">if</span> <span class="n">data</span><span class="o">.</span><span class="n">ndim</span> <span class="o">==</span> <span class="mi">3</span><span class="p">:</span>
-                <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">grid</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">:],</span> <span class="n">data</span><span class="o">.</span><span class="n">device</span><span class="p">,</span> <span class="n">data</span><span class="o">.</span><span class="n">dtype</span><span class="p">)</span>
-        <span class="n">out</span> <span class="o">=</span>  <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">data</span><span class="p">,</span> <span class="n">x</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">),</span>
-                          <span class="n">y</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">)),</span>
-                         <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="c1"># in the unbatched case, the dataloader will stack N </span>
-        <span class="c1"># examples with no batch dim to create one</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">batched</span> <span class="ow">and</span> <span class="n">batch_size</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span> 
-            <span class="k">return</span> <span class="n">out</span><span class="o">.</span><span class="n">squeeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="k">return</span> <span class="n">out</span></div>
-</div>
-
-
-<div class="viewcode-block" id="GridEmbeddingND">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND">[docs]</a>
-<span class="k">class</span> <span class="nc">GridEmbeddingND</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;A positional embedding as a regular ND grid</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dim</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">grid_boundaries</span><span class="o">=</span><span class="p">[[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">]]):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;GridEmbeddingND applies a simple positional </span>
-<span class="sd">        embedding as a regular ND grid</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        dim: int</span>
-<span class="sd">            dimensions of positional encoding to apply</span>
-<span class="sd">        grid_boundaries : list, optional</span>
-<span class="sd">            coordinate boundaries of input grid along each dim, by default [[0, 1], [0, 1]]</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">dim</span> <span class="o">=</span> <span class="n">dim</span>
-        <span class="k">assert</span> <span class="bp">self</span><span class="o">.</span><span class="n">dim</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">grid_boundaries</span><span class="p">),</span> <span class="sa">f</span><span class="s2">&quot;Error: expected grid_boundaries to be</span><span class="se">\</span>
-<span class="s2">            an iterable of length </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">dim</span><span class="si">}</span><span class="s2">, received </span><span class="si">{</span><span class="n">grid_boundaries</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">grid_boundaries</span> <span class="o">=</span> <span class="n">grid_boundaries</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="o">=</span> <span class="kc">None</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="kc">None</span>
-
-<div class="viewcode-block" id="GridEmbeddingND.grid">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND.grid">[docs]</a>
-    <span class="k">def</span> <span class="nf">grid</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">spatial_dims</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Size</span><span class="p">,</span> <span class="n">device</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">dtype</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">dtype</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;grid generates ND grid needed for pos encoding</span>
-<span class="sd">        and caches the grid associated with MRU resolution</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        spatial_dims : torch.Size</span>
-<span class="sd">             sizes of spatial resolution</span>
-<span class="sd">        device : literal &#39;cpu&#39; or &#39;cuda:*&#39;</span>
-<span class="sd">            where to load data</span>
-<span class="sd">        dtype : str</span>
-<span class="sd">            dtype to encode data</span>
-
-<span class="sd">        Returns</span>
-<span class="sd">        -------</span>
-<span class="sd">        torch.tensor</span>
-<span class="sd">            output grids to concatenate </span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># handle case of multiple train resolutions</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="ow">is</span> <span class="kc">None</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">!=</span> <span class="n">spatial_dims</span><span class="p">:</span> 
-            <span class="n">grids_by_dim</span> <span class="o">=</span> <span class="n">regular_grid_nd</span><span class="p">(</span><span class="n">spatial_dims</span><span class="p">,</span>
-                                      <span class="n">grid_boundaries</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">grid_boundaries</span><span class="p">)</span>
-            <span class="c1"># add batch, channel dims</span>
-            <span class="n">grids_by_dim</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">dtype</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">grids_by_dim</span><span class="p">]</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span> <span class="o">=</span> <span class="n">grids_by_dim</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_res</span> <span class="o">=</span> <span class="n">spatial_dims</span>
-
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_grid</span></div>
-
-
-<div class="viewcode-block" id="GridEmbeddingND.forward">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">,</span> <span class="n">batched</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Params</span>
-<span class="sd">        --------</span>
-<span class="sd">        data: torch.Tensor</span>
-<span class="sd">            assumes shape batch (optional), channels, x_1, x_2, ...x_n</span>
-<span class="sd">        batched: bool</span>
-<span class="sd">            whether data has a batch dim</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="c1"># add batch dim if it doesn&#39;t exist</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">batched</span><span class="p">:</span>
-            <span class="k">if</span> <span class="n">data</span><span class="o">.</span><span class="n">ndim</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">dim</span> <span class="o">+</span> <span class="mi">1</span><span class="p">:</span>
-                <span class="n">data</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="n">grids</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">grid</span><span class="p">(</span><span class="n">spatial_dims</span><span class="o">=</span><span class="n">data</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:],</span>
-                          <span class="n">device</span><span class="o">=</span><span class="n">data</span><span class="o">.</span><span class="n">device</span><span class="p">,</span>
-                          <span class="n">dtype</span><span class="o">=</span><span class="n">data</span><span class="o">.</span><span class="n">dtype</span><span class="p">)</span>
-        <span class="n">grids</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">*</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dim</span><span class="o">+</span><span class="mi">1</span><span class="p">))</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">grids</span><span class="p">]</span>
-        <span class="n">out</span> <span class="o">=</span>  <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">data</span><span class="p">,</span> <span class="o">*</span><span class="n">grids</span><span class="p">),</span>
-                         <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">out</span></div>
-</div>
-
-    
-<div class="viewcode-block" id="SinusoidalEmbedding2D">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html#neuralop.layers.embeddings.SinusoidalEmbedding2D">[docs]</a>
-<span class="k">class</span> <span class="nc">SinusoidalEmbedding2D</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">num_channels</span><span class="p">,</span> <span class="n">max_positions</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span> <span class="n">endpoint</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;SinusoidalEmbedding2D applies a 2d sinusoidal positional encoding </span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        num_channels : int</span>
-<span class="sd">            number of input channels</span>
-<span class="sd">        max_positions : int, optional</span>
-<span class="sd">            maximum positions to encode, by default 10000</span>
-<span class="sd">        endpoint : bool, optional</span>
-<span class="sd">            whether to set endpoint, by default False</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">num_channels</span> <span class="o">=</span> <span class="n">num_channels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">max_positions</span> <span class="o">=</span> <span class="n">max_positions</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">endpoint</span> <span class="o">=</span> <span class="n">endpoint</span>
-
-<div class="viewcode-block" id="SinusoidalEmbedding2D.forward">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html#neuralop.layers.embeddings.SinusoidalEmbedding2D.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
-        <span class="n">freqs</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span>
-            <span class="n">start</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">num_channels</span> <span class="o">//</span> <span class="mi">2</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">x</span><span class="o">.</span><span class="n">device</span>
-        <span class="p">)</span>
-        <span class="n">freqs</span> <span class="o">=</span> <span class="n">freqs</span> <span class="o">/</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">num_channels</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">-</span> <span class="p">(</span><span class="mi">1</span> <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">endpoint</span> <span class="k">else</span> <span class="mi">0</span><span class="p">))</span>
-        <span class="n">freqs</span> <span class="o">=</span> <span class="p">(</span><span class="mi">1</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">max_positions</span><span class="p">)</span> <span class="o">**</span> <span class="n">freqs</span>
-        <span class="n">x</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">ger</span><span class="p">(</span><span class="n">freqs</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">dtype</span><span class="p">))</span>
-        <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">([</span><span class="n">x</span><span class="o">.</span><span class="n">cos</span><span class="p">(),</span> <span class="n">x</span><span class="o">.</span><span class="n">sin</span><span class="p">()],</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">x</span></div>
-</div>
-
-
-
-<span class="k">class</span> <span class="nc">RotaryEmbedding2D</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="n">min_freq</span><span class="o">=</span><span class="mi">1</span><span class="o">/</span><span class="mi">64</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mf">1.</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Applying rotary positional embedding (https://arxiv.org/abs/2104.09864) to the input feature tensor.</span>
-<span class="sd">        The crux is the dot product of two rotation matrices R(theta1) and R(theta2) is equal to R(theta2 - theta1).</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="n">inv_freq</span> <span class="o">=</span> <span class="mf">1.</span> <span class="o">/</span> <span class="p">(</span><span class="mi">10000</span> <span class="o">**</span> <span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">dim</span><span class="p">,</span> <span class="mi">2</span><span class="p">)</span><span class="o">.</span><span class="n">float</span><span class="p">()</span> <span class="o">/</span> <span class="n">dim</span><span class="p">))</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">min_freq</span> <span class="o">=</span> <span class="n">min_freq</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">scale</span> <span class="o">=</span> <span class="n">scale</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s1">&#39;inv_freq&#39;</span><span class="p">,</span> <span class="n">inv_freq</span><span class="p">,</span> <span class="n">persistent</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">coordinates</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;coordinates is tensor of [batch_size, num_points]&quot;&quot;&quot;</span>
-        <span class="n">coordinates</span> <span class="o">=</span> <span class="n">coordinates</span> <span class="o">*</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">scale</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">min_freq</span><span class="p">)</span>
-        <span class="n">freqs</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">einsum</span><span class="p">(</span><span class="s1">&#39;... i , j -&gt; ... i j&#39;</span><span class="p">,</span> <span class="n">coordinates</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">inv_freq</span><span class="p">)</span>  <span class="c1"># [b, n, d//2]</span>
-        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">freqs</span><span class="p">,</span> <span class="n">freqs</span><span class="p">),</span> <span class="n">dim</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>  <span class="c1"># [b, n, d]</span>
-
-    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">apply_1d_rotary_pos_emb</span><span class="p">(</span><span class="n">t</span><span class="p">,</span> <span class="n">freqs</span><span class="p">):</span>
-        <span class="k">return</span> <span class="n">apply_rotary_pos_emb</span><span class="p">(</span><span class="n">t</span><span class="p">,</span> <span class="n">freqs</span><span class="p">)</span>
-
-    <span class="nd">@staticmethod</span>
-    <span class="k">def</span> <span class="nf">apply_2d_rotary_pos_emb</span><span class="p">(</span><span class="n">t</span><span class="p">,</span> <span class="n">freqs_x</span><span class="p">,</span> <span class="n">freqs_y</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Split the last dimension of features into two equal halves</span>
-<span class="sd">           and apply 1d rotary positional embedding to each half.&quot;&quot;&quot;</span>
-        <span class="n">d</span> <span class="o">=</span> <span class="n">t</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-        <span class="n">t_x</span><span class="p">,</span> <span class="n">t_y</span> <span class="o">=</span> <span class="n">t</span><span class="p">[</span><span class="o">...</span><span class="p">,</span> <span class="p">:</span><span class="n">d</span><span class="o">//</span><span class="mi">2</span><span class="p">],</span> <span class="n">t</span><span class="p">[</span><span class="o">...</span><span class="p">,</span> <span class="n">d</span><span class="o">//</span><span class="mi">2</span><span class="p">:]</span>
-
-        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">apply_rotary_pos_emb</span><span class="p">(</span><span class="n">t_x</span><span class="p">,</span> <span class="n">freqs_x</span><span class="p">),</span>
-                          <span class="n">apply_rotary_pos_emb</span><span class="p">(</span><span class="n">t_y</span><span class="p">,</span> <span class="n">freqs_y</span><span class="p">)),</span> <span class="n">dim</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
-    
-
-<span class="c1"># Utility functions for GridEmbedding</span>
-<span class="k">def</span> <span class="nf">regular_grid_2d</span><span class="p">(</span><span class="n">spatial_dims</span><span class="p">,</span> <span class="n">grid_boundaries</span><span class="o">=</span><span class="p">[[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">]]):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Creates a 2 x height x width stack of positional encodings A, where</span>
-<span class="sd">    A[:,i,j] = [[x,y]] at coordinate (i,j) on a (height, width) grid. </span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">spatial_dims</span>
-
-    <span class="n">xt</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="n">grid_boundaries</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">],</span> <span class="n">grid_boundaries</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">1</span><span class="p">],</span>
-                        <span class="n">height</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-    <span class="n">yt</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="n">grid_boundaries</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="mi">0</span><span class="p">],</span> <span class="n">grid_boundaries</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="mi">1</span><span class="p">],</span>
-                        <span class="n">width</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-
-    <span class="n">grid_x</span><span class="p">,</span> <span class="n">grid_y</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">meshgrid</span><span class="p">(</span><span class="n">xt</span><span class="p">,</span> <span class="n">yt</span><span class="p">,</span> <span class="n">indexing</span><span class="o">=</span><span class="s1">&#39;ij&#39;</span><span class="p">)</span>
-
-    <span class="n">grid_x</span> <span class="o">=</span> <span class="n">grid_x</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-    <span class="n">grid_y</span> <span class="o">=</span> <span class="n">grid_y</span><span class="o">.</span><span class="n">repeat</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-
-    <span class="k">return</span> <span class="n">grid_x</span><span class="p">,</span> <span class="n">grid_y</span>
-
-<span class="k">def</span> <span class="nf">regular_grid_nd</span><span class="p">(</span><span class="n">resolutions</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span> <span class="n">grid_boundaries</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span><span class="o">=</span><span class="p">[[</span><span class="mi">0</span><span class="p">,</span><span class="mi">1</span><span class="p">]]</span> <span class="o">*</span> <span class="mi">2</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;regular_grid_nd generates a tensor of coordinate points that </span>
-<span class="sd">    describe a bounded regular grid.</span>
-<span class="sd">    </span>
-<span class="sd">    Creates a dim x res_d1 x ... x res_dn stack of positional encodings A, where</span>
-<span class="sd">    A[:,c1,c2,...] = [[d1,d2,...dn]] at coordinate (c1,c2,...cn) on a (res_d1, ...res_dn) grid. </span>
-
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    resolutions : List[int]</span>
-<span class="sd">        resolution of the output grid along each dimension</span>
-<span class="sd">    grid_boundaries : List[List[int]], optional</span>
-<span class="sd">        List of pairs [start, end] of the boundaries of the</span>
-<span class="sd">        regular grid. Must correspond 1-to-1 with resolutions default [[0,1], [0,1]]</span>
-
-<span class="sd">    Returns</span>
-<span class="sd">    -------</span>
-<span class="sd">    grid: tuple(Tensor)</span>
-<span class="sd">    list of tensors describing positional encoding </span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">assert</span> <span class="nb">len</span><span class="p">(</span><span class="n">resolutions</span><span class="p">)</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">grid_boundaries</span><span class="p">),</span> <span class="s2">&quot;Error: inputs must have same number of dimensions&quot;</span>
-    <span class="n">dim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">resolutions</span><span class="p">)</span>
-
-    <span class="n">meshgrid_inputs</span> <span class="o">=</span> <span class="nb">list</span><span class="p">()</span>
-    <span class="k">for</span> <span class="n">res</span><span class="p">,</span> <span class="p">(</span><span class="n">start</span><span class="p">,</span><span class="n">stop</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">resolutions</span><span class="p">,</span> <span class="n">grid_boundaries</span><span class="p">):</span>
-        <span class="n">meshgrid_inputs</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="n">start</span><span class="p">,</span> <span class="n">stop</span><span class="p">,</span> <span class="n">res</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)[:</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
-    <span class="n">grid</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">meshgrid</span><span class="p">(</span><span class="o">*</span><span class="n">meshgrid_inputs</span><span class="p">,</span> <span class="n">indexing</span><span class="o">=</span><span class="s1">&#39;ij&#39;</span><span class="p">)</span>
-    <span class="n">grid</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="n">x</span><span class="o">.</span><span class="n">repeat</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="n">dim</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">grid</span><span class="p">])</span>
-    <span class="k">return</span> <span class="n">grid</span>
-
-  
-<span class="c1"># Utility fucntions for Rotary embedding</span>
-<span class="c1"># modified from https://github.com/lucidrains/x-transformers/blob/main/x_transformers/x_transformers.py</span>
-<span class="k">def</span> <span class="nf">rotate_half</span><span class="p">(</span><span class="n">x</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Split x&#39;s channels into two equal halves.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># split the last dimension of x into two equal halves</span>
-    <span class="n">x</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">*</span><span class="n">x</span><span class="o">.</span><span class="n">shape</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">x1</span><span class="p">,</span> <span class="n">x2</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">unbind</span><span class="p">(</span><span class="n">dim</span><span class="o">=-</span><span class="mi">2</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="o">-</span><span class="n">x2</span><span class="p">,</span> <span class="n">x1</span><span class="p">),</span> <span class="n">dim</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
-
-
-<span class="k">def</span> <span class="nf">apply_rotary_pos_emb</span><span class="p">(</span><span class="n">t</span><span class="p">,</span> <span class="n">freqs</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Apply rotation matrix computed based on freqs to rotate t.</span>
-<span class="sd">    t: tensor of shape [batch_size, num_points, dim]</span>
-<span class="sd">    freqs: tensor of shape [batch_size, num_points, 1]</span>
-
-<span class="sd">    Formula: see equation (34) in https://arxiv.org/pdf/2104.09864.pdf</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">return</span> <span class="p">(</span><span class="n">t</span> <span class="o">*</span> <span class="n">freqs</span><span class="o">.</span><span class="n">cos</span><span class="p">())</span> <span class="o">+</span> <span class="p">(</span><span class="n">rotate_half</span><span class="p">(</span><span class="n">t</span><span class="p">)</span> <span class="o">*</span> <span class="n">freqs</span><span class="o">.</span><span class="n">sin</span><span class="p">())</span>
-</pre></div>
-
-      </div>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/_modules/neuralop/layers/gno_block.html b/dev/_modules/neuralop/layers/gno_block.html
deleted file mode 100644
index 5ad397e..0000000
--- a/dev/_modules/neuralop/layers/gno_block.html
+++ /dev/null
@@ -1,328 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>neuralop.layers.gno_block &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../../index.html">
-            <img src="../../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../../../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-
-      <div class="container content main-content">
-        
-  <h1>Source code for neuralop.layers.gno_block</h1><div class="highlight"><pre>
-<span></span><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">List</span>
-
-
-<span class="kn">import</span> <span class="nn">torch</span>
-<span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
-<span class="kn">import</span> <span class="nn">torch.nn.functional</span> <span class="k">as</span> <span class="nn">F</span>
-
-<span class="kn">from</span> <span class="nn">.channel_mlp</span> <span class="kn">import</span> <span class="n">ChannelMLP</span><span class="p">,</span> <span class="n">LinearChannelMLP</span>
-<span class="kn">from</span> <span class="nn">.integral_transform</span> <span class="kn">import</span> <span class="n">IntegralTransform</span>
-<span class="kn">from</span> <span class="nn">.neighbor_search</span> <span class="kn">import</span> <span class="n">NeighborSearch</span>
-
-
-<div class="viewcode-block" id="GNOBlock">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.gno_block.GNOBlock.html#neuralop.layers.gno_block.GNOBlock">[docs]</a>
-<span class="k">class</span> <span class="nc">GNOBlock</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;GNOBlock implements a Graph Neural Operator layer as described in _[1].</span>
-
-<span class="sd">    A GNO layer is a resolution-invariant operator that maps a function defined</span>
-<span class="sd">    over one coordinate mesh to another defined over another coordinate mesh using </span>
-<span class="sd">    a pointwise kernel integral that takes contributions from neighbors of distance 1</span>
-<span class="sd">    within a graph constructed via neighbor search with a specified radius. </span>
-
-<span class="sd">    The kernel integral computed in IntegralTransform </span>
-<span class="sd">    computes one of the following:</span>
-<span class="sd">        (a) \int_{A(x)} k(x, y) dy</span>
-<span class="sd">        (b) \int_{A(x)} k(x, y) * f(y) dy</span>
-<span class="sd">        (c) \int_{A(x)} k(x, y, f(y)) dy</span>
-<span class="sd">        (d) \int_{A(x)} k(x, y, f(y)) * f(y) dy</span>
-<span class="sd">    </span>
-<span class="sd">    Parameters</span>
-<span class="sd">    ----------</span>
-<span class="sd">    in_channels : int</span>
-<span class="sd">        number of channels in input function. Only used if transform_type</span>
-<span class="sd">        is (c) &quot;nonlinear&quot; or (d) &quot;nonlinear_kernelonly&quot;</span>
-<span class="sd">    out_channels : int</span>
-<span class="sd">        number of channels in output function</span>
-<span class="sd">    coord_dim : int</span>
-<span class="sd">        dimension of domain on which x and y are defined</span>
-<span class="sd">    radius : float</span>
-<span class="sd">        radius in which to search for neighbors</span>
-<span class="sd">    use_open3d_neighbor_search : _type_, optional</span>
-<span class="sd">        _description_, by default None</span>
-<span class="sd">    channel_mlp : nn.Module, optional</span>
-<span class="sd">        ChannelMLP parametrizing the kernel k. Input dimension</span>
-<span class="sd">        should be dim x + dim y or dim x + dim y + dim f.</span>
-<span class="sd">        ChannelMLP should not be pointwise and should only operate across</span>
-<span class="sd">        channels to preserve the discretization-invariance of the </span>
-<span class="sd">        kernel integral.</span>
-<span class="sd">    channel_mlp_layers : List[int], optional</span>
-<span class="sd">        list of layer widths to dynamically construct</span>
-<span class="sd">        LinearChannelMLP network to parameterize kernel k, by default None</span>
-<span class="sd">    channel_mlp_non_linearity : torch.nn function, optional</span>
-<span class="sd">        activation function for ChannelMLPLinear above, by default F.gelu</span>
-<span class="sd">    transform_type : str, optional</span>
-<span class="sd">        Which integral transform to compute. The mapping is:</span>
-<span class="sd">        &#39;linear_kernelonly&#39; -&gt; (a)</span>
-<span class="sd">        &#39;linear&#39; -&gt; (b) [DEFAULT]</span>
-<span class="sd">        &#39;nonlinear_kernelonly&#39; -&gt; (c)</span>
-<span class="sd">        &#39;nonlinear&#39; -&gt; (d)</span>
-<span class="sd">        If the input f is not given then (a) is computed</span>
-<span class="sd">        by default independently of this parameter.</span>
-<span class="sd">    use_open3d_neighbor_search: bool, optional</span>
-<span class="sd">    use_torch_scatter_reduce : bool, optional</span>
-<span class="sd">        whether to reduce in integral computation using a function</span>
-<span class="sd">        provided by the extra dependency torch_scatter or the slower</span>
-<span class="sd">        native PyTorch implementation, by default True</span>
-
-<span class="sd">    References</span>
-<span class="sd">    -----------</span>
-<span class="sd">    [1]_ Neural Operator: Graph Kernel Network for Partial Differential Equations.</span>
-<span class="sd">        Zongyi Li, Kamyar Azizzadenesheli, Burigede Liu, Kaushik Bhattacharya, </span>
-<span class="sd">        Anima Anandkumar. ArXiV, 2020 </span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span>
-                 <span class="n">in_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-                 <span class="n">out_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-                 <span class="n">coord_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-                 <span class="n">radius</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span>
-                 <span class="n">channel_mlp</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                 <span class="n">channel_mlp_layers</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-                 <span class="n">channel_mlp_non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
-                 <span class="n">transform_type</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
-                 <span class="n">use_open3d_neighbor_search</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-                 <span class="n">use_torch_scatter_reduce</span><span class="o">=</span><span class="kc">True</span><span class="p">,):</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">in_channels</span> <span class="o">=</span> <span class="n">in_channels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span> <span class="o">=</span> <span class="n">out_channels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">coord_dim</span> <span class="o">=</span> <span class="n">coord_dim</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">radius</span> <span class="o">=</span> <span class="n">radius</span>
-
-        <span class="c1"># Create in-to-out nb search module</span>
-        <span class="k">if</span> <span class="n">use_open3d_neighbor_search</span><span class="p">:</span>
-            <span class="k">assert</span> <span class="bp">self</span><span class="o">.</span><span class="n">coord_dim</span> <span class="o">==</span> <span class="mi">3</span><span class="p">,</span> <span class="sa">f</span><span class="s2">&quot;Error: open3d is only designed for 3d data, </span><span class="se">\</span>
-<span class="s2">                GNO instantiated for dim=</span><span class="si">{</span><span class="n">coord_dim</span><span class="si">}</span><span class="s2">&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">neighbor_search</span> <span class="o">=</span> <span class="n">NeighborSearch</span><span class="p">(</span><span class="n">use_open3d</span><span class="o">=</span><span class="n">use_open3d_neighbor_search</span><span class="p">)</span>
-
-        <span class="c1"># create proper kernel input channel dim</span>
-        <span class="c1"># if nonlinear of either type, add in_features dim</span>
-        <span class="c1"># otherwise just add x and y dim</span>
-        <span class="n">kernel_in_dim</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">coord_dim</span> <span class="o">*</span> <span class="mi">2</span>
-        <span class="n">kernel_in_dim_str</span> <span class="o">=</span> <span class="s2">&quot;dim(y) + dim(x)&quot;</span>
-        <span class="k">if</span> <span class="n">transform_type</span> <span class="o">==</span> <span class="s2">&quot;nonlinear&quot;</span> <span class="ow">or</span> <span class="n">transform_type</span> <span class="o">==</span> <span class="s2">&quot;nonlinear_kernelonly&quot;</span><span class="p">:</span>
-            <span class="n">kernel_in_dim</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">in_channels</span>
-            <span class="n">kernel_in_dim_str</span> <span class="o">+=</span> <span class="s2">&quot; + dim(f_y)&quot;</span>
-
-        <span class="k">if</span> <span class="n">channel_mlp</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">assert</span> <span class="n">channel_mlp</span><span class="o">.</span><span class="n">in_channels</span> <span class="o">==</span> <span class="n">kernel_in_dim</span><span class="p">,</span> <span class="sa">f</span><span class="s2">&quot;Error: expected ChannelMLP to take</span><span class="se">\</span>
-<span class="s2">                  input with </span><span class="si">{</span><span class="n">kernel_in_dim</span><span class="si">}</span><span class="s2"> channels (feature channels=</span><span class="si">{</span><span class="n">kernel_in_dim_str</span><span class="si">}</span><span class="s2">),</span><span class="se">\</span>
-<span class="s2">                      got </span><span class="si">{</span><span class="n">channel_mlp</span><span class="o">.</span><span class="n">in_channels</span><span class="si">}</span><span class="s2">.&quot;</span>
-            <span class="k">assert</span> <span class="n">channel_mlp</span><span class="o">.</span><span class="n">out_channels</span> <span class="o">==</span> <span class="n">out_channels</span><span class="p">,</span> <span class="sa">f</span><span class="s2">&quot;Error: expected ChannelMLP to have</span><span class="se">\</span>
-<span class="s2">                 </span><span class="si">{</span><span class="n">out_channels</span><span class="si">=}</span><span class="s2"> but got </span><span class="si">{</span><span class="n">channel_mlp</span><span class="o">.</span><span class="n">in_channels</span><span class="si">=}</span><span class="s2">.&quot;</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">channel_mlp</span> <span class="o">=</span> <span class="n">channel_mlp</span>
-
-        <span class="k">if</span> <span class="n">channel_mlp_layers</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">if</span> <span class="n">channel_mlp_layers</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">!=</span> <span class="n">kernel_in_dim</span><span class="p">:</span>
-                <span class="n">channel_mlp_layers</span> <span class="o">=</span> <span class="p">[</span><span class="n">kernel_in_dim</span><span class="p">]</span> <span class="o">+</span> <span class="n">channel_mlp_layers</span>
-            <span class="k">if</span> <span class="n">channel_mlp_layers</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">!=</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">:</span>
-                <span class="n">channel_mlp_layers</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">channel_mlp</span> <span class="o">=</span> <span class="n">LinearChannelMLP</span><span class="p">(</span><span class="n">layers</span><span class="o">=</span><span class="n">channel_mlp_layers</span><span class="p">,</span> <span class="n">non_linearity</span><span class="o">=</span><span class="n">channel_mlp_non_linearity</span><span class="p">)</span>
-
-        <span class="c1"># Create integral transform module</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">integral_transform</span> <span class="o">=</span> <span class="n">IntegralTransform</span><span class="p">(</span>
-            <span class="n">channel_mlp</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">channel_mlp</span><span class="p">,</span>
-            <span class="n">transform_type</span><span class="o">=</span><span class="n">transform_type</span><span class="p">,</span>
-            <span class="n">use_torch_scatter</span><span class="o">=</span><span class="n">use_torch_scatter_reduce</span>
-        <span class="p">)</span>
-
-<div class="viewcode-block" id="GNOBlock.forward">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.gno_block.GNOBlock.html#neuralop.layers.gno_block.GNOBlock.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">f_y</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Compute a GNO neighbor search and kernel integral transform.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        y : torch.Tensor of shape [n, d1]</span>
-<span class="sd">            n points of dimension d1 specifying</span>
-<span class="sd">            the space to integrate over.</span>
-<span class="sd">            If batched, these must remain constant</span>
-<span class="sd">            over the whole batch so no batch dim is needed.</span>
-<span class="sd">        x : torch.Tensor of shape [m, d1], default None</span>
-<span class="sd">            m points of dimension d1 over which the</span>
-<span class="sd">            output function is defined. Must share domain</span>
-<span class="sd">            with y</span>
-<span class="sd">        f_y : torch.Tensor of shape [batch, n, d2] or [n, d2], default None</span>
-<span class="sd">            Function to integrate the kernel against defined</span>
-<span class="sd">            on the points y. The kernel is assumed diagonal</span>
-<span class="sd">            hence its output shape must be d3 for the transforms</span>
-<span class="sd">            (b) or (d). If None, (a) is computed.</span>
-<span class="sd">        </span>
-<span class="sd">        Output</span>
-<span class="sd">        ----------</span>
-<span class="sd">        out_features : torch.Tensor of shape [batch, m, d3] or [m, d3]</span>
-<span class="sd">            Output function given on the points x.</span>
-<span class="sd">            d4 is the output size of the kernel k.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        
-        <span class="n">neighbors_dict</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">neighbor_search</span><span class="p">(</span><span class="n">data</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">queries</span><span class="o">=</span><span class="n">x</span><span class="p">,</span> <span class="n">radius</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">radius</span><span class="p">)</span>
-
-        <span class="c1"># TODO: compute weights using the neighborhood dict</span>
-        <span class="n">out_features</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">integral_transform</span><span class="p">(</span><span class="n">y</span><span class="o">=</span><span class="n">y</span><span class="p">,</span>
-                                               <span class="n">x</span><span class="o">=</span><span class="n">x</span><span class="p">,</span>
-                                               <span class="n">neighbors</span><span class="o">=</span><span class="n">neighbors_dict</span><span class="p">,</span>
-                                               <span class="n">f_y</span><span class="o">=</span><span class="n">f_y</span><span class="p">)</span>
-        
-        <span class="k">return</span> <span class="n">out_features</span></div>
-</div>
-
-
-
-</pre></div>
-
-      </div>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/_modules/neuralop/layers/integral_transform.html b/dev/_modules/neuralop/layers/integral_transform.html
index 1374993..e58d14a 100644
--- a/dev/_modules/neuralop/layers/integral_transform.html
+++ b/dev/_modules/neuralop/layers/integral_transform.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/layers/neighbor_search.html b/dev/_modules/neuralop/layers/neighbor_search.html
index 659cec0..d2d0084 100644
--- a/dev/_modules/neuralop/layers/neighbor_search.html
+++ b/dev/_modules/neuralop/layers/neighbor_search.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/layers/padding.html b/dev/_modules/neuralop/layers/padding.html
index 75b5210..be8c2f4 100644
--- a/dev/_modules/neuralop/layers/padding.html
+++ b/dev/_modules/neuralop/layers/padding.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -133,7 +133,7 @@ <h1>Source code for neuralop.layers.padding</h1><div class="highlight"><pre>
 <span class="sd">        if a list, make sure if matches the dim of (d1, ..., dN)</span>
 <span class="sd">    padding_mode : {&#39;symmetric&#39;, &#39;one-sided&#39;}, optional</span>
 <span class="sd">        whether to pad on both sides, by default &#39;one-sided&#39;</span>
-<span class="sd">    resolution_scaling_factor : int ; default is 1</span>
+<span class="sd">    output_scaling_factor : int ; default is 1</span>
 
 <span class="sd">    Notes</span>
 <span class="sd">    -----</span>
@@ -145,14 +145,14 @@ <h1>Source code for neuralop.layers.padding</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="p">,</span>
         <span class="n">domain_padding</span><span class="p">,</span>
         <span class="n">padding_mode</span><span class="o">=</span><span class="s2">&quot;one-sided&quot;</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
     <span class="p">):</span>
         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding</span> <span class="o">=</span> <span class="n">domain_padding</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">padding_mode</span> <span class="o">=</span> <span class="n">padding_mode</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span>
-        <span class="k">if</span> <span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">resolution_scaling_factor</span> <span class="o">=</span> <span class="mi">1</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="n">resolution_scaling_factor</span>
+        <span class="k">if</span> <span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">output_scaling_factor</span> <span class="o">=</span> <span class="mi">1</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="n">output_scaling_factor</span>
 
         <span class="c1"># dict(f&#39;{resolution}&#39;=padding) such that padded = F.pad(x, indices)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_padding</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">()</span>
@@ -185,12 +185,12 @@ <h1>Source code for neuralop.layers.padding</h1><div class="highlight"><pre>
             <span class="s2">&quot;(excluding batch, ch)&quot;</span>
         <span class="p">)</span>
 
-        <span class="n">resolution_scaling_factor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
+        <span class="n">output_scaling_factor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
             <span class="c1"># if unset by the user, scaling_factor will be 1 be default,</span>
-            <span class="c1"># so `resolution_scaling_factor` should never be None.</span>
-            <span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">resolution</span><span class="p">),</span> <span class="n">n_layers</span><span class="o">=</span><span class="kc">None</span>
+            <span class="c1"># so `output_scaling_factor` should never be None.</span>
+            <span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">float</span><span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">resolution</span><span class="p">),</span> <span class="n">n_layers</span><span class="o">=</span><span class="kc">None</span>
             <span class="p">)</span>
 
         <span class="k">try</span><span class="p">:</span>
@@ -209,7 +209,7 @@ <h1>Source code for neuralop.layers.padding</h1><div class="highlight"><pre>
             <span class="n">output_pad</span> <span class="o">=</span> <span class="n">padding</span>
 
             <span class="n">output_pad</span> <span class="o">=</span> <span class="p">[</span>
-                <span class="nb">round</span><span class="p">(</span><span class="n">i</span> <span class="o">*</span> <span class="n">j</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="n">j</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="n">output_pad</span><span class="p">)</span>
+                <span class="nb">round</span><span class="p">(</span><span class="n">i</span> <span class="o">*</span> <span class="n">j</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="n">j</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="n">output_pad</span><span class="p">)</span>
             <span class="p">]</span>
 
             <span class="c1"># padding is being applied in reverse order</span>
@@ -260,7 +260,7 @@ <h1>Source code for neuralop.layers.padding</h1><div class="highlight"><pre>
             <span class="n">output_shape</span> <span class="o">=</span> <span class="n">padded</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:]</span>
 
             <span class="n">output_shape</span> <span class="o">=</span> <span class="p">[</span>
-                <span class="nb">round</span><span class="p">(</span><span class="n">i</span> <span class="o">*</span> <span class="n">j</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="n">j</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="n">output_shape</span><span class="p">)</span>
+                <span class="nb">round</span><span class="p">(</span><span class="n">i</span> <span class="o">*</span> <span class="n">j</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="n">j</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="n">output_shape</span><span class="p">)</span>
             <span class="p">]</span>
 
             <span class="bp">self</span><span class="o">.</span><span class="n">_unpad_indices</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="p">[</span><span class="n">i</span><span class="w"> </span><span class="k">for</span><span class="w"> </span><span class="n">i</span><span class="w"> </span><span class="ow">in</span><span class="w"> </span><span class="n">output_shape</span><span class="p">]</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">unpad_indices</span>
diff --git a/dev/_modules/neuralop/layers/skip_connections.html b/dev/_modules/neuralop/layers/skip_connections.html
index 5fd8131..7ddff92 100644
--- a/dev/_modules/neuralop/layers/skip_connections.html
+++ b/dev/_modules/neuralop/layers/skip_connections.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -190,7 +190,7 @@ <h1>Source code for neuralop.layers.skip_connections</h1><div class="highlight">
         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
         <span class="k">if</span> <span class="n">out_features</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">in_features</span> <span class="o">!=</span> <span class="n">out_features</span><span class="p">:</span>
             <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
-                <span class="sa">f</span><span class="s2">&quot;Got in_features=</span><span class="si">{</span><span class="n">in_features</span><span class="si">}</span><span class="s2"> and out_features=</span><span class="si">{</span><span class="n">out_features</span><span class="si">}</span><span class="s2">, &quot;</span>
+                <span class="sa">f</span><span class="s2">&quot;Got in_features=</span><span class="si">{</span><span class="n">in_features</span><span class="si">}</span><span class="s2"> and out_features=</span><span class="si">{</span><span class="n">out_features</span><span class="si">}</span><span class="s2">&quot;</span>
                 <span class="s2">&quot;but these two must be the same for soft-gating&quot;</span>
             <span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">in_features</span> <span class="o">=</span> <span class="n">in_features</span>
diff --git a/dev/_modules/neuralop/layers/spectral_convolution.html b/dev/_modules/neuralop/layers/spectral_convolution.html
index d19152f..275644a 100644
--- a/dev/_modules/neuralop/layers/spectral_convolution.html
+++ b/dev/_modules/neuralop/layers/spectral_convolution.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -333,11 +333,16 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 <span class="sd">        tensor weight individually</span>
 <span class="sd">    init_std : float or &#39;auto&#39;, default is &#39;auto&#39;</span>
 <span class="sd">        std to use for the init</span>
+<span class="sd">    n_layers : int, optional</span>
+<span class="sd">        Number of Fourier Layers, by default 4</span>
 <span class="sd">    factorization : str or None, {&#39;tucker&#39;, &#39;cp&#39;, &#39;tt&#39;}, default is None</span>
 <span class="sd">        If None, a single dense weight is learned for the FNO.</span>
 <span class="sd">        Otherwise, that weight, used for the contraction in the Fourier domain</span>
 <span class="sd">        is learned in factorized form. In that case, `factorization` is the</span>
 <span class="sd">        tensor factorization of the parameters weight used.</span>
+<span class="sd">    joint_factorization : bool, optional</span>
+<span class="sd">        Whether all the Fourier Layers should be parametrized by a single tensor</span>
+<span class="sd">        (vs one per layer), by default False Ignored if ``factorization is None``</span>
 <span class="sd">    rank : float or rank, optional</span>
 <span class="sd">        Rank of the tensor factorization of the Fourier weights, by default 1.0</span>
 <span class="sd">        Ignored if ``factorization is None``</span>
@@ -356,7 +361,7 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 <span class="sd">    decomposition_kwargs : dict, optional, default is {}</span>
 <span class="sd">        Optionaly additional parameters to pass to the tensor decomposition</span>
 <span class="sd">        Ignored if ``factorization is None``</span>
-<span class="sd">    complex: bool, optional</span>
+<span class="sd">    complex_data: bool, optional</span>
 <span class="sd">        whether data takes on complex values in the spatial domain, by default False</span>
 <span class="sd">        if True, uses different logic for FFT contraction and uses full FFT instead of real-valued</span>
 <span class="sd">    &quot;&quot;&quot;</span>
@@ -366,29 +371,30 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="n">in_channels</span><span class="p">,</span>
         <span class="n">out_channels</span><span class="p">,</span>
         <span class="n">n_modes</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">bias</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">n_layers</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
         <span class="n">separable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
         <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;reconstructed&quot;</span><span class="p">,</span>
         <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">decomposition_kwargs</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">dict</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
+        <span class="n">complex_data</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">init_std</span><span class="o">=</span><span class="s2">&quot;auto&quot;</span><span class="p">,</span>
         <span class="n">fft_norm</span><span class="o">=</span><span class="s2">&quot;forward&quot;</span><span class="p">,</span>
         <span class="n">device</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">dtype</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
     <span class="p">):</span>
         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">dtype</span><span class="o">=</span><span class="n">dtype</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">device</span><span class="p">)</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">in_channels</span> <span class="o">=</span> <span class="n">in_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span> <span class="o">=</span> <span class="n">out_channels</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">dtype</span> <span class="o">=</span> <span class="n">dtype</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">complex</span> <span class="o">=</span> <span class="nb">complex</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">joint_factorization</span> <span class="o">=</span> <span class="n">joint_factorization</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span> <span class="o">=</span> <span class="n">complex_data</span>
 
         <span class="c1"># n_modes is the total number of modes kept along each dimension</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="n">n_modes</span>
@@ -403,11 +409,12 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="bp">self</span><span class="o">.</span><span class="n">fno_block_precision</span> <span class="o">=</span> <span class="n">fno_block_precision</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">rank</span> <span class="o">=</span> <span class="n">rank</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">factorization</span> <span class="o">=</span> <span class="n">factorization</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">implementation</span> <span class="o">=</span> <span class="n">implementation</span>
 
-        <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span>
             <span class="kc">None</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">float</span><span class="p">]]</span>
-        <span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">)</span>
+        <span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">,</span> <span class="n">n_layers</span><span class="p">)</span>
 
         <span class="k">if</span> <span class="n">init_std</span> <span class="o">==</span> <span class="s2">&quot;auto&quot;</span><span class="p">:</span>
             <span class="n">init_std</span> <span class="o">=</span> <span class="p">(</span><span class="mi">2</span> <span class="o">/</span> <span class="p">(</span><span class="n">in_channels</span> <span class="o">+</span> <span class="n">out_channels</span><span class="p">))</span><span class="o">**</span><span class="mf">0.5</span>
@@ -438,36 +445,50 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="bp">self</span><span class="o">.</span><span class="n">separable</span> <span class="o">=</span> <span class="n">separable</span>
 
         <span class="n">tensor_kwargs</span> <span class="o">=</span> <span class="n">decomposition_kwargs</span> <span class="k">if</span> <span class="n">decomposition_kwargs</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="k">else</span> <span class="p">{}</span>
-
-        <span class="c1"># Create/init spectral weight tensor</span>
-
         <span class="k">if</span> <span class="n">factorization</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">weight_shape</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">cfloat</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleList</span><span class="p">(</span>
+                <span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">(</span><span class="n">weight_shape</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">cfloat</span><span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_layers</span><span class="p">)]</span>
+            <span class="p">)</span>
+            <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">:</span>
+                <span class="n">w</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
+        <span class="k">elif</span> <span class="n">joint_factorization</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span>
+                <span class="p">(</span><span class="n">n_layers</span><span class="p">,</span> <span class="o">*</span><span class="n">weight_shape</span><span class="p">),</span>
+                <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span> <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span> <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
+                <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">cfloat</span><span class="p">,</span> <span class="o">**</span><span class="n">tensor_kwargs</span><span class="p">,</span>
+            <span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span><span class="n">weight_shape</span><span class="p">,</span> <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span> 
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleList</span><span class="p">([</span>
+                <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span><span class="n">weight_shape</span><span class="p">,</span> <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span> 
                                      <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span> <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
                                      <span class="o">**</span><span class="n">tensor_kwargs</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">cfloat</span><span class="p">)</span> 
-        <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
-        
+                <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_layers</span><span class="p">)]</span>
+            <span class="p">)</span>
+            <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">:</span>
+                <span class="n">w</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span> <span class="o">=</span> <span class="n">get_contract_fun</span><span class="p">(</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">,</span> <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span> <span class="n">separable</span><span class="o">=</span><span class="n">separable</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span> <span class="n">separable</span><span class="o">=</span><span class="n">separable</span>
         <span class="p">)</span>
 
         <span class="k">if</span> <span class="n">bias</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
-                <span class="n">init_std</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="o">*</span><span class="p">(</span><span class="nb">tuple</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">])</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span><span class="p">,)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">))</span>
+                <span class="n">init_std</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="o">*</span><span class="p">((</span><span class="n">n_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">)</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span><span class="p">,)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">))</span>
             <span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="o">=</span> <span class="kc">None</span>
 
+    <span class="k">def</span> <span class="nf">_get_weight</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">index</span><span class="p">]</span>
+
 <div class="viewcode-block" id="SpectralConv.transform">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html#neuralop.layers.spectral_convolution.SpectralConv.transform">[docs]</a>
-    <span class="k">def</span> <span class="nf">transform</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">transform</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">layer_index</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
         <span class="n">in_shape</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:])</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">out_shape</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span>
-                <span class="p">[</span><span class="nb">round</span><span class="p">(</span><span class="n">s</span> <span class="o">*</span> <span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="n">r</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">in_shape</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">)]</span>
+                <span class="p">[</span><span class="nb">round</span><span class="p">(</span><span class="n">s</span> <span class="o">*</span> <span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="n">r</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">in_shape</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">layer_index</span><span class="p">])]</span>
             <span class="p">)</span>
         <span class="k">elif</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">out_shape</span> <span class="o">=</span> <span class="n">output_shape</span>
@@ -493,14 +514,14 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="c1"># the real FFT is skew-symmetric, so the last mode has a redundacy if our data is real in space </span>
         <span class="c1"># As a design choice we do the operation here to avoid users dealing with the +1</span>
         <span class="c1"># if we use the full FFT we cannot cut off informtion from the last mode</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">n_modes</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">=</span> <span class="n">n_modes</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_n_modes</span> <span class="o">=</span> <span class="n">n_modes</span>
 
 <div class="viewcode-block" id="SpectralConv.forward">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html#neuralop.layers.spectral_convolution.SpectralConv.forward">[docs]</a>
     <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
-        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">output_shape</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">indices</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">output_shape</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">]]</span> <span class="o">=</span> <span class="kc">None</span>
     <span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Generic forward pass for the Factorized Spectral Conv</span>
 
@@ -508,6 +529,8 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 <span class="sd">        ----------</span>
 <span class="sd">        x : torch.Tensor</span>
 <span class="sd">            input activation of size (batch_size, channels, d1, ..., dN)</span>
+<span class="sd">        indices : int, default is 0</span>
+<span class="sd">            if joint_factorization, index of the layers for n_layers &gt; 1</span>
 
 <span class="sd">        Returns</span>
 <span class="sd">        -------</span>
@@ -516,14 +539,14 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="n">batchsize</span><span class="p">,</span> <span class="n">channels</span><span class="p">,</span> <span class="o">*</span><span class="n">mode_sizes</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span>
 
         <span class="n">fft_size</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">mode_sizes</span><span class="p">)</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">fft_size</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">=</span> <span class="n">fft_size</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">//</span> <span class="mi">2</span> <span class="o">+</span> <span class="mi">1</span>  <span class="c1"># Redundant last coefficient in real spatial data</span>
         <span class="n">fft_dims</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">fno_block_precision</span> <span class="o">==</span> <span class="s2">&quot;half&quot;</span><span class="p">:</span>
             <span class="n">x</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">half</span><span class="p">()</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">fftn</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="n">fft_dims</span><span class="p">)</span>
         <span class="k">else</span><span class="p">:</span> 
             <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">rfftn</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="n">fft_dims</span><span class="p">)</span>
@@ -551,14 +574,14 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
             <span class="n">slices_w</span> <span class="o">=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">)]</span> <span class="c1"># channels</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">slices_w</span> <span class="o">=</span>  <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">),</span> <span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">)]</span> <span class="c1"># in_channels, out_channels</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">slices_w</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">)</span> <span class="k">if</span> <span class="n">start</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="k">for</span> <span class="n">start</span> <span class="ow">in</span> <span class="n">starts</span><span class="p">]</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="c1"># The last mode already has redundant half removed in real FFT</span>
             <span class="n">slices_w</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">)</span> <span class="k">if</span> <span class="n">start</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="k">for</span> <span class="n">start</span> <span class="ow">in</span> <span class="n">starts</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]]</span>
             <span class="n">slices_w</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="o">-</span><span class="n">starts</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span> <span class="k">if</span> <span class="n">starts</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">)]</span>
         
-        <span class="n">weight</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices_w</span><span class="p">]</span>
+        <span class="n">weight</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices_w</span><span class="p">]</span>
 
         <span class="c1"># if separable conv, weight tensor only has one channel dim</span>
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">separable</span><span class="p">:</span>
@@ -569,15 +592,15 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="n">starts</span> <span class="o">=</span> <span class="p">[(</span><span class="n">size</span> <span class="o">-</span> <span class="nb">min</span><span class="p">(</span><span class="n">size</span><span class="p">,</span> <span class="n">n_mode</span><span class="p">))</span> <span class="k">for</span> <span class="p">(</span><span class="n">size</span><span class="p">,</span> <span class="n">n_mode</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:]),</span> <span class="nb">list</span><span class="p">(</span><span class="n">weight</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="n">weight_start_idx</span><span class="p">:]))]</span>
         <span class="n">slices_x</span> <span class="o">=</span>  <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">),</span> <span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">)]</span> <span class="c1"># Batch_size, channels</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">slices_x</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">)</span> <span class="k">if</span> <span class="n">start</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="k">for</span> <span class="n">start</span> <span class="ow">in</span> <span class="n">starts</span><span class="p">]</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">slices_x</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="n">start</span><span class="o">//</span><span class="mi">2</span><span class="p">)</span> <span class="k">if</span> <span class="n">start</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="n">start</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span> <span class="k">for</span> <span class="n">start</span> <span class="ow">in</span> <span class="n">starts</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]]</span>
             <span class="n">slices_x</span> <span class="o">+=</span> <span class="p">[</span><span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="o">-</span><span class="n">starts</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span> <span class="k">if</span> <span class="n">starts</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="k">else</span> <span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">)]</span> <span class="c1"># The last mode already has redundant half removed</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices_x</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="n">slices_x</span><span class="p">],</span> <span class="n">weight</span><span class="p">,</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span><span class="p">)</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">mode_sizes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="nb">round</span><span class="p">(</span><span class="n">s</span> <span class="o">*</span> <span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="n">r</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">mode_sizes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">)])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">mode_sizes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="nb">round</span><span class="p">(</span><span class="n">s</span> <span class="o">*</span> <span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">s</span><span class="p">,</span> <span class="n">r</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">mode_sizes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">indices</span><span class="p">])])</span>
 
         <span class="k">if</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">mode_sizes</span> <span class="o">=</span> <span class="n">output_shape</span>
@@ -585,16 +608,32 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
             <span class="n">out_fft</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">fftshift</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="n">fft_dims</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
         
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">ifftn</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="n">mode_sizes</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="n">fft_dims</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">irfftn</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="n">mode_sizes</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="n">fft_dims</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">)</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span>
+            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="n">indices</span><span class="p">,</span> <span class="o">...</span><span class="p">]</span>
 
         <span class="k">return</span> <span class="n">x</span></div>
-</div>
+
+
+<div class="viewcode-block" id="SpectralConv.get_conv">
+<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html#neuralop.layers.spectral_convolution.SpectralConv.get_conv">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_conv</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns a sub-convolutional layer from the joint parametrize main-convolution</span>
+
+<span class="sd">        The parametrization of sub-convolutional layers is shared with the main one.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+            <span class="ne">Warning</span><span class="p">(</span><span class="s2">&quot;A single convolution is parametrized, directly use the main class.&quot;</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">SubConv</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_conv</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span></div>
 
 
 
@@ -651,16 +690,16 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
             <span class="nb">slice</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]),</span> <span class="c1"># :half_n_modes[0]]</span>
         <span class="p">)</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">irfft</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">n</span><span class="o">=</span><span class="n">width</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">)</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="o">...</span><span class="p">]</span>
+            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="n">indices</span><span class="p">,</span> <span class="o">...</span><span class="p">]</span>
 
         <span class="k">return</span> <span class="n">x</span></div>
 </div>
@@ -678,7 +717,7 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 
 <div class="viewcode-block" id="SpectralConv2d.forward">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html#neuralop.layers.spectral_convolution.SpectralConv2d.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">indices</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
         <span class="n">batchsize</span><span class="p">,</span> <span class="n">channels</span><span class="p">,</span> <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">rfft2</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="p">(</span><span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
@@ -703,28 +742,28 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
             <span class="nb">slice</span><span class="p">(</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">//</span> <span class="mi">2</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span>  <span class="c1"># -half_n_modes[0]:,</span>
             <span class="nb">slice</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">1</span><span class="p">]),</span>  <span class="c1"># ......      :half_n_modes[1]]</span>
         <span class="p">)</span>
-        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;2D: </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">]</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">, </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices0</span><span class="p">]</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">, </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">&#39;</span><span class="p">)</span>
+        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;2D: </span><span class="si">{</span><span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">]</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">, </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices0</span><span class="p">]</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">, </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">&#39;</span><span class="p">)</span>
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Upper block (truncate high frequencies).&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices0</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices1</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Lower block&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices1</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices0</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">indices</span><span class="p">][</span><span class="mi">0</span><span class="p">])</span>
+            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">indices</span><span class="p">][</span><span class="mi">1</span><span class="p">])</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">irfft2</span><span class="p">(</span>
             <span class="n">out_fft</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">dim</span><span class="o">=</span><span class="p">(</span><span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span>
         <span class="p">)</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span>
+            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="n">indices</span><span class="p">,</span> <span class="o">...</span><span class="p">]</span>
 
         <span class="k">return</span> <span class="n">x</span></div>
 </div>
@@ -742,7 +781,7 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 
 <div class="viewcode-block" id="SpectralConv3d.forward">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.html#neuralop.layers.spectral_convolution.SpectralConv3d.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">indices</span><span class="o">=</span><span class="mi">0</span><span class="p">):</span>
         <span class="n">batchsize</span><span class="p">,</span> <span class="n">channels</span><span class="p">,</span> <span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">depth</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">rfftn</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">float</span><span class="p">(),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span> <span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">])</span>
@@ -784,34 +823,34 @@ <h1>Source code for neuralop.layers.spectral_convolution</h1><div class="highlig
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Upper block -- truncate high frequencies.&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices0</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices3</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices3</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Low-pass filter for indices 2 &amp; 4, and high-pass filter for index 3.&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices1</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices2</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices2</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Low-pass filter for indices 3 &amp; 4, and high-pass filter for index 2.&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices2</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices2</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices1</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices2</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices1</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Lower block -- low-cut filter in indices 2 &amp; 3</span>
 <span class="sd">        and high-cut filter in index 4.&quot;&quot;&quot;</span>
         <span class="n">out_fft</span><span class="p">[</span><span class="n">slices3</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
-            <span class="n">x</span><span class="p">[</span><span class="n">slices3</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">slices0</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
+            <span class="n">x</span><span class="p">[</span><span class="n">slices3</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[</span><span class="n">slices0</span><span class="p">],</span> <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span>
         <span class="p">)</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-            <span class="n">depth</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">depth</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+            <span class="n">depth</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">depth</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="mi">2</span><span class="p">])</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">fft</span><span class="o">.</span><span class="n">irfftn</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">depth</span><span class="p">),</span> <span class="n">dim</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">3</span><span class="p">,</span> <span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span><span class="p">)</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span>
+            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="n">indices</span><span class="p">,</span> <span class="o">...</span><span class="p">]</span>
         <span class="k">return</span> <span class="n">x</span></div>
 </div>
 
diff --git a/dev/_modules/neuralop/layers/spherical_convolution.html b/dev/_modules/neuralop/layers/spherical_convolution.html
index b039d8d..f1261f6 100644
--- a/dev/_modules/neuralop/layers/spherical_convolution.html
+++ b/dev/_modules/neuralop/layers/spherical_convolution.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -426,9 +426,10 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
         <span class="n">n_modes</span><span class="p">,</span>
         <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">bias</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+        <span class="n">n_layers</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
         <span class="n">separable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+        <span class="c1"># fno_block_precision=&quot;full&quot;,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="s2">&quot;cp&quot;</span><span class="p">,</span>
         <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;reconstructed&quot;</span><span class="p">,</span>
@@ -440,7 +441,6 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
         <span class="n">sht_grids</span><span class="o">=</span><span class="s2">&quot;equiangular&quot;</span><span class="p">,</span>
         <span class="n">device</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">dtype</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="o">=</span><span class="kc">False</span> <span class="c1"># dummy param until we unify dtype interface</span>
     <span class="p">):</span>
         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">dtype</span><span class="o">=</span><span class="n">dtype</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">device</span><span class="p">)</span>
 
@@ -461,11 +461,12 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
 
         <span class="bp">self</span><span class="o">.</span><span class="n">rank</span> <span class="o">=</span> <span class="n">rank</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">factorization</span> <span class="o">=</span> <span class="n">factorization</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">implementation</span> <span class="o">=</span> <span class="n">implementation</span>
 
-        <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span>
             <span class="kc">None</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="nb">float</span><span class="p">]]</span>
-        <span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">)</span>
+        <span class="p">]</span> <span class="o">=</span> <span class="n">validate_scaling_factor</span><span class="p">(</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">,</span> <span class="n">n_layers</span><span class="p">)</span>
 
         <span class="k">if</span> <span class="n">init_std</span> <span class="o">==</span> <span class="s2">&quot;auto&quot;</span><span class="p">:</span>
             <span class="n">init_std</span> <span class="o">=</span> <span class="p">(</span><span class="mi">2</span> <span class="o">/</span> <span class="p">(</span><span class="n">in_channels</span> <span class="o">+</span> <span class="n">out_channels</span><span class="p">))</span><span class="o">**</span><span class="mf">0.5</span>
@@ -496,64 +497,84 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
         <span class="k">else</span><span class="p">:</span>
             <span class="n">weight_shape</span> <span class="o">=</span> <span class="p">(</span><span class="n">in_channels</span><span class="p">,</span> <span class="n">out_channels</span><span class="p">,</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">separable</span> <span class="o">=</span> <span class="n">separable</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span>
-                    <span class="n">weight_shape</span><span class="p">,</span>
-                    <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span>
-                    <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
-                    <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
-                    <span class="o">**</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
-                <span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
 
+        <span class="k">if</span> <span class="n">joint_factorization</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span>
+                <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span><span class="p">,</span> <span class="o">*</span><span class="n">weight_shape</span><span class="p">),</span>
+                <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span>
+                <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
+                <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
+                <span class="o">**</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
+            <span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
+        <span class="k">else</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleList</span><span class="p">(</span>
+                <span class="p">[</span>
+                    <span class="n">FactorizedTensor</span><span class="o">.</span><span class="n">new</span><span class="p">(</span>
+                        <span class="n">weight_shape</span><span class="p">,</span>
+                        <span class="n">rank</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">rank</span><span class="p">,</span>
+                        <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
+                        <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
+                        <span class="o">**</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
+                    <span class="p">)</span>
+                    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_layers</span><span class="p">)</span>
+                <span class="p">]</span>
+            <span class="p">)</span>
+            <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">:</span>
+                <span class="n">w</span><span class="o">.</span><span class="n">normal_</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">init_std</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span> <span class="o">=</span> <span class="n">get_contract_fun</span><span class="p">(</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">,</span> <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span> <span class="n">separable</span><span class="o">=</span><span class="n">separable</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span> <span class="n">separable</span><span class="o">=</span><span class="n">separable</span>
         <span class="p">)</span>
 
         <span class="k">if</span> <span class="n">bias</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span>
                 <span class="n">init_std</span>
-                <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="o">*</span><span class="p">(</span><span class="nb">tuple</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">])</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span><span class="p">,)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">))</span>
+                <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="o">*</span><span class="p">((</span><span class="n">n_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span><span class="p">)</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span><span class="p">,)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">order</span><span class="p">))</span>
             <span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="o">=</span> <span class="kc">None</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span> <span class="o">=</span> <span class="n">sht_norm</span>
         <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sht_grids</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-            <span class="n">sht_grids</span> <span class="o">=</span> <span class="p">[</span><span class="n">sht_grids</span><span class="p">]</span><span class="o">*</span><span class="mi">2</span>
+            <span class="n">sht_grids</span> <span class="o">=</span> <span class="p">[</span><span class="n">sht_grids</span><span class="p">]</span><span class="o">*</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span> <span class="o">=</span> <span class="n">sht_grids</span>
-        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="si">=}</span><span class="s2">&quot;</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span> <span class="o">=</span> <span class="n">SHT</span><span class="p">(</span><span class="n">dtype</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">dtype</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+
+    <span class="k">def</span> <span class="nf">_get_weight</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="n">index</span><span class="p">]</span>
     
 <div class="viewcode-block" id="SphericalConv.transform">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html#neuralop.layers.spherical_convolution.SphericalConv.transform">[docs]</a>
-    <span class="k">def</span> <span class="nf">transform</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">transform</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">layer_index</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
         <span class="o">*</span><span class="n">_</span><span class="p">,</span> <span class="n">in_height</span><span class="p">,</span> <span class="n">in_width</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">in_height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">in_width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">in_height</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">layer_index</span><span class="p">][</span><span class="mi">0</span><span class="p">])</span>
+            <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">in_width</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">layer_index</span><span class="p">][</span><span class="mi">1</span><span class="p">])</span>
         <span class="k">elif</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">output_shape</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">output_shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">in_height</span><span class="p">,</span> <span class="n">in_width</span>
 
         <span class="c1"># Return the identity if the resolution and grid of the input and output are the same</span>
-        <span class="k">if</span> <span class="p">((</span><span class="n">in_height</span><span class="p">,</span> <span class="n">in_width</span><span class="p">)</span> <span class="o">==</span> <span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">))</span> <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">1</span><span class="p">]):</span>
+        <span class="k">if</span> <span class="p">((</span><span class="n">in_height</span><span class="p">,</span> <span class="n">in_width</span><span class="p">)</span> <span class="o">==</span> <span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">))</span> <span class="ow">and</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">layer_index</span><span class="p">]</span> <span class="o">==</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">layer_index</span><span class="o">+</span><span class="mi">1</span><span class="p">]):</span>
             <span class="k">return</span> <span class="n">x</span>
         <span class="k">else</span><span class="p">:</span>
-            <span class="n">coefs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">sht</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">isht</span><span class="p">(</span><span class="n">coefs</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span></div>
+            <span class="n">coefs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">sht</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">,</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">layer_index</span><span class="p">])</span>
+            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">isht</span><span class="p">(</span><span class="n">coefs</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">layer_index</span> <span class="o">+</span> <span class="mi">1</span><span class="p">])</span></div>
 
 
 <div class="viewcode-block" id="SphericalConv.forward">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html#neuralop.layers.spherical_convolution.SphericalConv.forward">[docs]</a>
-    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
+    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">indices</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
 <span class="w">        </span><span class="sd">&quot;&quot;&quot;Generic forward pass for the Factorized Spectral Conv</span>
 
 <span class="sd">        Parameters</span>
 <span class="sd">        ----------</span>
 <span class="sd">        x : torch.Tensor</span>
 <span class="sd">            input activation of size (batch_size, channels, d1, ..., dN)</span>
+<span class="sd">        indices : int, default is 0</span>
+<span class="sd">            if joint_factorization, index of the layers for n_layers &gt; 1</span>
 
 <span class="sd">        Returns</span>
 <span class="sd">        -------</span>
@@ -561,28 +582,28 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
 <span class="sd">        &quot;&quot;&quot;</span>
         <span class="n">batchsize</span><span class="p">,</span> <span class="n">channels</span><span class="p">,</span> <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">x</span><span class="o">.</span><span class="n">shape</span>
 
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">scaling_factors</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="n">scaling_factors</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span><span class="p">[</span><span class="n">indices</span><span class="p">]</span>
             <span class="n">height</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">height</span> <span class="o">*</span> <span class="n">scaling_factors</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
             <span class="n">width</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="n">width</span> <span class="o">*</span> <span class="n">scaling_factors</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
         <span class="k">elif</span> <span class="n">output_shape</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">height</span><span class="p">,</span> <span class="n">width</span> <span class="o">=</span> <span class="n">output_shape</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="n">output_shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
 
         <span class="n">out_fft</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">sht</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">//</span><span class="mi">2</span><span class="p">),</span>
-                                      <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+                                      <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span> <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">indices</span><span class="p">])</span>
 
         <span class="n">out_fft</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_contract</span><span class="p">(</span>
             <span class="n">out_fft</span><span class="p">[:,</span> <span class="p">:,</span> <span class="p">:</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="p">:</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span><span class="o">//</span><span class="mi">2</span><span class="p">],</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">weight</span><span class="p">[:,</span> <span class="p">:,</span> <span class="p">:</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">_get_weight</span><span class="p">(</span><span class="n">indices</span><span class="p">)[:,</span> <span class="p">:,</span> <span class="p">:</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]],</span>
             <span class="n">separable</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">separable</span><span class="p">,</span>
             <span class="n">dhconv</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
         <span class="p">)</span>
 
         <span class="n">x</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sht_handle</span><span class="o">.</span><span class="n">isht</span><span class="p">(</span><span class="n">out_fft</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="n">height</span><span class="p">,</span> <span class="n">width</span><span class="p">),</span> <span class="n">norm</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_norm</span><span class="p">,</span>
-                                 <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+                                 <span class="n">grid</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sht_grids</span><span class="p">[</span><span class="n">indices</span><span class="o">+</span><span class="mi">1</span><span class="p">])</span>
 
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span>
+            <span class="n">x</span> <span class="o">=</span> <span class="n">x</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">[</span><span class="n">indices</span><span class="p">,</span> <span class="o">...</span><span class="p">]</span>
 
         <span class="k">return</span> <span class="n">x</span></div>
 
@@ -597,7 +618,25 @@ <h1>Source code for neuralop.layers.spherical_convolution</h1><div class="highli
             <span class="n">n_modes</span> <span class="o">=</span> <span class="p">[</span><span class="n">n_modes</span><span class="p">]</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">n_modes</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">n_modes</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_n_modes</span> <span class="o">=</span> <span class="n">n_modes</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">_n_modes</span> <span class="o">=</span> <span class="n">n_modes</span>
+
+<div class="viewcode-block" id="SphericalConv.get_conv">
+<a class="viewcode-back" href="../../../modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html#neuralop.layers.spherical_convolution.SphericalConv.get_conv">[docs]</a>
+    <span class="k">def</span> <span class="nf">get_conv</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">):</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;Returns a sub-convolutional layer from the joint parametrize main-convolution</span>
+
+<span class="sd">        The parametrization of sub-convolutional layers is shared with the main one.</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span>
+                <span class="s2">&quot;A single convolution is parametrized, directly use the main class.&quot;</span>
+            <span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">SubConv</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">)</span></div>
+
+
+    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">indices</span><span class="p">):</span>
+        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">get_conv</span><span class="p">(</span><span class="n">indices</span><span class="p">)</span></div>
 
 </pre></div>
 
diff --git a/dev/_modules/neuralop/losses/data_losses.html b/dev/_modules/neuralop/losses/data_losses.html
index 46444bd..8b22e36 100644
--- a/dev/_modules/neuralop/losses/data_losses.html
+++ b/dev/_modules/neuralop/losses/data_losses.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/models/base_model.html b/dev/_modules/neuralop/models/base_model.html
index e52e4fa..8ce89b8 100644
--- a/dev/_modules/neuralop/models/base_model.html
+++ b/dev/_modules/neuralop/models/base_model.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_modules/neuralop/models/fno.html b/dev/_modules/neuralop/models/fno.html
index 116c6c7..3d2cb8e 100644
--- a/dev/_modules/neuralop/models/fno.html
+++ b/dev/_modules/neuralop/models/fno.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -114,11 +114,7 @@
         
   <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
 <span></span><span class="kn">from</span> <span class="nn">functools</span> <span class="kn">import</span> <span class="n">partialmethod</span>
-<span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Tuple</span><span class="p">,</span> <span class="n">List</span><span class="p">,</span> <span class="n">Union</span>
 
-<span class="n">Number</span> <span class="o">=</span> <span class="n">Union</span><span class="p">[</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">]</span>
-
-<span class="kn">import</span> <span class="nn">torch</span>
 <span class="kn">import</span> <span class="nn">torch.nn</span> <span class="k">as</span> <span class="nn">nn</span>
 <span class="kn">import</span> <span class="nn">torch.nn.functional</span> <span class="k">as</span> <span class="nn">F</span>
 
@@ -133,193 +129,145 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
 <div class="viewcode-block" id="FNO">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.models.FNO.html#neuralop.models.FNO">[docs]</a>
 <span class="k">class</span> <span class="nc">FNO</span><span class="p">(</span><span class="n">BaseModel</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s1">&#39;FNO&#39;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;N-Dimensional Fourier Neural Operator. The FNO learns a mapping between</span>
-<span class="sd">    spaces of functions discretized over regular grids. </span>
-<span class="sd">    </span>
-<span class="sd">    The key component of an FNO is its SpectralConv layer (see ``neuralop.layers.spectral_convolution``), which</span>
-<span class="sd">    is similar to a standard CNN conv layer but operates in the frequency domain.</span>
-
-<span class="sd">    For more information, refer to :ref:`fno-guide`.</span>
+<span class="w">    </span><span class="sd">&quot;&quot;&quot;N-Dimensional Fourier Neural Operator</span>
 
 <span class="sd">    Parameters</span>
 <span class="sd">    ----------</span>
-<span class="sd">    n_modes : Tuple[int]</span>
+<span class="sd">    n_modes : int tuple</span>
 <span class="sd">        number of modes to keep in Fourier Layer, along each dimension</span>
 <span class="sd">        The dimensionality of the FNO is inferred from ``len(n_modes)``</span>
-<span class="sd">    in_channels : int</span>
-<span class="sd">        Number of channels in input function</span>
-<span class="sd">    out_channels : int</span>
-<span class="sd">        Number of channels in output function</span>
 <span class="sd">    hidden_channels : int</span>
-<span class="sd">        width of the FNO (i.e. number of channels), by default 256</span>
+<span class="sd">        width of the FNO (i.e. number of channels)</span>
+<span class="sd">    in_channels : int, optional</span>
+<span class="sd">        Number of input channels, by default 3</span>
+<span class="sd">    out_channels : int, optional</span>
+<span class="sd">        Number of output channels, by default 1</span>
+<span class="sd">    lifting_channels : int, optional</span>
+<span class="sd">        number of hidden channels of the lifting block of the FNO, by default 256</span>
+<span class="sd">    projection_channels : int, optional</span>
+<span class="sd">        number of hidden channels of the projection block of the FNO, by default 256</span>
 <span class="sd">    n_layers : int, optional</span>
 <span class="sd">        Number of Fourier Layers, by default 4</span>
-
-<span class="sd">    Documentation for more advanced parameters is below.</span>
-
-<span class="sd">    Examples</span>
-<span class="sd">    ---------</span>
-<span class="sd">    </span>
-<span class="sd">    &gt;&gt;&gt; from neuralop.models import FNO</span>
-<span class="sd">    &gt;&gt;&gt; model = FNO(n_modes=(12,12), in_channels=1, out_channels=1, hidden_channels=64)</span>
-<span class="sd">    &gt;&gt;&gt; model</span>
-<span class="sd">    FNO(</span>
-<span class="sd">    (positional_embedding): GridEmbeddingND()</span>
-<span class="sd">    (fno_blocks): FNOBlocks(</span>
-<span class="sd">        (convs): SpectralConv(</span>
-<span class="sd">        (weight): ModuleList(</span>
-<span class="sd">            (0-3): 4 x DenseTensor(shape=torch.Size([64, 64, 12, 7]), rank=None)</span>
-<span class="sd">        )</span>
-<span class="sd">        )</span>
-<span class="sd">            ... torch.nn.Module printout truncated ...</span>
-
-
-<span class="sd">    Other parameters</span>
-<span class="sd">    ------------------</span>
-<span class="sd">    lifting_channel_ratio : int, optional</span>
-<span class="sd">        ratio of lifting channels to hidden_channels, by default 2</span>
-<span class="sd">        The number of liting channels in the lifting block of the FNO is</span>
-<span class="sd">        lifting_channel_ratio * hidden_channels (e.g. default 512)</span>
-<span class="sd">    projection_channel_ratio : int, optional</span>
-<span class="sd">        ratio of projection channels to hidden_channels, by default 2</span>
-<span class="sd">        The number of projection channels in the projection block of the FNO is</span>
-<span class="sd">        projection_channel_ratio * hidden_channels (e.g. default 512)</span>
-<span class="sd">    positional_embedding : Union[str, nn.Module], optional</span>
-<span class="sd">        Positional embedding to apply to last channels of raw input</span>
-<span class="sd">        before being passed through the FNO. Defaults to &quot;grid&quot;</span>
-
-<span class="sd">        * If &quot;grid&quot;, appends a grid positional embedding with default settings to </span>
+<span class="sd">    positional_embedding : str literal | GridEmbedding2D | GridEmbeddingND | None</span>
+<span class="sd">        if &quot;grid&quot;, appends a grid positional embedding with default settings to </span>
 <span class="sd">        the last channels of raw input. Assumes the inputs are discretized</span>
 <span class="sd">        over a grid with entry [0,0,...] at the origin and side lengths of 1.</span>
+<span class="sd">        If an initialized GridEmbedding, uses this module directly</span>
+<span class="sd">        See `neuralop.embeddings.GridEmbeddingND` for details</span>
+<span class="sd">        if None, does nothing</span>
+<span class="sd">    max_n_modes : None or int tuple, default is None</span>
+<span class="sd">        * If not None, this allows to incrementally increase the number of</span>
+<span class="sd">          modes in Fourier domain during training. Has to verify n &lt;= N</span>
+<span class="sd">          for (n, m) in zip(max_n_modes, n_modes).</span>
 
-<span class="sd">        * If an initialized GridEmbedding module, uses this module directly</span>
-<span class="sd">        See :mod:`neuralop.embeddings.GridEmbeddingND` for details.</span>
-
-<span class="sd">        * If None, does nothing</span>
+<span class="sd">        * If None, all the n_modes are used.</span>
 
+<span class="sd">        This can be updated dynamically during training.</span>
+<span class="sd">    fno_block_precision : str {&#39;full&#39;, &#39;half&#39;, &#39;mixed&#39;}</span>
+<span class="sd">        if &#39;full&#39;, the FNO Block runs in full precision</span>
+<span class="sd">        if &#39;half&#39;, the FFT, contraction, and inverse FFT run in half precision</span>
+<span class="sd">        if &#39;mixed&#39;, the contraction and inverse FFT run in half precision</span>
+<span class="sd">    stabilizer : str {&#39;tanh&#39;} or None, optional</span>
+<span class="sd">        By default None, otherwise tanh is used before FFT in the FNO block</span>
+<span class="sd">    use_channel_mlp : bool, optional</span>
+<span class="sd">        Whether to use a ChannelMLP layer after each FNO block, by default False</span>
+<span class="sd">    channel_mlp_dropout : float , optional</span>
+<span class="sd">        droupout parameter of ChannelMLP layer, by default 0</span>
+<span class="sd">    channel_mlp_expansion : float, optional</span>
+<span class="sd">        expansion parameter of ChannelMLP layer, by default 0.5</span>
 <span class="sd">    non_linearity : nn.Module, optional</span>
-<span class="sd">        Non-Linear activation function module to use, by default F.gelu</span>
-<span class="sd">    norm : str {&quot;ada_in&quot;, &quot;group_norm&quot;, &quot;instance_norm&quot;}, optional</span>
+<span class="sd">        Non-Linearity module to use, by default F.gelu</span>
+<span class="sd">    norm : Literal[&quot;ada_in&quot;, &quot;group_norm&quot;, &quot;instance_norm&quot;], optional</span>
 <span class="sd">        Normalization layer to use, by default None</span>
-<span class="sd">    complex : bool, optional</span>
-<span class="sd">        Whether data is complex-valued (default False)</span>
-<span class="sd">        if True, initializes complex-valued modules.</span>
-<span class="sd">    channel_mlp_dropout : float, optional</span>
-<span class="sd">        dropout parameter for ChannelMLP in FNO Block, by default 0</span>
-<span class="sd">    channel_mlp_expansion : float, optional</span>
-<span class="sd">        expansion parameter for ChannelMLP in FNO Block, by default 0.5</span>
-<span class="sd">    channel_mlp_skip : str {&#39;linear&#39;, &#39;identity&#39;, &#39;soft-gating&#39;}, optional</span>
+<span class="sd">    preactivation : bool, default is False</span>
+<span class="sd">        if True, use resnet-style preactivation</span>
+<span class="sd">    fno_skip : {&#39;linear&#39;, &#39;identity&#39;, &#39;soft-gating&#39;}, optional</span>
+<span class="sd">        Type of skip connection to use in fno, by default &#39;linear&#39;</span>
+<span class="sd">    channel_mlp_skip : {&#39;linear&#39;, &#39;identity&#39;, &#39;soft-gating&#39;}, optional</span>
 <span class="sd">        Type of skip connection to use in channel-mixing mlp, by default &#39;soft-gating&#39;</span>
-<span class="sd">    fno_skip : str {&#39;linear&#39;, &#39;identity&#39;, &#39;soft-gating&#39;}, optional</span>
-<span class="sd">        Type of skip connection to use in FNO layers, by default &#39;linear&#39;</span>
-<span class="sd">    resolution_scaling_factor : Union[Number, List[Number]], optional</span>
-<span class="sd">        layer-wise factor by which to scale the domain resolution of function, by default None</span>
-<span class="sd">        </span>
-<span class="sd">        * If a single number n, scales resolution by n at each layer</span>
-
-<span class="sd">        * if a list of numbers [n_0, n_1,...] scales layer i&#39;s resolution by n_i.</span>
-<span class="sd">    domain_padding : Union[Number, List[Number]], optional</span>
+<span class="sd">    separable : bool, default is False</span>
+<span class="sd">        if True, use a depthwise separable spectral convolution</span>
+<span class="sd">    factorization : str or None, {&#39;tucker&#39;, &#39;cp&#39;, &#39;tt&#39;}</span>
+<span class="sd">        Tensor factorization of the parameters weight to use, by default None.</span>
+<span class="sd">        * If None, a dense tensor parametrizes the Spectral convolutions</span>
+<span class="sd">        * Otherwise, the specified tensor factorization is used.</span>
+<span class="sd">    joint_factorization : bool, optional</span>
+<span class="sd">        Whether all the Fourier Layers should be parametrized by a single tensor</span>
+<span class="sd">        (vs one per layer), by default False</span>
+<span class="sd">    rank : float or rank, optional</span>
+<span class="sd">        Rank of the tensor factorization of the Fourier weights, by default 1.0</span>
+<span class="sd">    fixed_rank_modes : bool, optional</span>
+<span class="sd">        Modes to not factorize, by default False</span>
+<span class="sd">    implementation : {&#39;factorized&#39;, &#39;reconstructed&#39;}, optional, default is &#39;factorized&#39;</span>
+<span class="sd">        If factorization is not None, forward mode to use::</span>
+<span class="sd">        * `reconstructed` : the full weight tensor is reconstructed from the</span>
+<span class="sd">          factorization and used for the forward pass</span>
+<span class="sd">        * `factorized` : the input is directly contracted with the factors of</span>
+<span class="sd">          the decomposition</span>
+<span class="sd">    decomposition_kwargs : dict, optional, default is {}</span>
+<span class="sd">        Optionaly additional parameters to pass to the tensor decomposition</span>
+<span class="sd">    domain_padding : None, float, or List[float], optional</span>
 <span class="sd">        If not None, percentage of padding to use, by default None</span>
 <span class="sd">        To vary the percentage of padding used along each input dimension,</span>
 <span class="sd">        pass in a list of percentages e.g. [p1, p2, ..., pN] such that</span>
 <span class="sd">        p1 corresponds to the percentage of padding along dim 1, etc.</span>
-<span class="sd">    domain_padding_mode : str {&#39;symmetric&#39;, &#39;one-sided&#39;}, optional</span>
+<span class="sd">    domain_padding_mode : {&#39;symmetric&#39;, &#39;one-sided&#39;}, optional</span>
 <span class="sd">        How to perform domain padding, by default &#39;one-sided&#39;</span>
-<span class="sd">    fno_block_precision : str {&#39;full&#39;, &#39;half&#39;, &#39;mixed&#39;}, optional</span>
-<span class="sd">        precision mode in which to perform spectral convolution, by default &quot;full&quot;</span>
-<span class="sd">    stabilizer : str {&#39;tanh&#39;} | None, optional</span>
-<span class="sd">        whether to use a tanh stabilizer in FNO block, by default None</span>
-
-<span class="sd">        Note: stabilizer greatly improves performance in the case</span>
-<span class="sd">        `fno_block_precision=&#39;mixed&#39;`. </span>
-
-<span class="sd">    max_n_modes : Tuple[int] | None, optional</span>
-
-<span class="sd">        * If not None, this allows to incrementally increase the number of</span>
-<span class="sd">        modes in Fourier domain during training. Has to verify n &lt;= N</span>
-<span class="sd">        for (n, m) in zip(max_n_modes, n_modes).</span>
-
-<span class="sd">        * If None, all the n_modes are used.</span>
-
-<span class="sd">        This can be updated dynamically during training.</span>
-<span class="sd">    factorization : str, optional</span>
-<span class="sd">        Tensor factorization of the FNO layer weights to use, by default None.</span>
-
-<span class="sd">        * If None, a dense tensor parametrizes the Spectral convolutions</span>
-
-<span class="sd">        * Otherwise, the specified tensor factorization is used.</span>
-<span class="sd">    rank : float, optional</span>
-<span class="sd">        tensor rank to use in above factorization, by default 1.0</span>
-<span class="sd">    fixed_rank_modes : bool, optional</span>
-<span class="sd">        Modes to not factorize, by default False</span>
-<span class="sd">    implementation : str {&#39;factorized&#39;, &#39;reconstructed&#39;}, optional</span>
-
-<span class="sd">        * If &#39;factorized&#39;, implements tensor contraction with the individual factors of the decomposition </span>
-<span class="sd">        </span>
-<span class="sd">        * If &#39;reconstructed&#39;, implements with the reconstructed full tensorized weight.</span>
-<span class="sd">    decomposition_kwargs : dict, optional</span>
-<span class="sd">        extra kwargs for tensor decomposition (see `tltorch.FactorizedTensor`), by default dict()</span>
-<span class="sd">    separable : bool, optional (**DEACTIVATED**)</span>
-<span class="sd">        if True, use a depthwise separable spectral convolution, by default False   </span>
-<span class="sd">    preactivation : bool, optional (**DEACTIVATED**)</span>
-<span class="sd">        whether to compute FNO forward pass with resnet-style preactivation, by default False</span>
-<span class="sd">    conv_module : nn.Module, optional</span>
-<span class="sd">        module to use for FNOBlock&#39;s convolutions, by default SpectralConv</span>
+<span class="sd">    conv_module : BaseConv, optional</span>
+<span class="sd">        Module to use for convolutions in FNO, by default SpectralConv</span>
+<span class="sd">    complex_data: bool, optional</span>
+<span class="sd">        whether FNO data takes on complex values </span>
+<span class="sd">        in the spatial domain, by default False</span>
 <span class="sd">    &quot;&quot;&quot;</span>
 
     <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
         <span class="bp">self</span><span class="p">,</span>
-        <span class="n">n_modes</span><span class="p">:</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">],</span>
-        <span class="n">in_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-        <span class="n">out_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-        <span class="n">hidden_channels</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
-        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-        <span class="n">lifting_channel_ratio</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
-        <span class="n">projection_channel_ratio</span><span class="p">:</span> <span class="nb">int</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span>
-        <span class="n">positional_embedding</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span><span class="o">=</span><span class="s2">&quot;grid&quot;</span><span class="p">,</span>
-        <span class="n">non_linearity</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
-        <span class="n">norm</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">channel_mlp_dropout</span><span class="p">:</span> <span class="nb">float</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-        <span class="n">channel_mlp_expansion</span><span class="p">:</span> <span class="nb">float</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
-        <span class="n">channel_mlp_skip</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="s2">&quot;soft-gating&quot;</span><span class="p">,</span>
-        <span class="n">fno_skip</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">domain_padding</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">Number</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">Number</span><span class="p">]]</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">domain_padding_mode</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="s2">&quot;one-sided&quot;</span><span class="p">,</span>
-        <span class="n">fno_block_precision</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
-        <span class="n">stabilizer</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">max_n_modes</span><span class="p">:</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">]</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">factorization</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">rank</span><span class="p">:</span> <span class="nb">float</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
-        <span class="n">fixed_rank_modes</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">implementation</span><span class="p">:</span> <span class="nb">str</span><span class="o">=</span><span class="s2">&quot;factorized&quot;</span><span class="p">,</span>
-        <span class="n">decomposition_kwargs</span><span class="p">:</span> <span class="nb">dict</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
-        <span class="n">separable</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">preactivation</span><span class="p">:</span> <span class="nb">bool</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
-        <span class="n">conv_module</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="o">=</span><span class="n">SpectralConv</span><span class="p">,</span>
+        <span class="n">n_modes</span><span class="p">,</span>
+        <span class="n">hidden_channels</span><span class="p">,</span>
+        <span class="n">in_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
+        <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+        <span class="n">lifting_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
+        <span class="n">projection_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
+        <span class="n">n_layers</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
+        <span class="n">positional_embedding</span><span class="o">=</span><span class="s2">&quot;grid&quot;</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
+        <span class="n">use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+        <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
+        <span class="n">non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
+        <span class="n">stabilizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">norm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">preactivation</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">fno_skip</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
+        <span class="n">channel_mlp_skip</span><span class="o">=</span><span class="s2">&quot;soft-gating&quot;</span><span class="p">,</span>
+        <span class="n">separable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">rank</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;factorized&quot;</span><span class="p">,</span>
+        <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
+        <span class="n">domain_padding</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">domain_padding_mode</span><span class="o">=</span><span class="s2">&quot;one-sided&quot;</span><span class="p">,</span>
+        <span class="n">conv_module</span><span class="o">=</span><span class="n">SpectralConv</span><span class="p">,</span>
+        <span class="n">complex_data</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="o">**</span><span class="n">kwargs</span>
     <span class="p">):</span>
-        
         <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">n_modes</span><span class="p">)</span>
-        
-        <span class="c1"># n_modes is a special property - see the class&#39; property for underlying mechanism</span>
+
+        <span class="c1"># See the class&#39; property for underlying mechanism</span>
         <span class="c1"># When updated, change should be reflected in fno blocks</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">_n_modes</span> <span class="o">=</span> <span class="n">n_modes</span>
-
         <span class="bp">self</span><span class="o">.</span><span class="n">hidden_channels</span> <span class="o">=</span> <span class="n">hidden_channels</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">lifting_channels</span> <span class="o">=</span> <span class="n">lifting_channels</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">projection_channels</span> <span class="o">=</span> <span class="n">projection_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">in_channels</span> <span class="o">=</span> <span class="n">in_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span> <span class="o">=</span> <span class="n">out_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
-
-        <span class="c1"># init lifting and projection channels using ratios w.r.t hidden channels</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">lifting_channel_ratio</span> <span class="o">=</span> <span class="n">lifting_channel_ratio</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">lifting_channels</span> <span class="o">=</span> <span class="n">lifting_channel_ratio</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_channels</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">projection_channel_ratio</span> <span class="o">=</span> <span class="n">projection_channel_ratio</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">projection_channels</span> <span class="o">=</span> <span class="n">projection_channel_ratio</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_channels</span>
-
+        <span class="bp">self</span><span class="o">.</span><span class="n">joint_factorization</span> <span class="o">=</span> <span class="n">joint_factorization</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">non_linearity</span> <span class="o">=</span> <span class="n">non_linearity</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">rank</span> <span class="o">=</span> <span class="n">rank</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">factorization</span> <span class="o">=</span> <span class="n">factorization</span>
@@ -330,9 +278,8 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">implementation</span> <span class="o">=</span> <span class="n">implementation</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">separable</span> <span class="o">=</span> <span class="n">separable</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">preactivation</span> <span class="o">=</span> <span class="n">preactivation</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">complex</span> <span class="o">=</span> <span class="nb">complex</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">fno_block_precision</span> <span class="o">=</span> <span class="n">fno_block_precision</span>
-        
+
         <span class="k">if</span> <span class="n">positional_embedding</span> <span class="o">==</span> <span class="s2">&quot;grid&quot;</span><span class="p">:</span>
             <span class="n">spatial_grid_boundaries</span> <span class="o">=</span> <span class="p">[[</span><span class="mf">0.</span><span class="p">,</span> <span class="mf">1.</span><span class="p">]]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">positional_embedding</span> <span class="o">=</span> <span class="n">GridEmbeddingND</span><span class="p">(</span><span class="n">dim</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span><span class="p">,</span> <span class="n">grid_boundaries</span><span class="o">=</span><span class="n">spatial_grid_boundaries</span><span class="p">)</span>
@@ -356,24 +303,25 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding</span> <span class="o">=</span> <span class="n">DomainPadding</span><span class="p">(</span>
                 <span class="n">domain_padding</span><span class="o">=</span><span class="n">domain_padding</span><span class="p">,</span>
                 <span class="n">padding_mode</span><span class="o">=</span><span class="n">domain_padding_mode</span><span class="p">,</span>
-                <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">resolution_scaling_factor</span><span class="p">,</span>
+                <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">output_scaling_factor</span><span class="p">,</span>
             <span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding</span> <span class="o">=</span> <span class="kc">None</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding_mode</span> <span class="o">=</span> <span class="n">domain_padding_mode</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">complex</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span> <span class="o">=</span> <span class="n">complex_data</span>
 
-        <span class="k">if</span> <span class="n">resolution_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">resolution_scaling_factor</span><span class="p">,</span> <span class="p">(</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">)):</span>
-                <span class="n">resolution_scaling_factor</span> <span class="o">=</span> <span class="p">[</span><span class="n">resolution_scaling_factor</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">resolution_scaling_factor</span> <span class="o">=</span> <span class="n">resolution_scaling_factor</span>
+        <span class="k">if</span> <span class="n">output_scaling_factor</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="ow">not</span> <span class="n">joint_factorization</span><span class="p">:</span>
+            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">output_scaling_factor</span><span class="p">,</span> <span class="p">(</span><span class="nb">float</span><span class="p">,</span> <span class="nb">int</span><span class="p">)):</span>
+                <span class="n">output_scaling_factor</span> <span class="o">=</span> <span class="p">[</span><span class="n">output_scaling_factor</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">output_scaling_factor</span> <span class="o">=</span> <span class="n">output_scaling_factor</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">fno_blocks</span> <span class="o">=</span> <span class="n">FNOBlocks</span><span class="p">(</span>
             <span class="n">in_channels</span><span class="o">=</span><span class="n">hidden_channels</span><span class="p">,</span>
             <span class="n">out_channels</span><span class="o">=</span><span class="n">hidden_channels</span><span class="p">,</span>
             <span class="n">n_modes</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_modes</span><span class="p">,</span>
-            <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">resolution_scaling_factor</span><span class="p">,</span>
+            <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">output_scaling_factor</span><span class="p">,</span>
+            <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">use_channel_mlp</span><span class="p">,</span>
             <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="n">channel_mlp_dropout</span><span class="p">,</span>
             <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="n">channel_mlp_expansion</span><span class="p">,</span>
             <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
@@ -382,7 +330,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">preactivation</span><span class="o">=</span><span class="n">preactivation</span><span class="p">,</span>
             <span class="n">fno_skip</span><span class="o">=</span><span class="n">fno_skip</span><span class="p">,</span>
             <span class="n">channel_mlp_skip</span><span class="o">=</span><span class="n">channel_mlp_skip</span><span class="p">,</span>
-            <span class="nb">complex</span><span class="o">=</span><span class="nb">complex</span><span class="p">,</span>
+            <span class="n">complex_data</span><span class="o">=</span><span class="n">complex_data</span><span class="p">,</span>
             <span class="n">max_n_modes</span><span class="o">=</span><span class="n">max_n_modes</span><span class="p">,</span>
             <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
             <span class="n">rank</span><span class="o">=</span><span class="n">rank</span><span class="p">,</span>
@@ -391,6 +339,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">separable</span><span class="o">=</span><span class="n">separable</span><span class="p">,</span>
             <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
             <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
+            <span class="n">joint_factorization</span><span class="o">=</span><span class="n">joint_factorization</span><span class="p">,</span>
             <span class="n">conv_module</span><span class="o">=</span><span class="n">conv_module</span><span class="p">,</span>
             <span class="n">n_layers</span><span class="o">=</span><span class="n">n_layers</span><span class="p">,</span>
             <span class="o">**</span><span class="n">kwargs</span>
@@ -421,8 +370,8 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
                 <span class="n">n_dim</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span><span class="p">,</span>
                 <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span>
             <span class="p">)</span>
-        <span class="c1"># Convert lifting to a complex ChannelMLP if self.complex==True</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="c1"># Convert lifting to a complex ChannelMLP if self.complex_data==True</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">lifting</span> <span class="o">=</span> <span class="n">ComplexValued</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">lifting</span><span class="p">)</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">projection</span> <span class="o">=</span> <span class="n">ChannelMLP</span><span class="p">(</span>
@@ -433,39 +382,22 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">n_dim</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span><span class="p">,</span>
             <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
         <span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex</span><span class="p">:</span>
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">complex_data</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">projection</span> <span class="o">=</span> <span class="n">ComplexValued</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">projection</span><span class="p">)</span>
 
 <div class="viewcode-block" id="FNO.forward">
 <a class="viewcode-back" href="../../../modules/generated/neuralop.models.FNO.html#neuralop.models.FNO.forward">[docs]</a>
     <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">output_shape</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;FNO&#39;s forward pass</span>
-<span class="sd">        </span>
-<span class="sd">        1. Applies optional positional encoding</span>
-
-<span class="sd">        2. Sends inputs through a lifting layer to a high-dimensional latent</span>
-<span class="sd">            space</span>
-
-<span class="sd">        3. Applies optional domain padding to high-dimensional intermediate function representation</span>
-
-<span class="sd">        4. Applies `n_layers` Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity) </span>
-
-<span class="sd">        5. If domain padding was applied, domain padding is removed</span>
-
-<span class="sd">        6. Projection of intermediate function representation to the output channels</span>
+<span class="w">        </span><span class="sd">&quot;&quot;&quot;TFNO&#39;s forward pass</span>
 
 <span class="sd">        Parameters</span>
 <span class="sd">        ----------</span>
 <span class="sd">        x : tensor</span>
 <span class="sd">            input tensor</span>
-<span class="sd">        </span>
 <span class="sd">        output_shape : {tuple, tuple list, None}, default is None</span>
 <span class="sd">            Gives the option of specifying the exact output shape for odd shaped inputs.</span>
-<span class="sd">            </span>
 <span class="sd">            * If None, don&#39;t specify an output shape</span>
-
 <span class="sd">            * If tuple, specifies the output-shape of the **last** FNO Block</span>
-
 <span class="sd">            * If tuple list, specifies the exact output-shape of each FNO Block</span>
 <span class="sd">        &quot;&quot;&quot;</span>
 
@@ -527,12 +459,12 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">lifting_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">projection_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
         <span class="n">n_layers</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
         <span class="n">stabilizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
-        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
+        <span class="n">use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
         <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">norm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
@@ -541,6 +473,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">preactivation</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;factorized&quot;</span><span class="p">,</span>
         <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
@@ -556,20 +489,21 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">lifting_channels</span><span class="o">=</span><span class="n">lifting_channels</span><span class="p">,</span>
             <span class="n">projection_channels</span><span class="o">=</span><span class="n">projection_channels</span><span class="p">,</span>
             <span class="n">n_layers</span><span class="o">=</span><span class="n">n_layers</span><span class="p">,</span>
-            <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">resolution_scaling_factor</span><span class="p">,</span>
+            <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">output_scaling_factor</span><span class="p">,</span>
             <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
             <span class="n">stabilizer</span><span class="o">=</span><span class="n">stabilizer</span><span class="p">,</span>
-            <span class="nb">complex</span><span class="o">=</span><span class="nb">complex</span><span class="p">,</span>
-            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
+            <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">use_channel_mlp</span><span class="p">,</span>
             <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="n">channel_mlp_dropout</span><span class="p">,</span>
             <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="n">channel_mlp_expansion</span><span class="p">,</span>
             <span class="n">max_n_modes</span><span class="o">=</span><span class="n">max_n_modes</span><span class="p">,</span>
+            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
             <span class="n">norm</span><span class="o">=</span><span class="n">norm</span><span class="p">,</span>
             <span class="n">skip</span><span class="o">=</span><span class="n">skip</span><span class="p">,</span>
             <span class="n">separable</span><span class="o">=</span><span class="n">separable</span><span class="p">,</span>
             <span class="n">preactivation</span><span class="o">=</span><span class="n">preactivation</span><span class="p">,</span>
             <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
             <span class="n">rank</span><span class="o">=</span><span class="n">rank</span><span class="p">,</span>
+            <span class="n">joint_factorization</span><span class="o">=</span><span class="n">joint_factorization</span><span class="p">,</span>
             <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
             <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span>
             <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
@@ -605,12 +539,12 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">lifting_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">projection_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">n_layers</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
         <span class="n">non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
         <span class="n">stabilizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
-        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
+        <span class="n">use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
         <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">norm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
@@ -619,6 +553,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">preactivation</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;factorized&quot;</span><span class="p">,</span>
         <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
@@ -634,20 +569,21 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">lifting_channels</span><span class="o">=</span><span class="n">lifting_channels</span><span class="p">,</span>
             <span class="n">projection_channels</span><span class="o">=</span><span class="n">projection_channels</span><span class="p">,</span>
             <span class="n">n_layers</span><span class="o">=</span><span class="n">n_layers</span><span class="p">,</span>
-            <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">resolution_scaling_factor</span><span class="p">,</span>
+            <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">output_scaling_factor</span><span class="p">,</span>
             <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
             <span class="n">stabilizer</span><span class="o">=</span><span class="n">stabilizer</span><span class="p">,</span>
-            <span class="nb">complex</span><span class="o">=</span><span class="nb">complex</span><span class="p">,</span>
-            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
+            <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">use_channel_mlp</span><span class="p">,</span>
             <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="n">channel_mlp_dropout</span><span class="p">,</span>
             <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="n">channel_mlp_expansion</span><span class="p">,</span>
             <span class="n">max_n_modes</span><span class="o">=</span><span class="n">max_n_modes</span><span class="p">,</span>
+            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
             <span class="n">norm</span><span class="o">=</span><span class="n">norm</span><span class="p">,</span>
             <span class="n">skip</span><span class="o">=</span><span class="n">skip</span><span class="p">,</span>
             <span class="n">separable</span><span class="o">=</span><span class="n">separable</span><span class="p">,</span>
             <span class="n">preactivation</span><span class="o">=</span><span class="n">preactivation</span><span class="p">,</span>
             <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
             <span class="n">rank</span><span class="o">=</span><span class="n">rank</span><span class="p">,</span>
+            <span class="n">joint_factorization</span><span class="o">=</span><span class="n">joint_factorization</span><span class="p">,</span>
             <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
             <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span>
             <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
@@ -687,12 +623,12 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">lifting_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">projection_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
         <span class="n">n_layers</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-        <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">output_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">max_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
         <span class="n">non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
         <span class="n">stabilizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="nb">complex</span><span class="o">=</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">,</span>
-        <span class="n">fno_block_precision</span><span class="o">=</span><span class="s2">&quot;full&quot;</span><span class="p">,</span>
+        <span class="n">use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
         <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">norm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
@@ -701,6 +637,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
         <span class="n">preactivation</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">implementation</span><span class="o">=</span><span class="s2">&quot;factorized&quot;</span><span class="p">,</span>
         <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
@@ -716,12 +653,12 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">lifting_channels</span><span class="o">=</span><span class="n">lifting_channels</span><span class="p">,</span>
             <span class="n">projection_channels</span><span class="o">=</span><span class="n">projection_channels</span><span class="p">,</span>
             <span class="n">n_layers</span><span class="o">=</span><span class="n">n_layers</span><span class="p">,</span>
-            <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">resolution_scaling_factor</span><span class="p">,</span>
+            <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">output_scaling_factor</span><span class="p">,</span>
             <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
             <span class="n">stabilizer</span><span class="o">=</span><span class="n">stabilizer</span><span class="p">,</span>
-            <span class="nb">complex</span><span class="o">=</span><span class="nb">complex</span><span class="p">,</span>
-            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
             <span class="n">max_n_modes</span><span class="o">=</span><span class="n">max_n_modes</span><span class="p">,</span>
+            <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
+            <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">use_channel_mlp</span><span class="p">,</span>
             <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="n">channel_mlp_dropout</span><span class="p">,</span>
             <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="n">channel_mlp_expansion</span><span class="p">,</span>
             <span class="n">norm</span><span class="o">=</span><span class="n">norm</span><span class="p">,</span>
@@ -730,6 +667,7 @@ <h1>Source code for neuralop.models.fno</h1><div class="highlight"><pre>
             <span class="n">preactivation</span><span class="o">=</span><span class="n">preactivation</span><span class="p">,</span>
             <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
             <span class="n">rank</span><span class="o">=</span><span class="n">rank</span><span class="p">,</span>
+            <span class="n">joint_factorization</span><span class="o">=</span><span class="n">joint_factorization</span><span class="p">,</span>
             <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
             <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span>
             <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
diff --git a/dev/_modules/neuralop/models/gino.html b/dev/_modules/neuralop/models/gino.html
index 56135e7..97ccc44 100644
--- a/dev/_modules/neuralop/models/gino.html
+++ b/dev/_modules/neuralop/models/gino.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -183,7 +183,7 @@ <h1>Source code for neuralop.models.gino</h1><div class="highlight"><pre>
 <span class="sd">            number of channels in FNO&#39;s pointwise projection, by default 256</span>
 <span class="sd">        fno_n_layers : int, optional</span>
 <span class="sd">            number of layers in FNO, by default 4</span>
-<span class="sd">        fno_resolution_scaling_factor : float | None, optional</span>
+<span class="sd">        fno_output_scaling_factor : float | None, optional</span>
 <span class="sd">            factor by which to scale output of FNO, by default None</span>
 <span class="sd">        fno_incremental_n_modes : list[int] | None, defaults to None</span>
 <span class="sd">        if passed, sets n_modes separately for each FNO layer.</span>
@@ -255,7 +255,7 @@ <h1>Source code for neuralop.models.gino</h1><div class="highlight"><pre>
             <span class="n">fno_hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
             <span class="n">lifting_channels</span><span class="o">=</span><span class="mi">256</span><span class="p">,</span>
             <span class="n">fno_n_layers</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-            <span class="n">fno_resolution_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+            <span class="n">fno_output_scaling_factor</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
             <span class="n">fno_incremental_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
             <span class="n">fno_block_precision</span><span class="o">=</span><span class="s1">&#39;full&#39;</span><span class="p">,</span>
             <span class="n">fno_use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> 
@@ -328,7 +328,7 @@ <h1>Source code for neuralop.models.gino</h1><div class="highlight"><pre>
                 <span class="n">out_channels</span><span class="o">=</span><span class="n">fno_hidden_channels</span><span class="p">,</span>
                 <span class="n">positional_embedding</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
                 <span class="n">n_layers</span><span class="o">=</span><span class="n">fno_n_layers</span><span class="p">,</span>
-                <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="n">fno_resolution_scaling_factor</span><span class="p">,</span>
+                <span class="n">output_scaling_factor</span><span class="o">=</span><span class="n">fno_output_scaling_factor</span><span class="p">,</span>
                 <span class="n">incremental_n_modes</span><span class="o">=</span><span class="n">fno_incremental_n_modes</span><span class="p">,</span>
                 <span class="n">fno_block_precision</span><span class="o">=</span><span class="n">fno_block_precision</span><span class="p">,</span>
                 <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">fno_use_channel_mlp</span><span class="p">,</span>
diff --git a/dev/_modules/neuralop/models/uno.html b/dev/_modules/neuralop/models/uno.html
index 5f187e1..26721cc 100644
--- a/dev/_modules/neuralop/models/uno.html
+++ b/dev/_modules/neuralop/models/uno.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -173,10 +173,11 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
 <span class="sd">        * If None, all the n_modes are used.</span>
 
 <span class="sd">        This can be updated dynamically during training.</span>
-<span class="sd">    channel_mlp_dropout: float, optional</span>
-<span class="sd">        dropout parameter for channelMLP after each FNO Block</span>
-<span class="sd">    channel_mlp_expansions: float, optional</span>
-<span class="sd">        expansion parameter for channelMLP after each FNO block</span>
+<span class="sd">    use_channel_mlp : bool, optional</span>
+<span class="sd">        Whether to use an ChannelMLP layer after each FNO block, by default False</span>
+<span class="sd">    ChannelMLP : dict, optional</span>
+<span class="sd">        Parameters of the ChannelMLP, by default None</span>
+<span class="sd">        {&#39;expansion&#39;: float, &#39;dropout&#39;: float}</span>
 <span class="sd">    non_linearity : nn.Module, optional</span>
 <span class="sd">        Non-Linearity module to use, by default F.gelu</span>
 <span class="sd">    norm : F.module, optional</span>
@@ -227,17 +228,19 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
         <span class="n">uno_scalings</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">horizontal_skips_map</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">incremental_n_modes</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-        <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-        <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
+        <span class="n">use_channel_mlp</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+        <span class="n">channel_mlpdropout</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+        <span class="n">channel_mlpexpansion</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span>
         <span class="n">non_linearity</span><span class="o">=</span><span class="n">F</span><span class="o">.</span><span class="n">gelu</span><span class="p">,</span>
         <span class="n">norm</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">preactivation</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">fno_skip</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
         <span class="n">horizontal_skip</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
-        <span class="n">channel_mlp_skip</span><span class="o">=</span><span class="s2">&quot;soft-gating&quot;</span><span class="p">,</span>
+        <span class="n">channel_mlpskip</span><span class="o">=</span><span class="s2">&quot;soft-gating&quot;</span><span class="p">,</span>
         <span class="n">separable</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">factorization</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">rank</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
+        <span class="n">joint_factorization</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="n">integral_operator</span><span class="o">=</span><span class="n">SpectralConv</span><span class="p">,</span>
         <span class="n">operator_block</span><span class="o">=</span><span class="n">FNOBlocks</span><span class="p">,</span>
@@ -245,6 +248,8 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
         <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="nb">dict</span><span class="p">(),</span>
         <span class="n">domain_padding</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">domain_padding_mode</span><span class="o">=</span><span class="s2">&quot;one-sided&quot;</span><span class="p">,</span>
+        <span class="n">fft_norm</span><span class="o">=</span><span class="s2">&quot;forward&quot;</span><span class="p">,</span>
+        <span class="n">normalizer</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
         <span class="n">verbose</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
         <span class="o">**</span><span class="n">kwargs</span>
     <span class="p">):</span>
@@ -273,13 +278,15 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">in_channels</span> <span class="o">=</span> <span class="n">in_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">out_channels</span> <span class="o">=</span> <span class="n">out_channels</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">horizontal_skips_map</span> <span class="o">=</span> <span class="n">horizontal_skips_map</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">joint_factorization</span> <span class="o">=</span> <span class="n">joint_factorization</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">non_linearity</span> <span class="o">=</span> <span class="n">non_linearity</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">rank</span> <span class="o">=</span> <span class="n">rank</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">factorization</span> <span class="o">=</span> <span class="n">factorization</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">fixed_rank_modes</span> <span class="o">=</span> <span class="n">fixed_rank_modes</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">decomposition_kwargs</span> <span class="o">=</span> <span class="n">decomposition_kwargs</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">fno_skip</span> <span class="o">=</span> <span class="p">(</span><span class="n">fno_skip</span><span class="p">,)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">channel_mlp_skip</span> <span class="o">=</span> <span class="p">(</span><span class="n">channel_mlp_skip</span><span class="p">,)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">channel_mlpskip</span> <span class="o">=</span> <span class="p">(</span><span class="n">channel_mlpskip</span><span class="p">,)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">fft_norm</span> <span class="o">=</span> <span class="n">fft_norm</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">implementation</span> <span class="o">=</span> <span class="n">implementation</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">separable</span> <span class="o">=</span> <span class="n">separable</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">preactivation</span> <span class="o">=</span> <span class="n">preactivation</span>
@@ -347,7 +354,7 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
             <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding</span> <span class="o">=</span> <span class="n">DomainPadding</span><span class="p">(</span>
                 <span class="n">domain_padding</span><span class="o">=</span><span class="n">domain_padding</span><span class="p">,</span>
                 <span class="n">padding_mode</span><span class="o">=</span><span class="n">domain_padding_mode</span><span class="p">,</span>
-                <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">end_to_end_scaling_factor</span><span class="p">,</span>
+                <span class="n">output_scaling_factor</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">end_to_end_scaling_factor</span><span class="p">,</span>
             <span class="p">)</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">domain_padding</span> <span class="o">=</span> <span class="kc">None</span>
@@ -370,29 +377,31 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
                     <span class="n">prev_out</span> <span class="o">+</span> <span class="bp">self</span><span class="o">.</span><span class="n">uno_out_channels</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">horizontal_skips_map</span><span class="p">[</span><span class="n">i</span><span class="p">]]</span>
                 <span class="p">)</span>
 
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">fno_skip</span><span class="si">=}</span><span class="s2">&quot;</span><span class="p">)</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">channel_mlp_skip</span><span class="si">=}</span><span class="s2">&quot;</span><span class="p">)</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
                 <span class="bp">self</span><span class="o">.</span><span class="n">operator_block</span><span class="p">(</span>
                     <span class="n">in_channels</span><span class="o">=</span><span class="n">prev_out</span><span class="p">,</span>
                     <span class="n">out_channels</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">uno_out_channels</span><span class="p">[</span><span class="n">i</span><span class="p">],</span>
                     <span class="n">n_modes</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">uno_n_modes</span><span class="p">[</span><span class="n">i</span><span class="p">],</span>
-                    <span class="n">channel_mlp_dropout</span><span class="o">=</span><span class="n">channel_mlp_dropout</span><span class="p">,</span>
-                    <span class="n">channel_mlp_expansion</span><span class="o">=</span><span class="n">channel_mlp_expansion</span><span class="p">,</span>
-                    <span class="n">resolution_scaling_factor</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">uno_scalings</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
+                    <span class="n">use_channel_mlp</span><span class="o">=</span><span class="n">use_channel_mlp</span><span class="p">,</span>
+                    <span class="n">channel_mlpdropout</span><span class="o">=</span><span class="n">channel_mlpdropout</span><span class="p">,</span>
+                    <span class="n">channel_mlpexpansion</span><span class="o">=</span><span class="n">channel_mlpexpansion</span><span class="p">,</span>
+                    <span class="n">output_scaling_factor</span><span class="o">=</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">uno_scalings</span><span class="p">[</span><span class="n">i</span><span class="p">]],</span>
                     <span class="n">non_linearity</span><span class="o">=</span><span class="n">non_linearity</span><span class="p">,</span>
                     <span class="n">norm</span><span class="o">=</span><span class="n">norm</span><span class="p">,</span>
                     <span class="n">preactivation</span><span class="o">=</span><span class="n">preactivation</span><span class="p">,</span>
                     <span class="n">fno_skip</span><span class="o">=</span><span class="n">fno_skip</span><span class="p">,</span>
-                    <span class="n">channel_mlp_skip</span><span class="o">=</span><span class="n">channel_mlp_skip</span><span class="p">,</span>
+                    <span class="n">channel_mlpskip</span><span class="o">=</span><span class="n">channel_mlpskip</span><span class="p">,</span>
                     <span class="n">incremental_n_modes</span><span class="o">=</span><span class="n">incremental_n_modes</span><span class="p">,</span>
                     <span class="n">rank</span><span class="o">=</span><span class="n">rank</span><span class="p">,</span>
                     <span class="n">SpectralConv</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">integral_operator</span><span class="p">,</span>
+                    <span class="n">fft_norm</span><span class="o">=</span><span class="n">fft_norm</span><span class="p">,</span>
                     <span class="n">fixed_rank_modes</span><span class="o">=</span><span class="n">fixed_rank_modes</span><span class="p">,</span>
                     <span class="n">implementation</span><span class="o">=</span><span class="n">implementation</span><span class="p">,</span>
                     <span class="n">separable</span><span class="o">=</span><span class="n">separable</span><span class="p">,</span>
                     <span class="n">factorization</span><span class="o">=</span><span class="n">factorization</span><span class="p">,</span>
                     <span class="n">decomposition_kwargs</span><span class="o">=</span><span class="n">decomposition_kwargs</span><span class="p">,</span>
+                    <span class="n">joint_factorization</span><span class="o">=</span><span class="n">joint_factorization</span><span class="p">,</span>
+                    <span class="n">normalizer</span><span class="o">=</span><span class="n">normalizer</span><span class="p">,</span>
                 <span class="p">)</span>
             <span class="p">)</span>
 
@@ -436,12 +445,12 @@ <h1>Source code for neuralop.models.uno</h1><div class="highlight"><pre>
             
             <span class="k">if</span> <span class="n">layer_idx</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">horizontal_skips_map</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
                 <span class="n">skip_val</span> <span class="o">=</span> <span class="n">skip_outputs</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">horizontal_skips_map</span><span class="p">[</span><span class="n">layer_idx</span><span class="p">]]</span>
-                <span class="n">resolution_scaling_factors</span> <span class="o">=</span> <span class="p">[</span>
+                <span class="n">output_scaling_factors</span> <span class="o">=</span> <span class="p">[</span>
                     <span class="n">m</span> <span class="o">/</span> <span class="n">n</span> <span class="k">for</span> <span class="p">(</span><span class="n">m</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">shape</span><span class="p">,</span> <span class="n">skip_val</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
                 <span class="p">]</span>
-                <span class="n">resolution_scaling_factors</span> <span class="o">=</span> <span class="n">resolution_scaling_factors</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span> <span class="p">:]</span>
+                <span class="n">output_scaling_factors</span> <span class="o">=</span> <span class="n">output_scaling_factors</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span> <span class="p">:]</span>
                 <span class="n">t</span> <span class="o">=</span> <span class="n">resample</span><span class="p">(</span>
-                    <span class="n">skip_val</span><span class="p">,</span> <span class="n">resolution_scaling_factors</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
+                    <span class="n">skip_val</span><span class="p">,</span> <span class="n">output_scaling_factors</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="o">-</span><span class="bp">self</span><span class="o">.</span><span class="n">n_dim</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
                 <span class="p">)</span>
                 <span class="n">x</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">([</span><span class="n">x</span><span class="p">,</span> <span class="n">t</span><span class="p">],</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
 
diff --git a/dev/_modules/neuralop/training/callbacks.html b/dev/_modules/neuralop/training/callbacks.html
deleted file mode 100644
index ac3eccf..0000000
--- a/dev/_modules/neuralop/training/callbacks.html
+++ /dev/null
@@ -1,721 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
-    <title>neuralop.training.callbacks &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../../index.html">
-            <img src="../../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../../../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-
-      <div class="container content main-content">
-        
-  <h1>Source code for neuralop.training.callbacks</h1><div class="highlight"><pre>
-<span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">Callbacks store all non-essential logic</span>
-<span class="sd">required to run specific training scripts. </span>
-
-<span class="sd">The callbacks in this module follow the form and </span>
-<span class="sd">logic of callbacks in Pytorch-Lightning (https://lightning.ai/docs/pytorch/stable)</span>
-<span class="sd">&quot;&quot;&quot;</span>
-
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">from</span> <span class="nn">pathlib</span> <span class="kn">import</span> <span class="n">Path</span>
-<span class="kn">import</span> <span class="nn">sys</span>
-<span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">List</span><span class="p">,</span> <span class="n">Union</span><span class="p">,</span> <span class="n">Literal</span>
-
-<span class="kn">import</span> <span class="nn">torch</span>
-<span class="kn">import</span> <span class="nn">wandb</span>
-
-<span class="kn">from</span> <span class="nn">.training_state</span> <span class="kn">import</span> <span class="n">save_training_state</span><span class="p">,</span> <span class="n">load_training_state</span>
-<span class="kn">from</span> <span class="nn">neuralop.utils</span> <span class="kn">import</span> <span class="n">compute_rank</span><span class="p">,</span> <span class="n">compute_stable_rank</span><span class="p">,</span> <span class="n">compute_explained_variance</span>
-
-
-<div class="viewcode-block" id="Callback">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.training.callbacks.Callback.html#neuralop.training.callbacks.Callback">[docs]</a>
-<span class="k">class</span> <span class="nc">Callback</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Base callback class. Each abstract method is called in the trainer&#39;s</span>
-<span class="sd">    training loop at the appropriate time.</span>
-
-<span class="sd">    Callbacks are stateful, meaning they keep track of a state and</span>
-<span class="sd">        update it throughout the lifetime of a Trainer class.</span>
-<span class="sd">        Storing the state as a dict enables the Callback to keep track of</span>
-<span class="sd">        references to underlying parts of the Trainer&#39;s process, such as</span>
-<span class="sd">        models, cost functions and output encoders</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span> <span class="o">=</span> <span class="p">{}</span>
-
-    <span class="k">def</span> <span class="nf">_update_state_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_init_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_init_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_before_train</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_train_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_load_to_device</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_before_forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_before_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">compute_training_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
-
-    <span class="k">def</span> <span class="nf">on_batch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_train_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_before_val</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_before_val_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">compute_val_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_batch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">pass</span></div>
-
-
-
-<span class="k">class</span> <span class="nc">PipelineCallback</span><span class="p">(</span><span class="n">Callback</span><span class="p">):</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">callbacks</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">Callback</span><span class="p">]):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        PipelineCallback handles logic for the case in which</span>
-<span class="sd">        a user passes more than one Callback to a trainer.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        callbacks : List[Callback]</span>
-<span class="sd">            list of Callbacks to use in Trainer</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span> <span class="o">=</span> <span class="n">callbacks</span>
-
-        <span class="n">overrides_device_load</span> <span class="o">=</span> <span class="p">[</span>
-            <span class="s2">&quot;on_load_to_device&quot;</span> <span class="ow">in</span> <span class="n">c</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__dict__</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">callbacks</span>
-        <span class="p">]</span>
-
-        <span class="k">assert</span> <span class="p">(</span>
-            <span class="nb">sum</span><span class="p">(</span><span class="n">overrides_device_load</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span>
-        <span class="p">),</span> <span class="s2">&quot;More than one callback cannot override device loading&quot;</span>
-        <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">overrides_device_load</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">device_load_callback_idx</span> <span class="o">=</span> <span class="n">overrides_device_load</span><span class="o">.</span><span class="n">index</span><span class="p">(</span><span class="kc">True</span><span class="p">)</span>
-            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;using custom callback to load data to device.&quot;</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">device_load_callback_idx</span> <span class="o">=</span> <span class="kc">None</span>
-            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;using standard method to load data to device.&quot;</span><span class="p">)</span>
-
-        <span class="c1"># unless loss computation is overriden, call a basic loss function calculation</span>
-        <span class="n">overrides_loss</span> <span class="o">=</span> <span class="p">[</span>
-            <span class="s2">&quot;compute_training_loss&quot;</span> <span class="ow">in</span> <span class="n">c</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__dict__</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">callbacks</span>
-        <span class="p">]</span>
-
-        <span class="k">if</span> <span class="nb">sum</span><span class="p">(</span><span class="n">overrides_loss</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="mi">1</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">overrides_loss</span> <span class="o">=</span> <span class="kc">True</span>
-            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;using custom callback to compute loss.&quot;</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">overrides_loss</span> <span class="o">=</span> <span class="kc">False</span>
-            <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;using standard method to compute loss.&quot;</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">_update_state_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_init_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_init_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_init_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_init_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_before_train</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_before_train</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_train_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_train_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_epoch_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_batch_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_load_to_device</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">device_load_callback_idx</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">[</span><span class="bp">self</span><span class="o">.</span><span class="n">device_load_callback_idx</span><span class="p">]</span><span class="o">.</span><span class="n">on_load_to_device</span><span class="p">(</span>
-                <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">*</span><span class="n">kwargs</span>
-            <span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_before_forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_before_forward</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_before_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_before_loss</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">compute_training_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">overrides_loss</span><span class="p">:</span>
-            <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-                <span class="n">c</span><span class="o">.</span><span class="n">compute_training_loss</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_batch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_batch_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_epoch_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_train_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_train_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_before_val</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_before_val</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_val_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_val_epoch_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_val_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_val_batch_start</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_before_val_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_before_val_loss</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">compute_val_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">overrides_loss</span><span class="p">:</span>
-            <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-                <span class="n">c</span><span class="o">.</span><span class="n">compute_val_loss</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="k">pass</span>
-
-    <span class="k">def</span> <span class="nf">on_val_batch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_val_batch_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_val_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_val_epoch_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_val_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">callbacks</span><span class="p">:</span>
-            <span class="n">c</span><span class="o">.</span><span class="n">on_val_end</span><span class="p">(</span><span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-<div class="viewcode-block" id="CheckpointCallback">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.training.callbacks.CheckpointCallback.html#neuralop.training.callbacks.CheckpointCallback">[docs]</a>
-<span class="k">class</span> <span class="nc">CheckpointCallback</span><span class="p">(</span><span class="n">Callback</span><span class="p">):</span>
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
-        <span class="bp">self</span><span class="p">,</span>
-        <span class="n">save_dir</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">Path</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span>
-        <span class="n">save_best</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">save_interval</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
-        <span class="n">save_optimizer</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-        <span class="n">save_scheduler</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-        <span class="n">save_regularizer</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-        <span class="n">resume_from_dir</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">Path</span><span class="p">,</span> <span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-    <span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;CheckpointCallback handles saving and resuming</span>
-<span class="sd">        training state from checkpoint .pt save files.</span>
-
-<span class="sd">        Parameters</span>
-<span class="sd">        ----------</span>
-<span class="sd">        save_dir : Union[Path, str], optional</span>
-<span class="sd">            folder in which to save checkpoints, by default &#39;./checkpoints&#39;</span>
-<span class="sd">        save_best : str, optional</span>
-<span class="sd">            metric to monitor for best value in order to save state</span>
-<span class="sd">        save_interval : int, optional</span>
-<span class="sd">            interval on which to save/check metric, by default 1</span>
-<span class="sd">        save_optimizer : bool, optional</span>
-<span class="sd">            whether to save optimizer state, by default False</span>
-<span class="sd">        save_scheduler : bool, optional</span>
-<span class="sd">            whether to save scheduler state, by default False</span>
-<span class="sd">        save_regularizer : bool, optional</span>
-<span class="sd">            whether to save regularizer state, by default False</span>
-<span class="sd">        resume_from_dir : Union[Path, str], optional</span>
-<span class="sd">            folder from which to resume training state.</span>
-<span class="sd">            Expects saved states in the form: (all but model optional)</span>
-<span class="sd">               (best_model.pt or model.pt), optimizer.pt, scheduler.pt, regularizer.pt</span>
-<span class="sd">            All state files present will be loaded.</span>
-<span class="sd">            if some metric was monitored during checkpointing,</span>
-<span class="sd">            the file name will be best_model.pt.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">save_dir</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-            <span class="n">save_dir</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="n">save_dir</span><span class="p">)</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">save_dir</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
-            <span class="n">save_dir</span><span class="o">.</span><span class="n">mkdir</span><span class="p">(</span><span class="n">parents</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_dir</span> <span class="o">=</span> <span class="n">save_dir</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_interval</span> <span class="o">=</span> <span class="n">save_interval</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_best</span> <span class="o">=</span> <span class="n">save_best</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_optimizer</span> <span class="o">=</span> <span class="n">save_optimizer</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_scheduler</span> <span class="o">=</span> <span class="n">save_scheduler</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">save_regularizer</span> <span class="o">=</span> <span class="n">save_regularizer</span>
-
-        <span class="k">if</span> <span class="n">resume_from_dir</span><span class="p">:</span>
-            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">resume_from_dir</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-                <span class="n">resume_from_dir</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="n">resume_from_dir</span><span class="p">)</span>
-            <span class="k">assert</span> <span class="n">resume_from_dir</span><span class="o">.</span><span class="n">exists</span><span class="p">()</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span> <span class="o">=</span> <span class="n">resume_from_dir</span>
-
-    <span class="k">def</span> <span class="nf">on_init_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_train_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-        <span class="n">verbose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;verbose&quot;</span><span class="p">,</span> <span class="kc">False</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">save_best</span><span class="p">:</span>
-            <span class="k">assert</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span>
-                <span class="s2">&quot;eval_losses&quot;</span>
-            <span class="p">],</span> <span class="s2">&quot;Error: cannot monitor a metric if no validation metrics exist.&quot;</span>
-            <span class="k">assert</span> <span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">save_best</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;eval_losses&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
-            <span class="p">),</span> <span class="s2">&quot;Error: cannot monitor a metric outside of eval_losses.&quot;</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">best_metric_value</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s2">&quot;inf&quot;</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">best_metric_value</span> <span class="o">=</span> <span class="kc">None</span>
-
-        <span class="c1"># load state dict if resume_from_dir is given</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span><span class="p">:</span>
-            <span class="n">saved_modules</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="o">.</span><span class="n">stem</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span><span class="o">.</span><span class="n">glob</span><span class="p">(</span><span class="s2">&quot;*.pt&quot;</span><span class="p">)]</span>
-
-            <span class="c1"># check for save model exists</span>
-            <span class="k">if</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span> <span class="o">/</span> <span class="s2">&quot;best_model_state_dict.pt&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
-                <span class="n">save_name</span> <span class="o">=</span> <span class="s2">&quot;best_model&quot;</span>
-            <span class="k">elif</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span> <span class="o">/</span> <span class="s2">&quot;model_state_dict.pt&quot;</span><span class="p">)</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
-                <span class="n">save_name</span> <span class="o">=</span> <span class="s2">&quot;model&quot;</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="k">raise</span> <span class="ne">FileNotFoundError</span><span class="p">(</span><span class="s2">&quot;Error: CheckpointCallback expects a model</span><span class="se">\</span>
-<span class="s2">                                         state dict named model.pt or best_model.pt.&quot;</span><span class="p">)</span>
-            <span class="c1"># returns key-value pairs &quot;model&quot;:model, &quot;optimizer&quot;:optimizer...</span>
-            <span class="n">training_state</span> <span class="o">=</span> <span class="n">load_training_state</span><span class="p">(</span><span class="n">save_dir</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">resume_from_dir</span><span class="p">,</span> <span class="n">save_name</span><span class="o">=</span><span class="n">save_name</span><span class="p">,</span>
-                                                 <span class="n">model</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">],</span>
-                                                 <span class="n">optimizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;optimizer&#39;</span><span class="p">),</span>
-                                                 <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;regularizer&#39;</span><span class="p">),</span>
-                                                 <span class="n">scheduler</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;scheduler&#39;</span><span class="p">))</span>
-            
-            <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">training_state</span><span class="p">)</span>
-            
-    <span class="k">def</span> <span class="nf">on_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">on_val_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-<div class="viewcode-block" id="CheckpointCallback.on_val_epoch_end">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.training.callbacks.CheckpointCallback.html#neuralop.training.callbacks.CheckpointCallback.on_val_epoch_end">[docs]</a>
-    <span class="k">def</span> <span class="nf">on_val_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Update state dict with errors</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></div>
-
-
-<div class="viewcode-block" id="CheckpointCallback.on_epoch_end">
-<a class="viewcode-back" href="../../../modules/generated/neuralop.training.callbacks.CheckpointCallback.html#neuralop.training.callbacks.CheckpointCallback.on_epoch_end">[docs]</a>
-    <span class="k">def</span> <span class="nf">on_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Save state to dir if all conditions are met</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">save_best</span><span class="p">:</span>
-            <span class="n">log_prefix</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;log_prefix&quot;</span><span class="p">]</span>
-            <span class="k">if</span> <span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;errors&quot;</span><span class="p">][</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">log_prefix</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">save_best</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span>
-                <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">best_metric_value</span>
-            <span class="p">):</span>
-                <span class="n">metric_cond</span> <span class="o">=</span> <span class="kc">True</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">metric_cond</span> <span class="o">=</span> <span class="kc">False</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">metric_cond</span> <span class="o">=</span> <span class="kc">True</span>
-
-        <span class="c1"># Save states to save_dir</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;epoch&quot;</span><span class="p">]</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">save_interval</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">metric_cond</span><span class="p">:</span>
-            <span class="c1"># save model or best_model.pt no matter what</span>
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">save_best</span><span class="p">:</span>
-                <span class="n">model_name</span> <span class="o">=</span> <span class="s2">&quot;best_model&quot;</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">model_name</span> <span class="o">=</span> <span class="s2">&quot;model&quot;</span>
-
-            <span class="n">save_training_state</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">save_dir</span><span class="p">,</span>
-                <span class="n">model_name</span><span class="p">,</span>
-                <span class="n">model</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;model&quot;</span><span class="p">],</span>
-                <span class="n">optimizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;optimizer&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span>
-                <span class="n">regularizer</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;regularizer&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span>
-                <span class="n">scheduler</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;scheduler&quot;</span><span class="p">,</span> <span class="kc">None</span><span class="p">),</span>
-            <span class="p">)</span>
-
-            <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;verbose&quot;</span><span class="p">]:</span>
-                <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Saved training state to </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">save_dir</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span></div>
-</div>
-
-
-<span class="k">class</span> <span class="nc">IncrementalCallback</span><span class="p">(</span><span class="n">Callback</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Callback that implements the Incremental Algorithm - Both the Gradient explained and Loss Gap versions</span>
-<span class="sd">    </span>
-<span class="sd">    incremental : bool, default is False</span>
-<span class="sd">        if True, use the base incremental algorithm which is based on gradient variance</span>
-<span class="sd">        uses the incremental_grad_eps parameter - set the threshold for gradient variance</span>
-<span class="sd">        uses the incremental_buffer paramater - sets the number of buffer modes to calculate the gradient variance</span>
-<span class="sd">        uses the incremental_max_iter parameter - sets the initial number of iterations</span>
-<span class="sd">        uses the incremental_grad_max_iter parameter - sets the maximum number of iterations to accumulate the gradients</span>
-<span class="sd">    incremental_loss_gap : bool, default is False</span>
-<span class="sd">        if True, use the incremental algorithm based on loss gap</span>
-<span class="sd">        uses the incremental_loss_eps parameter</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span>
-                 <span class="n">incremental_grad</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> 
-                 <span class="n">incremental_loss_gap</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> 
-                 <span class="n">incremental_grad_eps</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.001</span><span class="p">,</span>
-                 <span class="n">incremental_buffer</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span> 
-                 <span class="n">incremental_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span> 
-                 <span class="n">incremental_grad_max_iter</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10</span><span class="p">,</span>
-                 <span class="n">incremental_loss_eps</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.001</span>
-                 <span class="p">):</span>
-        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_gap</span> <span class="o">=</span> <span class="n">incremental_loss_gap</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad</span> <span class="o">=</span> <span class="n">incremental_grad</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_gap</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad</span>
-        <span class="k">assert</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental</span><span class="p">,</span> <span class="s2">&quot;Error: IncrementalCallback expects at least one incremental algorithm to be True.&quot;</span>
-        <span class="k">assert</span> <span class="ow">not</span> <span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_gap</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad</span><span class="p">),</span> <span class="s2">&quot;Error: IncrementalCallback expects only one incremental algorithm to be True.&quot;</span>
-        
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad_eps</span> <span class="o">=</span> <span class="n">incremental_grad_eps</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_buffer</span> <span class="o">=</span> <span class="n">incremental_buffer</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_max_iter</span> <span class="o">=</span> <span class="n">incremental_max_iter</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad_max_iter</span> <span class="o">=</span> <span class="n">incremental_grad_max_iter</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_eps</span> <span class="o">=</span> <span class="n">incremental_loss_eps</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;Train&quot;</span>
-    
-    <span class="k">def</span> <span class="nf">on_init_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-    
-    <span class="k">def</span> <span class="nf">on_train_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="o">**</span><span class="n">kwargs</span><span class="p">)</span>
-
-        <span class="n">train_loader</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;train_loader&#39;</span><span class="p">]</span>
-        <span class="n">test_loaders</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;test_loaders&#39;</span><span class="p">]</span>
-        <span class="n">verbose</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;verbose&#39;</span><span class="p">]</span>
-
-        <span class="n">n_train</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">train_loader</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">n_train</span><span class="o">=</span><span class="n">n_train</span><span class="p">)</span>
-
-        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">test_loaders</span><span class="p">,</span> <span class="nb">dict</span><span class="p">):</span>
-            <span class="n">test_loaders</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="n">test</span><span class="o">=</span><span class="n">test_loaders</span><span class="p">)</span>
-
-        <span class="k">if</span> <span class="n">verbose</span><span class="p">:</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Training on </span><span class="si">{</span><span class="n">n_train</span><span class="si">}</span><span class="s1"> samples&#39;</span><span class="p">)</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Testing on </span><span class="si">{</span><span class="p">[</span><span class="nb">len</span><span class="p">(</span><span class="n">loader</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span><span class="w"> </span><span class="k">for</span><span class="w"> </span><span class="n">loader</span><span class="w"> </span><span class="ow">in</span><span class="w"> </span><span class="n">test_loaders</span><span class="o">.</span><span class="n">values</span><span class="p">()]</span><span class="si">}</span><span class="s1"> samples&#39;</span>
-                  <span class="sa">f</span><span class="s1">&#39;         on resolutions </span><span class="si">{</span><span class="p">[</span><span class="n">name</span><span class="w"> </span><span class="k">for</span><span class="w"> </span><span class="n">name</span><span class="w"> </span><span class="ow">in</span><span class="w"> </span><span class="n">test_loaders</span><span class="p">]</span><span class="si">}</span><span class="s1">.&#39;</span><span class="p">)</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
-        
-    <span class="k">def</span> <span class="nf">on_epoch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">epoch</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">epoch</span><span class="o">=</span><span class="n">epoch</span><span class="p">)</span>
-        
-    <span class="k">def</span> <span class="nf">on_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">epoch</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">epoch</span><span class="o">=</span><span class="n">epoch</span><span class="p">)</span>
-        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Currently the model is using incremental_n_modes = </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s2">&quot;model&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="si">}</span><span class="s1">&#39;</span><span class="p">)</span>
-    
-    <span class="k">def</span> <span class="nf">on_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">idx</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">idx</span><span class="o">=</span><span class="n">idx</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;Train&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">data</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;data_processor&#39;</span><span class="p">]</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">data</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">epoch</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;epoch&#39;</span><span class="p">]</span>
-        
-    <span class="k">def</span> <span class="nf">on_before_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">out</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;epoch&#39;</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;idx&#39;</span><span class="p">]</span> <span class="o">==</span> <span class="mi">0</span> \
-            <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;verbose&#39;</span><span class="p">]:</span>
-            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s1">&#39;Raw outputs of size </span><span class="si">{</span><span class="n">out</span><span class="o">.</span><span class="n">shape</span><span class="si">=}</span><span class="s1">&#39;</span><span class="p">)</span>
-    
-    <span class="k">def</span> <span class="nf">on_before_val</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">epoch</span><span class="p">,</span> <span class="n">train_err</span><span class="p">,</span> <span class="n">time</span><span class="p">,</span> <span class="n">avg_loss</span><span class="p">,</span> <span class="n">avg_lasso_loss</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="c1"># track training err and val losses to print at interval epochs</span>
-        <span class="n">msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s1">&#39;[</span><span class="si">{</span><span class="n">epoch</span><span class="si">}</span><span class="s1">] time=</span><span class="si">{</span><span class="n">time</span><span class="si">:</span><span class="s1">.2f</span><span class="si">}</span><span class="s1">, avg_loss=</span><span class="si">{</span><span class="n">avg_loss</span><span class="si">:</span><span class="s1">.4f</span><span class="si">}</span><span class="s1">, train_err=</span><span class="si">{</span><span class="n">train_err</span><span class="si">:</span><span class="s1">.4f</span><span class="si">}</span><span class="s1">&#39;</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">step</span><span class="p">(</span><span class="n">avg_loss</span><span class="p">)</span>
-        
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">msg</span><span class="o">=</span><span class="n">msg</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_state_dict</span><span class="p">(</span><span class="n">avg_lasso_loss</span><span class="o">=</span><span class="n">avg_lasso_loss</span><span class="p">)</span>
-        
-    <span class="k">def</span> <span class="nf">on_val_epoch_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">errors</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">loss_name</span><span class="p">,</span> <span class="n">loss_value</span> <span class="ow">in</span> <span class="n">errors</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-            <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">loss_value</span><span class="p">,</span> <span class="nb">float</span><span class="p">):</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;msg&#39;</span><span class="p">]</span> <span class="o">+=</span> <span class="sa">f</span><span class="s1">&#39;, </span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s1">=</span><span class="si">{</span><span class="n">loss_value</span><span class="si">:</span><span class="s1">.4f</span><span class="si">}</span><span class="s1">&#39;</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">loss_value</span> <span class="o">=</span> <span class="p">{</span><span class="n">i</span><span class="p">:</span><span class="n">e</span><span class="o">.</span><span class="n">item</span><span class="p">()</span> <span class="k">for</span> <span class="p">(</span><span class="n">i</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">loss_value</span><span class="p">)}</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;msg&#39;</span><span class="p">]</span> <span class="o">+=</span> <span class="sa">f</span><span class="s1">&#39;, </span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s1">=</span><span class="si">{</span><span class="n">loss_value</span><span class="si">}</span><span class="s1">&#39;</span>
-    
-    <span class="k">def</span> <span class="nf">on_val_batch_start</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">mode</span> <span class="o">=</span> <span class="s2">&quot;Validation&quot;</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">data</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">epoch</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;epoch&#39;</span><span class="p">]</span>
-
-    <span class="k">def</span> <span class="nf">on_val_end</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="n">args</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;regularizer&#39;</span><span class="p">,</span> <span class="kc">False</span><span class="p">):</span>
-            <span class="n">avg_lasso</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;avg_lasso_loss&#39;</span><span class="p">,</span> <span class="mf">0.</span><span class="p">)</span>
-            <span class="n">avg_lasso</span> <span class="o">/=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;n_epochs&#39;</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;msg&#39;</span><span class="p">]</span> <span class="o">+=</span> <span class="sa">f</span><span class="s1">&#39;, avg_lasso=</span><span class="si">{</span><span class="n">avg_lasso</span><span class="si">:</span><span class="s1">.5f</span><span class="si">}</span><span class="s1">&#39;</span>
-        
-        <span class="nb">print</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;msg&#39;</span><span class="p">])</span>
-        <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
-    
-    <span class="c1"># Main step function: which algorithm to run</span>
-    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_gap</span> <span class="ow">and</span> <span class="n">loss</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">loss_gap</span><span class="p">(</span><span class="n">loss</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">grad_explained</span><span class="p">()</span>
-    
-    <span class="c1"># Algorithm 1: Incremental</span>
-    <span class="k">def</span> <span class="nf">loss_gap</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">loss</span><span class="p">):</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
-        <span class="c1"># method 1: loss_gap</span>
-        <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-            <span class="k">if</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">])</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_eps</span><span class="p">:</span>
-                <span class="k">if</span> <span class="n">incremental_modes</span> <span class="o">&lt;</span> <span class="n">max_modes</span><span class="p">:</span>
-                    <span class="n">incremental_modes</span> <span class="o">+=</span> <span class="mi">1</span>
-        <span class="n">modes_list</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="n">incremental_modes</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="n">modes_list</span>
-
-    <span class="c1"># Algorithm 2: Gradient based explained ratio</span>
-    <span class="k">def</span> <span class="nf">grad_explained</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-        <span class="c1"># for mode 1</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="s1">&#39;accumulated_grad&#39;</span><span class="p">):</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="s1">&#39;grad_iter&#39;</span><span class="p">):</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">=</span> <span class="mi">1</span>
-            
-        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad_max_iter</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">+=</span> <span class="mi">1</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">incremental_final</span> <span class="o">=</span> <span class="p">[]</span>
-            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">):</span>
-                <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-                <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-                <span class="n">weight</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span>
-                <span class="n">strength_vector</span> <span class="o">=</span> <span class="p">[]</span>
-                <span class="k">for</span> <span class="n">mode_index</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
-                        <span class="nb">min</span><span class="p">(</span><span class="n">weight</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">incremental_modes</span><span class="p">)):</span>
-                    <span class="n">strength</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">norm</span><span class="p">(</span>
-                        <span class="n">weight</span><span class="p">[:,</span> <span class="n">mode_index</span><span class="p">,</span> <span class="p">:],</span> <span class="n">p</span><span class="o">=</span><span class="s1">&#39;fro&#39;</span><span class="p">)</span>
-                    <span class="n">strength_vector</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">strength</span><span class="p">)</span>
-                <span class="n">expained_ratio</span> <span class="o">=</span> <span class="n">compute_explained_variance</span><span class="p">(</span>
-                    <span class="n">incremental_modes</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_buffer</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">(</span><span class="n">strength_vector</span><span class="p">))</span>
-                <span class="k">if</span> <span class="n">expained_ratio</span> <span class="o">&lt;</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad_eps</span><span class="p">:</span>
-                    <span class="k">if</span> <span class="n">incremental_modes</span> <span class="o">&lt;</span> <span class="n">max_modes</span><span class="p">:</span>
-                        <span class="n">incremental_modes</span> <span class="o">+=</span> <span class="mi">1</span>
-                <span class="n">incremental_final</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">incremental_modes</span><span class="p">)</span>
-
-            <span class="c1"># update the modes and frequency dimensions</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">=</span> <span class="mi">1</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-            <span class="n">main_modes</span> <span class="o">=</span> <span class="n">incremental_final</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-            <span class="n">modes_list</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="n">main_modes</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">state_dict</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">modes_list</span><span class="p">)</span>
-</pre></div>
-
-      </div>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/_modules/neuralop/training/incremental.html b/dev/_modules/neuralop/training/incremental.html
index d2298fd..2a8afca 100644
--- a/dev/_modules/neuralop/training/incremental.html
+++ b/dev/_modules/neuralop/training/incremental.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -241,17 +241,17 @@ <h1>Source code for neuralop.training.incremental</h1><div class="highlight"><pr
 <span class="sd">            scalar value of epoch&#39;s training loss</span>
 <span class="sd">        &quot;&quot;&quot;</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
 
         <span class="c1"># method 1: loss_gap</span>
-        <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-        <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+        <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+        <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
         <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
             <span class="k">if</span> <span class="nb">abs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_list</span><span class="p">[</span><span class="o">-</span><span class="mi">2</span><span class="p">])</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_loss_eps</span><span class="p">:</span>
                 <span class="k">if</span> <span class="n">incremental_modes</span> <span class="o">&lt;</span> <span class="n">max_modes</span><span class="p">:</span>
                     <span class="n">incremental_modes</span> <span class="o">+=</span> <span class="mi">1</span>
         <span class="n">modes_list</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="n">incremental_modes</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="n">modes_list</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="n">modes_list</span></div>
 
 
     <span class="c1"># Algorithm 2: Gradient based explained ratio</span>
@@ -259,19 +259,19 @@ <h1>Source code for neuralop.training.incremental</h1><div class="highlight"><pr
         <span class="c1"># for mode 1</span>
         <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="s1">&#39;accumulated_grad&#39;</span><span class="p">):</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">weight</span><span class="p">)</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
         <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="s1">&#39;grad_iter&#39;</span><span class="p">):</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">=</span> <span class="mi">1</span>
             
-        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">)</span>
         <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">incremental_grad_max_iter</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">+=</span> <span class="mi">1</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">weight</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">+=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
         <span class="k">else</span><span class="p">:</span>
             <span class="n">incremental_final</span> <span class="o">=</span> <span class="p">[]</span>
             <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">):</span>
-                <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-                <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+                <span class="n">max_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">max_n_modes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+                <span class="n">incremental_modes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
                 <span class="n">weight</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span>
                 <span class="n">strength_vector</span> <span class="o">=</span> <span class="p">[]</span>
                 <span class="k">for</span> <span class="n">mode_index</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span>
@@ -289,10 +289,10 @@ <h1>Source code for neuralop.training.incremental</h1><div class="highlight"><pr
             <span class="c1"># update the modes and frequency dimensions</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">grad_iter</span> <span class="o">=</span> <span class="mi">1</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">accumulated_grad</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">weight</span><span class="p">)</span>
+                <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">weight</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
             <span class="n">main_modes</span> <span class="o">=</span> <span class="n">incremental_final</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
             <span class="n">modes_list</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">([</span><span class="n">main_modes</span><span class="p">]</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">ndim</span><span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">modes_list</span><span class="p">)</span></div>
+            <span class="bp">self</span><span class="o">.</span><span class="n">model</span><span class="o">.</span><span class="n">fno_blocks</span><span class="o">.</span><span class="n">convs</span><span class="o">.</span><span class="n">n_modes</span> <span class="o">=</span> <span class="nb">tuple</span><span class="p">(</span><span class="n">modes_list</span><span class="p">)</span></div>
 
         
 </pre></div>
diff --git a/dev/_modules/neuralop/training/trainer.html b/dev/_modules/neuralop/training/trainer.html
index d015f2f..b164348 100644
--- a/dev/_modules/neuralop/training/trainer.html
+++ b/dev/_modules/neuralop/training/trainer.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/_sources/auto_examples/checkpoint_FNO_darcy.rst.txt b/dev/_sources/auto_examples/checkpoint_FNO_darcy.rst.txt
index 10290d9..f955fbf 100644
--- a/dev/_sources/auto_examples/checkpoint_FNO_darcy.rst.txt
+++ b/dev/_sources/auto_examples/checkpoint_FNO_darcy.rst.txt
@@ -62,19 +62,12 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
 We create a tensorized FNO model
 
-.. GENERATED FROM PYTHON SOURCE LINES 35-51
+.. GENERATED FROM PYTHON SOURCE LINES 35-44
 
 .. code-block:: Python
 
 
-    model = TFNO(n_modes=(16, 16),
-                 in_channels=1, 
-                 out_channels=1, 
-                 hidden_channels=32, 
-                 projection_channels=64, 
-                 factorization='tucker', 
-                 rank=0.42)
-
+    model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)
     model = model.to(device)
 
     n_params = count_model_params(model)
@@ -83,11 +76,11 @@ We create a tensorized FNO model
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 52-53
+.. GENERATED FROM PYTHON SOURCE LINES 45-46
 
 Create the optimizer
 
-.. GENERATED FROM PYTHON SOURCE LINES 53-59
+.. GENERATED FROM PYTHON SOURCE LINES 46-52
 
 .. code-block:: Python
 
@@ -98,11 +91,11 @@ Create the optimizer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 60-61
+.. GENERATED FROM PYTHON SOURCE LINES 53-54
 
 Creating the losses
 
-.. GENERATED FROM PYTHON SOURCE LINES 61-68
+.. GENERATED FROM PYTHON SOURCE LINES 54-61
 
 .. code-block:: Python
 
@@ -114,7 +107,7 @@ Creating the losses
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 69-80
+.. GENERATED FROM PYTHON SOURCE LINES 62-73
 
 .. code-block:: Python
 
@@ -130,11 +123,11 @@ Creating the losses
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 81-82
+.. GENERATED FROM PYTHON SOURCE LINES 74-75
 
 Create the trainer
 
-.. GENERATED FROM PYTHON SOURCE LINES 82-91
+.. GENERATED FROM PYTHON SOURCE LINES 75-84
 
 .. code-block:: Python
 
@@ -148,11 +141,11 @@ Create the trainer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 92-93
+.. GENERATED FROM PYTHON SOURCE LINES 85-86
 
 Actually train the model on our small Darcy-Flow dataset
 
-.. GENERATED FROM PYTHON SOURCE LINES 93-120
+.. GENERATED FROM PYTHON SOURCE LINES 86-113
 
 .. code-block:: Python
 
@@ -199,6 +192,10 @@ Actually train the model on our small Darcy-Flow dataset
 
       :download:`Download Python source code: checkpoint_FNO_darcy.py <checkpoint_FNO_darcy.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: checkpoint_FNO_darcy.zip <checkpoint_FNO_darcy.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/darcy_data_processor.rst.txt b/dev/_sources/auto_examples/darcy_data_processor.rst.txt
deleted file mode 100644
index 4a6c029..0000000
--- a/dev/_sources/auto_examples/darcy_data_processor.rst.txt
+++ /dev/null
@@ -1,91 +0,0 @@
-
-.. DO NOT EDIT.
-.. THIS FILE WAS AUTOMATICALLY GENERATED BY SPHINX-GALLERY.
-.. TO MAKE CHANGES, EDIT THE SOURCE PYTHON FILE:
-.. "auto_examples/darcy_data_processor.py"
-.. LINE NUMBERS ARE GIVEN BELOW.
-
-.. only:: html
-
-    .. note::
-        :class: sphx-glr-download-link-note
-
-        :ref:`Go to the end <sphx_glr_download_auto_examples_darcy_data_processor.py>`
-        to download the full example code.
-
-.. rst-class:: sphx-glr-example-title
-
-.. _sphx_glr_auto_examples_darcy_data_processor.py:
-
-
-Data Processors
-=============================
-
-In this example, we demonstrate how to use neuralop.data.transforms.DataProcessor
-to preprocess and postprocess the small Darcy Flow example we ship with the package
-for downstream use in training a neural operator model. 
-
-.. GENERATED FROM PYTHON SOURCE LINES 12-27
-
-.. code-block:: Python
-
-    import torch
-    import matplotlib.pyplot as plt
-    import sys
-    from neuralop.models import TFNO
-    from neuralop import Trainer
-    from neuralop.training import CheckpointCallback
-    from neuralop.data.datasets import load_darcy_flow_small
-    from neuralop.utils import count_model_params
-    from neuralop import LpLoss, H1Loss
-
-    device = 'cpu'
-
-    """
-    First, let's load the small Darcy Flow dataset:
-    """
-
-.. GENERATED FROM PYTHON SOURCE LINES 28-29
-
-Loading the Navier-Stokes dataset in 128x128 resolution
-
-.. GENERATED FROM PYTHON SOURCE LINES 29-36
-
-.. code-block:: Python
-
-    train_loader, test_loaders, data_processor = load_darcy_flow_small(
-            n_train=1000, batch_size=32, 
-            test_resolutions=[16, 32], n_tests=[100, 50],
-            test_batch_sizes=[32, 32],
-            data_root="../neuralop/data/datasets/data/"
-    )
-
-
-.. GENERATED FROM PYTHON SOURCE LINES 37-39
-
-.. code-block:: Python
-
-    """
-    Next let's visualize the data in its raw form.
-    """
-
-.. _sphx_glr_download_auto_examples_darcy_data_processor.py:
-
-.. only:: html
-
-  .. container:: sphx-glr-footer sphx-glr-footer-example
-
-    .. container:: sphx-glr-download sphx-glr-download-jupyter
-
-      :download:`Download Jupyter notebook: darcy_data_processor.ipynb <darcy_data_processor.ipynb>`
-
-    .. container:: sphx-glr-download sphx-glr-download-python
-
-      :download:`Download Python source code: darcy_data_processor.py <darcy_data_processor.py>`
-
-
-.. only:: html
-
- .. rst-class:: sphx-glr-signature
-
-    `Gallery generated by Sphinx-Gallery <https://sphinx-gallery.github.io>`_
diff --git a/dev/_sources/auto_examples/index.rst.txt b/dev/_sources/auto_examples/index.rst.txt
index e2fa91b..6edc759 100644
--- a/dev/_sources/auto_examples/index.rst.txt
+++ b/dev/_sources/auto_examples/index.rst.txt
@@ -18,7 +18,7 @@ Gallery of examples
 
 .. raw:: html
 
-    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use torchtnt to estimate the number of floating-point op...">
+    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use torchtnt to estimate the number of floating-point operations per second (FLOPS) required for a model&#x27;s forward and backward pass. ">
 
 .. only:: html
 
@@ -52,7 +52,7 @@ Gallery of examples
 
 .. raw:: html
 
-    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the packag...">
+    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package to train a Tensorized Fourier-Neural Operator">
 
 .. only:: html
 
@@ -69,7 +69,7 @@ Gallery of examples
 
 .. raw:: html
 
-    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the packag...">
+    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package to train a Tensorized Fourier-Neural Operator">
 
 .. only:: html
 
@@ -80,13 +80,13 @@ Gallery of examples
 
 .. raw:: html
 
-      <div class="sphx-glr-thumbnail-title">Training an FNO on Darcy-Flow</div>
+      <div class="sphx-glr-thumbnail-title">Training a TFNO on Darcy-Flow</div>
     </div>
 
 
 .. raw:: html
 
-    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Spherical Shallow Water Equations example ...">
+    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Spherical Shallow Water Equations example we ship with the package to train a Spherical Fourier-Neural Operator">
 
 .. only:: html
 
@@ -103,7 +103,7 @@ Gallery of examples
 
 .. raw:: html
 
-    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to train a U-shaped Neural Operator on  the small Darcy-Flo...">
+    <div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to train a U-shaped Neural Operator on  the small Darcy-Flow example we ship with the package">
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_FNO_darcy.rst.txt b/dev/_sources/auto_examples/plot_FNO_darcy.rst.txt
index a771d21..85bebd2 100644
--- a/dev/_sources/auto_examples/plot_FNO_darcy.rst.txt
+++ b/dev/_sources/auto_examples/plot_FNO_darcy.rst.txt
@@ -18,21 +18,22 @@
 .. _sphx_glr_auto_examples_plot_FNO_darcy.py:
 
 
-Training an FNO on Darcy-Flow
+Training a TFNO on Darcy-Flow
 =============================
 
 In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package
-to train a Fourier-Neural Operator
+to train a Tensorized Fourier-Neural Operator
 
-.. GENERATED FROM PYTHON SOURCE LINES 11-25
+.. GENERATED FROM PYTHON SOURCE LINES 11-26
 
 .. code-block:: Python
 
 
+
     import torch
     import matplotlib.pyplot as plt
     import sys
-    from neuralop.models import FNO
+    from neuralop.models import TFNO
     from neuralop import Trainer
     from neuralop.training import AdamW
     from neuralop.data.datasets import load_darcy_flow_small
@@ -49,11 +50,11 @@ to train a Fourier-Neural Operator
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 26-27
+.. GENERATED FROM PYTHON SOURCE LINES 27-28
 
 Loading the Navier-Stokes dataset in 128x128 resolution
 
-.. GENERATED FROM PYTHON SOURCE LINES 27-35
+.. GENERATED FROM PYTHON SOURCE LINES 28-36
 
 .. code-block:: Python
 
@@ -73,26 +74,26 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
  .. code-block:: none
 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(
     Loading test db for resolution 16 with 100 samples 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(Path(root_dir).joinpath(f"{dataset_name}_test_{res}.pt").as_posix())
     Loading test db for resolution 32 with 50 samples 
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 36-37
+.. GENERATED FROM PYTHON SOURCE LINES 37-38
 
-We create a simple FNO model
+We create a tensorized FNO model
 
-.. GENERATED FROM PYTHON SOURCE LINES 37-50
+.. GENERATED FROM PYTHON SOURCE LINES 38-47
 
 .. code-block:: Python
 
 
-    model = FNO(n_modes=(16, 16),
-                 in_channels=1, 
-                 out_channels=1,
-                 hidden_channels=32, 
-                 projection_channels=64)
+    model = TFNO(n_modes=(16, 16), in_channels=1, hidden_channels=32, projection_channels=64, factorization='tucker', rank=0.42)
     model = model.to(device)
 
     n_params = count_model_params(model)
@@ -109,16 +110,16 @@ We create a simple FNO model
  .. code-block:: none
 
 
-    Our model has 1188385 parameters.
+    Our model has 523257 parameters.
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 51-52
+.. GENERATED FROM PYTHON SOURCE LINES 48-49
 
 Create the optimizer
 
-.. GENERATED FROM PYTHON SOURCE LINES 52-58
+.. GENERATED FROM PYTHON SOURCE LINES 49-55
 
 .. code-block:: Python
 
@@ -135,11 +136,11 @@ Create the optimizer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 59-60
+.. GENERATED FROM PYTHON SOURCE LINES 56-57
 
 Creating the losses
 
-.. GENERATED FROM PYTHON SOURCE LINES 60-67
+.. GENERATED FROM PYTHON SOURCE LINES 57-64
 
 .. code-block:: Python
 
@@ -157,7 +158,7 @@ Creating the losses
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 68-79
+.. GENERATED FROM PYTHON SOURCE LINES 65-76
 
 .. code-block:: Python
 
@@ -182,12 +183,12 @@ Creating the losses
 
 
     ### MODEL ###
-     FNO(
+     TFNO(
       (positional_embedding): GridEmbeddingND()
       (fno_blocks): FNOBlocks(
-        (convs): ModuleList(
-          (0-3): 4 x SpectralConv(
-            (weight): DenseTensor(shape=torch.Size([32, 32, 16, 9]), rank=None)
+        (convs): SpectralConv(
+          (weight): ModuleList(
+            (0-3): 4 x TuckerTensor(shape=(32, 32, 16, 9), rank=(26, 26, 13, 7))
           )
         )
         (fno_skips): ModuleList(
@@ -198,8 +199,8 @@ Creating the losses
       )
       (lifting): ChannelMLP(
         (fcs): ModuleList(
-          (0): Conv1d(3, 64, kernel_size=(1,), stride=(1,))
-          (1): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
+          (0): Conv1d(3, 256, kernel_size=(1,), stride=(1,))
+          (1): Conv1d(256, 32, kernel_size=(1,), stride=(1,))
         )
       )
       (projection): ChannelMLP(
@@ -222,22 +223,22 @@ Creating the losses
     )
 
     ### SCHEDULER ###
-     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fca77766020>
+     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7feaa01afac0>
 
     ### LOSSES ###
 
-     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7fca76f46830>
+     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7feaa01aff40>
 
-     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7fca76f46830>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7fca77798ca0>}
+     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7feaa01aff40>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7feaa01bcbe0>}
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 80-81
+.. GENERATED FROM PYTHON SOURCE LINES 77-78
 
 Create the trainer
 
-.. GENERATED FROM PYTHON SOURCE LINES 81-90
+.. GENERATED FROM PYTHON SOURCE LINES 78-87
 
 .. code-block:: Python
 
@@ -257,11 +258,11 @@ Create the trainer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 91-92
+.. GENERATED FROM PYTHON SOURCE LINES 88-89
 
 Actually train the model on our small Darcy-Flow dataset
 
-.. GENERATED FROM PYTHON SOURCE LINES 92-102
+.. GENERATED FROM PYTHON SOURCE LINES 89-99
 
 .. code-block:: Python
 
@@ -286,26 +287,26 @@ Actually train the model on our small Darcy-Flow dataset
     Training on 1000 samples
     Testing on [50, 50] samples         on resolutions [16, 32].
     Raw outputs of shape torch.Size([32, 1, 16, 16])
-    [0] time=1.66, avg_loss=0.5065, train_err=15.8288
-    Eval: 16_h1=0.2896, 16_l2=0.2301, 32_h1=0.3807, 32_l2=0.2436
-    [3] time=1.55, avg_loss=0.2119, train_err=6.6233
-    Eval: 16_h1=0.1865, 16_l2=0.1367, 32_h1=0.3028, 32_l2=0.1624
-    [6] time=1.54, avg_loss=0.1922, train_err=6.0064
-    Eval: 16_h1=0.2095, 16_l2=0.1634, 32_h1=0.3203, 32_l2=0.1882
-    [9] time=1.54, avg_loss=0.1814, train_err=5.6678
-    Eval: 16_h1=0.1942, 16_l2=0.1419, 32_h1=0.3132, 32_l2=0.1671
-    [12] time=1.54, avg_loss=0.1636, train_err=5.1129
-    Eval: 16_h1=0.2336, 16_l2=0.1748, 32_h1=0.3897, 32_l2=0.2129
-    [15] time=1.53, avg_loss=0.1126, train_err=3.5185
-    Eval: 16_h1=0.1868, 16_l2=0.1356, 32_h1=0.3154, 32_l2=0.1651
-    [18] time=1.54, avg_loss=0.1192, train_err=3.7263
-    Eval: 16_h1=0.1858, 16_l2=0.1359, 32_h1=0.3326, 32_l2=0.1827
+    [0] time=2.66, avg_loss=0.9003, train_err=28.1341
+    Eval: 16_h1=0.4747, 16_l2=0.3676, 32_h1=0.5249, 32_l2=0.3596
+    [3] time=2.69, avg_loss=0.3368, train_err=10.5251
+    Eval: 16_h1=0.2390, 16_l2=0.1887, 32_h1=0.3212, 32_l2=0.1959
+    [6] time=2.63, avg_loss=0.2176, train_err=6.8002
+    Eval: 16_h1=0.3172, 16_l2=0.2739, 32_h1=0.3649, 32_l2=0.2818
+    [9] time=2.66, avg_loss=0.1803, train_err=5.6347
+    Eval: 16_h1=0.1602, 16_l2=0.1168, 32_h1=0.2624, 32_l2=0.1403
+    [12] time=2.69, avg_loss=0.1738, train_err=5.4326
+    Eval: 16_h1=0.1735, 16_l2=0.1389, 32_h1=0.2747, 32_l2=0.1699
+    [15] time=2.65, avg_loss=0.1604, train_err=5.0136
+    Eval: 16_h1=0.1394, 16_l2=0.0983, 32_h1=0.2542, 32_l2=0.1292
+    [18] time=2.65, avg_loss=0.1506, train_err=4.7071
+    Eval: 16_h1=0.1596, 16_l2=0.1228, 32_h1=0.2629, 32_l2=0.1533
 
-    {'train_err': 3.398870412260294, 'avg_loss': 0.10876385319232941, 'avg_lasso_loss': None, 'epoch_train_time': 1.5358347818255424}
+    {'train_err': 4.956099387258291, 'avg_loss': 0.15859518039226533, 'avg_lasso_loss': None, 'epoch_train_time': 2.642554324999992}
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 103-113
+.. GENERATED FROM PYTHON SOURCE LINES 100-110
 
 Plot the prediction, and compare with the ground-truth 
 Note that we trained on a very small resolution for
@@ -318,7 +319,7 @@ ii) can be trained quickly on CPU
 
 In practice we would train a Neural Operator on one or multiple GPUs
 
-.. GENERATED FROM PYTHON SOURCE LINES 113-151
+.. GENERATED FROM PYTHON SOURCE LINES 110-148
 
 .. code-block:: Python
 
@@ -375,7 +376,7 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 32.144 seconds)
+   **Total running time of the script:** (0 minutes 54.415 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_FNO_darcy.py:
@@ -392,6 +393,10 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
       :download:`Download Python source code: plot_FNO_darcy.py <plot_FNO_darcy.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_FNO_darcy.zip <plot_FNO_darcy.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_SFNO_swe.rst.txt b/dev/_sources/auto_examples/plot_SFNO_swe.rst.txt
index e32be99..d0d3a0d 100644
--- a/dev/_sources/auto_examples/plot_SFNO_swe.rst.txt
+++ b/dev/_sources/auto_examples/plot_SFNO_swe.rst.txt
@@ -80,17 +80,12 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
 We create a tensorized FNO model
 
-.. GENERATED FROM PYTHON SOURCE LINES 33-47
+.. GENERATED FROM PYTHON SOURCE LINES 33-42
 
 .. code-block:: Python
 
 
-    model = SFNO(n_modes=(32, 32),
-                 in_channels=3,
-                 out_channels=3,
-                 hidden_channels=32,
-                 projection_channels=64,
-                 factorization='dense')
+    model = SFNO(n_modes=(32, 32), in_channels=3, out_channels=3, hidden_channels=32, projection_channels=64, factorization='dense')
     model = model.to(device)
 
     n_params = count_model_params(model)
@@ -106,21 +101,17 @@ We create a tensorized FNO model
 
  .. code-block:: none
 
-    self.sht_grids=['equiangular', 'equiangular']
-    self.sht_grids=['equiangular', 'equiangular']
-    self.sht_grids=['equiangular', 'equiangular']
-    self.sht_grids=['equiangular', 'equiangular']
 
-    Our model has 275555 parameters.
+    Our model has 278435 parameters.
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 48-49
+.. GENERATED FROM PYTHON SOURCE LINES 43-44
 
 Create the optimizer
 
-.. GENERATED FROM PYTHON SOURCE LINES 49-55
+.. GENERATED FROM PYTHON SOURCE LINES 44-50
 
 .. code-block:: Python
 
@@ -137,11 +128,11 @@ Create the optimizer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 56-57
+.. GENERATED FROM PYTHON SOURCE LINES 51-52
 
 Creating the losses
 
-.. GENERATED FROM PYTHON SOURCE LINES 57-64
+.. GENERATED FROM PYTHON SOURCE LINES 52-59
 
 .. code-block:: Python
 
@@ -159,7 +150,7 @@ Creating the losses
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 65-76
+.. GENERATED FROM PYTHON SOURCE LINES 60-71
 
 .. code-block:: Python
 
@@ -187,13 +178,13 @@ Creating the losses
      SFNO(
       (positional_embedding): GridEmbeddingND()
       (fno_blocks): FNOBlocks(
-        (convs): ModuleList(
-          (0-3): 4 x SphericalConv(
-            (weight): ComplexDenseTensor(shape=torch.Size([32, 32, 32]), rank=None)
-            (sht_handle): SHT(
-              (_SHT_cache): ModuleDict()
-              (_iSHT_cache): ModuleDict()
-            )
+        (convs): SphericalConv(
+          (weight): ModuleList(
+            (0-3): 4 x ComplexDenseTensor(shape=torch.Size([32, 32, 32]), rank=None)
+          )
+          (sht_handle): SHT(
+            (_SHT_cache): ModuleDict()
+            (_iSHT_cache): ModuleDict()
           )
         )
         (fno_skips): ModuleList(
@@ -201,22 +192,11 @@ Creating the losses
             (conv): Conv1d(32, 32, kernel_size=(1,), stride=(1,), bias=False)
           )
         )
-        (channel_mlp): ModuleList(
-          (0-3): 4 x ChannelMLP(
-            (fcs): ModuleList(
-              (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-              (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-            )
-          )
-        )
-        (channel_mlp_skips): ModuleList(
-          (0-3): 4 x SoftGating()
-        )
       )
       (lifting): ChannelMLP(
         (fcs): ModuleList(
-          (0): Conv1d(5, 64, kernel_size=(1,), stride=(1,))
-          (1): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
+          (0): Conv1d(5, 256, kernel_size=(1,), stride=(1,))
+          (1): Conv1d(256, 32, kernel_size=(1,), stride=(1,))
         )
       )
       (projection): ChannelMLP(
@@ -239,22 +219,22 @@ Creating the losses
     )
 
     ### SCHEDULER ###
-     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f746f238df0>
+     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fea8ebc0ee0>
 
     ### LOSSES ###
 
-     * Train: <neuralop.losses.data_losses.LpLoss object at 0x7f746c5a3d90>
+     * Train: <neuralop.losses.data_losses.LpLoss object at 0x7fea8ec2a2e0>
 
-     * Test: {'l2': <neuralop.losses.data_losses.LpLoss object at 0x7f746c5a3d90>}
+     * Test: {'l2': <neuralop.losses.data_losses.LpLoss object at 0x7fea8ec2a2e0>}
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 77-78
+.. GENERATED FROM PYTHON SOURCE LINES 72-73
 
 Create the trainer
 
-.. GENERATED FROM PYTHON SOURCE LINES 78-86
+.. GENERATED FROM PYTHON SOURCE LINES 73-81
 
 .. code-block:: Python
 
@@ -273,11 +253,11 @@ Create the trainer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 87-88
+.. GENERATED FROM PYTHON SOURCE LINES 82-83
 
 Actually train the model on our small Darcy-Flow dataset
 
-.. GENERATED FROM PYTHON SOURCE LINES 88-98
+.. GENERATED FROM PYTHON SOURCE LINES 83-93
 
 .. code-block:: Python
 
@@ -302,26 +282,26 @@ Actually train the model on our small Darcy-Flow dataset
     Training on 200 samples
     Testing on [50, 50] samples         on resolutions [(32, 64), (64, 128)].
     Raw outputs of shape torch.Size([4, 3, 32, 64])
-    [0] time=0.91, avg_loss=2.6421, train_err=10.5682
-    Eval: (32, 64)_l2=2.1051, (64, 128)_l2=2.4542
-    [3] time=0.84, avg_loss=0.3812, train_err=1.5250
-    Eval: (32, 64)_l2=0.5328, (64, 128)_l2=2.3434
-    [6] time=0.73, avg_loss=0.2580, train_err=1.0322
-    Eval: (32, 64)_l2=0.5245, (64, 128)_l2=2.2983
-    [9] time=0.73, avg_loss=0.2163, train_err=0.8652
-    Eval: (32, 64)_l2=0.4739, (64, 128)_l2=2.2781
-    [12] time=0.73, avg_loss=0.1938, train_err=0.7753
-    Eval: (32, 64)_l2=0.4735, (64, 128)_l2=2.2642
-    [15] time=0.73, avg_loss=0.1628, train_err=0.6512
-    Eval: (32, 64)_l2=0.4826, (64, 128)_l2=2.2505
-    [18] time=0.73, avg_loss=0.1391, train_err=0.5565
-    Eval: (32, 64)_l2=0.4369, (64, 128)_l2=2.2668
+    [0] time=3.46, avg_loss=2.2655, train_err=9.0619
+    Eval: (32, 64)_l2=1.6165, (64, 128)_l2=2.6751
+    [3] time=3.47, avg_loss=0.4604, train_err=1.8414
+    Eval: (32, 64)_l2=0.5567, (64, 128)_l2=2.3834
+    [6] time=3.44, avg_loss=0.3189, train_err=1.2755
+    Eval: (32, 64)_l2=0.4640, (64, 128)_l2=2.3548
+    [9] time=3.41, avg_loss=0.2569, train_err=1.0278
+    Eval: (32, 64)_l2=0.4651, (64, 128)_l2=2.3221
+    [12] time=3.41, avg_loss=0.2121, train_err=0.8484
+    Eval: (32, 64)_l2=0.3232, (64, 128)_l2=2.3157
+    [15] time=3.40, avg_loss=0.1598, train_err=0.6390
+    Eval: (32, 64)_l2=0.2673, (64, 128)_l2=2.3022
+    [18] time=3.44, avg_loss=0.1432, train_err=0.5729
+    Eval: (32, 64)_l2=0.2376, (64, 128)_l2=2.3091
 
-    {'train_err': 0.5427721077203751, 'avg_loss': 0.13569302693009377, 'avg_lasso_loss': None, 'epoch_train_time': 0.7358115278184414}
+    {'train_err': 0.550230712890625, 'avg_loss': 0.13755767822265624, 'avg_lasso_loss': None, 'epoch_train_time': 3.4114261440000746}
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 99-109
+.. GENERATED FROM PYTHON SOURCE LINES 94-104
 
 Plot the prediction, and compare with the ground-truth 
 Note that we trained on a very small resolution for
@@ -334,7 +314,7 @@ ii) can be trained quickly on CPU
 
 In practice we would train a Neural Operator on one or multiple GPUs
 
-.. GENERATED FROM PYTHON SOURCE LINES 109-144
+.. GENERATED FROM PYTHON SOURCE LINES 104-139
 
 .. code-block:: Python
 
@@ -388,7 +368,7 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 20.521 seconds)
+   **Total running time of the script:** (1 minutes 25.030 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_SFNO_swe.py:
@@ -405,6 +385,10 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
       :download:`Download Python source code: plot_SFNO_swe.py <plot_SFNO_swe.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_SFNO_swe.zip <plot_SFNO_swe.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_UNO_darcy.rst.txt b/dev/_sources/auto_examples/plot_UNO_darcy.rst.txt
index e25dfa5..e6793e3 100644
--- a/dev/_sources/auto_examples/plot_UNO_darcy.rst.txt
+++ b/dev/_sources/auto_examples/plot_UNO_darcy.rst.txt
@@ -54,7 +54,7 @@ the small Darcy-Flow example we ship with the package
 
 Loading the Darcy Flow dataset
 
-.. GENERATED FROM PYTHON SOURCE LINES 28-53
+.. GENERATED FROM PYTHON SOURCE LINES 28-46
 
 .. code-block:: Python
 
@@ -64,18 +64,11 @@ Loading the Darcy Flow dataset
             test_batch_sizes=[32, 32],
     )
 
-    model = UNO(in_channels=1, 
-                out_channels=1, 
-                hidden_channels=64, 
-                projection_channels=64,
-                uno_out_channels=[32,64,64,64,32],
-                uno_n_modes=[[16,16],[8,8],[8,8],[8,8],[16,16]],
-                uno_scalings=[[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],
-                horizontal_skips_map=None,
-                channel_mlp_skip="linear",
-                n_layers = 5,
-                domain_padding=0.2)
 
+
+    model = UNO(in_channels=1, out_channels=1, hidden_channels=64, projection_channels=64,uno_out_channels = [32,64,64,64,32], \
+                uno_n_modes= [[16,16],[8,8],[8,8],[8,8],[16,16]], uno_scalings=  [[1.0,1.0],[0.5,0.5],[1,1],[2,2],[1,1]],\
+                horizontal_skips_map = None, n_layers = 5, domain_padding = 0.2)
     model = model.to(device)
 
     n_params = count_model_params(model)
@@ -91,29 +84,23 @@ Loading the Darcy Flow dataset
 
  .. code-block:: none
 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(
     Loading test db for resolution 16 with 100 samples 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(Path(root_dir).joinpath(f"{dataset_name}_test_{res}.pt").as_posix())
     Loading test db for resolution 32 with 50 samples 
-    fno_skip='linear'
-    channel_mlp_skip='linear'
-    fno_skip='linear'
-    channel_mlp_skip='linear'
-    fno_skip='linear'
-    channel_mlp_skip='linear'
-    fno_skip='linear'
-    channel_mlp_skip='linear'
-    fno_skip='linear'
-    channel_mlp_skip='linear'
 
-    Our model has 2700097 parameters.
+    Our model has 2665921 parameters.
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 54-55
+.. GENERATED FROM PYTHON SOURCE LINES 47-48
 
 Create the optimizer
 
-.. GENERATED FROM PYTHON SOURCE LINES 55-61
+.. GENERATED FROM PYTHON SOURCE LINES 48-54
 
 .. code-block:: Python
 
@@ -130,11 +117,11 @@ Create the optimizer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 62-63
+.. GENERATED FROM PYTHON SOURCE LINES 55-56
 
 Creating the losses
 
-.. GENERATED FROM PYTHON SOURCE LINES 63-70
+.. GENERATED FROM PYTHON SOURCE LINES 56-63
 
 .. code-block:: Python
 
@@ -152,7 +139,7 @@ Creating the losses
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 71-82
+.. GENERATED FROM PYTHON SOURCE LINES 64-75
 
 .. code-block:: Python
 
@@ -188,9 +175,9 @@ Creating the losses
       )
       (fno_blocks): ModuleList(
         (0): FNOBlocks(
-          (convs): ModuleList(
-            (0): SpectralConv(
-              (weight): DenseTensor(shape=torch.Size([64, 32, 16, 9]), rank=None)
+          (convs): SpectralConv(
+            (weight): ModuleList(
+              (0): DenseTensor(shape=torch.Size([64, 32, 16, 9]), rank=None)
             )
           )
           (fno_skips): ModuleList(
@@ -198,24 +185,11 @@ Creating the losses
               (conv): Conv1d(64, 32, kernel_size=(1,), stride=(1,), bias=False)
             )
           )
-          (channel_mlp): ModuleList(
-            (0): ChannelMLP(
-              (fcs): ModuleList(
-                (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-                (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-              )
-            )
-          )
-          (channel_mlp_skips): ModuleList(
-            (0): Flattened1dConv(
-              (conv): Conv1d(64, 32, kernel_size=(1,), stride=(1,), bias=False)
-            )
-          )
         )
         (1): FNOBlocks(
-          (convs): ModuleList(
-            (0): SpectralConv(
-              (weight): DenseTensor(shape=torch.Size([32, 64, 8, 5]), rank=None)
+          (convs): SpectralConv(
+            (weight): ModuleList(
+              (0): DenseTensor(shape=torch.Size([32, 64, 8, 5]), rank=None)
             )
           )
           (fno_skips): ModuleList(
@@ -223,24 +197,11 @@ Creating the losses
               (conv): Conv1d(32, 64, kernel_size=(1,), stride=(1,), bias=False)
             )
           )
-          (channel_mlp): ModuleList(
-            (0): ChannelMLP(
-              (fcs): ModuleList(
-                (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-                (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-              )
-            )
-          )
-          (channel_mlp_skips): ModuleList(
-            (0): Flattened1dConv(
-              (conv): Conv1d(32, 64, kernel_size=(1,), stride=(1,), bias=False)
-            )
-          )
         )
         (2): FNOBlocks(
-          (convs): ModuleList(
-            (0): SpectralConv(
-              (weight): DenseTensor(shape=torch.Size([64, 64, 8, 5]), rank=None)
+          (convs): SpectralConv(
+            (weight): ModuleList(
+              (0): DenseTensor(shape=torch.Size([64, 64, 8, 5]), rank=None)
             )
           )
           (fno_skips): ModuleList(
@@ -248,24 +209,11 @@ Creating the losses
               (conv): Conv1d(64, 64, kernel_size=(1,), stride=(1,), bias=False)
             )
           )
-          (channel_mlp): ModuleList(
-            (0): ChannelMLP(
-              (fcs): ModuleList(
-                (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-                (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-              )
-            )
-          )
-          (channel_mlp_skips): ModuleList(
-            (0): Flattened1dConv(
-              (conv): Conv1d(64, 64, kernel_size=(1,), stride=(1,), bias=False)
-            )
-          )
         )
         (3): FNOBlocks(
-          (convs): ModuleList(
-            (0): SpectralConv(
-              (weight): DenseTensor(shape=torch.Size([128, 64, 8, 5]), rank=None)
+          (convs): SpectralConv(
+            (weight): ModuleList(
+              (0): DenseTensor(shape=torch.Size([128, 64, 8, 5]), rank=None)
             )
           )
           (fno_skips): ModuleList(
@@ -273,24 +221,11 @@ Creating the losses
               (conv): Conv1d(128, 64, kernel_size=(1,), stride=(1,), bias=False)
             )
           )
-          (channel_mlp): ModuleList(
-            (0): ChannelMLP(
-              (fcs): ModuleList(
-                (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-                (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-              )
-            )
-          )
-          (channel_mlp_skips): ModuleList(
-            (0): Flattened1dConv(
-              (conv): Conv1d(128, 64, kernel_size=(1,), stride=(1,), bias=False)
-            )
-          )
         )
         (4): FNOBlocks(
-          (convs): ModuleList(
-            (0): SpectralConv(
-              (weight): DenseTensor(shape=torch.Size([96, 32, 16, 9]), rank=None)
+          (convs): SpectralConv(
+            (weight): ModuleList(
+              (0): DenseTensor(shape=torch.Size([96, 32, 16, 9]), rank=None)
             )
           )
           (fno_skips): ModuleList(
@@ -298,19 +233,6 @@ Creating the losses
               (conv): Conv1d(96, 32, kernel_size=(1,), stride=(1,), bias=False)
             )
           )
-          (channel_mlp): ModuleList(
-            (0): ChannelMLP(
-              (fcs): ModuleList(
-                (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-                (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-              )
-            )
-          )
-          (channel_mlp_skips): ModuleList(
-            (0): Flattened1dConv(
-              (conv): Conv1d(96, 32, kernel_size=(1,), stride=(1,), bias=False)
-            )
-          )
         )
       )
       (horizontal_skips): ModuleDict(
@@ -341,22 +263,22 @@ Creating the losses
     )
 
     ### SCHEDULER ###
-     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f2f6dd18a00>
+     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7feab5259a00>
 
     ### LOSSES ###
 
-     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7f2f6dee84f0>
+     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7feab5259dc0>
 
-     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7f2f6dee84f0>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7f2f6dd4d5a0>}
+     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7feab5259dc0>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7feab52594c0>}
 
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 83-84
+.. GENERATED FROM PYTHON SOURCE LINES 76-77
 
 Create the trainer
 
-.. GENERATED FROM PYTHON SOURCE LINES 84-94
+.. GENERATED FROM PYTHON SOURCE LINES 77-87
 
 .. code-block:: Python
 
@@ -377,11 +299,11 @@ Create the trainer
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 95-96
+.. GENERATED FROM PYTHON SOURCE LINES 88-89
 
 Actually train the model on our small Darcy-Flow dataset
 
-.. GENERATED FROM PYTHON SOURCE LINES 96-106
+.. GENERATED FROM PYTHON SOURCE LINES 89-99
 
 .. code-block:: Python
 
@@ -406,26 +328,26 @@ Actually train the model on our small Darcy-Flow dataset
     Training on 1000 samples
     Testing on [50, 50] samples         on resolutions [16, 32].
     Raw outputs of shape torch.Size([32, 1, 16, 16])
-    [0] time=4.61, avg_loss=0.6586, train_err=20.5798
-    Eval: 16_h1=0.4974, 16_l2=0.4004, 32_h1=0.8209, 32_l2=0.6873
-    [3] time=4.63, avg_loss=0.2522, train_err=7.8821
-    Eval: 16_h1=0.2281, 16_l2=0.1702, 32_h1=0.7338, 32_l2=0.5956
-    [6] time=4.52, avg_loss=0.2534, train_err=7.9194
-    Eval: 16_h1=0.2041, 16_l2=0.1527, 32_h1=0.6873, 32_l2=0.5407
-    [9] time=4.44, avg_loss=0.2240, train_err=6.9998
-    Eval: 16_h1=0.2075, 16_l2=0.1543, 32_h1=0.6566, 32_l2=0.4983
-    [12] time=4.35, avg_loss=0.2071, train_err=6.4715
-    Eval: 16_h1=0.1967, 16_l2=0.1384, 32_h1=0.6875, 32_l2=0.5304
-    [15] time=4.36, avg_loss=0.1711, train_err=5.3483
-    Eval: 16_h1=0.2300, 16_l2=0.1629, 32_h1=0.6453, 32_l2=0.4576
-    [18] time=4.43, avg_loss=0.1268, train_err=3.9616
-    Eval: 16_h1=0.1860, 16_l2=0.1351, 32_h1=0.6503, 32_l2=0.4821
+    [0] time=6.61, avg_loss=0.5430, train_err=16.9693
+    Eval: 16_h1=0.3210, 16_l2=0.2597, 32_h1=0.7922, 32_l2=0.5999
+    [3] time=6.48, avg_loss=0.2685, train_err=8.3897
+    Eval: 16_h1=0.2068, 16_l2=0.1545, 32_h1=0.7909, 32_l2=0.6063
+    [6] time=6.47, avg_loss=0.2368, train_err=7.4001
+    Eval: 16_h1=0.2155, 16_l2=0.1649, 32_h1=0.7626, 32_l2=0.5989
+    [9] time=6.47, avg_loss=0.2172, train_err=6.7885
+    Eval: 16_h1=0.2323, 16_l2=0.1762, 32_h1=0.7456, 32_l2=0.5858
+    [12] time=6.48, avg_loss=0.2048, train_err=6.3987
+    Eval: 16_h1=0.1903, 16_l2=0.1337, 32_h1=0.7315, 32_l2=0.5729
+    [15] time=6.46, avg_loss=0.1886, train_err=5.8936
+    Eval: 16_h1=0.1910, 16_l2=0.1350, 32_h1=0.7238, 32_l2=0.5652
+    [18] time=6.48, avg_loss=0.1804, train_err=5.6383
+    Eval: 16_h1=0.1816, 16_l2=0.1254, 32_h1=0.7171, 32_l2=0.5568
 
-    {'train_err': 3.9999673664569855, 'avg_loss': 0.12799895572662354, 'avg_lasso_loss': None, 'epoch_train_time': 4.439005568623543}
+    {'train_err': 5.1316939406096935, 'avg_loss': 0.16421420609951018, 'avg_lasso_loss': None, 'epoch_train_time': 6.497358972000029}
 
 
 
-.. GENERATED FROM PYTHON SOURCE LINES 107-117
+.. GENERATED FROM PYTHON SOURCE LINES 100-110
 
 Plot the prediction, and compare with the ground-truth 
 Note that we trained on a very small resolution for
@@ -438,7 +360,7 @@ ii) can be trained quickly on CPU
 
 In practice we would train a Neural Operator on one or multiple GPUs
 
-.. GENERATED FROM PYTHON SOURCE LINES 117-155
+.. GENERATED FROM PYTHON SOURCE LINES 110-148
 
 .. code-block:: Python
 
@@ -495,7 +417,7 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (1 minutes 33.254 seconds)
+   **Total running time of the script:** (2 minutes 12.491 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_UNO_darcy.py:
@@ -512,6 +434,10 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
       :download:`Download Python source code: plot_UNO_darcy.py <plot_UNO_darcy.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_UNO_darcy.zip <plot_UNO_darcy.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_count_flops.rst.txt b/dev/_sources/auto_examples/plot_count_flops.rst.txt
index 3294fd1..0598e81 100644
--- a/dev/_sources/auto_examples/plot_count_flops.rst.txt
+++ b/dev/_sources/auto_examples/plot_count_flops.rst.txt
@@ -39,13 +39,13 @@ We will use the FLOP computation to compare the resources used by a base FNO.
     device = 'cpu'
 
     fno = FNO(n_modes=(64,64), 
-              in_channels=1, 
+              in_channels=3, 
               out_channels=1, 
               hidden_channels=64, 
               projection_channels=64)
 
     batch_size = 4
-    model_input = torch.randn(batch_size, 1, 128, 128)
+    model_input = torch.randn(batch_size, 3, 128, 128)
 
 
     with FlopTensorDispatchMode(fno) as ftdm:
@@ -80,7 +80,7 @@ This output is organized as a defaultdict object that counts the FLOPS used in e
 
  .. code-block:: none
 
-    defaultdict(<function FlopTensorDispatchMode.__init__.<locals>.<lambda> at 0x7f03bbb1be20>, {'': defaultdict(<class 'int'>, {'convolution.default': 2470445056, 'bmm.default': 138412032}), 'lifting': defaultdict(<class 'int'>, {'convolution.default': 1124073472}), 'lifting.fcs.0': defaultdict(<class 'int'>, {'convolution.default': 50331648}), 'lifting.fcs.1': defaultdict(<class 'int'>, {'convolution.default': 1073741824}), 'fno_blocks': defaultdict(<class 'int'>, {'convolution.default': 1073741824, 'bmm.default': 138412032}), 'fno_blocks.fno_skips.0': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.0.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.convs': defaultdict(<class 'int'>, {'bmm.default': 138412032}), 'fno_blocks.fno_skips.1': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.1.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.2': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.2.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.3': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.3.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'projection': defaultdict(<class 'int'>, {'convolution.default': 272629760}), 'projection.fcs.0': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'projection.fcs.1': defaultdict(<class 'int'>, {'convolution.default': 4194304})})
+    defaultdict(<function FlopTensorDispatchMode.__init__.<locals>.<lambda> at 0x7feab52b2e50>, {'': defaultdict(<class 'int'>, {'convolution.default': 2503999488, 'bmm.default': 138412032}), 'lifting': defaultdict(<class 'int'>, {'convolution.default': 1157627904}), 'lifting.fcs.0': defaultdict(<class 'int'>, {'convolution.default': 83886080}), 'lifting.fcs.1': defaultdict(<class 'int'>, {'convolution.default': 1073741824}), 'fno_blocks': defaultdict(<class 'int'>, {'convolution.default': 1073741824, 'bmm.default': 138412032}), 'fno_blocks.fno_skips.0': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.0.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.convs': defaultdict(<class 'int'>, {'bmm.default': 138412032}), 'fno_blocks.fno_skips.1': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.1.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.2': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.2.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.3': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'fno_blocks.fno_skips.3.conv': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'projection': defaultdict(<class 'int'>, {'convolution.default': 272629760}), 'projection.fcs.0': defaultdict(<class 'int'>, {'convolution.default': 268435456}), 'projection.fcs.1': defaultdict(<class 'int'>, {'convolution.default': 4194304})})
 
 
 
@@ -116,8 +116,8 @@ To check the maximum FLOPS used during the forward pass, let's create a recursiv
 
  .. code-block:: none
 
-    Max FLOPS required for FNO.forward: 2470445056
-    Max FLOPS required for FNO.backward: 4890558464
+    Max FLOPS required for FNO.forward: 2503999488
+    Max FLOPS required for FNO.backward: 4924112896
 
 
 
@@ -125,7 +125,7 @@ To check the maximum FLOPS used during the forward pass, let's create a recursiv
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 1.302 seconds)
+   **Total running time of the script:** (0 minutes 4.065 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_count_flops.py:
@@ -142,6 +142,10 @@ To check the maximum FLOPS used during the forward pass, let's create a recursiv
 
       :download:`Download Python source code: plot_count_flops.py <plot_count_flops.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_count_flops.zip <plot_count_flops.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_darcy_flow.rst.txt b/dev/_sources/auto_examples/plot_darcy_flow.rst.txt
index 55194cc..7abc160 100644
--- a/dev/_sources/auto_examples/plot_darcy_flow.rst.txt
+++ b/dev/_sources/auto_examples/plot_darcy_flow.rst.txt
@@ -71,7 +71,11 @@ Training samples are 16x16 and we load testing samples at both
 
  .. code-block:: none
 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(
     Loading test db for resolution 16 with 50 samples 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(Path(root_dir).joinpath(f"{dataset_name}_test_{res}.pt").as_posix())
     Loading test db for resolution 32 with 50 samples 
 
 
@@ -159,7 +163,7 @@ Visualizing the data
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 0.186 seconds)
+   **Total running time of the script:** (0 minutes 0.429 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_darcy_flow.py:
@@ -176,6 +180,10 @@ Visualizing the data
 
       :download:`Download Python source code: plot_darcy_flow.py <plot_darcy_flow.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_darcy_flow.zip <plot_darcy_flow.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_darcy_flow_spectrum.rst.txt b/dev/_sources/auto_examples/plot_darcy_flow_spectrum.rst.txt
index dcb6c9c..72d9c2d 100644
--- a/dev/_sources/auto_examples/plot_darcy_flow_spectrum.rst.txt
+++ b/dev/_sources/auto_examples/plot_darcy_flow_spectrum.rst.txt
@@ -149,7 +149,11 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
  .. code-block:: none
 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(
     Loading test db for resolution 16 with 50 samples 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(Path(root_dir).joinpath(f"{dataset_name}_test_{res}.pt").as_posix())
     Original dataset shape torch.Size([50, 1, 16, 16])
 
 
@@ -206,7 +210,7 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
  .. code-block:: none
 
-    /home/dave/myneurop/examples/plot_darcy_flow_spectrum.py:104: UserWarning: Attempt to set non-positive ylim on a log-scaled axis will be ignored.
+    /home/runner/work/neuraloperator/neuraloperator/examples/plot_darcy_flow_spectrum.py:104: UserWarning: Attempt to set non-positive ylim on a log-scaled axis will be ignored.
       ax.set_ylim(10, 10^10)
 
 
@@ -215,7 +219,7 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 0.139 seconds)
+   **Total running time of the script:** (0 minutes 0.279 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_darcy_flow_spectrum.py:
@@ -232,6 +236,10 @@ Loading the Navier-Stokes dataset in 128x128 resolution
 
       :download:`Download Python source code: plot_darcy_flow_spectrum.py <plot_darcy_flow_spectrum.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_darcy_flow_spectrum.zip <plot_darcy_flow_spectrum.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/plot_incremental_FNO_darcy.rst.txt b/dev/_sources/auto_examples/plot_incremental_FNO_darcy.rst.txt
index 2076ac9..b7f63db 100644
--- a/dev/_sources/auto_examples/plot_incremental_FNO_darcy.rst.txt
+++ b/dev/_sources/auto_examples/plot_incremental_FNO_darcy.rst.txt
@@ -70,7 +70,11 @@ Loading the Darcy flow dataset
 
  .. code-block:: none
 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(
     Loading test db for resolution 16 with 100 samples 
+    /home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don't have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+      data = torch.load(Path(root_dir).joinpath(f"{dataset_name}_test_{res}.pt").as_posix())
     Loading test db for resolution 32 with 50 samples 
 
 
@@ -220,7 +224,7 @@ Set up the losses
 
 
     ### N PARAMS ###
-     2110305
+     2119329
 
     ### OPTIMIZER ###
      AdamW (
@@ -234,15 +238,15 @@ Set up the losses
     )
 
     ### SCHEDULER ###
-     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f746c2a2b90>
+     <torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fea8ec5f790>
 
     ### LOSSES ###
 
     ### INCREMENTAL RESOLUTION + GRADIENT EXPLAINED ###
 
-     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7f746c3ab1f0>
+     * Train: <neuralop.losses.data_losses.H1Loss object at 0x7feab84cca90>
 
-     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7f746c3ab1f0>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7f746c2a2fe0>}
+     * Test: {'h1': <neuralop.losses.data_losses.H1Loss object at 0x7feab84cca90>, 'l2': <neuralop.losses.data_losses.LpLoss object at 0x7feaa0415d00>}
 
 
 
@@ -323,51 +327,51 @@ Train the model
     Training on 100 samples
     Testing on [50, 50] samples         on resolutions [16, 32].
     Raw outputs of shape torch.Size([16, 1, 8, 8])
-    [0] time=0.07, avg_loss=0.8236, train_err=11.7655
-    Eval: 16_h1=0.7665, 16_l2=0.6166, 32_h1=0.7932, 32_l2=0.6111
-    [1] time=0.03, avg_loss=0.6737, train_err=9.6245
-    Eval: 16_h1=0.6417, 16_l2=0.4694, 32_h1=0.7263, 32_l2=0.4793
-    [2] time=0.03, avg_loss=0.5479, train_err=7.8269
-    Eval: 16_h1=0.6615, 16_l2=0.4694, 32_h1=0.8183, 32_l2=0.4896
-    [3] time=0.03, avg_loss=0.5040, train_err=7.1998
-    Eval: 16_h1=0.5634, 16_l2=0.4002, 32_h1=0.6886, 32_l2=0.4146
-    [4] time=0.04, avg_loss=0.4482, train_err=6.4026
-    Eval: 16_h1=0.5917, 16_l2=0.4267, 32_h1=0.7822, 32_l2=0.4703
-    [5] time=0.04, avg_loss=0.4120, train_err=5.8851
-    Eval: 16_h1=0.5466, 16_l2=0.3766, 32_h1=0.7625, 32_l2=0.4164
-    [6] time=0.04, avg_loss=0.3683, train_err=5.2609
-    Eval: 16_h1=0.4672, 16_l2=0.3235, 32_h1=0.6485, 32_l2=0.3597
-    [7] time=0.04, avg_loss=0.3326, train_err=4.7513
-    Eval: 16_h1=0.4938, 16_l2=0.3391, 32_h1=0.6948, 32_l2=0.3841
-    [8] time=0.04, avg_loss=0.3064, train_err=4.3769
-    Eval: 16_h1=0.4673, 16_l2=0.3198, 32_h1=0.6777, 32_l2=0.3651
-    [9] time=0.04, avg_loss=0.2868, train_err=4.0965
-    Eval: 16_h1=0.4539, 16_l2=0.3072, 32_h1=0.6651, 32_l2=0.3536
+    [0] time=0.21, avg_loss=0.7750, train_err=11.0714
+    Eval: 16_h1=0.7031, 16_l2=0.5348, 32_h1=0.7319, 32_l2=0.5357
+    [1] time=0.21, avg_loss=0.5908, train_err=8.4395
+    Eval: 16_h1=0.6114, 16_l2=0.4391, 32_h1=0.6716, 32_l2=0.4473
+    [2] time=0.20, avg_loss=0.5093, train_err=7.2754
+    Eval: 16_h1=0.5647, 16_l2=0.3843, 32_h1=0.6667, 32_l2=0.3946
+    [3] time=0.21, avg_loss=0.4408, train_err=6.2975
+    Eval: 16_h1=0.5216, 16_l2=0.3600, 32_h1=0.6661, 32_l2=0.3915
+    [4] time=0.21, avg_loss=0.4055, train_err=5.7927
+    Eval: 16_h1=0.5165, 16_l2=0.3631, 32_h1=0.6852, 32_l2=0.4008
+    [5] time=0.21, avg_loss=0.3794, train_err=5.4201
+    Eval: 16_h1=0.5407, 16_l2=0.4053, 32_h1=0.6456, 32_l2=0.4213
+    [6] time=0.22, avg_loss=0.3662, train_err=5.2311
+    Eval: 16_h1=0.4848, 16_l2=0.3434, 32_h1=0.6641, 32_l2=0.3786
+    [7] time=0.22, avg_loss=0.3320, train_err=4.7433
+    Eval: 16_h1=0.4515, 16_l2=0.3280, 32_h1=0.5890, 32_l2=0.3661
+    [8] time=0.22, avg_loss=0.3013, train_err=4.3041
+    Eval: 16_h1=0.4443, 16_l2=0.3024, 32_h1=0.6300, 32_l2=0.3467
+    [9] time=0.23, avg_loss=0.2621, train_err=3.7436
+    Eval: 16_h1=0.4252, 16_l2=0.2978, 32_h1=0.6085, 32_l2=0.3395
     Incre Res Update: change index to 1
     Incre Res Update: change sub to 1
     Incre Res Update: change res to 16
-    [10] time=0.06, avg_loss=0.3922, train_err=5.6035
-    Eval: 16_h1=0.3690, 16_l2=0.2683, 32_h1=0.4566, 32_l2=0.2656
-    [11] time=0.04, avg_loss=0.3392, train_err=4.8454
-    Eval: 16_h1=0.3419, 16_l2=0.2484, 32_h1=0.4551, 32_l2=0.2650
-    [12] time=0.04, avg_loss=0.3098, train_err=4.4253
-    Eval: 16_h1=0.3172, 16_l2=0.2389, 32_h1=0.4273, 32_l2=0.2547
-    [13] time=0.04, avg_loss=0.2827, train_err=4.0392
-    Eval: 16_h1=0.3155, 16_l2=0.2391, 32_h1=0.4182, 32_l2=0.2516
-    [14] time=0.04, avg_loss=0.2774, train_err=3.9626
-    Eval: 16_h1=0.2872, 16_l2=0.2186, 32_h1=0.3938, 32_l2=0.2344
-    [15] time=0.04, avg_loss=0.2490, train_err=3.5571
-    Eval: 16_h1=0.2744, 16_l2=0.2075, 32_h1=0.3745, 32_l2=0.2220
-    [16] time=0.04, avg_loss=0.2346, train_err=3.3511
-    Eval: 16_h1=0.2758, 16_l2=0.2056, 32_h1=0.3889, 32_l2=0.2249
-    [17] time=0.04, avg_loss=0.2293, train_err=3.2760
-    Eval: 16_h1=0.2793, 16_l2=0.2077, 32_h1=0.3904, 32_l2=0.2213
-    [18] time=0.04, avg_loss=0.2262, train_err=3.2321
-    Eval: 16_h1=0.3024, 16_l2=0.2263, 32_h1=0.4136, 32_l2=0.2417
-    [19] time=0.04, avg_loss=0.2388, train_err=3.4117
-    Eval: 16_h1=0.3040, 16_l2=0.2327, 32_h1=0.4129, 32_l2=0.2462
-
-    {'train_err': 3.411697438785008, 'avg_loss': 0.23881882071495056, 'avg_lasso_loss': None, 'epoch_train_time': 0.04143996722996235, '16_h1': tensor(0.3040, device='cuda:0'), '16_l2': tensor(0.2327, device='cuda:0'), '32_h1': tensor(0.4129, device='cuda:0'), '32_l2': tensor(0.2462, device='cuda:0')}
+    [10] time=0.30, avg_loss=0.3530, train_err=5.0422
+    Eval: 16_h1=0.3418, 16_l2=0.2496, 32_h1=0.4258, 32_l2=0.2477
+    [11] time=0.29, avg_loss=0.2891, train_err=4.1300
+    Eval: 16_h1=0.3833, 16_l2=0.2783, 32_h1=0.4696, 32_l2=0.2820
+    [12] time=0.31, avg_loss=0.2975, train_err=4.2504
+    Eval: 16_h1=0.3179, 16_l2=0.2267, 32_h1=0.4156, 32_l2=0.2404
+    [13] time=0.31, avg_loss=0.2420, train_err=3.4567
+    Eval: 16_h1=0.2829, 16_l2=0.2034, 32_h1=0.3807, 32_l2=0.2174
+    [14] time=0.31, avg_loss=0.2147, train_err=3.0676
+    Eval: 16_h1=0.3394, 16_l2=0.2630, 32_h1=0.4255, 32_l2=0.2714
+    [15] time=0.32, avg_loss=0.2232, train_err=3.1885
+    Eval: 16_h1=0.3785, 16_l2=0.2985, 32_h1=0.4668, 32_l2=0.3102
+    [16] time=0.32, avg_loss=0.2555, train_err=3.6494
+    Eval: 16_h1=0.3279, 16_l2=0.2593, 32_h1=0.4078, 32_l2=0.2623
+    [17] time=0.32, avg_loss=0.2769, train_err=3.9559
+    Eval: 16_h1=0.4073, 16_l2=0.3371, 32_h1=0.4499, 32_l2=0.3422
+    [18] time=0.32, avg_loss=0.2840, train_err=4.0576
+    Eval: 16_h1=0.2826, 16_l2=0.2202, 32_h1=0.3649, 32_l2=0.2272
+    [19] time=0.32, avg_loss=0.1984, train_err=2.8340
+    Eval: 16_h1=0.2795, 16_l2=0.2186, 32_h1=0.3582, 32_l2=0.2296
+
+    {'train_err': 2.8339713641575406, 'avg_loss': 0.19837799549102783, 'avg_lasso_loss': None, 'epoch_train_time': 0.3178346639999745, '16_h1': tensor(0.2795), '16_l2': tensor(0.2186), '32_h1': tensor(0.3582), '32_l2': tensor(0.2296)}
 
 
 
@@ -441,7 +445,7 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
 .. rst-class:: sphx-glr-timing
 
-   **Total running time of the script:** (0 minutes 1.140 seconds)
+   **Total running time of the script:** (0 minutes 7.776 seconds)
 
 
 .. _sphx_glr_download_auto_examples_plot_incremental_FNO_darcy.py:
@@ -458,6 +462,10 @@ In practice we would train a Neural Operator on one or multiple GPUs
 
       :download:`Download Python source code: plot_incremental_FNO_darcy.py <plot_incremental_FNO_darcy.py>`
 
+    .. container:: sphx-glr-download sphx-glr-download-zip
+
+      :download:`Download zipped: plot_incremental_FNO_darcy.zip <plot_incremental_FNO_darcy.zip>`
+
 
 .. only:: html
 
diff --git a/dev/_sources/auto_examples/sg_execution_times.rst.txt b/dev/_sources/auto_examples/sg_execution_times.rst.txt
index 7f3a427..10a5c1f 100644
--- a/dev/_sources/auto_examples/sg_execution_times.rst.txt
+++ b/dev/_sources/auto_examples/sg_execution_times.rst.txt
@@ -6,7 +6,7 @@
 
 Computation times
 =================
-**01:33.254** total execution time for 8 files **from auto_examples**:
+**04:44.485** total execution time for 8 files **from auto_examples**:
 
 .. container::
 
@@ -33,26 +33,26 @@ Computation times
      - Time
      - Mem (MB)
    * - :ref:`sphx_glr_auto_examples_plot_UNO_darcy.py` (``plot_UNO_darcy.py``)
-     - 01:33.254
+     - 02:12.491
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_checkpoint_FNO_darcy.py` (``checkpoint_FNO_darcy.py``)
-     - 00:00.000
+   * - :ref:`sphx_glr_auto_examples_plot_SFNO_swe.py` (``plot_SFNO_swe.py``)
+     - 01:25.030
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_FNO_darcy.py` (``plot_FNO_darcy.py``)
-     - 00:00.000
+     - 00:54.415
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_plot_SFNO_swe.py` (``plot_SFNO_swe.py``)
-     - 00:00.000
+   * - :ref:`sphx_glr_auto_examples_plot_incremental_FNO_darcy.py` (``plot_incremental_FNO_darcy.py``)
+     - 00:07.776
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_count_flops.py` (``plot_count_flops.py``)
-     - 00:00.000
+     - 00:04.065
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_darcy_flow.py` (``plot_darcy_flow.py``)
-     - 00:00.000
+     - 00:00.429
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_darcy_flow_spectrum.py` (``plot_darcy_flow_spectrum.py``)
-     - 00:00.000
+     - 00:00.279
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_plot_incremental_FNO_darcy.py` (``plot_incremental_FNO_darcy.py``)
+   * - :ref:`sphx_glr_auto_examples_checkpoint_FNO_darcy.py` (``checkpoint_FNO_darcy.py``)
      - 00:00.000
      - 0.0
diff --git a/dev/_sources/modules/_autosummary/neuralop.models.FNO.rst.txt b/dev/_sources/modules/_autosummary/neuralop.models.FNO.rst.txt
deleted file mode 100644
index 6c30201..0000000
--- a/dev/_sources/modules/_autosummary/neuralop.models.FNO.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.models`.FNO
-=================================
-
-.. currentmodule:: neuralop.models
-
-.. autoclass:: FNO
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/api.rst.txt b/dev/_sources/modules/api.rst.txt
index 3521ca1..ec19ae7 100644
--- a/dev/_sources/modules/api.rst.txt
+++ b/dev/_sources/modules/api.rst.txt
@@ -111,7 +111,7 @@ In addition to the full architectures, we also provide
 in :mod:`neuralop.layers` building blocks,
 in the form of PyTorch layers, that you can use to build your own models:
 
-Neural operator layers
+Neural operator Layers
 ------------------------
 
 **Spectral convolutions** (in Fourier domain):
@@ -170,24 +170,6 @@ To support geometry-informed (GINO) models, we also offer the ability to integra
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
-**Embeddings**
-
-Apply positional embeddings as additional channels on a function:
-
-.. automodule:: neuralop.layers.embeddings
-    :no-members:
-    :no-inherited-members:
-
-.. autosummary::
-    :toctree: generated
-    :template: class.rst
-
-    GridEmbeddingND
-    GridEmbedding2D
-    SinusoidalEmbedding2D
-
-~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
-
 **Neighbor search**
 
 Find neighborhoods on arbitrary coordinate meshes:
@@ -210,7 +192,6 @@ Find neighborhoods on arbitrary coordinate meshes:
 
 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
 
-
 Other resolution invariant operations
 -------------------------------------
 
diff --git a/dev/_sources/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.rst.txt b/dev/_sources/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.rst.txt
deleted file mode 100644
index e5de184..0000000
--- a/dev/_sources/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.datasets.data_transforms`.DefaultDataProcessor
-====================================================================
-
-.. currentmodule:: neuralop.datasets.data_transforms
-
-.. autoclass:: DefaultDataProcessor
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.rst.txt b/dev/_sources/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.rst.txt
deleted file mode 100644
index 31184fe..0000000
--- a/dev/_sources/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.datasets.data_transforms`.MGPatchingDataProcessor
-=======================================================================
-
-.. currentmodule:: neuralop.datasets.data_transforms
-
-.. autoclass:: MGPatchingDataProcessor
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.datasets.load_darcy_flow_small.rst.txt b/dev/_sources/modules/generated/neuralop.datasets.load_darcy_flow_small.rst.txt
deleted file mode 100644
index f8d11c5..0000000
--- a/dev/_sources/modules/generated/neuralop.datasets.load_darcy_flow_small.rst.txt
+++ /dev/null
@@ -1,10 +0,0 @@
-﻿:mod:`neuralop.datasets`.load_darcy_flow_small
-===========================================================
-
-.. currentmodule:: neuralop.datasets
-
-.. autofunction:: load_darcy_flow_small
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.rst.txt b/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.rst.txt
deleted file mode 100644
index f92127e..0000000
--- a/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.layers.embeddings`.GridEmbedding2D
-========================================================
-
-.. currentmodule:: neuralop.layers.embeddings
-
-.. autoclass:: GridEmbedding2D
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.rst.txt b/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.rst.txt
deleted file mode 100644
index 4cdf0a7..0000000
--- a/dev/_sources/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.layers.embeddings`.GridEmbeddingND
-========================================================
-
-.. currentmodule:: neuralop.layers.embeddings
-
-.. autoclass:: GridEmbeddingND
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.rst.txt b/dev/_sources/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.rst.txt
deleted file mode 100644
index beb4d36..0000000
--- a/dev/_sources/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.layers.embeddings`.SinusoidalEmbedding2D
-==============================================================
-
-.. currentmodule:: neuralop.layers.embeddings
-
-.. autoclass:: SinusoidalEmbedding2D
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.layers.gno_block.GNOBlock.rst.txt b/dev/_sources/modules/generated/neuralop.layers.gno_block.GNOBlock.rst.txt
deleted file mode 100644
index 3d47fbd..0000000
--- a/dev/_sources/modules/generated/neuralop.layers.gno_block.GNOBlock.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.layers.gno_block`.GNOBlock
-================================================
-
-.. currentmodule:: neuralop.layers.gno_block
-
-.. autoclass:: GNOBlock
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.rst.txt b/dev/_sources/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.rst.txt
deleted file mode 100644
index 7ad12c5..0000000
--- a/dev/_sources/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.training.callbacks`.BasicLoggerCallback
-=============================================================
-
-.. currentmodule:: neuralop.training.callbacks
-
-.. autoclass:: BasicLoggerCallback
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.training.callbacks.Callback.rst.txt b/dev/_sources/modules/generated/neuralop.training.callbacks.Callback.rst.txt
deleted file mode 100644
index 403e8d9..0000000
--- a/dev/_sources/modules/generated/neuralop.training.callbacks.Callback.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.training.callbacks`.Callback
-==================================================
-
-.. currentmodule:: neuralop.training.callbacks
-
-.. autoclass:: Callback
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/modules/generated/neuralop.training.callbacks.CheckpointCallback.rst.txt b/dev/_sources/modules/generated/neuralop.training.callbacks.CheckpointCallback.rst.txt
deleted file mode 100644
index 2bf7430..0000000
--- a/dev/_sources/modules/generated/neuralop.training.callbacks.CheckpointCallback.rst.txt
+++ /dev/null
@@ -1,11 +0,0 @@
-﻿:mod:`neuralop.training.callbacks`.CheckpointCallback
-============================================================
-
-.. currentmodule:: neuralop.training.callbacks
-
-.. autoclass:: CheckpointCallback
-   :members:
-
-.. raw:: html
-
-    <div class="clearer"></div>
\ No newline at end of file
diff --git a/dev/_sources/sg_execution_times.rst.txt b/dev/_sources/sg_execution_times.rst.txt
index 9da0481..8c18dd5 100644
--- a/dev/_sources/sg_execution_times.rst.txt
+++ b/dev/_sources/sg_execution_times.rst.txt
@@ -6,7 +6,7 @@
 
 Computation times
 =================
-**01:33.254** total execution time for 8 files **from all galleries**:
+**04:44.485** total execution time for 8 files **from all galleries**:
 
 .. container::
 
@@ -33,26 +33,26 @@ Computation times
      - Time
      - Mem (MB)
    * - :ref:`sphx_glr_auto_examples_plot_UNO_darcy.py` (``../../examples/plot_UNO_darcy.py``)
-     - 01:33.254
+     - 02:12.491
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_checkpoint_FNO_darcy.py` (``../../examples/checkpoint_FNO_darcy.py``)
-     - 00:00.000
+   * - :ref:`sphx_glr_auto_examples_plot_SFNO_swe.py` (``../../examples/plot_SFNO_swe.py``)
+     - 01:25.030
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_FNO_darcy.py` (``../../examples/plot_FNO_darcy.py``)
-     - 00:00.000
+     - 00:54.415
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_plot_SFNO_swe.py` (``../../examples/plot_SFNO_swe.py``)
-     - 00:00.000
+   * - :ref:`sphx_glr_auto_examples_plot_incremental_FNO_darcy.py` (``../../examples/plot_incremental_FNO_darcy.py``)
+     - 00:07.776
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_count_flops.py` (``../../examples/plot_count_flops.py``)
-     - 00:00.000
+     - 00:04.065
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_darcy_flow.py` (``../../examples/plot_darcy_flow.py``)
-     - 00:00.000
+     - 00:00.429
      - 0.0
    * - :ref:`sphx_glr_auto_examples_plot_darcy_flow_spectrum.py` (``../../examples/plot_darcy_flow_spectrum.py``)
-     - 00:00.000
+     - 00:00.279
      - 0.0
-   * - :ref:`sphx_glr_auto_examples_plot_incremental_FNO_darcy.py` (``../../examples/plot_incremental_FNO_darcy.py``)
+   * - :ref:`sphx_glr_auto_examples_checkpoint_FNO_darcy.py` (``../../examples/checkpoint_FNO_darcy.py``)
      - 00:00.000
      - 0.0
diff --git a/dev/_sources/user_guide/fno.rst.txt b/dev/_sources/user_guide/fno.rst.txt
index 3f09950..581b47e 100644
--- a/dev/_sources/user_guide/fno.rst.txt
+++ b/dev/_sources/user_guide/fno.rst.txt
@@ -1,4 +1,3 @@
-.. _fno-guide:
 ========================
 Fourier Neural Operators
 ========================
diff --git a/dev/_sources/user_guide/getting_started.rst.txt b/dev/_sources/user_guide/getting_started.rst.txt
deleted file mode 100644
index 3a24d0b..0000000
--- a/dev/_sources/user_guide/getting_started.rst.txt
+++ /dev/null
@@ -1,47 +0,0 @@
-.. _getting_started :
-
-Getting Started
-===========
-
-*NeuralOperator* aims to provide you with all the tools 
-to easily use, build and train neural operators for your own applications
-and learn mapping between function spaces, in PyTorch.
-
-Intro to operator learning
-----------------------------
-To get a better feel for the theory behind our neural operator models, see :ref:`neuralop_intro` and :ref:`fno_intro`.
-
-~~~~~~~~~~~~
-
-Interactive examples with code
-----------------------------
-To get up to speed on the code, and look through some interactive examples to help you hit the ground running,
-check out :ref:`gallery_examples`.
-
-~~~~~~~~~~~~
-
-NeuralOperator library structure
----------------------------------
-
-Here are the main components of the library:
-
-================================= ================================
-Module                             Description
-================================= ================================
-:mod:`neuralop`                   Main library 
-:mod:`neuralop.models`            Full ready-to-use neural operators
-:mod:`neuralop.layers`            Individual layers to build neural operators
-:mod:`neuralop.datasets`          Convenience PyTorch data loaders for PDE datasets
-:mod:`neuralop.training`          Utilities to train neural operators end-to-end
-================================= ================================
-
-The full API documentation is provided in :ref:`api_ref`.
-
-Finally, if you're building the library from source, your repository will also include the following directories:
-
-================================= ================================
-Directory                         Description
-================================= ================================
-:mod:`scripts`                    Training recipe scripts for our models on sample problems
-:mod:`examples`                   More documented interactive examples, seen in 
-================================= ================================
diff --git a/dev/_sources/user_guide/index_old.rst.txt b/dev/_sources/user_guide/index_old.rst.txt
deleted file mode 100644
index 2352602..0000000
--- a/dev/_sources/user_guide/index_old.rst.txt
+++ /dev/null
@@ -1,13 +0,0 @@
-.. _user_guide:
-
-
-User guide
-==========
-
-
-.. toctree::
-
-   getting_started
-   neural_operators
-   fno
-   training
diff --git a/dev/_static/searchtools.js b/dev/_static/searchtools.js
index 92da3f8..b08d58c 100644
--- a/dev/_static/searchtools.js
+++ b/dev/_static/searchtools.js
@@ -178,7 +178,7 @@ const Search = {
 
   htmlToText: (htmlString, anchor) => {
     const htmlElement = new DOMParser().parseFromString(htmlString, 'text/html');
-    for (const removalQuery of [".headerlinks", "script", "style"]) {
+    for (const removalQuery of [".headerlink", "script", "style"]) {
       htmlElement.querySelectorAll(removalQuery).forEach((el) => { el.remove() });
     }
     if (anchor) {
@@ -328,13 +328,14 @@ const Search = {
     for (const [title, foundTitles] of Object.entries(allTitles)) {
       if (title.toLowerCase().trim().includes(queryLower) && (queryLower.length >= title.length/2)) {
         for (const [file, id] of foundTitles) {
-          let score = Math.round(100 * queryLower.length / title.length)
+          const score = Math.round(Scorer.title * queryLower.length / title.length);
+          const boost = titles[file] === title ? 1 : 0;  // add a boost for document titles
           normalResults.push([
             docNames[file],
             titles[file] !== title ? `${titles[file]} > ${title}` : title,
             id !== null ? "#" + id : "",
             null,
-            score,
+            score + boost,
             filenames[file],
           ]);
         }
diff --git a/dev/_static/sg_gallery.css b/dev/_static/sg_gallery.css
index 7222783..9bcd33c 100644
--- a/dev/_static/sg_gallery.css
+++ b/dev/_static/sg_gallery.css
@@ -178,23 +178,44 @@ thumbnail with its default link Background color */
   max-height: 112px;
   max-width: 160px;
 }
-.sphx-glr-thumbcontainer[tooltip]:hover:after {
-  background: var(--sg-tooltip-background);
+
+.sphx-glr-thumbcontainer[tooltip]::before {
+  content: "";
+  position: absolute;
+  pointer-events: none;
+  top: 0;
+  left: 0;
+  width: 100%;
+  height: 100%;
+  z-index: 97;
+  background-color: var(--sg-tooltip-background);
+  backdrop-filter: blur(3px);
+  opacity: 0;
+  transition: opacity 0.3s;
+}
+
+.sphx-glr-thumbcontainer[tooltip]:hover::before {
+  opacity: 1;
+}
+
+.sphx-glr-thumbcontainer[tooltip]:hover::after {
   -webkit-border-radius: 4px;
   -moz-border-radius: 4px;
   border-radius: 4px;
   color: var(--sg-tooltip-foreground);
   content: attr(tooltip);
-  padding: 10px;
+  padding: 10px 10px 5px;
   z-index: 98;
   width: 100%;
-  height: 100%;
+  max-height: 100%;
   position: absolute;
   pointer-events: none;
   top: 0;
   box-sizing: border-box;
   overflow: hidden;
-  backdrop-filter: blur(3px);
+  display: -webkit-box;
+  -webkit-box-orient: vertical;
+  -webkit-line-clamp: 6;
 }
 
 .sphx-glr-script-out {
@@ -283,6 +304,10 @@ div.sphx-glr-download a:hover {
   background-color: var(--sg-download-a-hover-background-color);
 }
 
+div.sphx-glr-sidebar-item img {
+  max-height: 20px;
+}
+
 .sphx-glr-example-title:target::before {
   display: block;
   content: "";
diff --git a/dev/auto_examples/checkpoint_FNO_darcy.html b/dev/auto_examples/checkpoint_FNO_darcy.html
index bd9e11b..7585685 100644
--- a/dev/auto_examples/checkpoint_FNO_darcy.html
+++ b/dev/auto_examples/checkpoint_FNO_darcy.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -31,7 +31,7 @@
  
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Training an FNO on Darcy-Flow" href="plot_FNO_darcy.html" />
+    <link rel="next" title="Training a TFNO on Darcy-Flow" href="plot_FNO_darcy.html" />
     <link rel="prev" title="A simple Darcy-Flow dataset" href="plot_darcy_flow.html" />
 <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
 
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2 current"><a class="current reference internal" href="#">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -194,14 +194,7 @@
 </pre></div>
 </div>
 <p>We create a tensorized FNO model</p>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">TFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="mi">16</span><span class="p">),</span>
-             <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-             <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-             <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span>
-             <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
-             <span class="n">factorization</span><span class="o">=</span><span class="s1">&#39;tucker&#39;</span><span class="p">,</span>
-             <span class="n">rank</span><span class="o">=</span><span class="mf">0.42</span><span class="p">)</span>
-
+<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">TFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="mi">16</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">factorization</span><span class="o">=</span><span class="s1">&#39;tucker&#39;</span><span class="p">,</span> <span class="n">rank</span><span class="o">=</span><span class="mf">0.42</span><span class="p">)</span>
 <span class="n">model</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
 
 <span class="n">n_params</span> <span class="o">=</span> <span class="n">count_model_params</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>
@@ -280,6 +273,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/2a3ecbdce9fd535c53d44cc373f6a228/checkpoint_FNO_darcy.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">checkpoint_FNO_darcy.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/7296405f6df7c2cfe184e9b258cee33e/checkpoint_FNO_darcy.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">checkpoint_FNO_darcy.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
@@ -299,7 +295,7 @@
     
     
     <a class="button pagination-next" href="plot_FNO_darcy.html" title="next page" accesskey="n">
-        <span>Training an FNO on Darcy-Flow </span>
+        <span>Training a TFNO on Darcy-Flow </span>
         <span class="icon">
             <i class="fa fa-arrow-circle-right"></i>
         </span>
diff --git a/dev/auto_examples/darcy_data_processor.html b/dev/auto_examples/darcy_data_processor.html
deleted file mode 100644
index 566da0b..0000000
--- a/dev/auto_examples/darcy_data_processor.html
+++ /dev/null
@@ -1,255 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Data Processors &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../index.html">
-            <img src="../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../modules/api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <div class="sphx-glr-download-link-note admonition note">
-<p class="admonition-title">Note</p>
-<p><a class="reference internal" href="#sphx-glr-download-auto-examples-darcy-data-processor-py"><span class="std std-ref">Go to the end</span></a>
-to download the full example code.</p>
-</div>
-<section class="sphx-glr-example-title" id="data-processors">
-<span id="sphx-glr-auto-examples-darcy-data-processor-py"></span><h1>Data Processors<a class="headerlink" href="#data-processors" title="Link to this heading"></a></h1>
-<p>In this example, we demonstrate how to use neuralop.data.transforms.DataProcessor
-to preprocess and postprocess the small Darcy Flow example we ship with the package
-for downstream use in training a neural operator model.</p>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">torch</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">sys</span>
-<span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">TFNO</span>
-<span class="kn">from</span> <span class="nn">neuralop</span> <span class="kn">import</span> <span class="n">Trainer</span>
-<span class="kn">from</span> <span class="nn">neuralop.training</span> <span class="kn">import</span> <span class="n">CheckpointCallback</span>
-<span class="kn">from</span> <span class="nn">neuralop.data.datasets</span> <span class="kn">import</span> <span class="n">load_darcy_flow_small</span>
-<span class="kn">from</span> <span class="nn">neuralop.utils</span> <span class="kn">import</span> <span class="n">count_model_params</span>
-<span class="kn">from</span> <span class="nn">neuralop</span> <span class="kn">import</span> <span class="n">LpLoss</span><span class="p">,</span> <span class="n">H1Loss</span>
-
-<span class="n">device</span> <span class="o">=</span> <span class="s1">&#39;cpu&#39;</span>
-
-<span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">First, let&#39;s load the small Darcy Flow dataset:</span>
-<span class="sd">&quot;&quot;&quot;</span>
-</pre></div>
-</div>
-<p>Loading the Navier-Stokes dataset in 128x128 resolution</p>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">train_loader</span><span class="p">,</span> <span class="n">test_loaders</span><span class="p">,</span> <span class="n">data_processor</span> <span class="o">=</span> <span class="n">load_darcy_flow_small</span><span class="p">(</span>
-        <span class="n">n_train</span><span class="o">=</span><span class="mi">1000</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span>
-        <span class="n">test_resolutions</span><span class="o">=</span><span class="p">[</span><span class="mi">16</span><span class="p">,</span> <span class="mi">32</span><span class="p">],</span> <span class="n">n_tests</span><span class="o">=</span><span class="p">[</span><span class="mi">100</span><span class="p">,</span> <span class="mi">50</span><span class="p">],</span>
-        <span class="n">test_batch_sizes</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">],</span>
-        <span class="n">data_root</span><span class="o">=</span><span class="s2">&quot;../neuralop/data/datasets/data/&quot;</span>
-<span class="p">)</span>
-</pre></div>
-</div>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">Next let&#39;s visualize the data in its raw form.</span>
-<span class="sd">&quot;&quot;&quot;</span>
-</pre></div>
-</div>
-<div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-darcy-data-processor-py">
-<div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
-<p><a class="reference download internal" download="" href="../_downloads/969baa48c90c32befa7c7d2590c8ca42/darcy_data_processor.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">darcy_data_processor.ipynb</span></code></a></p>
-</div>
-<div class="sphx-glr-download sphx-glr-download-python docutils container">
-<p><a class="reference download internal" download="" href="../_downloads/b84984d89c00aa83f7c56c96a61b8aee/darcy_data_processor.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">darcy_data_processor.py</span></code></a></p>
-</div>
-</div>
-<p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
-</section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/auto_examples/index.html b/dev/auto_examples/index.html
index 6a2d38a..3762738 100644
--- a/dev/auto_examples/index.html
+++ b/dev/auto_examples/index.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -165,22 +165,22 @@
         
   <section id="gallery-of-examples">
 <h1>Gallery of examples<a class="headerlink" href="#gallery-of-examples" title="Link to this heading"></a></h1>
-<div class="sphx-glr-thumbnails"><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use torchtnt to estimate the number of floating-point op..."><img alt="" src="../_images/sphx_glr_plot_count_flops_thumb.png" />
+<div class="sphx-glr-thumbnails"><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use torchtnt to estimate the number of floating-point operations per second (FLOPS) required for a model&#x27;s forward and backward pass. "><img alt="" src="../_images/sphx_glr_plot_count_flops_thumb.png" />
 <p><a class="reference internal" href="plot_count_flops.html#sphx-glr-auto-examples-plot-count-flops-py"><span class="std std-ref">Using torchtnt to count FLOPS</span></a></p>
   <div class="sphx-glr-thumbnail-title">Using torchtnt to count FLOPS</div>
 </div><div class="sphx-glr-thumbcontainer" tooltip="A simple Darcy-Flow dataset"><img alt="" src="../_images/sphx_glr_plot_darcy_flow_thumb.png" />
 <p><a class="reference internal" href="plot_darcy_flow.html#sphx-glr-auto-examples-plot-darcy-flow-py"><span class="std std-ref">A simple Darcy-Flow dataset</span></a></p>
   <div class="sphx-glr-thumbnail-title">A simple Darcy-Flow dataset</div>
-</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the packag..."><img alt="" src="../_images/sphx_glr_checkpoint_FNO_darcy_thumb.png" />
+</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package to train a Tensorized Fourier-Neural Operator"><img alt="" src="../_images/sphx_glr_checkpoint_FNO_darcy_thumb.png" />
 <p><a class="reference internal" href="checkpoint_FNO_darcy.html#sphx-glr-auto-examples-checkpoint-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a></p>
   <div class="sphx-glr-thumbnail-title">Training a TFNO on Darcy-Flow</div>
-</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the packag..."><img alt="" src="../_images/sphx_glr_plot_FNO_darcy_thumb.png" />
-<p><a class="reference internal" href="plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training an FNO on Darcy-Flow</span></a></p>
-  <div class="sphx-glr-thumbnail-title">Training an FNO on Darcy-Flow</div>
-</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Spherical Shallow Water Equations example ..."><img alt="" src="../_images/sphx_glr_plot_SFNO_swe_thumb.png" />
+</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package to train a Tensorized Fourier-Neural Operator"><img alt="" src="../_images/sphx_glr_plot_FNO_darcy_thumb.png" />
+<p><a class="reference internal" href="plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a></p>
+  <div class="sphx-glr-thumbnail-title">Training a TFNO on Darcy-Flow</div>
+</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to use the small Spherical Shallow Water Equations example we ship with the package to train a Spherical Fourier-Neural Operator"><img alt="" src="../_images/sphx_glr_plot_SFNO_swe_thumb.png" />
 <p><a class="reference internal" href="plot_SFNO_swe.html#sphx-glr-auto-examples-plot-sfno-swe-py"><span class="std std-ref">Training a SFNO on the spherical Shallow Water equations</span></a></p>
   <div class="sphx-glr-thumbnail-title">Training a SFNO on the spherical Shallow Water equations</div>
-</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to train a U-shaped Neural Operator on  the small Darcy-Flo..."><img alt="" src="../_images/sphx_glr_plot_UNO_darcy_thumb.png" />
+</div><div class="sphx-glr-thumbcontainer" tooltip="In this example, we demonstrate how to train a U-shaped Neural Operator on  the small Darcy-Flow example we ship with the package"><img alt="" src="../_images/sphx_glr_plot_UNO_darcy_thumb.png" />
 <p><a class="reference internal" href="plot_UNO_darcy.html#sphx-glr-auto-examples-plot-uno-darcy-py"><span class="std std-ref">U-NO on Darcy-Flow</span></a></p>
   <div class="sphx-glr-thumbnail-title">U-NO on Darcy-Flow</div>
 </div><div class="sphx-glr-thumbcontainer" tooltip="Short summary -------------"><img alt="" src="../_images/sphx_glr_plot_darcy_flow_spectrum_thumb.png" />
diff --git a/dev/auto_examples/plot_FNO_darcy.html b/dev/auto_examples/plot_FNO_darcy.html
index 8720792..a26702c 100644
--- a/dev/auto_examples/plot_FNO_darcy.html
+++ b/dev/auto_examples/plot_FNO_darcy.html
@@ -5,7 +5,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Training an FNO on Darcy-Flow &#8212; neuraloperator 0.3.0 documentation</title> 
+    <title>Training a TFNO on Darcy-Flow &#8212; neuraloperator 0.3.0 documentation</title> 
 <link rel="stylesheet" href="../_static/tensorly_style.css">
 <link rel="apple-touch-icon" sizes="180x180" href="../_static/favicon/apple-touch-icon.png">
 <link rel="icon" type="image/png" sizes="32x32" href="../_static/favicon/favicon-32x32.png">
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2 current"><a class="current reference internal" href="#">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2 current"><a class="current reference internal" href="#">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -168,14 +168,14 @@
 <p><a class="reference internal" href="#sphx-glr-download-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Go to the end</span></a>
 to download the full example code.</p>
 </div>
-<section class="sphx-glr-example-title" id="training-an-fno-on-darcy-flow">
-<span id="sphx-glr-auto-examples-plot-fno-darcy-py"></span><h1>Training an FNO on Darcy-Flow<a class="headerlink" href="#training-an-fno-on-darcy-flow" title="Link to this heading"></a></h1>
+<section class="sphx-glr-example-title" id="training-a-tfno-on-darcy-flow">
+<span id="sphx-glr-auto-examples-plot-fno-darcy-py"></span><h1>Training a TFNO on Darcy-Flow<a class="headerlink" href="#training-a-tfno-on-darcy-flow" title="Link to this heading"></a></h1>
 <p>In this example, we demonstrate how to use the small Darcy-Flow example we ship with the package
-to train a Fourier-Neural Operator</p>
+to train a Tensorized Fourier-Neural Operator</p>
 <div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">torch</span>
 <span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
 <span class="kn">import</span> <span class="nn">sys</span>
-<span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">FNO</span>
+<span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">TFNO</span>
 <span class="kn">from</span> <span class="nn">neuralop</span> <span class="kn">import</span> <span class="n">Trainer</span>
 <span class="kn">from</span> <span class="nn">neuralop.training</span> <span class="kn">import</span> <span class="n">AdamW</span>
 <span class="kn">from</span> <span class="nn">neuralop.data.datasets</span> <span class="kn">import</span> <span class="n">load_darcy_flow_small</span>
@@ -194,16 +194,16 @@
 <span class="n">data_processor</span> <span class="o">=</span> <span class="n">data_processor</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Loading test db for resolution 16 with 100 samples
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(
+Loading test db for resolution 16 with 100 samples
+/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(Path(root_dir).joinpath(f&quot;{dataset_name}_test_{res}.pt&quot;).as_posix())
 Loading test db for resolution 32 with 50 samples
 </pre></div>
 </div>
-<p>We create a simple FNO model</p>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">FNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="mi">16</span><span class="p">),</span>
-             <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-             <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-             <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span>
-             <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
+<p>We create a tensorized FNO model</p>
+<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">TFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="mi">16</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">factorization</span><span class="o">=</span><span class="s1">&#39;tucker&#39;</span><span class="p">,</span> <span class="n">rank</span><span class="o">=</span><span class="mf">0.42</span><span class="p">)</span>
 <span class="n">model</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
 
 <span class="n">n_params</span> <span class="o">=</span> <span class="n">count_model_params</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>
@@ -211,7 +211,7 @@
 <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Our model has 1188385 parameters.
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Our model has 523257 parameters.
 </pre></div>
 </div>
 <p>Create the optimizer</p>
@@ -239,12 +239,12 @@
 </pre></div>
 </div>
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>### MODEL ###
- FNO(
+ TFNO(
   (positional_embedding): GridEmbeddingND()
   (fno_blocks): FNOBlocks(
-    (convs): ModuleList(
-      (0-3): 4 x SpectralConv(
-        (weight): DenseTensor(shape=torch.Size([32, 32, 16, 9]), rank=None)
+    (convs): SpectralConv(
+      (weight): ModuleList(
+        (0-3): 4 x TuckerTensor(shape=(32, 32, 16, 9), rank=(26, 26, 13, 7))
       )
     )
     (fno_skips): ModuleList(
@@ -255,8 +255,8 @@
   )
   (lifting): ChannelMLP(
     (fcs): ModuleList(
-      (0): Conv1d(3, 64, kernel_size=(1,), stride=(1,))
-      (1): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
+      (0): Conv1d(3, 256, kernel_size=(1,), stride=(1,))
+      (1): Conv1d(256, 32, kernel_size=(1,), stride=(1,))
     )
   )
   (projection): ChannelMLP(
@@ -279,13 +279,13 @@
 )
 
 ### SCHEDULER ###
- &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fca77766020&gt;
+ &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7feaa01afac0&gt;
 
 ### LOSSES ###
 
- * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7fca76f46830&gt;
+ * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feaa01aff40&gt;
 
- * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7fca76f46830&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7fca77798ca0&gt;}
+ * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feaa01aff40&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7feaa01bcbe0&gt;}
 </pre></div>
 </div>
 <p>Create the trainer</p>
@@ -311,22 +311,22 @@
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Training on 1000 samples
 Testing on [50, 50] samples         on resolutions [16, 32].
 Raw outputs of shape torch.Size([32, 1, 16, 16])
-[0] time=1.66, avg_loss=0.5065, train_err=15.8288
-Eval: 16_h1=0.2896, 16_l2=0.2301, 32_h1=0.3807, 32_l2=0.2436
-[3] time=1.55, avg_loss=0.2119, train_err=6.6233
-Eval: 16_h1=0.1865, 16_l2=0.1367, 32_h1=0.3028, 32_l2=0.1624
-[6] time=1.54, avg_loss=0.1922, train_err=6.0064
-Eval: 16_h1=0.2095, 16_l2=0.1634, 32_h1=0.3203, 32_l2=0.1882
-[9] time=1.54, avg_loss=0.1814, train_err=5.6678
-Eval: 16_h1=0.1942, 16_l2=0.1419, 32_h1=0.3132, 32_l2=0.1671
-[12] time=1.54, avg_loss=0.1636, train_err=5.1129
-Eval: 16_h1=0.2336, 16_l2=0.1748, 32_h1=0.3897, 32_l2=0.2129
-[15] time=1.53, avg_loss=0.1126, train_err=3.5185
-Eval: 16_h1=0.1868, 16_l2=0.1356, 32_h1=0.3154, 32_l2=0.1651
-[18] time=1.54, avg_loss=0.1192, train_err=3.7263
-Eval: 16_h1=0.1858, 16_l2=0.1359, 32_h1=0.3326, 32_l2=0.1827
-
-{&#39;train_err&#39;: 3.398870412260294, &#39;avg_loss&#39;: 0.10876385319232941, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 1.5358347818255424}
+[0] time=2.66, avg_loss=0.9003, train_err=28.1341
+Eval: 16_h1=0.4747, 16_l2=0.3676, 32_h1=0.5249, 32_l2=0.3596
+[3] time=2.69, avg_loss=0.3368, train_err=10.5251
+Eval: 16_h1=0.2390, 16_l2=0.1887, 32_h1=0.3212, 32_l2=0.1959
+[6] time=2.63, avg_loss=0.2176, train_err=6.8002
+Eval: 16_h1=0.3172, 16_l2=0.2739, 32_h1=0.3649, 32_l2=0.2818
+[9] time=2.66, avg_loss=0.1803, train_err=5.6347
+Eval: 16_h1=0.1602, 16_l2=0.1168, 32_h1=0.2624, 32_l2=0.1403
+[12] time=2.69, avg_loss=0.1738, train_err=5.4326
+Eval: 16_h1=0.1735, 16_l2=0.1389, 32_h1=0.2747, 32_l2=0.1699
+[15] time=2.65, avg_loss=0.1604, train_err=5.0136
+Eval: 16_h1=0.1394, 16_l2=0.0983, 32_h1=0.2542, 32_l2=0.1292
+[18] time=2.65, avg_loss=0.1506, train_err=4.7071
+Eval: 16_h1=0.1596, 16_l2=0.1228, 32_h1=0.2629, 32_l2=0.1533
+
+{&#39;train_err&#39;: 4.956099387258291, &#39;avg_loss&#39;: 0.15859518039226533, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 2.642554324999992}
 </pre></div>
 </div>
 <p>Plot the prediction, and compare with the ground-truth
@@ -376,7 +376,7 @@
 <span class="n">fig</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
 </pre></div>
 </div>
-<img src="../_images/sphx_glr_plot_FNO_darcy_001.png" srcset="../_images/sphx_glr_plot_FNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 32.144 seconds)</p>
+<img src="../_images/sphx_glr_plot_FNO_darcy_001.png" srcset="../_images/sphx_glr_plot_FNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 54.415 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-fno-darcy-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/e81e8f640b2a3cda84c542bbc8f36a54/plot_FNO_darcy.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_FNO_darcy.ipynb</span></code></a></p>
@@ -384,6 +384,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/1a3050d57a180b92b424ce128dfe1d36/plot_FNO_darcy.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_FNO_darcy.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/645da00b8fbbb9bb5cae877fd0f31635/plot_FNO_darcy.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_FNO_darcy.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/plot_SFNO_swe.html b/dev/auto_examples/plot_SFNO_swe.html
index c759765..1e5d2a5 100644
--- a/dev/auto_examples/plot_SFNO_swe.html
+++ b/dev/auto_examples/plot_SFNO_swe.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -32,7 +32,7 @@
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
     <link rel="next" title="U-NO on Darcy-Flow" href="plot_UNO_darcy.html" />
-    <link rel="prev" title="Training an FNO on Darcy-Flow" href="plot_FNO_darcy.html" />
+    <link rel="prev" title="Training a TFNO on Darcy-Flow" href="plot_FNO_darcy.html" />
 <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
 
   </head>
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2 current"><a class="current reference internal" href="#">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -196,12 +196,7 @@
 </pre></div>
 </div>
 <p>We create a tensorized FNO model</p>
-<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">SFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">),</span>
-             <span class="n">in_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
-             <span class="n">out_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
-             <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span>
-             <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
-             <span class="n">factorization</span><span class="o">=</span><span class="s1">&#39;dense&#39;</span><span class="p">)</span>
+<div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">SFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">factorization</span><span class="o">=</span><span class="s1">&#39;dense&#39;</span><span class="p">)</span>
 <span class="n">model</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
 
 <span class="n">n_params</span> <span class="o">=</span> <span class="n">count_model_params</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>
@@ -209,12 +204,7 @@
 <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>self.sht_grids=[&#39;equiangular&#39;, &#39;equiangular&#39;]
-self.sht_grids=[&#39;equiangular&#39;, &#39;equiangular&#39;]
-self.sht_grids=[&#39;equiangular&#39;, &#39;equiangular&#39;]
-self.sht_grids=[&#39;equiangular&#39;, &#39;equiangular&#39;]
-
-Our model has 275555 parameters.
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Our model has 278435 parameters.
 </pre></div>
 </div>
 <p>Create the optimizer</p>
@@ -245,13 +235,13 @@
  SFNO(
   (positional_embedding): GridEmbeddingND()
   (fno_blocks): FNOBlocks(
-    (convs): ModuleList(
-      (0-3): 4 x SphericalConv(
-        (weight): ComplexDenseTensor(shape=torch.Size([32, 32, 32]), rank=None)
-        (sht_handle): SHT(
-          (_SHT_cache): ModuleDict()
-          (_iSHT_cache): ModuleDict()
-        )
+    (convs): SphericalConv(
+      (weight): ModuleList(
+        (0-3): 4 x ComplexDenseTensor(shape=torch.Size([32, 32, 32]), rank=None)
+      )
+      (sht_handle): SHT(
+        (_SHT_cache): ModuleDict()
+        (_iSHT_cache): ModuleDict()
       )
     )
     (fno_skips): ModuleList(
@@ -259,22 +249,11 @@
         (conv): Conv1d(32, 32, kernel_size=(1,), stride=(1,), bias=False)
       )
     )
-    (channel_mlp): ModuleList(
-      (0-3): 4 x ChannelMLP(
-        (fcs): ModuleList(
-          (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-          (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-        )
-      )
-    )
-    (channel_mlp_skips): ModuleList(
-      (0-3): 4 x SoftGating()
-    )
   )
   (lifting): ChannelMLP(
     (fcs): ModuleList(
-      (0): Conv1d(5, 64, kernel_size=(1,), stride=(1,))
-      (1): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
+      (0): Conv1d(5, 256, kernel_size=(1,), stride=(1,))
+      (1): Conv1d(256, 32, kernel_size=(1,), stride=(1,))
     )
   )
   (projection): ChannelMLP(
@@ -297,13 +276,13 @@
 )
 
 ### SCHEDULER ###
- &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f746f238df0&gt;
+ &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fea8ebc0ee0&gt;
 
 ### LOSSES ###
 
- * Train: &lt;neuralop.losses.data_losses.LpLoss object at 0x7f746c5a3d90&gt;
+ * Train: &lt;neuralop.losses.data_losses.LpLoss object at 0x7fea8ec2a2e0&gt;
 
- * Test: {&#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7f746c5a3d90&gt;}
+ * Test: {&#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7fea8ec2a2e0&gt;}
 </pre></div>
 </div>
 <p>Create the trainer</p>
@@ -328,22 +307,22 @@
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Training on 200 samples
 Testing on [50, 50] samples         on resolutions [(32, 64), (64, 128)].
 Raw outputs of shape torch.Size([4, 3, 32, 64])
-[0] time=0.91, avg_loss=2.6421, train_err=10.5682
-Eval: (32, 64)_l2=2.1051, (64, 128)_l2=2.4542
-[3] time=0.84, avg_loss=0.3812, train_err=1.5250
-Eval: (32, 64)_l2=0.5328, (64, 128)_l2=2.3434
-[6] time=0.73, avg_loss=0.2580, train_err=1.0322
-Eval: (32, 64)_l2=0.5245, (64, 128)_l2=2.2983
-[9] time=0.73, avg_loss=0.2163, train_err=0.8652
-Eval: (32, 64)_l2=0.4739, (64, 128)_l2=2.2781
-[12] time=0.73, avg_loss=0.1938, train_err=0.7753
-Eval: (32, 64)_l2=0.4735, (64, 128)_l2=2.2642
-[15] time=0.73, avg_loss=0.1628, train_err=0.6512
-Eval: (32, 64)_l2=0.4826, (64, 128)_l2=2.2505
-[18] time=0.73, avg_loss=0.1391, train_err=0.5565
-Eval: (32, 64)_l2=0.4369, (64, 128)_l2=2.2668
-
-{&#39;train_err&#39;: 0.5427721077203751, &#39;avg_loss&#39;: 0.13569302693009377, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 0.7358115278184414}
+[0] time=3.46, avg_loss=2.2655, train_err=9.0619
+Eval: (32, 64)_l2=1.6165, (64, 128)_l2=2.6751
+[3] time=3.47, avg_loss=0.4604, train_err=1.8414
+Eval: (32, 64)_l2=0.5567, (64, 128)_l2=2.3834
+[6] time=3.44, avg_loss=0.3189, train_err=1.2755
+Eval: (32, 64)_l2=0.4640, (64, 128)_l2=2.3548
+[9] time=3.41, avg_loss=0.2569, train_err=1.0278
+Eval: (32, 64)_l2=0.4651, (64, 128)_l2=2.3221
+[12] time=3.41, avg_loss=0.2121, train_err=0.8484
+Eval: (32, 64)_l2=0.3232, (64, 128)_l2=2.3157
+[15] time=3.40, avg_loss=0.1598, train_err=0.6390
+Eval: (32, 64)_l2=0.2673, (64, 128)_l2=2.3022
+[18] time=3.44, avg_loss=0.1432, train_err=0.5729
+Eval: (32, 64)_l2=0.2376, (64, 128)_l2=2.3091
+
+{&#39;train_err&#39;: 0.550230712890625, &#39;avg_loss&#39;: 0.13755767822265624, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 3.4114261440000746}
 </pre></div>
 </div>
 <p>Plot the prediction, and compare with the ground-truth
@@ -390,7 +369,7 @@
 <span class="n">fig</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
 </pre></div>
 </div>
-<img src="../_images/sphx_glr_plot_SFNO_swe_001.png" srcset="../_images/sphx_glr_plot_SFNO_swe_001.png" alt="Inputs, ground-truth output and prediction., Input x (32, 64), Ground-truth y, Model prediction, Input x (64, 128), Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 20.521 seconds)</p>
+<img src="../_images/sphx_glr_plot_SFNO_swe_001.png" srcset="../_images/sphx_glr_plot_SFNO_swe_001.png" alt="Inputs, ground-truth output and prediction., Input x (32, 64), Ground-truth y, Model prediction, Input x (64, 128), Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (1 minutes 25.030 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-sfno-swe-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/af3a515d2684655c6a5a8e0df87a4cf9/plot_SFNO_swe.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_SFNO_swe.ipynb</span></code></a></p>
@@ -398,6 +377,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/be42c4c413e9b89016fa3a4984cb9758/plot_SFNO_swe.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_SFNO_swe.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/5e60095ce99919773daa83384f767e02/plot_SFNO_swe.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_SFNO_swe.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
@@ -412,7 +394,7 @@
         <span class="icon">
             <i class="fa fa-arrow-circle-left"></i>
         </span>
-        <span>Training an FNO on Darcy-Flow</span>
+        <span>Training a TFNO on Darcy-Flow</span>
     </a>
     
     
diff --git a/dev/auto_examples/plot_UNO_darcy.html b/dev/auto_examples/plot_UNO_darcy.html
index 0b46e0e..474a69a 100644
--- a/dev/auto_examples/plot_UNO_darcy.html
+++ b/dev/auto_examples/plot_UNO_darcy.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2 current"><a class="current reference internal" href="#">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -192,18 +192,11 @@
         <span class="n">test_batch_sizes</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">],</span>
 <span class="p">)</span>
 
-<span class="n">model</span> <span class="o">=</span> <span class="n">UNO</span><span class="p">(</span><span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-            <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
-            <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
-            <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
-            <span class="n">uno_out_channels</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">32</span><span class="p">],</span>
-            <span class="n">uno_n_modes</span><span class="o">=</span><span class="p">[[</span><span class="mi">16</span><span class="p">,</span><span class="mi">16</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">16</span><span class="p">,</span><span class="mi">16</span><span class="p">]],</span>
-            <span class="n">uno_scalings</span><span class="o">=</span><span class="p">[[</span><span class="mf">1.0</span><span class="p">,</span><span class="mf">1.0</span><span class="p">],[</span><span class="mf">0.5</span><span class="p">,</span><span class="mf">0.5</span><span class="p">],[</span><span class="mi">1</span><span class="p">,</span><span class="mi">1</span><span class="p">],[</span><span class="mi">2</span><span class="p">,</span><span class="mi">2</span><span class="p">],[</span><span class="mi">1</span><span class="p">,</span><span class="mi">1</span><span class="p">]],</span>
-            <span class="n">horizontal_skips_map</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-            <span class="n">channel_mlp_skip</span><span class="o">=</span><span class="s2">&quot;linear&quot;</span><span class="p">,</span>
-            <span class="n">n_layers</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span>
-            <span class="n">domain_padding</span><span class="o">=</span><span class="mf">0.2</span><span class="p">)</span>
 
+
+<span class="n">model</span> <span class="o">=</span> <span class="n">UNO</span><span class="p">(</span><span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span><span class="n">uno_out_channels</span> <span class="o">=</span> <span class="p">[</span><span class="mi">32</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">64</span><span class="p">,</span><span class="mi">32</span><span class="p">],</span> \
+            <span class="n">uno_n_modes</span><span class="o">=</span> <span class="p">[[</span><span class="mi">16</span><span class="p">,</span><span class="mi">16</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">8</span><span class="p">,</span><span class="mi">8</span><span class="p">],[</span><span class="mi">16</span><span class="p">,</span><span class="mi">16</span><span class="p">]],</span> <span class="n">uno_scalings</span><span class="o">=</span>  <span class="p">[[</span><span class="mf">1.0</span><span class="p">,</span><span class="mf">1.0</span><span class="p">],[</span><span class="mf">0.5</span><span class="p">,</span><span class="mf">0.5</span><span class="p">],[</span><span class="mi">1</span><span class="p">,</span><span class="mi">1</span><span class="p">],[</span><span class="mi">2</span><span class="p">,</span><span class="mi">2</span><span class="p">],[</span><span class="mi">1</span><span class="p">,</span><span class="mi">1</span><span class="p">]],</span>\
+            <span class="n">horizontal_skips_map</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">n_layers</span> <span class="o">=</span> <span class="mi">5</span><span class="p">,</span> <span class="n">domain_padding</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">)</span>
 <span class="n">model</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">device</span><span class="p">)</span>
 
 <span class="n">n_params</span> <span class="o">=</span> <span class="n">count_model_params</span><span class="p">(</span><span class="n">model</span><span class="p">)</span>
@@ -211,20 +204,14 @@
 <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Loading test db for resolution 16 with 100 samples
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(
+Loading test db for resolution 16 with 100 samples
+/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(Path(root_dir).joinpath(f&quot;{dataset_name}_test_{res}.pt&quot;).as_posix())
 Loading test db for resolution 32 with 50 samples
-fno_skip=&#39;linear&#39;
-channel_mlp_skip=&#39;linear&#39;
-fno_skip=&#39;linear&#39;
-channel_mlp_skip=&#39;linear&#39;
-fno_skip=&#39;linear&#39;
-channel_mlp_skip=&#39;linear&#39;
-fno_skip=&#39;linear&#39;
-channel_mlp_skip=&#39;linear&#39;
-fno_skip=&#39;linear&#39;
-channel_mlp_skip=&#39;linear&#39;
-
-Our model has 2700097 parameters.
+
+Our model has 2665921 parameters.
 </pre></div>
 </div>
 <p>Create the optimizer</p>
@@ -263,9 +250,9 @@
   )
   (fno_blocks): ModuleList(
     (0): FNOBlocks(
-      (convs): ModuleList(
-        (0): SpectralConv(
-          (weight): DenseTensor(shape=torch.Size([64, 32, 16, 9]), rank=None)
+      (convs): SpectralConv(
+        (weight): ModuleList(
+          (0): DenseTensor(shape=torch.Size([64, 32, 16, 9]), rank=None)
         )
       )
       (fno_skips): ModuleList(
@@ -273,24 +260,11 @@
           (conv): Conv1d(64, 32, kernel_size=(1,), stride=(1,), bias=False)
         )
       )
-      (channel_mlp): ModuleList(
-        (0): ChannelMLP(
-          (fcs): ModuleList(
-            (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-            (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-          )
-        )
-      )
-      (channel_mlp_skips): ModuleList(
-        (0): Flattened1dConv(
-          (conv): Conv1d(64, 32, kernel_size=(1,), stride=(1,), bias=False)
-        )
-      )
     )
     (1): FNOBlocks(
-      (convs): ModuleList(
-        (0): SpectralConv(
-          (weight): DenseTensor(shape=torch.Size([32, 64, 8, 5]), rank=None)
+      (convs): SpectralConv(
+        (weight): ModuleList(
+          (0): DenseTensor(shape=torch.Size([32, 64, 8, 5]), rank=None)
         )
       )
       (fno_skips): ModuleList(
@@ -298,24 +272,11 @@
           (conv): Conv1d(32, 64, kernel_size=(1,), stride=(1,), bias=False)
         )
       )
-      (channel_mlp): ModuleList(
-        (0): ChannelMLP(
-          (fcs): ModuleList(
-            (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-            (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-          )
-        )
-      )
-      (channel_mlp_skips): ModuleList(
-        (0): Flattened1dConv(
-          (conv): Conv1d(32, 64, kernel_size=(1,), stride=(1,), bias=False)
-        )
-      )
     )
     (2): FNOBlocks(
-      (convs): ModuleList(
-        (0): SpectralConv(
-          (weight): DenseTensor(shape=torch.Size([64, 64, 8, 5]), rank=None)
+      (convs): SpectralConv(
+        (weight): ModuleList(
+          (0): DenseTensor(shape=torch.Size([64, 64, 8, 5]), rank=None)
         )
       )
       (fno_skips): ModuleList(
@@ -323,24 +284,11 @@
           (conv): Conv1d(64, 64, kernel_size=(1,), stride=(1,), bias=False)
         )
       )
-      (channel_mlp): ModuleList(
-        (0): ChannelMLP(
-          (fcs): ModuleList(
-            (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-            (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-          )
-        )
-      )
-      (channel_mlp_skips): ModuleList(
-        (0): Flattened1dConv(
-          (conv): Conv1d(64, 64, kernel_size=(1,), stride=(1,), bias=False)
-        )
-      )
     )
     (3): FNOBlocks(
-      (convs): ModuleList(
-        (0): SpectralConv(
-          (weight): DenseTensor(shape=torch.Size([128, 64, 8, 5]), rank=None)
+      (convs): SpectralConv(
+        (weight): ModuleList(
+          (0): DenseTensor(shape=torch.Size([128, 64, 8, 5]), rank=None)
         )
       )
       (fno_skips): ModuleList(
@@ -348,24 +296,11 @@
           (conv): Conv1d(128, 64, kernel_size=(1,), stride=(1,), bias=False)
         )
       )
-      (channel_mlp): ModuleList(
-        (0): ChannelMLP(
-          (fcs): ModuleList(
-            (0): Conv1d(64, 32, kernel_size=(1,), stride=(1,))
-            (1): Conv1d(32, 64, kernel_size=(1,), stride=(1,))
-          )
-        )
-      )
-      (channel_mlp_skips): ModuleList(
-        (0): Flattened1dConv(
-          (conv): Conv1d(128, 64, kernel_size=(1,), stride=(1,), bias=False)
-        )
-      )
     )
     (4): FNOBlocks(
-      (convs): ModuleList(
-        (0): SpectralConv(
-          (weight): DenseTensor(shape=torch.Size([96, 32, 16, 9]), rank=None)
+      (convs): SpectralConv(
+        (weight): ModuleList(
+          (0): DenseTensor(shape=torch.Size([96, 32, 16, 9]), rank=None)
         )
       )
       (fno_skips): ModuleList(
@@ -373,19 +308,6 @@
           (conv): Conv1d(96, 32, kernel_size=(1,), stride=(1,), bias=False)
         )
       )
-      (channel_mlp): ModuleList(
-        (0): ChannelMLP(
-          (fcs): ModuleList(
-            (0): Conv1d(32, 16, kernel_size=(1,), stride=(1,))
-            (1): Conv1d(16, 32, kernel_size=(1,), stride=(1,))
-          )
-        )
-      )
-      (channel_mlp_skips): ModuleList(
-        (0): Flattened1dConv(
-          (conv): Conv1d(96, 32, kernel_size=(1,), stride=(1,), bias=False)
-        )
-      )
     )
   )
   (horizontal_skips): ModuleDict(
@@ -416,13 +338,13 @@
 )
 
 ### SCHEDULER ###
- &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f2f6dd18a00&gt;
+ &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7feab5259a00&gt;
 
 ### LOSSES ###
 
- * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7f2f6dee84f0&gt;
+ * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feab5259dc0&gt;
 
- * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7f2f6dee84f0&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7f2f6dd4d5a0&gt;}
+ * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feab5259dc0&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7feab52594c0&gt;}
 </pre></div>
 </div>
 <p>Create the trainer</p>
@@ -449,22 +371,22 @@
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Training on 1000 samples
 Testing on [50, 50] samples         on resolutions [16, 32].
 Raw outputs of shape torch.Size([32, 1, 16, 16])
-[0] time=4.61, avg_loss=0.6586, train_err=20.5798
-Eval: 16_h1=0.4974, 16_l2=0.4004, 32_h1=0.8209, 32_l2=0.6873
-[3] time=4.63, avg_loss=0.2522, train_err=7.8821
-Eval: 16_h1=0.2281, 16_l2=0.1702, 32_h1=0.7338, 32_l2=0.5956
-[6] time=4.52, avg_loss=0.2534, train_err=7.9194
-Eval: 16_h1=0.2041, 16_l2=0.1527, 32_h1=0.6873, 32_l2=0.5407
-[9] time=4.44, avg_loss=0.2240, train_err=6.9998
-Eval: 16_h1=0.2075, 16_l2=0.1543, 32_h1=0.6566, 32_l2=0.4983
-[12] time=4.35, avg_loss=0.2071, train_err=6.4715
-Eval: 16_h1=0.1967, 16_l2=0.1384, 32_h1=0.6875, 32_l2=0.5304
-[15] time=4.36, avg_loss=0.1711, train_err=5.3483
-Eval: 16_h1=0.2300, 16_l2=0.1629, 32_h1=0.6453, 32_l2=0.4576
-[18] time=4.43, avg_loss=0.1268, train_err=3.9616
-Eval: 16_h1=0.1860, 16_l2=0.1351, 32_h1=0.6503, 32_l2=0.4821
-
-{&#39;train_err&#39;: 3.9999673664569855, &#39;avg_loss&#39;: 0.12799895572662354, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 4.439005568623543}
+[0] time=6.61, avg_loss=0.5430, train_err=16.9693
+Eval: 16_h1=0.3210, 16_l2=0.2597, 32_h1=0.7922, 32_l2=0.5999
+[3] time=6.48, avg_loss=0.2685, train_err=8.3897
+Eval: 16_h1=0.2068, 16_l2=0.1545, 32_h1=0.7909, 32_l2=0.6063
+[6] time=6.47, avg_loss=0.2368, train_err=7.4001
+Eval: 16_h1=0.2155, 16_l2=0.1649, 32_h1=0.7626, 32_l2=0.5989
+[9] time=6.47, avg_loss=0.2172, train_err=6.7885
+Eval: 16_h1=0.2323, 16_l2=0.1762, 32_h1=0.7456, 32_l2=0.5858
+[12] time=6.48, avg_loss=0.2048, train_err=6.3987
+Eval: 16_h1=0.1903, 16_l2=0.1337, 32_h1=0.7315, 32_l2=0.5729
+[15] time=6.46, avg_loss=0.1886, train_err=5.8936
+Eval: 16_h1=0.1910, 16_l2=0.1350, 32_h1=0.7238, 32_l2=0.5652
+[18] time=6.48, avg_loss=0.1804, train_err=5.6383
+Eval: 16_h1=0.1816, 16_l2=0.1254, 32_h1=0.7171, 32_l2=0.5568
+
+{&#39;train_err&#39;: 5.1316939406096935, &#39;avg_loss&#39;: 0.16421420609951018, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 6.497358972000029}
 </pre></div>
 </div>
 <p>Plot the prediction, and compare with the ground-truth
@@ -514,7 +436,7 @@
 <span class="n">fig</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
 </pre></div>
 </div>
-<img src="../_images/sphx_glr_plot_UNO_darcy_001.png" srcset="../_images/sphx_glr_plot_UNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (1 minutes 33.254 seconds)</p>
+<img src="../_images/sphx_glr_plot_UNO_darcy_001.png" srcset="../_images/sphx_glr_plot_UNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (2 minutes 12.491 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-uno-darcy-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/ecc34f03fb30bee651bda959149422c4/plot_UNO_darcy.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_UNO_darcy.ipynb</span></code></a></p>
@@ -522,6 +444,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/f9c1e50d48828a746410d5400feb61f7/plot_UNO_darcy.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_UNO_darcy.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/cefc537c5730a6b3e916b83c1fd313d6/plot_UNO_darcy.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_UNO_darcy.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/plot_count_flops.html b/dev/auto_examples/plot_count_flops.html
index 23e32fe..d5817d9 100644
--- a/dev/auto_examples/plot_count_flops.html
+++ b/dev/auto_examples/plot_count_flops.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2 current"><a class="current reference internal" href="#">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -182,13 +182,13 @@
 <span class="n">device</span> <span class="o">=</span> <span class="s1">&#39;cpu&#39;</span>
 
 <span class="n">fno</span> <span class="o">=</span> <span class="n">FNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span><span class="mi">64</span><span class="p">),</span>
-          <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
+          <span class="n">in_channels</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span>
           <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span>
           <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span>
           <span class="n">projection_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
 
 <span class="n">batch_size</span> <span class="o">=</span> <span class="mi">4</span>
-<span class="n">model_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">128</span><span class="p">,</span> <span class="mi">128</span><span class="p">)</span>
+<span class="n">model_input</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">128</span><span class="p">,</span> <span class="mi">128</span><span class="p">)</span>
 
 
 <span class="k">with</span> <span class="n">FlopTensorDispatchMode</span><span class="p">(</span><span class="n">fno</span><span class="p">)</span> <span class="k">as</span> <span class="n">ftdm</span><span class="p">:</span>
@@ -205,7 +205,7 @@
 <div class="highlight-Python notranslate"><div class="highlight"><pre><span></span><span class="nb">print</span><span class="p">(</span><span class="n">fno_forward_flops</span><span class="p">)</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>defaultdict(&lt;function FlopTensorDispatchMode.__init__.&lt;locals&gt;.&lt;lambda&gt; at 0x7f03bbb1be20&gt;, {&#39;&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 2470445056, &#39;bmm.default&#39;: 138412032}), &#39;lifting&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1124073472}), &#39;lifting.fcs.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 50331648}), &#39;lifting.fcs.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1073741824}), &#39;fno_blocks&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1073741824, &#39;bmm.default&#39;: 138412032}), &#39;fno_blocks.fno_skips.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.0.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.convs&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;bmm.default&#39;: 138412032}), &#39;fno_blocks.fno_skips.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.1.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.2&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.2.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.3&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.3.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;projection&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 272629760}), &#39;projection.fcs.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;projection.fcs.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 4194304})})
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>defaultdict(&lt;function FlopTensorDispatchMode.__init__.&lt;locals&gt;.&lt;lambda&gt; at 0x7feab52b2e50&gt;, {&#39;&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 2503999488, &#39;bmm.default&#39;: 138412032}), &#39;lifting&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1157627904}), &#39;lifting.fcs.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 83886080}), &#39;lifting.fcs.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1073741824}), &#39;fno_blocks&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 1073741824, &#39;bmm.default&#39;: 138412032}), &#39;fno_blocks.fno_skips.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.0.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.convs&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;bmm.default&#39;: 138412032}), &#39;fno_blocks.fno_skips.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.1.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.2&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.2.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.3&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;fno_blocks.fno_skips.3.conv&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;projection&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 272629760}), &#39;projection.fcs.0&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 268435456}), &#39;projection.fcs.1&#39;: defaultdict(&lt;class &#39;int&#39;&gt;, {&#39;convolution.default&#39;: 4194304})})
 </pre></div>
 </div>
 <p>To check the maximum FLOPS used during the forward pass, let’s create a recursive function to search the nested dict:</p>
@@ -226,11 +226,11 @@
 <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Max FLOPS required for FNO.backward: </span><span class="si">{</span><span class="n">get_max_flops</span><span class="p">(</span><span class="n">fno_backward_flops</span><span class="p">)</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Max FLOPS required for FNO.forward: 2470445056
-Max FLOPS required for FNO.backward: 4890558464
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Max FLOPS required for FNO.forward: 2503999488
+Max FLOPS required for FNO.backward: 4924112896
 </pre></div>
 </div>
-<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 1.302 seconds)</p>
+<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 4.065 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-count-flops-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/84c435865e4e2910253a980881498782/plot_count_flops.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_count_flops.ipynb</span></code></a></p>
@@ -238,6 +238,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/de69282d3144c5a2b675c6f6338237c1/plot_count_flops.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_count_flops.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/20c43dd37baf603889c4dc23e93bdb60/plot_count_flops.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_count_flops.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/plot_darcy_flow.html b/dev/auto_examples/plot_darcy_flow.html
index 61c4211..15a2e48 100644
--- a/dev/auto_examples/plot_darcy_flow.html
+++ b/dev/auto_examples/plot_darcy_flow.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2 current"><a class="current reference internal" href="#">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -192,7 +192,11 @@ <h2>Load the dataset<a class="headerlink" href="#load-the-dataset" title="Link t
 <span class="n">train_dataset</span> <span class="o">=</span> <span class="n">train_loader</span><span class="o">.</span><span class="n">dataset</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Loading test db for resolution 16 with 50 samples
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(
+Loading test db for resolution 16 with 50 samples
+/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(Path(root_dir).joinpath(f&quot;{dataset_name}_test_{res}.pt&quot;).as_posix())
 Loading test db for resolution 32 with 50 samples
 </pre></div>
 </div>
@@ -255,7 +259,7 @@ <h2>Visualizing the data<a class="headerlink" href="#visualizing-the-data" title
 Training samples have shape torch.Size([16, 16])
 </pre></div>
 </div>
-<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 0.186 seconds)</p>
+<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 0.429 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-darcy-flow-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/0ac9f102e4f1903984e3b4a7d517c88f/plot_darcy_flow.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_darcy_flow.ipynb</span></code></a></p>
@@ -263,6 +267,9 @@ <h2>Visualizing the data<a class="headerlink" href="#visualizing-the-data" title
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/01111202d22a556abc06831baa4765ac/plot_darcy_flow.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_darcy_flow.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/3864a2d85c7ce11adeac9580559229ab/plot_darcy_flow.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_darcy_flow.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/plot_darcy_flow_spectrum.html b/dev/auto_examples/plot_darcy_flow_spectrum.html
index b35f80d..b9c088a 100644
--- a/dev/auto_examples/plot_darcy_flow_spectrum.html
+++ b/dev/auto_examples/plot_darcy_flow_spectrum.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -132,7 +132,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2 current"><a class="current reference internal" href="#">A simple Darcy-Flow spectrum analysis</a></li>
@@ -247,7 +247,11 @@ <h2>Import the library<a class="headerlink" href="#import-the-library" title="Li
 <span class="n">grid</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">cat</span><span class="p">((</span><span class="n">gridx</span><span class="p">,</span> <span class="n">gridy</span><span class="p">),</span> <span class="n">dim</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Loading test db for resolution 16 with 50 samples
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(
+Loading test db for resolution 16 with 50 samples
+/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(Path(root_dir).joinpath(f&quot;{dataset_name}_test_{res}.pt&quot;).as_posix())
 Original dataset shape torch.Size([50, 1, 16, 16])
 </pre></div>
 </div>
@@ -280,11 +284,11 @@ <h2>Import the library<a class="headerlink" href="#import-the-library" title="Li
 <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
 </pre></div>
 </div>
-<img src="../_images/sphx_glr_plot_darcy_flow_spectrum_001.png" srcset="../_images/sphx_glr_plot_darcy_flow_spectrum_001.png" alt="Spectrum of Darcy Flow Datset" class = "sphx-glr-single-img"/><div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/dave/myneurop/examples/plot_darcy_flow_spectrum.py:104: UserWarning: Attempt to set non-positive ylim on a log-scaled axis will be ignored.
+<img src="../_images/sphx_glr_plot_darcy_flow_spectrum_001.png" srcset="../_images/sphx_glr_plot_darcy_flow_spectrum_001.png" alt="Spectrum of Darcy Flow Datset" class = "sphx-glr-single-img"/><div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/examples/plot_darcy_flow_spectrum.py:104: UserWarning: Attempt to set non-positive ylim on a log-scaled axis will be ignored.
   ax.set_ylim(10, 10^10)
 </pre></div>
 </div>
-<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 0.139 seconds)</p>
+<p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 0.279 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-darcy-flow-spectrum-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/c628421a5214dc8f1b3bde8be930715f/plot_darcy_flow_spectrum.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_darcy_flow_spectrum.ipynb</span></code></a></p>
@@ -292,6 +296,9 @@ <h2>Import the library<a class="headerlink" href="#import-the-library" title="Li
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/e24a0a604c121d50b764a91b613b2142/plot_darcy_flow_spectrum.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_darcy_flow_spectrum.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/3faf9d2eaee5cc8e9f1c631c002ce544/plot_darcy_flow_spectrum.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_darcy_flow_spectrum.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/plot_incremental_FNO_darcy.html b/dev/auto_examples/plot_incremental_FNO_darcy.html
index cad7e1b..d92910e 100644
--- a/dev/auto_examples/plot_incremental_FNO_darcy.html
+++ b/dev/auto_examples/plot_incremental_FNO_darcy.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -131,7 +131,7 @@
 <li class="toctree-l2"><a class="reference internal" href="plot_count_flops.html">Using <cite>torchtnt</cite> to count FLOPS</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow.html">A simple Darcy-Flow dataset</a></li>
 <li class="toctree-l2"><a class="reference internal" href="checkpoint_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
-<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training an FNO on Darcy-Flow</a></li>
+<li class="toctree-l2"><a class="reference internal" href="plot_FNO_darcy.html">Training a TFNO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_SFNO_swe.html">Training a SFNO on the spherical Shallow Water equations</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_UNO_darcy.html">U-NO on Darcy-Flow</a></li>
 <li class="toctree-l2"><a class="reference internal" href="plot_darcy_flow_spectrum.html">A simple Darcy-Flow spectrum analysis</a></li>
@@ -192,7 +192,11 @@
 <span class="p">)</span>
 </pre></div>
 </div>
-<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Loading test db for resolution 16 with 100 samples
+<div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:93: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(
+Loading test db for resolution 16 with 100 samples
+/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/pt_dataset.py:172: FutureWarning: You are using `torch.load` with `weights_only=False` (the current default value), which uses the default pickle module implicitly. It is possible to construct malicious pickle data which will execute arbitrary code during unpickling (See https://github.com/pytorch/pytorch/blob/main/SECURITY.md#untrusted-models for more details). In a future release, the default value for `weights_only` will be flipped to `True`. This limits the functions that could be executed during unpickling. Arbitrary objects will no longer be allowed to be loaded via this mode unless they are explicitly allowlisted by the user via `torch.serialization.add_safe_globals`. We recommend you start setting `weights_only=True` for any use case where you don&#39;t have full control of the loaded file. Please open an issue on GitHub for any issues related to this experimental feature.
+  data = torch.load(Path(root_dir).joinpath(f&quot;{dataset_name}_test_{res}.pt&quot;).as_posix())
 Loading test db for resolution 32 with 50 samples
 </pre></div>
 </div>
@@ -271,7 +275,7 @@
 </pre></div>
 </div>
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>### N PARAMS ###
- 2110305
+ 2119329
 
 ### OPTIMIZER ###
  AdamW (
@@ -285,15 +289,15 @@
 )
 
 ### SCHEDULER ###
- &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7f746c2a2b90&gt;
+ &lt;torch.optim.lr_scheduler.CosineAnnealingLR object at 0x7fea8ec5f790&gt;
 
 ### LOSSES ###
 
 ### INCREMENTAL RESOLUTION + GRADIENT EXPLAINED ###
 
- * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7f746c3ab1f0&gt;
+ * Train: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feab84cca90&gt;
 
- * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7f746c3ab1f0&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7f746c2a2fe0&gt;}
+ * Test: {&#39;h1&#39;: &lt;neuralop.losses.data_losses.H1Loss object at 0x7feab84cca90&gt;, &#39;l2&#39;: &lt;neuralop.losses.data_losses.LpLoss object at 0x7feaa0415d00&gt;}
 </pre></div>
 </div>
 <p>Set up the IncrementalTrainer
@@ -347,51 +351,51 @@
 <div class="sphx-glr-script-out highlight-none notranslate"><div class="highlight"><pre><span></span>Training on 100 samples
 Testing on [50, 50] samples         on resolutions [16, 32].
 Raw outputs of shape torch.Size([16, 1, 8, 8])
-[0] time=0.07, avg_loss=0.8236, train_err=11.7655
-Eval: 16_h1=0.7665, 16_l2=0.6166, 32_h1=0.7932, 32_l2=0.6111
-[1] time=0.03, avg_loss=0.6737, train_err=9.6245
-Eval: 16_h1=0.6417, 16_l2=0.4694, 32_h1=0.7263, 32_l2=0.4793
-[2] time=0.03, avg_loss=0.5479, train_err=7.8269
-Eval: 16_h1=0.6615, 16_l2=0.4694, 32_h1=0.8183, 32_l2=0.4896
-[3] time=0.03, avg_loss=0.5040, train_err=7.1998
-Eval: 16_h1=0.5634, 16_l2=0.4002, 32_h1=0.6886, 32_l2=0.4146
-[4] time=0.04, avg_loss=0.4482, train_err=6.4026
-Eval: 16_h1=0.5917, 16_l2=0.4267, 32_h1=0.7822, 32_l2=0.4703
-[5] time=0.04, avg_loss=0.4120, train_err=5.8851
-Eval: 16_h1=0.5466, 16_l2=0.3766, 32_h1=0.7625, 32_l2=0.4164
-[6] time=0.04, avg_loss=0.3683, train_err=5.2609
-Eval: 16_h1=0.4672, 16_l2=0.3235, 32_h1=0.6485, 32_l2=0.3597
-[7] time=0.04, avg_loss=0.3326, train_err=4.7513
-Eval: 16_h1=0.4938, 16_l2=0.3391, 32_h1=0.6948, 32_l2=0.3841
-[8] time=0.04, avg_loss=0.3064, train_err=4.3769
-Eval: 16_h1=0.4673, 16_l2=0.3198, 32_h1=0.6777, 32_l2=0.3651
-[9] time=0.04, avg_loss=0.2868, train_err=4.0965
-Eval: 16_h1=0.4539, 16_l2=0.3072, 32_h1=0.6651, 32_l2=0.3536
+[0] time=0.21, avg_loss=0.7750, train_err=11.0714
+Eval: 16_h1=0.7031, 16_l2=0.5348, 32_h1=0.7319, 32_l2=0.5357
+[1] time=0.21, avg_loss=0.5908, train_err=8.4395
+Eval: 16_h1=0.6114, 16_l2=0.4391, 32_h1=0.6716, 32_l2=0.4473
+[2] time=0.20, avg_loss=0.5093, train_err=7.2754
+Eval: 16_h1=0.5647, 16_l2=0.3843, 32_h1=0.6667, 32_l2=0.3946
+[3] time=0.21, avg_loss=0.4408, train_err=6.2975
+Eval: 16_h1=0.5216, 16_l2=0.3600, 32_h1=0.6661, 32_l2=0.3915
+[4] time=0.21, avg_loss=0.4055, train_err=5.7927
+Eval: 16_h1=0.5165, 16_l2=0.3631, 32_h1=0.6852, 32_l2=0.4008
+[5] time=0.21, avg_loss=0.3794, train_err=5.4201
+Eval: 16_h1=0.5407, 16_l2=0.4053, 32_h1=0.6456, 32_l2=0.4213
+[6] time=0.22, avg_loss=0.3662, train_err=5.2311
+Eval: 16_h1=0.4848, 16_l2=0.3434, 32_h1=0.6641, 32_l2=0.3786
+[7] time=0.22, avg_loss=0.3320, train_err=4.7433
+Eval: 16_h1=0.4515, 16_l2=0.3280, 32_h1=0.5890, 32_l2=0.3661
+[8] time=0.22, avg_loss=0.3013, train_err=4.3041
+Eval: 16_h1=0.4443, 16_l2=0.3024, 32_h1=0.6300, 32_l2=0.3467
+[9] time=0.23, avg_loss=0.2621, train_err=3.7436
+Eval: 16_h1=0.4252, 16_l2=0.2978, 32_h1=0.6085, 32_l2=0.3395
 Incre Res Update: change index to 1
 Incre Res Update: change sub to 1
 Incre Res Update: change res to 16
-[10] time=0.06, avg_loss=0.3922, train_err=5.6035
-Eval: 16_h1=0.3690, 16_l2=0.2683, 32_h1=0.4566, 32_l2=0.2656
-[11] time=0.04, avg_loss=0.3392, train_err=4.8454
-Eval: 16_h1=0.3419, 16_l2=0.2484, 32_h1=0.4551, 32_l2=0.2650
-[12] time=0.04, avg_loss=0.3098, train_err=4.4253
-Eval: 16_h1=0.3172, 16_l2=0.2389, 32_h1=0.4273, 32_l2=0.2547
-[13] time=0.04, avg_loss=0.2827, train_err=4.0392
-Eval: 16_h1=0.3155, 16_l2=0.2391, 32_h1=0.4182, 32_l2=0.2516
-[14] time=0.04, avg_loss=0.2774, train_err=3.9626
-Eval: 16_h1=0.2872, 16_l2=0.2186, 32_h1=0.3938, 32_l2=0.2344
-[15] time=0.04, avg_loss=0.2490, train_err=3.5571
-Eval: 16_h1=0.2744, 16_l2=0.2075, 32_h1=0.3745, 32_l2=0.2220
-[16] time=0.04, avg_loss=0.2346, train_err=3.3511
-Eval: 16_h1=0.2758, 16_l2=0.2056, 32_h1=0.3889, 32_l2=0.2249
-[17] time=0.04, avg_loss=0.2293, train_err=3.2760
-Eval: 16_h1=0.2793, 16_l2=0.2077, 32_h1=0.3904, 32_l2=0.2213
-[18] time=0.04, avg_loss=0.2262, train_err=3.2321
-Eval: 16_h1=0.3024, 16_l2=0.2263, 32_h1=0.4136, 32_l2=0.2417
-[19] time=0.04, avg_loss=0.2388, train_err=3.4117
-Eval: 16_h1=0.3040, 16_l2=0.2327, 32_h1=0.4129, 32_l2=0.2462
-
-{&#39;train_err&#39;: 3.411697438785008, &#39;avg_loss&#39;: 0.23881882071495056, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 0.04143996722996235, &#39;16_h1&#39;: tensor(0.3040, device=&#39;cuda:0&#39;), &#39;16_l2&#39;: tensor(0.2327, device=&#39;cuda:0&#39;), &#39;32_h1&#39;: tensor(0.4129, device=&#39;cuda:0&#39;), &#39;32_l2&#39;: tensor(0.2462, device=&#39;cuda:0&#39;)}
+[10] time=0.30, avg_loss=0.3530, train_err=5.0422
+Eval: 16_h1=0.3418, 16_l2=0.2496, 32_h1=0.4258, 32_l2=0.2477
+[11] time=0.29, avg_loss=0.2891, train_err=4.1300
+Eval: 16_h1=0.3833, 16_l2=0.2783, 32_h1=0.4696, 32_l2=0.2820
+[12] time=0.31, avg_loss=0.2975, train_err=4.2504
+Eval: 16_h1=0.3179, 16_l2=0.2267, 32_h1=0.4156, 32_l2=0.2404
+[13] time=0.31, avg_loss=0.2420, train_err=3.4567
+Eval: 16_h1=0.2829, 16_l2=0.2034, 32_h1=0.3807, 32_l2=0.2174
+[14] time=0.31, avg_loss=0.2147, train_err=3.0676
+Eval: 16_h1=0.3394, 16_l2=0.2630, 32_h1=0.4255, 32_l2=0.2714
+[15] time=0.32, avg_loss=0.2232, train_err=3.1885
+Eval: 16_h1=0.3785, 16_l2=0.2985, 32_h1=0.4668, 32_l2=0.3102
+[16] time=0.32, avg_loss=0.2555, train_err=3.6494
+Eval: 16_h1=0.3279, 16_l2=0.2593, 32_h1=0.4078, 32_l2=0.2623
+[17] time=0.32, avg_loss=0.2769, train_err=3.9559
+Eval: 16_h1=0.4073, 16_l2=0.3371, 32_h1=0.4499, 32_l2=0.3422
+[18] time=0.32, avg_loss=0.2840, train_err=4.0576
+Eval: 16_h1=0.2826, 16_l2=0.2202, 32_h1=0.3649, 32_l2=0.2272
+[19] time=0.32, avg_loss=0.1984, train_err=2.8340
+Eval: 16_h1=0.2795, 16_l2=0.2186, 32_h1=0.3582, 32_l2=0.2296
+
+{&#39;train_err&#39;: 2.8339713641575406, &#39;avg_loss&#39;: 0.19837799549102783, &#39;avg_lasso_loss&#39;: None, &#39;epoch_train_time&#39;: 0.3178346639999745, &#39;16_h1&#39;: tensor(0.2795), &#39;16_l2&#39;: tensor(0.2186), &#39;32_h1&#39;: tensor(0.3582), &#39;32_l2&#39;: tensor(0.2296)}
 </pre></div>
 </div>
 <p>Plot the prediction, and compare with the ground-truth
@@ -441,7 +445,7 @@
 <span class="n">fig</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
 </pre></div>
 </div>
-<img src="../_images/sphx_glr_plot_incremental_FNO_darcy_001.png" srcset="../_images/sphx_glr_plot_incremental_FNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 1.140 seconds)</p>
+<img src="../_images/sphx_glr_plot_incremental_FNO_darcy_001.png" srcset="../_images/sphx_glr_plot_incremental_FNO_darcy_001.png" alt="Inputs, ground-truth output and prediction., Input x, Ground-truth y, Model prediction" class = "sphx-glr-single-img"/><p class="sphx-glr-timing"><strong>Total running time of the script:</strong> (0 minutes 7.776 seconds)</p>
 <div class="sphx-glr-footer sphx-glr-footer-example docutils container" id="sphx-glr-download-auto-examples-plot-incremental-fno-darcy-py">
 <div class="sphx-glr-download sphx-glr-download-jupyter docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/082e73328a5caf8c1fe9ad7fe05cf68f/plot_incremental_FNO_darcy.ipynb"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Jupyter</span> <span class="pre">notebook:</span> <span class="pre">plot_incremental_FNO_darcy.ipynb</span></code></a></p>
@@ -449,6 +453,9 @@
 <div class="sphx-glr-download sphx-glr-download-python docutils container">
 <p><a class="reference download internal" download="" href="../_downloads/e0c6b93bc273399c7d7bc6ab62761730/plot_incremental_FNO_darcy.py"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">Python</span> <span class="pre">source</span> <span class="pre">code:</span> <span class="pre">plot_incremental_FNO_darcy.py</span></code></a></p>
 </div>
+<div class="sphx-glr-download sphx-glr-download-zip docutils container">
+<p><a class="reference download internal" download="" href="../_downloads/0d78e075dd52a34e158d7f5f710dfe89/plot_incremental_FNO_darcy.zip"><code class="xref download docutils literal notranslate"><span class="pre">Download</span> <span class="pre">zipped:</span> <span class="pre">plot_incremental_FNO_darcy.zip</span></code></a></p>
+</div>
 </div>
 <p class="sphx-glr-signature"><a class="reference external" href="https://sphinx-gallery.github.io">Gallery generated by Sphinx-Gallery</a></p>
 </section>
diff --git a/dev/auto_examples/sg_execution_times.html b/dev/auto_examples/sg_execution_times.html
index e634b50..459de5a 100644
--- a/dev/auto_examples/sg_execution_times.html
+++ b/dev/auto_examples/sg_execution_times.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -153,7 +153,7 @@
         
   <section id="computation-times">
 <span id="sphx-glr-auto-examples-sg-execution-times"></span><h1>Computation times<a class="headerlink" href="#computation-times" title="Link to this heading"></a></h1>
-<p><strong>01:33.254</strong> total execution time for 8 files <strong>from auto_examples</strong>:</p>
+<p><strong>04:44.485</strong> total execution time for 8 files <strong>from auto_examples</strong>:</p>
 <div class="docutils container">
 <style scoped>
 <link href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/5.3.0/css/bootstrap.min.css" rel="stylesheet" />
@@ -175,34 +175,34 @@
 </thead>
 <tbody>
 <tr class="row-even"><td><p><a class="reference internal" href="plot_UNO_darcy.html#sphx-glr-auto-examples-plot-uno-darcy-py"><span class="std std-ref">U-NO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_UNO_darcy.py</span></code>)</p></td>
-<td><p>01:33.254</p></td>
+<td><p>02:12.491</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="checkpoint_FNO_darcy.html#sphx-glr-auto-examples-checkpoint-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">checkpoint_FNO_darcy.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="plot_SFNO_swe.html#sphx-glr-auto-examples-plot-sfno-swe-py"><span class="std std-ref">Training a SFNO on the spherical Shallow Water equations</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_SFNO_swe.py</span></code>)</p></td>
+<td><p>01:25.030</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training an FNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_FNO_darcy.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-even"><td><p><a class="reference internal" href="plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_FNO_darcy.py</span></code>)</p></td>
+<td><p>00:54.415</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="plot_SFNO_swe.html#sphx-glr-auto-examples-plot-sfno-swe-py"><span class="std std-ref">Training a SFNO on the spherical Shallow Water equations</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_SFNO_swe.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="plot_incremental_FNO_darcy.html#sphx-glr-auto-examples-plot-incremental-fno-darcy-py"><span class="std std-ref">Training a neural operator on Darcy-Flow - Author Robert Joseph George</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_incremental_FNO_darcy.py</span></code>)</p></td>
+<td><p>00:07.776</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="plot_count_flops.html#sphx-glr-auto-examples-plot-count-flops-py"><span class="std std-ref">Using torchtnt to count FLOPS</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_count_flops.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:04.065</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-odd"><td><p><a class="reference internal" href="plot_darcy_flow.html#sphx-glr-auto-examples-plot-darcy-flow-py"><span class="std std-ref">A simple Darcy-Flow dataset</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_darcy_flow.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:00.429</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="plot_darcy_flow_spectrum.html#sphx-glr-auto-examples-plot-darcy-flow-spectrum-py"><span class="std std-ref">A simple Darcy-Flow spectrum analysis</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_darcy_flow_spectrum.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:00.279</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="plot_incremental_FNO_darcy.html#sphx-glr-auto-examples-plot-incremental-fno-darcy-py"><span class="std std-ref">Training a neural operator on Darcy-Flow - Author Robert Joseph George</span></a> (<code class="docutils literal notranslate"><span class="pre">plot_incremental_FNO_darcy.py</span></code>)</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="checkpoint_FNO_darcy.html#sphx-glr-auto-examples-checkpoint-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">checkpoint_FNO_darcy.py</span></code>)</p></td>
 <td><p>00:00.000</p></td>
 <td><p>0.0</p></td>
 </tr>
diff --git a/dev/genindex.html b/dev/genindex.html
index 8b911c7..5424ea8 100644
--- a/dev/genindex.html
+++ b/dev/genindex.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -167,11 +167,7 @@ <h2 id="D">D</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.html#neuralop.data.transforms.data_processors.DefaultDataProcessor">DefaultDataProcessor (class in neuralop.data.transforms.data_processors)</a>
-
-      <ul>
-        <li><a href="modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.html#neuralop.datasets.data_transforms.DefaultDataProcessor">(in module neuralop.datasets.data_transforms)</a>
 </li>
-      </ul></li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.layers.padding.DomainPadding.html#neuralop.layers.padding.DomainPadding">DomainPadding (class in neuralop.layers.padding)</a>
@@ -194,7 +190,7 @@ <h2 id="E">E</h2>
 <h2 id="F">F</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="modules/_autosummary/neuralop.models.FNO.html#neuralop.models.FNO">FNO (class in neuralop.models)</a>, <a href="modules/generated/neuralop.models.FNO.html#neuralop.models.FNO">[1]</a>
+      <li><a href="modules/generated/neuralop.models.FNO.html#neuralop.models.FNO">FNO (class in neuralop.models)</a>
 </li>
       <li><a href="modules/generated/neuralop.models.FNO1d.html#neuralop.models.FNO1d">FNO1d (class in neuralop.models)</a>
 </li>
@@ -206,12 +202,6 @@ <h2 id="F">F</h2>
 
       <ul>
         <li><a href="modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward">(neuralop.data.transforms.data_processors.MGPatchingDataProcessor method)</a>
-</li>
-        <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D.forward">(neuralop.layers.embeddings.GridEmbedding2D method)</a>
-</li>
-        <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND.forward">(neuralop.layers.embeddings.GridEmbeddingND method)</a>
-</li>
-        <li><a href="modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html#neuralop.layers.embeddings.SinusoidalEmbedding2D.forward">(neuralop.layers.embeddings.SinusoidalEmbedding2D method)</a>
 </li>
         <li><a href="modules/generated/neuralop.layers.integral_transform.IntegralTransform.html#neuralop.layers.integral_transform.IntegralTransform.forward">(neuralop.layers.integral_transform.IntegralTransform method)</a>
 </li>
@@ -231,7 +221,7 @@ <h2 id="F">F</h2>
 </li>
         <li><a href="modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html#neuralop.layers.spherical_convolution.SphericalConv.forward">(neuralop.layers.spherical_convolution.SphericalConv method)</a>
 </li>
-        <li><a href="modules/_autosummary/neuralop.models.FNO.html#neuralop.models.FNO.forward">(neuralop.models.FNO method)</a>, <a href="modules/generated/neuralop.models.FNO.html#neuralop.models.FNO.forward">[1]</a>
+        <li><a href="modules/generated/neuralop.models.FNO.html#neuralop.models.FNO.forward">(neuralop.models.FNO method)</a>
 </li>
         <li><a href="modules/generated/neuralop.models.GINO.html#neuralop.models.GINO.forward">(neuralop.models.GINO method)</a>
 </li>
@@ -254,21 +244,17 @@ <h2 id="F">F</h2>
 <h2 id="G">G</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="modules/generated/neuralop.models.base_model.get_model.html#neuralop.models.base_model.get_model">get_model() (in module neuralop.models.base_model)</a>
-</li>
-      <li><a href="modules/generated/neuralop.models.GINO.html#neuralop.models.GINO">GINO (class in neuralop.models)</a>
-</li>
-      <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D.grid">grid() (neuralop.layers.embeddings.GridEmbedding2D method)</a>
+      <li><a href="modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html#neuralop.layers.spectral_convolution.SpectralConv.get_conv">get_conv() (neuralop.layers.spectral_convolution.SpectralConv method)</a>
 
       <ul>
-        <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND.grid">(neuralop.layers.embeddings.GridEmbeddingND method)</a>
+        <li><a href="modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html#neuralop.layers.spherical_convolution.SphericalConv.get_conv">(neuralop.layers.spherical_convolution.SphericalConv method)</a>
 </li>
       </ul></li>
   </ul></td>
   <td style="width: 33%; vertical-align: top;"><ul>
-      <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D">GridEmbedding2D (class in neuralop.layers.embeddings)</a>
+      <li><a href="modules/generated/neuralop.models.base_model.get_model.html#neuralop.models.base_model.get_model">get_model() (in module neuralop.models.base_model)</a>
 </li>
-      <li><a href="modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND">GridEmbeddingND (class in neuralop.layers.embeddings)</a>
+      <li><a href="modules/generated/neuralop.models.GINO.html#neuralop.models.GINO">GINO (class in neuralop.models)</a>
 </li>
   </ul></td>
 </tr></table>
@@ -297,11 +283,7 @@ <h2 id="L">L</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.data.datasets.load_darcy_flow_small.html#neuralop.data.datasets.load_darcy_flow_small">load_darcy_flow_small() (in module neuralop.data.datasets)</a>
-
-      <ul>
-        <li><a href="modules/generated/neuralop.datasets.load_darcy_flow_small.html#neuralop.datasets.load_darcy_flow_small">(in module neuralop.datasets)</a>
 </li>
-      </ul></li>
       <li><a href="modules/generated/neuralop.training.Trainer.html#neuralop.training.Trainer.log_eval">log_eval() (neuralop.training.Trainer method)</a>
 </li>
   </ul></td>
@@ -319,11 +301,7 @@ <h2 id="M">M</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html#neuralop.data.transforms.data_processors.MGPatchingDataProcessor">MGPatchingDataProcessor (class in neuralop.data.transforms.data_processors)</a>
-
-      <ul>
-        <li><a href="modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.html#neuralop.datasets.data_transforms.MGPatchingDataProcessor">(in module neuralop.datasets.data_transforms)</a>
 </li>
-      </ul></li>
       <li>
     module
 
@@ -333,8 +311,6 @@ <h2 id="M">M</h2>
         <li><a href="modules/api.html#module-neuralop.data.transforms.data_processors">neuralop.data.transforms.data_processors</a>
 </li>
         <li><a href="modules/api.html#module-neuralop.layers">neuralop.layers</a>
-</li>
-        <li><a href="modules/api.html#module-neuralop.layers.embeddings">neuralop.layers.embeddings</a>
 </li>
         <li><a href="modules/api.html#module-neuralop.layers.integral_transform">neuralop.layers.integral_transform</a>
 </li>
@@ -390,13 +366,6 @@ <h2 id="N">N</h2>
 
       <ul>
         <li><a href="modules/api.html#module-neuralop.layers">module</a>
-</li>
-      </ul></li>
-      <li>
-    neuralop.layers.embeddings
-
-      <ul>
-        <li><a href="modules/api.html#module-neuralop.layers.embeddings">module</a>
 </li>
       </ul></li>
       <li>
@@ -530,17 +499,15 @@ <h2 id="S">S</h2>
 <table style="width: 100%" class="indextable genindextable"><tr>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.models.SFNO.html#neuralop.models.SFNO">SFNO (class in neuralop.models)</a>
-</li>
-      <li><a href="modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html#neuralop.layers.embeddings.SinusoidalEmbedding2D">SinusoidalEmbedding2D (class in neuralop.layers.embeddings)</a>
 </li>
       <li><a href="modules/generated/neuralop.layers.skip_connections.skip_connection.html#neuralop.layers.skip_connections.skip_connection">skip_connection() (in module neuralop.layers.skip_connections)</a>
 </li>
       <li><a href="modules/generated/neuralop.layers.skip_connections.SoftGating.html#neuralop.layers.skip_connections.SoftGating">SoftGating (class in neuralop.layers.skip_connections)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html#neuralop.layers.spectral_convolution.SpectralConv">SpectralConv (class in neuralop.layers.spectral_convolution)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.html#neuralop.layers.spectral_convolution.SpectralConv1d">SpectralConv1d (class in neuralop.layers.spectral_convolution)</a>
 </li>
       <li><a href="modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html#neuralop.layers.spectral_convolution.SpectralConv2d">SpectralConv2d (class in neuralop.layers.spectral_convolution)</a>
diff --git a/dev/index.html b/dev/index.html
index e3fd58b..e69d964 100644
--- a/dev/index.html
+++ b/dev/index.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/install.html b/dev/install.html
index efa4164..b9c626b 100644
--- a/dev/install.html
+++ b/dev/install.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/_autosummary/neuralop.models.FNO.html b/dev/modules/_autosummary/neuralop.models.FNO.html
deleted file mode 100644
index fc670ab..0000000
--- a/dev/modules/_autosummary/neuralop.models.FNO.html
+++ /dev/null
@@ -1,416 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.models.FNO &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-models-fno">
-<h1><a class="reference internal" href="../api.html#module-neuralop.models" title="neuralop.models"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.models</span></code></a>.FNO<a class="headerlink" href="#neuralop-models-fno" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="neuralop.models.FNO">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">FNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/fno.html#FNO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.FNO" title="Link to this definition"></a></dt>
-<dd><p>N-Dimensional Fourier Neural Operator. The FNO learns a mapping between
-spaces of functions discretized over regular grids.</p>
-<p>The key component of an FNO is its SpectralConv layer (see <code class="docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code>), which
-is similar to a standard CNN conv layer but operates in the frequency domain.</p>
-<p>For more information, refer to <a class="reference internal" href="../../user_guide/fno.html#fno-guide"><span class="std std-ref">Fourier Neural Operators</span></a>.</p>
-<dl class="field-list">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>n_modes</strong><span class="classifier">Tuple[int]</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
-The dimensionality of the FNO is inferred from <code class="docutils literal notranslate"><span class="pre">len(n_modes)</span></code></p>
-</dd>
-<dt><strong>in_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in input function</p>
-</dd>
-<dt><strong>out_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in output function</p>
-</dd>
-<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the FNO (i.e. number of channels), by default 256</p>
-</dd>
-<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
-</dd>
-<dt><strong>Documentation for more advanced parameters is below.</strong></dt><dd></dd>
-</dl>
-</dd>
-<dt class="field-even">Other Parameters<span class="colon">:</span></dt>
-<dd class="field-even"><dl>
-<dt><strong>lifting_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of lifting channels to hidden_channels, by default 2
-The number of liting channels in the lifting block of the FNO is
-lifting_channel_ratio * hidden_channels (e.g. default 512)</p>
-</dd>
-<dt><strong>projection_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of projection channels to hidden_channels, by default 2
-The number of projection channels in the projection block of the FNO is
-projection_channel_ratio * hidden_channels (e.g. default 512)</p>
-</dd>
-<dt><strong>positional_embedding</strong><span class="classifier">Union[str, nn.Module], optional</span></dt><dd><p>Positional embedding to apply to last channels of raw input
-before being passed through the FNO. Defaults to “grid”</p>
-<ul class="simple">
-<li><p>If “grid”, appends a grid positional embedding with default settings to</p></li>
-</ul>
-<p>the last channels of raw input. Assumes the inputs are discretized
-over a grid with entry [0,0,…] at the origin and side lengths of 1.</p>
-<ul class="simple">
-<li><p>If an initialized GridEmbedding module, uses this module directly</p></li>
-</ul>
-<p>See <code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.embeddings.GridEmbeddingND</span></code> for details.</p>
-<ul class="simple">
-<li><p>If None, does nothing</p></li>
-</ul>
-</dd>
-<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linear activation function module to use, by default F.gelu</p>
-</dd>
-<dt><strong>norm</strong><span class="classifier">str {“ada_in”, “group_norm”, “instance_norm”}, optional</span></dt><dd><p>Normalization layer to use, by default None</p>
-</dd>
-<dt><strong>complex</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether data is complex-valued (default False)
-if True, initializes complex-valued modules.</p>
-</dd>
-<dt><strong>channel_mlp_dropout</strong><span class="classifier">float, optional</span></dt><dd><p>dropout parameter for ChannelMLP in FNO Block, by default 0</p>
-</dd>
-<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter for ChannelMLP in FNO Block, by default 0.5</p>
-</dd>
-<dt><strong>channel_mlp_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
-</dd>
-<dt><strong>fno_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in FNO layers, by default ‘linear’</p>
-</dd>
-<dt><strong>resolution_scaling_factor</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>layer-wise factor by which to scale the domain resolution of function, by default None</p>
-<ul class="simple">
-<li><p>If a single number n, scales resolution by n at each layer</p></li>
-<li><p>if a list of numbers [n_0, n_1,…] scales layer i’s resolution by n_i.</p></li>
-</ul>
-</dd>
-<dt><strong>domain_padding</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
-To vary the percentage of padding used along each input dimension,
-pass in a list of percentages e.g. [p1, p2, …, pN] such that
-p1 corresponds to the percentage of padding along dim 1, etc.</p>
-</dd>
-<dt><strong>domain_padding_mode</strong><span class="classifier">str {‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
-</dd>
-<dt><strong>fno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}, optional</span></dt><dd><p>precision mode in which to perform spectral convolution, by default “full”</p>
-</dd>
-<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} | None, optional</span></dt><dd><p>whether to use a tanh stabilizer in FNO block, by default None</p>
-<p>Note: stabilizer greatly improves performance in the case
-<cite>fno_block_precision=’mixed’</cite>.</p>
-</dd>
-<dt><strong>max_n_modes</strong><span class="classifier">Tuple[int] | None, optional</span></dt><dd><ul class="simple">
-<li><p>If not None, this allows to incrementally increase the number of</p></li>
-</ul>
-<p>modes in Fourier domain during training. Has to verify n &lt;= N
-for (n, m) in zip(max_n_modes, n_modes).</p>
-<ul class="simple">
-<li><p>If None, all the n_modes are used.</p></li>
-</ul>
-<p>This can be updated dynamically during training.</p>
-</dd>
-<dt><strong>factorization</strong><span class="classifier">str, optional</span></dt><dd><p>Tensor factorization of the FNO layer weights to use, by default None.</p>
-<ul class="simple">
-<li><p>If None, a dense tensor parametrizes the Spectral convolutions</p></li>
-<li><p>Otherwise, the specified tensor factorization is used.</p></li>
-</ul>
-</dd>
-<dt><strong>rank</strong><span class="classifier">float, optional</span></dt><dd><p>tensor rank to use in above factorization, by default 1.0</p>
-</dd>
-<dt><strong>fixed_rank_modes</strong><span class="classifier">bool, optional</span></dt><dd><p>Modes to not factorize, by default False</p>
-</dd>
-<dt><strong>implementation</strong><span class="classifier">str {‘factorized’, ‘reconstructed’}, optional</span></dt><dd><ul class="simple">
-<li><p>If ‘factorized’, implements tensor contraction with the individual factors of the decomposition</p></li>
-<li><p>If ‘reconstructed’, implements with the reconstructed full tensorized weight.</p></li>
-</ul>
-</dd>
-<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional</span></dt><dd><p>extra kwargs for tensor decomposition (see <cite>tltorch.FactorizedTensor</cite>), by default dict()</p>
-</dd>
-<dt><strong>separable</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>if True, use a depthwise separable spectral convolution, by default False</p>
-</dd>
-<dt><strong>preactivation</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>whether to compute FNO forward pass with resnet-style preactivation, by default False</p>
-</dd>
-<dt><strong>conv_module</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>module to use for FNOBlock’s convolutions, by default SpectralConv</p>
-</dd>
-</dl>
-</dd>
-</dl>
-<p class="rubric">Examples</p>
-<div class="doctest highlight-default notranslate"><div class="highlight"><pre><span></span><span class="gp">&gt;&gt;&gt; </span><span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">FNO</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span> <span class="o">=</span> <span class="n">FNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span>
-<span class="go">FNO(</span>
-<span class="go">(positional_embedding): GridEmbeddingND()</span>
-<span class="go">(fno_blocks): FNOBlocks(</span>
-<span class="go">    (convs): SpectralConv(</span>
-<span class="go">    (weight): ModuleList(</span>
-<span class="go">        (0-3): 4 x DenseTensor(shape=torch.Size([64, 64, 12, 7]), rank=None)</span>
-<span class="go">    )</span>
-<span class="go">    )</span>
-<span class="go">        ... torch.nn.Module printout truncated ...</span>
-</pre></div>
-</div>
-<dl class="field-list simple">
-<dt class="field-odd">Attributes<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>n_modes</strong></dt><dd></dd>
-</dl>
-</dd>
-</dl>
-<p class="rubric">Methods</p>
-<table class="autosummary longtable docutils align-default">
-<tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="../generated/neuralop.models.FNO.html#neuralop.models.FNO.forward" title="neuralop.models.FNO.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
-</tr>
-</tbody>
-</table>
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.models.FNO.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/fno.html#FNO.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.FNO.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
-<dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
-</dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
-</dd>
-</dl>
-</dd>
-</dl>
-</dd></dl>
-
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.models</span></code>.FNO</a><ul>
-<li><a class="reference internal" href="#neuralop.models.FNO"><code class="docutils literal notranslate"><span class="pre">FNO</span></code></a><ul>
-<li><a class="reference internal" href="#neuralop.models.FNO.forward"><code class="docutils literal notranslate"><span class="pre">FNO.forward()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/api.html b/dev/modules/api.html
index 1d71ad1..7d8014a 100644
--- a/dev/modules/api.html
+++ b/dev/modules/api.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -174,7 +174,7 @@ <h3>FNO<a class="headerlink" href="#fno" title="Link to this heading"></a></h3>
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="generated/neuralop.models.FNO.html#neuralop.models.FNO" title="neuralop.models.FNO"><code class="xref py py-obj docutils literal notranslate"><span class="pre">FNO</span></code></a>(*args, **kwargs)</p></td>
-<td><p>N-Dimensional Fourier Neural Operator.</p></td>
+<td><p>N-Dimensional Fourier Neural Operator</p></td>
 </tr>
 </tbody>
 </table>
@@ -200,7 +200,7 @@ <h3>Tensorized FNO (TFNO)<a class="headerlink" href="#tensorized-fno-tfno" title
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="generated/neuralop.models.TFNO.html#neuralop.models.TFNO" title="neuralop.models.TFNO"><code class="xref py py-obj docutils literal notranslate"><span class="pre">TFNO</span></code></a>(*args, **kwargs)</p></td>
-<td><p>N-Dimensional Fourier Neural Operator.</p></td>
+<td><p>N-Dimensional Fourier Neural Operator</p></td>
 </tr>
 </tbody>
 </table>
@@ -225,7 +225,7 @@ <h3>Spherical Fourier Neural Operators (SFNO)<a class="headerlink" href="#spheri
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="generated/neuralop.models.SFNO.html#neuralop.models.SFNO" title="neuralop.models.SFNO"><code class="xref py py-obj docutils literal notranslate"><span class="pre">SFNO</span></code></a>(*args, **kwargs)</p></td>
-<td><p>N-Dimensional Spherical Fourier Neural Operator.</p></td>
+<td><p>N-Dimensional Spherical Fourier Neural Operator</p></td>
 </tr>
 </tbody>
 </table>
@@ -260,7 +260,7 @@ <h3>U-shaped Neural Operators (U-NO)<a class="headerlink" href="#u-shaped-neural
 in <a class="reference internal" href="#module-neuralop.layers" title="neuralop.layers"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers</span></code></a> building blocks,
 in the form of PyTorch layers, that you can use to build your own models:</p>
 <section id="neural-operator-layers">
-<h3>Neural operator layers<a class="headerlink" href="#neural-operator-layers" title="Link to this heading"></a></h3>
+<h3>Neural operator Layers<a class="headerlink" href="#neural-operator-layers" title="Link to this heading"></a></h3>
 <p><strong>Spectral convolutions</strong> (in Fourier domain):</p>
 <span class="target" id="module-neuralop.layers.spectral_convolution"></span><p>General SpectralConv layer:</p>
 <table class="autosummary longtable docutils align-default">
@@ -304,23 +304,6 @@ <h3>Neural operator layers<a class="headerlink" href="#neural-operator-layers" t
 </tbody>
 </table>
 <hr class="docutils" />
-<p><strong>Embeddings</strong></p>
-<p>Apply positional embeddings as additional channels on a function:</p>
-<span class="target" id="module-neuralop.layers.embeddings"></span><table class="autosummary longtable docutils align-default">
-<tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="generated/neuralop.layers.embeddings.GridEmbeddingND.html#neuralop.layers.embeddings.GridEmbeddingND" title="neuralop.layers.embeddings.GridEmbeddingND"><code class="xref py py-obj docutils literal notranslate"><span class="pre">GridEmbeddingND</span></code></a>([dim, grid_boundaries])</p></td>
-<td><p>A positional embedding as a regular ND grid</p></td>
-</tr>
-<tr class="row-even"><td><p><a class="reference internal" href="generated/neuralop.layers.embeddings.GridEmbedding2D.html#neuralop.layers.embeddings.GridEmbedding2D" title="neuralop.layers.embeddings.GridEmbedding2D"><code class="xref py py-obj docutils literal notranslate"><span class="pre">GridEmbedding2D</span></code></a>([grid_boundaries])</p></td>
-<td><p>A simple positional embedding as a regular 2D grid</p></td>
-</tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html#neuralop.layers.embeddings.SinusoidalEmbedding2D" title="neuralop.layers.embeddings.SinusoidalEmbedding2D"><code class="xref py py-obj docutils literal notranslate"><span class="pre">SinusoidalEmbedding2D</span></code></a>(num_channels[, ...])</p></td>
-<td><p><p class="rubric">Methods</p>
-</p></td>
-</tr>
-</tbody>
-</table>
-<hr class="docutils" />
 <p><strong>Neighbor search</strong></p>
 <p>Find neighborhoods on arbitrary coordinate meshes:</p>
 <span class="target" id="module-neuralop.layers.neighbor_search"></span><table class="autosummary longtable docutils align-default">
@@ -436,8 +419,7 @@ <h3>DataProcessors<a class="headerlink" href="#dataprocessors" title="Link to th
 <td><p>DefaultDataProcessor is a simple processor  to pre/post process data before training/inferencing a model.</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html#neuralop.data.transforms.data_processors.MGPatchingDataProcessor" title="neuralop.data.transforms.data_processors.MGPatchingDataProcessor"><code class="xref py py-obj docutils literal notranslate"><span class="pre">MGPatchingDataProcessor</span></code></a>(model, levels, ...)</p></td>
-<td><p><p class="rubric">Methods</p>
-</p></td>
+<td><p></p></td>
 </tr>
 </tbody>
 </table>
@@ -511,7 +493,7 @@ <h3>DataProcessors<a class="headerlink" href="#dataprocessors" title="Link to th
 </ul>
 </li>
 <li><a class="reference internal" href="#module-neuralop.layers">Layers</a><ul>
-<li><a class="reference internal" href="#neural-operator-layers">Neural operator layers</a><ul>
+<li><a class="reference internal" href="#neural-operator-layers">Neural operator Layers</a><ul>
 </ul>
 </li>
 <li><a class="reference internal" href="#other-resolution-invariant-operations">Other resolution invariant operations</a><ul>
diff --git a/dev/modules/generated/neuralop.data.datasets.load_darcy_flow_small.html b/dev/modules/generated/neuralop.data.datasets.load_darcy_flow_small.html
index 2e9ab61..f64d522 100644
--- a/dev/modules/generated/neuralop.data.datasets.load_darcy_flow_small.html
+++ b/dev/modules/generated/neuralop.data.datasets.load_darcy_flow_small.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.data.datasets" title="neuralop.data.datasets"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.data.datasets</span></code></a>.load_darcy_flow_small<a class="headerlink" href="#neuralop-data-datasets-load-darcy-flow-small" title="Link to this heading"></a></h1>
 <dl class="py function">
 <dt class="sig sig-object py" id="neuralop.data.datasets.load_darcy_flow_small">
-<span class="sig-prename descclassname"><span class="pre">neuralop.data.datasets.</span></span><span class="sig-name descname"><span class="pre">load_darcy_flow_small</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n_train</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_tests</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">batch_size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">test_batch_sizes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">data_root</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">PosixPath('/home/dave/myneurop/neuralop/data/datasets/data')</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">test_resolutions</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">[16,</span> <span class="pre">32]</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encode_input</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encode_output</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encoding</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'channel-wise'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_dim</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/data/datasets/darcy.html#load_darcy_flow_small"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.data.datasets.load_darcy_flow_small" title="Link to this definition"></a></dt>
+<span class="sig-prename descclassname"><span class="pre">neuralop.data.datasets.</span></span><span class="sig-name descname"><span class="pre">load_darcy_flow_small</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">n_train</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_tests</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">batch_size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">test_batch_sizes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">data_root</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">PosixPath('/home/runner/work/neuraloperator/neuraloperator/neuralop/data/datasets/data')</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">test_resolutions</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">[16,</span> <span class="pre">32]</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encode_input</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encode_output</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">encoding</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'channel-wise'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_dim</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/data/datasets/darcy.html#load_darcy_flow_small"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.data.datasets.load_darcy_flow_small" title="Link to this definition"></a></dt>
 <dd></dd></dl>
 
 <div class="clearer"></div></section>
diff --git a/dev/modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.html b/dev/modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.html
index 65d8489..e44ce97 100644
--- a/dev/modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.html
+++ b/dev/modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -180,14 +180,14 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.data.transfo
 <td><p>preprocess a batch of data into the format expected in model's forward call</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="#neuralop.data.transforms.data_processors.DefaultDataProcessor.to" title="neuralop.data.transforms.data_processors.DefaultDataProcessor.to"><code class="xref py py-obj docutils literal notranslate"><span class="pre">to</span></code></a>(device)</p></td>
-<td><p>Moves and/or casts the parameters and buffers.</p></td>
+<td><p>Move and/or cast the parameters and buffers.</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.data.transforms.data_processors.DefaultDataProcessor.to">
 <span class="sig-name descname"><span class="pre">to</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/data/transforms/data_processors.html#DefaultDataProcessor.to"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.data.transforms.data_processors.DefaultDataProcessor.to" title="Link to this definition"></a></dt>
-<dd><p>Moves and/or casts the parameters and buffers.</p>
+<dd><p>Move and/or cast the parameters and buffers.</p>
 <p>This can be called as</p>
 <dl class="py function">
 <dt class="sig sig-object py">
diff --git a/dev/modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html b/dev/modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html
index 3cf2be5..05b0b64 100644
--- a/dev/modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html
+++ b/dev/modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -169,7 +169,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.data.transfo
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward" title="neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(**data_dict)</p></td>
-<td><p>Defines the computation performed at every call.</p></td>
+<td><p>Define the computation performed at every call.</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.postprocess" title="neuralop.data.transforms.data_processors.MGPatchingDataProcessor.postprocess"><code class="xref py py-obj docutils literal notranslate"><span class="pre">postprocess</span></code></a>(out, data_dict)</p></td>
 <td><p>Postprocess model outputs.</p></td>
@@ -178,14 +178,14 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.data.transfo
 <td><p>Preprocess data assuming that if encoder exists, it has encoded all data during data loading</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.to" title="neuralop.data.transforms.data_processors.MGPatchingDataProcessor.to"><code class="xref py py-obj docutils literal notranslate"><span class="pre">to</span></code></a>(device)</p></td>
-<td><p>Moves and/or casts the parameters and buffers.</p></td>
+<td><p>Move and/or cast the parameters and buffers.</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.data.transforms.data_processors.MGPatchingDataProcessor.to">
 <span class="sig-name descname"><span class="pre">to</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">device</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/data/transforms/data_processors.html#MGPatchingDataProcessor.to"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.to" title="Link to this definition"></a></dt>
-<dd><p>Moves and/or casts the parameters and buffers.</p>
+<dd><p>Move and/or cast the parameters and buffers.</p>
 <p>This can be called as</p>
 <dl class="py function">
 <dt class="sig sig-object py">
@@ -294,7 +294,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.data.transfo
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">data_dict</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/data/transforms/data_processors.html#MGPatchingDataProcessor.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward" title="Link to this definition"></a></dt>
-<dd><p>Defines the computation performed at every call.</p>
+<dd><p>Define the computation performed at every call.</p>
 <p>Should be overridden by all subclasses.</p>
 <div class="admonition note">
 <p class="admonition-title">Note</p>
diff --git a/dev/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.html b/dev/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.html
deleted file mode 100644
index cf05c67..0000000
--- a/dev/modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.html
+++ /dev/null
@@ -1,234 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.datasets.data_transforms.DefaultDataProcessor &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-datasets-data-transforms-defaultdataprocessor">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets.data_transforms</span></code>.DefaultDataProcessor<a class="headerlink" href="#neuralop-datasets-data-transforms-defaultdataprocessor" title="Link to this heading"></a></h1>
-<dl class="py attribute">
-<dt class="sig sig-object py" id="neuralop.datasets.data_transforms.DefaultDataProcessor">
-<span class="sig-prename descclassname"><span class="pre">neuralop.datasets.data_transforms.</span></span><span class="sig-name descname"><span class="pre">DefaultDataProcessor</span></span><a class="headerlink" href="#neuralop.datasets.data_transforms.DefaultDataProcessor" title="Link to this definition"></a></dt>
-<dd><p>alias of <code class="xref py py-class docutils literal notranslate"><span class="pre">wrapped</span></code></p>
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets.data_transforms</span></code>.DefaultDataProcessor</a><ul>
-<li><a class="reference internal" href="#neuralop.datasets.data_transforms.DefaultDataProcessor"><code class="docutils literal notranslate"><span class="pre">DefaultDataProcessor</span></code></a></li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.html b/dev/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.html
deleted file mode 100644
index 9abb43d..0000000
--- a/dev/modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.html
+++ /dev/null
@@ -1,234 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.datasets.data_transforms.MGPatchingDataProcessor &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-datasets-data-transforms-mgpatchingdataprocessor">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets.data_transforms</span></code>.MGPatchingDataProcessor<a class="headerlink" href="#neuralop-datasets-data-transforms-mgpatchingdataprocessor" title="Link to this heading"></a></h1>
-<dl class="py attribute">
-<dt class="sig sig-object py" id="neuralop.datasets.data_transforms.MGPatchingDataProcessor">
-<span class="sig-prename descclassname"><span class="pre">neuralop.datasets.data_transforms.</span></span><span class="sig-name descname"><span class="pre">MGPatchingDataProcessor</span></span><a class="headerlink" href="#neuralop.datasets.data_transforms.MGPatchingDataProcessor" title="Link to this definition"></a></dt>
-<dd><p>alias of <code class="xref py py-class docutils literal notranslate"><span class="pre">wrapped</span></code></p>
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets.data_transforms</span></code>.MGPatchingDataProcessor</a><ul>
-<li><a class="reference internal" href="#neuralop.datasets.data_transforms.MGPatchingDataProcessor"><code class="docutils literal notranslate"><span class="pre">MGPatchingDataProcessor</span></code></a></li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.datasets.load_darcy_flow_small.html b/dev/modules/generated/neuralop.datasets.load_darcy_flow_small.html
deleted file mode 100644
index 8f0c214..0000000
--- a/dev/modules/generated/neuralop.datasets.load_darcy_flow_small.html
+++ /dev/null
@@ -1,233 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.datasets.load_darcy_flow_small &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-datasets-load-darcy-flow-small">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets</span></code>.load_darcy_flow_small<a class="headerlink" href="#neuralop-datasets-load-darcy-flow-small" title="Link to this heading"></a></h1>
-<dl class="py function">
-<dt class="sig sig-object py" id="neuralop.datasets.load_darcy_flow_small">
-<span class="sig-prename descclassname"><span class="pre">neuralop.datasets.</span></span><span class="sig-name descname"><span class="pre">load_darcy_flow_small</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.datasets.load_darcy_flow_small" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets</span></code>.load_darcy_flow_small</a><ul>
-<li><a class="reference internal" href="#neuralop.datasets.load_darcy_flow_small"><code class="docutils literal notranslate"><span class="pre">load_darcy_flow_small()</span></code></a></li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html b/dev/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html
deleted file mode 100644
index 382cdc0..0000000
--- a/dev/modules/generated/neuralop.layers.embeddings.GridEmbedding2D.html
+++ /dev/null
@@ -1,311 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.layers.embeddings.GridEmbedding2D &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-    <link rel="next" title="neuralop.layers.embeddings.SinusoidalEmbedding2D" href="neuralop.layers.embeddings.SinusoidalEmbedding2D.html" />
-    <link rel="prev" title="neuralop.layers.embeddings.GridEmbeddingND" href="neuralop.layers.embeddings.GridEmbeddingND.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul class="current">
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1 current"><a class="reference internal" href="../api.html">API reference</a><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../api.html#models">Models</a></li>
-<li class="toctree-l2 current"><a class="reference internal" href="../api.html#module-neuralop.layers">Layers</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#model-dispatching">Model Dispatching</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#training">Training</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#data">Data</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-layers-embeddings-gridembedding2d">
-<h1><a class="reference internal" href="../api.html#module-neuralop.layers.embeddings" title="neuralop.layers.embeddings"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code></a>.GridEmbedding2D<a class="headerlink" href="#neuralop-layers-embeddings-gridembedding2d" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbedding2D">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.embeddings.</span></span><span class="sig-name descname"><span class="pre">GridEmbedding2D</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">grid_boundaries</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">[[0,</span> <span class="pre">1],</span> <span class="pre">[0,</span> <span class="pre">1]]</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbedding2D"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbedding2D" title="Link to this definition"></a></dt>
-<dd><p>A simple positional embedding as a regular 2D grid</p>
-<p class="rubric">Methods</p>
-<table class="autosummary longtable docutils align-default">
-<tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbedding2D.forward" title="neuralop.layers.embeddings.GridEmbedding2D.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(data[, batched])</p></td>
-<td><p>Defines the computation performed at every call.</p></td>
-</tr>
-<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbedding2D.grid" title="neuralop.layers.embeddings.GridEmbedding2D.grid"><code class="xref py py-obj docutils literal notranslate"><span class="pre">grid</span></code></a>(spatial_dims, device, dtype)</p></td>
-<td><p>grid generates 2D grid needed for pos encoding and caches the grid associated with MRU resolution</p></td>
-</tr>
-</tbody>
-</table>
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbedding2D.grid">
-<span class="sig-name descname"><span class="pre">grid</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">spatial_dims</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbedding2D.grid"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbedding2D.grid" title="Link to this definition"></a></dt>
-<dd><p>grid generates 2D grid needed for pos encoding
-and caches the grid associated with MRU resolution</p>
-<dl class="field-list">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl>
-<dt><strong>spatial_dims</strong><span class="classifier">torch.size</span></dt><dd><p>sizes of spatial resolution</p>
-</dd>
-<dt><strong>device</strong><span class="classifier">literal ‘cpu’ or ‘cuda:<a href="#id1"><span class="problematic" id="id2">*</span></a>’</span></dt><dd><p>where to load data</p>
-</dd>
-<dt><strong>dtype</strong><span class="classifier">str</span></dt><dd><p>dtype to encode data</p>
-</dd>
-</dl>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><dl class="simple">
-<dt>torch.tensor</dt><dd><p>output grids to concatenate</p>
-</dd>
-</dl>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbedding2D.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">data</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">batched</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbedding2D.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbedding2D.forward" title="Link to this definition"></a></dt>
-<dd><p>Defines the computation performed at every call.</p>
-<p>Should be overridden by all subclasses.</p>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>Although the recipe for forward pass needs to be defined within
-this function, one should call the <code class="xref py py-class docutils literal notranslate"><span class="pre">Module</span></code> instance afterwards
-instead of this since the former takes care of running the
-registered hooks while the latter silently ignores them.</p>
-</div>
-</dd></dl>
-
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    <a class="button pagination-previous" href="neuralop.layers.embeddings.GridEmbeddingND.html" title="previous page" accesskey="p">
-        <span class="icon">
-            <i class="fa fa-arrow-circle-left"></i>
-        </span>
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbeddingND</span>
-    </a>
-    
-    
-    <a class="button pagination-next" href="neuralop.layers.embeddings.SinusoidalEmbedding2D.html" title="next page" accesskey="n">
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.SinusoidalEmbedding2D </span>
-        <span class="icon">
-            <i class="fa fa-arrow-circle-right"></i>
-        </span>
-    </a>
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbedding2D</a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbedding2D"><code class="docutils literal notranslate"><span class="pre">GridEmbedding2D</span></code></a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbedding2D.grid"><code class="docutils literal notranslate"><span class="pre">GridEmbedding2D.grid()</span></code></a></li>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbedding2D.forward"><code class="docutils literal notranslate"><span class="pre">GridEmbedding2D.forward()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html b/dev/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html
deleted file mode 100644
index 7ba4682..0000000
--- a/dev/modules/generated/neuralop.layers.embeddings.GridEmbeddingND.html
+++ /dev/null
@@ -1,302 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.layers.embeddings.GridEmbeddingND &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-    <link rel="next" title="neuralop.layers.embeddings.GridEmbedding2D" href="neuralop.layers.embeddings.GridEmbedding2D.html" />
-    <link rel="prev" title="neuralop.layers.integral_transform.IntegralTransform" href="neuralop.layers.integral_transform.IntegralTransform.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul class="current">
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1 current"><a class="reference internal" href="../api.html">API reference</a><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../api.html#models">Models</a></li>
-<li class="toctree-l2 current"><a class="reference internal" href="../api.html#module-neuralop.layers">Layers</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#model-dispatching">Model Dispatching</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#training">Training</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#data">Data</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-layers-embeddings-gridembeddingnd">
-<h1><a class="reference internal" href="../api.html#module-neuralop.layers.embeddings" title="neuralop.layers.embeddings"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code></a>.GridEmbeddingND<a class="headerlink" href="#neuralop-layers-embeddings-gridembeddingnd" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbeddingND">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.embeddings.</span></span><span class="sig-name descname"><span class="pre">GridEmbeddingND</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">dim</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">2</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">grid_boundaries</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">[[0,</span> <span class="pre">1],</span> <span class="pre">[0,</span> <span class="pre">1]]</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbeddingND"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbeddingND" title="Link to this definition"></a></dt>
-<dd><p>A positional embedding as a regular ND grid</p>
-<p class="rubric">Methods</p>
-<table class="autosummary longtable docutils align-default">
-<tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbeddingND.forward" title="neuralop.layers.embeddings.GridEmbeddingND.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(data[, batched])</p></td>
-<td><p></p></td>
-</tr>
-<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbeddingND.grid" title="neuralop.layers.embeddings.GridEmbeddingND.grid"><code class="xref py py-obj docutils literal notranslate"><span class="pre">grid</span></code></a>(spatial_dims, device, dtype)</p></td>
-<td><p>grid generates ND grid needed for pos encoding and caches the grid associated with MRU resolution</p></td>
-</tr>
-</tbody>
-</table>
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbeddingND.grid">
-<span class="sig-name descname"><span class="pre">grid</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">spatial_dims</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Size</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">str</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dtype</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbeddingND.grid"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbeddingND.grid" title="Link to this definition"></a></dt>
-<dd><p>grid generates ND grid needed for pos encoding
-and caches the grid associated with MRU resolution</p>
-<dl class="field-list">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl>
-<dt><strong>spatial_dims</strong><span class="classifier">torch.Size</span></dt><dd><p>sizes of spatial resolution</p>
-</dd>
-<dt><strong>device</strong><span class="classifier">literal ‘cpu’ or ‘cuda:<a href="#id1"><span class="problematic" id="id2">*</span></a>’</span></dt><dd><p>where to load data</p>
-</dd>
-<dt><strong>dtype</strong><span class="classifier">str</span></dt><dd><p>dtype to encode data</p>
-</dd>
-</dl>
-</dd>
-<dt class="field-even">Returns<span class="colon">:</span></dt>
-<dd class="field-even"><dl class="simple">
-<dt>torch.tensor</dt><dd><p>output grids to concatenate</p>
-</dd>
-</dl>
-</dd>
-</dl>
-</dd></dl>
-
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.GridEmbeddingND.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">data</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">batched</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#GridEmbeddingND.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.GridEmbeddingND.forward" title="Link to this definition"></a></dt>
-<dd></dd></dl>
-
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    <a class="button pagination-previous" href="neuralop.layers.integral_transform.IntegralTransform.html" title="previous page" accesskey="p">
-        <span class="icon">
-            <i class="fa fa-arrow-circle-left"></i>
-        </span>
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.integral_transform</span></code>.IntegralTransform</span>
-    </a>
-    
-    
-    <a class="button pagination-next" href="neuralop.layers.embeddings.GridEmbedding2D.html" title="next page" accesskey="n">
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbedding2D </span>
-        <span class="icon">
-            <i class="fa fa-arrow-circle-right"></i>
-        </span>
-    </a>
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbeddingND</a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbeddingND"><code class="docutils literal notranslate"><span class="pre">GridEmbeddingND</span></code></a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbeddingND.grid"><code class="docutils literal notranslate"><span class="pre">GridEmbeddingND.grid()</span></code></a></li>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.GridEmbeddingND.forward"><code class="docutils literal notranslate"><span class="pre">GridEmbeddingND.forward()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html b/dev/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html
deleted file mode 100644
index 0df7d21..0000000
--- a/dev/modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.html
+++ /dev/null
@@ -1,281 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.layers.embeddings.SinusoidalEmbedding2D &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-    <link rel="next" title="neuralop.layers.neighbor_search.NeighborSearch" href="neuralop.layers.neighbor_search.NeighborSearch.html" />
-    <link rel="prev" title="neuralop.layers.embeddings.GridEmbedding2D" href="neuralop.layers.embeddings.GridEmbedding2D.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul class="current">
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1 current"><a class="reference internal" href="../api.html">API reference</a><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../api.html#models">Models</a></li>
-<li class="toctree-l2 current"><a class="reference internal" href="../api.html#module-neuralop.layers">Layers</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#model-dispatching">Model Dispatching</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#training">Training</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../api.html#data">Data</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-layers-embeddings-sinusoidalembedding2d">
-<h1><a class="reference internal" href="../api.html#module-neuralop.layers.embeddings" title="neuralop.layers.embeddings"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code></a>.SinusoidalEmbedding2D<a class="headerlink" href="#neuralop-layers-embeddings-sinusoidalembedding2d" title="Link to this heading"></a></h1>
-<dl class="py class">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.SinusoidalEmbedding2D">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.embeddings.</span></span><span class="sig-name descname"><span class="pre">SinusoidalEmbedding2D</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">num_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_positions</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">10000</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">endpoint</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#SinusoidalEmbedding2D"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.SinusoidalEmbedding2D" title="Link to this definition"></a></dt>
-<dd><p class="rubric">Methods</p>
-<table class="autosummary longtable docutils align-default">
-<tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.embeddings.SinusoidalEmbedding2D.forward" title="neuralop.layers.embeddings.SinusoidalEmbedding2D.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x)</p></td>
-<td><p>Defines the computation performed at every call.</p></td>
-</tr>
-</tbody>
-</table>
-<dl class="py method">
-<dt class="sig sig-object py" id="neuralop.layers.embeddings.SinusoidalEmbedding2D.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/embeddings.html#SinusoidalEmbedding2D.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.embeddings.SinusoidalEmbedding2D.forward" title="Link to this definition"></a></dt>
-<dd><p>Defines the computation performed at every call.</p>
-<p>Should be overridden by all subclasses.</p>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>Although the recipe for forward pass needs to be defined within
-this function, one should call the <code class="xref py py-class docutils literal notranslate"><span class="pre">Module</span></code> instance afterwards
-instead of this since the former takes care of running the
-registered hooks while the latter silently ignores them.</p>
-</div>
-</dd></dl>
-
-</dd></dl>
-
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    <a class="button pagination-previous" href="neuralop.layers.embeddings.GridEmbedding2D.html" title="previous page" accesskey="p">
-        <span class="icon">
-            <i class="fa fa-arrow-circle-left"></i>
-        </span>
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbedding2D</span>
-    </a>
-    
-    
-    <a class="button pagination-next" href="neuralop.layers.neighbor_search.NeighborSearch.html" title="next page" accesskey="n">
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.neighbor_search</span></code>.NeighborSearch </span>
-        <span class="icon">
-            <i class="fa fa-arrow-circle-right"></i>
-        </span>
-    </a>
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.SinusoidalEmbedding2D</a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.SinusoidalEmbedding2D"><code class="docutils literal notranslate"><span class="pre">SinusoidalEmbedding2D</span></code></a><ul>
-<li><a class="reference internal" href="#neuralop.layers.embeddings.SinusoidalEmbedding2D.forward"><code class="docutils literal notranslate"><span class="pre">SinusoidalEmbedding2D.forward()</span></code></a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.layers.gno_block.GNOBlock.html b/dev/modules/generated/neuralop.layers.gno_block.GNOBlock.html
deleted file mode 100644
index 9bc62bb..0000000
--- a/dev/modules/generated/neuralop.layers.gno_block.GNOBlock.html
+++ /dev/null
@@ -1,207 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.layers.gno_block.GNOBlock &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-layers-gno-block-gnoblock">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.gno_block</span></code>.GNOBlock<a class="headerlink" href="#neuralop-layers-gno-block-gnoblock" title="Link to this heading"></a></h1>
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.layers.integral_transform.IntegralTransform.html b/dev/modules/generated/neuralop.layers.integral_transform.IntegralTransform.html
index 305bd39..121e264 100644
--- a/dev/modules/generated/neuralop.layers.integral_transform.IntegralTransform.html
+++ b/dev/modules/generated/neuralop.layers.integral_transform.IntegralTransform.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -31,7 +31,7 @@
  
     <link rel="index" title="Index" href="../../genindex.html" />
     <link rel="search" title="Search" href="../../search.html" />
-    <link rel="next" title="neuralop.layers.embeddings.GridEmbeddingND" href="neuralop.layers.embeddings.GridEmbeddingND.html" />
+    <link rel="next" title="neuralop.layers.neighbor_search.NeighborSearch" href="neuralop.layers.neighbor_search.NeighborSearch.html" />
     <link rel="prev" title="neuralop.layers.spherical_convolution.SphericalConv" href="neuralop.layers.spherical_convolution.SphericalConv.html" />
 <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
 
@@ -281,8 +281,8 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.integ
     </a>
     
     
-    <a class="button pagination-next" href="neuralop.layers.embeddings.GridEmbeddingND.html" title="next page" accesskey="n">
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.GridEmbeddingND </span>
+    <a class="button pagination-next" href="neuralop.layers.neighbor_search.NeighborSearch.html" title="next page" accesskey="n">
+        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.neighbor_search</span></code>.NeighborSearch </span>
         <span class="icon">
             <i class="fa fa-arrow-circle-right"></i>
         </span>
diff --git a/dev/modules/generated/neuralop.layers.neighbor_search.NeighborSearch.html b/dev/modules/generated/neuralop.layers.neighbor_search.NeighborSearch.html
index d7383c9..afe6c53 100644
--- a/dev/modules/generated/neuralop.layers.neighbor_search.NeighborSearch.html
+++ b/dev/modules/generated/neuralop.layers.neighbor_search.NeighborSearch.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -32,7 +32,7 @@
     <link rel="index" title="Index" href="../../genindex.html" />
     <link rel="search" title="Search" href="../../search.html" />
     <link rel="next" title="neuralop.layers.neighbor_search.native_neighbor_search" href="neuralop.layers.neighbor_search.native_neighbor_search.html" />
-    <link rel="prev" title="neuralop.layers.embeddings.SinusoidalEmbedding2D" href="neuralop.layers.embeddings.SinusoidalEmbedding2D.html" />
+    <link rel="prev" title="neuralop.layers.integral_transform.IntegralTransform" href="neuralop.layers.integral_transform.IntegralTransform.html" />
 <meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
 
   </head>
@@ -216,11 +216,11 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.neigh
       
         <nav class="pagination" role="navigation" aria-label="pagination">
     
-    <a class="button pagination-previous" href="neuralop.layers.embeddings.SinusoidalEmbedding2D.html" title="previous page" accesskey="p">
+    <a class="button pagination-previous" href="neuralop.layers.integral_transform.IntegralTransform.html" title="previous page" accesskey="p">
         <span class="icon">
             <i class="fa fa-arrow-circle-left"></i>
         </span>
-        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.embeddings</span></code>.SinusoidalEmbedding2D</span>
+        <span><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.integral_transform</span></code>.IntegralTransform</span>
     </a>
     
     
diff --git a/dev/modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.html b/dev/modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.html
index a9ff1ca..cc3d913 100644
--- a/dev/modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.html
+++ b/dev/modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.layers.padding.DomainPadding.html b/dev/modules/generated/neuralop.layers.padding.DomainPadding.html
index b2b37ba..257aa93 100644
--- a/dev/modules/generated/neuralop.layers.padding.DomainPadding.html
+++ b/dev/modules/generated/neuralop.layers.padding.DomainPadding.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.padding" title="neuralop.layers.padding"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.padding</span></code></a>.DomainPadding<a class="headerlink" href="#neuralop-layers-padding-domainpadding" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.padding.DomainPadding">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.padding.</span></span><span class="sig-name descname"><span class="pre">DomainPadding</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">domain_padding</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">padding_mode</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'one-sided'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">int</span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/padding.html#DomainPadding"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.padding.DomainPadding" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.padding.</span></span><span class="sig-name descname"><span class="pre">DomainPadding</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">domain_padding</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">padding_mode</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'one-sided'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">int</span><span class="p"><span class="pre">]</span></span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">1</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/padding.html#DomainPadding"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.padding.DomainPadding" title="Link to this definition"></a></dt>
 <dd><p>Applies domain padding scaled automatically to the input’s resolution</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
@@ -174,13 +174,10 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.paddi
 </dd>
 <dt><strong>padding_mode</strong><span class="classifier">{‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>whether to pad on both sides, by default ‘one-sided’</p>
 </dd>
-<dt><strong>resolution_scaling_factor</strong><span class="classifier">int ; default is 1</span></dt><dd></dd>
+<dt><strong>output_scaling_factor</strong><span class="classifier">int ; default is 1</span></dt><dd></dd>
 </dl>
 </dd>
 </dl>
-<p class="rubric">Notes</p>
-<p>This class works for any input resolution, as long as it is in the form
-<cite>(batch-size, channels, d1, …., dN)</cite></p>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
@@ -195,6 +192,9 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.paddi
 </tr>
 </tbody>
 </table>
+<p class="rubric">Notes</p>
+<p>This class works for any input resolution, as long as it is in the form
+<cite>(batch-size, channels, d1, …., dN)</cite></p>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.padding.DomainPadding.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/padding.html#DomainPadding.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.padding.DomainPadding.forward" title="Link to this definition"></a></dt>
diff --git a/dev/modules/generated/neuralop.layers.skip_connections.SoftGating.html b/dev/modules/generated/neuralop.layers.skip_connections.SoftGating.html
index f464f0d..b3f8821 100644
--- a/dev/modules/generated/neuralop.layers.skip_connections.SoftGating.html
+++ b/dev/modules/generated/neuralop.layers.skip_connections.SoftGating.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.layers.skip_connections.skip_connection.html b/dev/modules/generated/neuralop.layers.skip_connections.skip_connection.html
index 7181a0c..b65660c 100644
--- a/dev/modules/generated/neuralop.layers.skip_connections.skip_connection.html
+++ b/dev/modules/generated/neuralop.layers.skip_connections.skip_connection.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html
index 5b27c1c..8c245a7 100644
--- a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html
+++ b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spectral_convolution" title="neuralop.layers.spectral_convolution"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code></a>.SpectralConv<a class="headerlink" href="#neuralop-layers-spectral-convolution-spectralconv" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex_data</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv" title="Link to this definition"></a></dt>
 <dd><p>Generic N-Dimensional Fourier Neural Operator</p>
 <dl class="field-list">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
@@ -203,11 +203,16 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 </dd>
 <dt><strong>init_std</strong><span class="classifier">float or ‘auto’, default is ‘auto’</span></dt><dd><p>std to use for the init</p>
 </dd>
+<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
+</dd>
 <dt><strong>factorization</strong><span class="classifier">str or None, {‘tucker’, ‘cp’, ‘tt’}, default is None</span></dt><dd><p>If None, a single dense weight is learned for the FNO.
 Otherwise, that weight, used for the contraction in the Fourier domain
 is learned in factorized form. In that case, <cite>factorization</cite> is the
 tensor factorization of the parameters weight used.</p>
 </dd>
+<dt><strong>joint_factorization</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether all the Fourier Layers should be parametrized by a single tensor
+(vs one per layer), by default False Ignored if <code class="docutils literal notranslate"><span class="pre">factorization</span> <span class="pre">is</span> <span class="pre">None</span></code></p>
+</dd>
 <dt><strong>rank</strong><span class="classifier">float or rank, optional</span></dt><dd><p>Rank of the tensor factorization of the Fourier weights, by default 1.0
 Ignored if <code class="docutils literal notranslate"><span class="pre">factorization</span> <span class="pre">is</span> <span class="pre">None</span></code></p>
 </dd>
@@ -230,7 +235,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 <dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional, default is {}</span></dt><dd><p>Optionaly additional parameters to pass to the tensor decomposition
 Ignored if <code class="docutils literal notranslate"><span class="pre">factorization</span> <span class="pre">is</span> <span class="pre">None</span></code></p>
 </dd>
-<dt><strong>complex: bool, optional</strong></dt><dd><p>whether data takes on complex values in the spatial domain, by default False
+<dt><strong>complex_data: bool, optional</strong></dt><dd><p>whether data takes on complex values in the spatial domain, by default False
 if True, uses different logic for FFT contraction and uses full FFT instead of real-valued</p>
 </dd>
 </dl>
@@ -244,17 +249,20 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.forward" title="neuralop.layers.spectral_convolution.SpectralConv.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.forward" title="neuralop.layers.spectral_convolution.SpectralConv.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, indices, output_shape])</p></td>
 <td><p>Generic forward pass for the Factorized Spectral Conv</p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.transform" title="neuralop.layers.spectral_convolution.SpectralConv.transform"><code class="xref py py-obj docutils literal notranslate"><span class="pre">transform</span></code></a>(x[, output_shape])</p></td>
+<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.get_conv" title="neuralop.layers.spectral_convolution.SpectralConv.get_conv"><code class="xref py py-obj docutils literal notranslate"><span class="pre">get_conv</span></code></a>(indices)</p></td>
+<td><p>Returns a sub-convolutional layer from the joint parametrize main-convolution</p></td>
+</tr>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.transform" title="neuralop.layers.spectral_convolution.SpectralConv.transform"><code class="xref py py-obj docutils literal notranslate"><span class="pre">transform</span></code></a>(x[, layer_index, output_shape])</p></td>
 <td><p>Transforms an input x for a skip connection, by default just an identity map</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv.transform">
-<span class="sig-name descname"><span class="pre">transform</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv.transform"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv.transform" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">transform</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">layer_index</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv.transform"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv.transform" title="Link to this definition"></a></dt>
 <dd><p>Transforms an input x for a skip connection, by default just an identity map</p>
 <p>If your function transforms the input then you should also implement this transform method 
 so the skip connection can also work.</p>
@@ -268,13 +276,15 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tuple</span><span class="p"><span class="pre">[</span></span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv.forward" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tensor</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">indices</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">Tuple</span><span class="p"><span class="pre">[</span></span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv.forward" title="Link to this definition"></a></dt>
 <dd><p>Generic forward pass for the Factorized Spectral Conv</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">torch.Tensor</span></dt><dd><p>input activation of size (batch_size, channels, d1, …, dN)</p>
 </dd>
+<dt><strong>indices</strong><span class="classifier">int, default is 0</span></dt><dd><p>if joint_factorization, index of the layers for n_layers &gt; 1</p>
+</dd>
 </dl>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
@@ -285,6 +295,13 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 </dl>
 </dd></dl>
 
+<dl class="py method">
+<dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv.get_conv">
+<span class="sig-name descname"><span class="pre">get_conv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">indices</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv.get_conv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv.get_conv" title="Link to this definition"></a></dt>
+<dd><p>Returns a sub-convolutional layer from the joint parametrize main-convolution</p>
+<p>The parametrization of sub-convolutional layers is shared with the main one.</p>
+</dd></dl>
+
 </dd></dl>
 
 <div class="clearer"></div></section>
@@ -344,6 +361,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 <li><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv"><code class="docutils literal notranslate"><span class="pre">SpectralConv</span></code></a><ul>
 <li><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.transform"><code class="docutils literal notranslate"><span class="pre">SpectralConv.transform()</span></code></a></li>
 <li><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.forward"><code class="docutils literal notranslate"><span class="pre">SpectralConv.forward()</span></code></a></li>
+<li><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv.get_conv"><code class="docutils literal notranslate"><span class="pre">SpectralConv.get_conv()</span></code></a></li>
 </ul>
 </li>
 </ul>
diff --git a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.html b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.html
index 6b57479..b350d0c 100644
--- a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.html
+++ b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spectral_convolution" title="neuralop.layers.spectral_convolution"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code></a>.SpectralConv1d<a class="headerlink" href="#neuralop-layers-spectral-convolution-spectralconv1d" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv1d">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv1d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv1d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv1d" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv1d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex_data</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv1d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv1d" title="Link to this definition"></a></dt>
 <dd><p>1D Spectral Conv</p>
 <p>This is provided for reference only,
 see <code class="xref py py-class docutils literal notranslate"><span class="pre">neuralop.layers.SpectraConv</span></code> for the preferred, general implementation</p>
@@ -185,6 +185,8 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spect
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">torch.Tensor</span></dt><dd><p>input activation of size (batch_size, channels, d1, …, dN)</p>
 </dd>
+<dt><strong>indices</strong><span class="classifier">int, default is 0</span></dt><dd><p>if joint_factorization, index of the layers for n_layers &gt; 1</p>
+</dd>
 </dl>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
diff --git a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html
index d24e3df..e8d7c24 100644
--- a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html
+++ b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,27 +164,29 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spectral_convolution" title="neuralop.layers.spectral_convolution"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code></a>.SpectralConv2d<a class="headerlink" href="#neuralop-layers-spectral-convolution-spectralconv2d" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv2d">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv2d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv2d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv2d" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv2d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex_data</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv2d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv2d" title="Link to this definition"></a></dt>
 <dd><p>2D Spectral Conv, see <code class="xref py py-class docutils literal notranslate"><span class="pre">neuralop.layers.SpectraConv</span></code> for the general case</p>
 <p>This is provided for reference only,
 see <code class="xref py py-class docutils literal notranslate"><span class="pre">neuralop.layers.SpectraConv</span></code> for the preferred, general implementation</p>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv2d.forward" title="neuralop.layers.spectral_convolution.SpectralConv2d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x)</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv2d.forward" title="neuralop.layers.spectral_convolution.SpectralConv2d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, indices])</p></td>
 <td><p>Generic forward pass for the Factorized Spectral Conv</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv2d.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv2d.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv2d.forward" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">indices</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv2d.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv2d.forward" title="Link to this definition"></a></dt>
 <dd><p>Generic forward pass for the Factorized Spectral Conv</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">torch.Tensor</span></dt><dd><p>input activation of size (batch_size, channels, d1, …, dN)</p>
 </dd>
+<dt><strong>indices</strong><span class="classifier">int, default is 0</span></dt><dd><p>if joint_factorization, index of the layers for n_layers &gt; 1</p>
+</dd>
 </dl>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
diff --git a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.html b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.html
index 18b9159..582800a 100644
--- a/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.html
+++ b/dev/modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,27 +164,29 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spectral_convolution" title="neuralop.layers.spectral_convolution"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code></a>.SpectralConv3d<a class="headerlink" href="#neuralop-layers-spectral-convolution-spectralconv3d" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv3d">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv3d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv3d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv3d" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spectral_convolution.</span></span><span class="sig-name descname"><span class="pre">SpectralConv3d</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">dict</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex_data</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">bool</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv3d"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv3d" title="Link to this definition"></a></dt>
 <dd><p>3D Spectral Conv, see <code class="xref py py-class docutils literal notranslate"><span class="pre">neuralop.layers.SpectraConv</span></code> for the general case</p>
 <p>This is provided for reference only,
 see <code class="xref py py-class docutils literal notranslate"><span class="pre">neuralop.layers.SpectraConv</span></code> for the preferred, general implementation</p>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv3d.forward" title="neuralop.layers.spectral_convolution.SpectralConv3d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x)</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spectral_convolution.SpectralConv3d.forward" title="neuralop.layers.spectral_convolution.SpectralConv3d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, indices])</p></td>
 <td><p>Generic forward pass for the Factorized Spectral Conv</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spectral_convolution.SpectralConv3d.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv3d.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv3d.forward" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">indices</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spectral_convolution.html#SpectralConv3d.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spectral_convolution.SpectralConv3d.forward" title="Link to this definition"></a></dt>
 <dd><p>Generic forward pass for the Factorized Spectral Conv</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">torch.Tensor</span></dt><dd><p>input activation of size (batch_size, channels, d1, …, dN)</p>
 </dd>
+<dt><strong>indices</strong><span class="classifier">int, default is 0</span></dt><dd><p>if joint_factorization, index of the layers for n_layers &gt; 1</p>
+</dd>
 </dl>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
diff --git a/dev/modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html b/dev/modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html
index 5482151..87b4aa6 100644
--- a/dev/modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html
+++ b/dev/modules/generated/neuralop.layers.spherical_convolution.SphericalConv.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spherical_convolution" title="neuralop.layers.spherical_convolution"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers.spherical_convolution</span></code></a>.SphericalConv<a class="headerlink" href="#neuralop-layers-spherical-convolution-sphericalconv" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.layers.spherical_convolution.SphericalConv">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spherical_convolution.</span></span><span class="sig-name descname"><span class="pre">SphericalConv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">resolution_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_block_precision</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'full'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'cp'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sht_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'ortho'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sht_grids</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'equiangular'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">complex</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.layers.spherical_convolution.</span></span><span class="sig-name descname"><span class="pre">SphericalConv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_modes</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">max_n_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">bias</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">True</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">1</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_scaling_factor</span></span><span class="p"><span class="pre">:</span></span><span class="w"> </span><span class="n"><span class="pre">int</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">List</span><span class="p"><span class="pre">[</span></span><span class="pre">float</span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">int</span><span class="p"><span class="pre">]</span></span><span class="w"> </span><span class="p"><span class="pre">|</span></span><span class="w"> </span><span class="pre">None</span></span><span class="w"> </span><span class="o"><span class="pre">=</span></span><span class="w"> </span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'cp'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'reconstructed'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">{}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">init_std</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'auto'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sht_norm</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'ortho'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">sht_grids</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">'equiangular'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">device</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">dtype</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">torch.float32</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv" title="Link to this definition"></a></dt>
 <dd><p>Spherical Convolution, base class for the SFNO <a class="reference internal" href="#radd7fd10dc7a-1" id="id1">[1]</a></p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
@@ -179,19 +179,8 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spher
 <dt><strong>See SpectralConv for full list of other parameters</strong></dt><dd></dd>
 </dl>
 </dd>
-</dl>
-<p class="rubric">References</p>
-<div role="list" class="citation-list">
-<div class="citation" id="radd7fd10dc7a-1" role="doc-biblioentry">
-<span class="label"><span class="fn-bracket">[</span><a role="doc-backlink" href="#id1">1</a><span class="fn-bracket">]</span></span>
-<p>Spherical Fourier Neural Operators: Learning Stable Dynamics on the Sphere,
-Boris Bonev, Thorsten Kurth, Christian Hundt, Jaideep Pathak, Maximilian Baust, Karthik Kashinath, Anima Anandkumar,
-ICML 2023.</p>
-</div>
-</div>
-<dl class="field-list simple">
-<dt class="field-odd">Attributes<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
+<dt class="field-even">Attributes<span class="colon">:</span></dt>
+<dd class="field-even"><dl class="simple">
 <dt><strong>n_modes</strong></dt><dd></dd>
 </dl>
 </dd>
@@ -199,17 +188,29 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spher
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
-<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.forward" title="neuralop.layers.spherical_convolution.SphericalConv.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.forward" title="neuralop.layers.spherical_convolution.SphericalConv.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, indices, output_shape])</p></td>
 <td><p>Generic forward pass for the Factorized Spectral Conv</p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.transform" title="neuralop.layers.spherical_convolution.SphericalConv.transform"><code class="xref py py-obj docutils literal notranslate"><span class="pre">transform</span></code></a>(x[, output_shape])</p></td>
+<tr class="row-even"><td><p><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.get_conv" title="neuralop.layers.spherical_convolution.SphericalConv.get_conv"><code class="xref py py-obj docutils literal notranslate"><span class="pre">get_conv</span></code></a>(indices)</p></td>
+<td><p>Returns a sub-convolutional layer from the joint parametrize main-convolution</p></td>
+</tr>
+<tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.transform" title="neuralop.layers.spherical_convolution.SphericalConv.transform"><code class="xref py py-obj docutils literal notranslate"><span class="pre">transform</span></code></a>(x[, layer_index, output_shape])</p></td>
 <td><p>Transforms an input x for a skip connection, by default just an identity map</p></td>
 </tr>
 </tbody>
 </table>
+<p class="rubric">References</p>
+<div role="list" class="citation-list">
+<div class="citation" id="radd7fd10dc7a-1" role="doc-biblioentry">
+<span class="label"><span class="fn-bracket">[</span><a role="doc-backlink" href="#id1">1</a><span class="fn-bracket">]</span></span>
+<p>Spherical Fourier Neural Operators: Learning Stable Dynamics on the Sphere,
+Boris Bonev, Thorsten Kurth, Christian Hundt, Jaideep Pathak, Maximilian Baust, Karthik Kashinath, Anima Anandkumar,
+ICML 2023.</p>
+</div>
+</div>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spherical_convolution.SphericalConv.transform">
-<span class="sig-name descname"><span class="pre">transform</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv.transform"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv.transform" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">transform</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">layer_index</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv.transform"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv.transform" title="Link to this definition"></a></dt>
 <dd><p>Transforms an input x for a skip connection, by default just an identity map</p>
 <p>If your function transforms the input then you should also implement this transform method 
 so the skip connection can also work.</p>
@@ -223,13 +224,15 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spher
 
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.layers.spherical_convolution.SphericalConv.forward">
-<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv.forward" title="Link to this definition"></a></dt>
+<span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">indices</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv.forward" title="Link to this definition"></a></dt>
 <dd><p>Generic forward pass for the Factorized Spectral Conv</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">torch.Tensor</span></dt><dd><p>input activation of size (batch_size, channels, d1, …, dN)</p>
 </dd>
+<dt><strong>indices</strong><span class="classifier">int, default is 0</span></dt><dd><p>if joint_factorization, index of the layers for n_layers &gt; 1</p>
+</dd>
 </dl>
 </dd>
 <dt class="field-even">Returns<span class="colon">:</span></dt>
@@ -240,6 +243,13 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spher
 </dl>
 </dd></dl>
 
+<dl class="py method">
+<dt class="sig sig-object py" id="neuralop.layers.spherical_convolution.SphericalConv.get_conv">
+<span class="sig-name descname"><span class="pre">get_conv</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">indices</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/layers/spherical_convolution.html#SphericalConv.get_conv"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.layers.spherical_convolution.SphericalConv.get_conv" title="Link to this definition"></a></dt>
+<dd><p>Returns a sub-convolutional layer from the joint parametrize main-convolution</p>
+<p>The parametrization of sub-convolutional layers is shared with the main one.</p>
+</dd></dl>
+
 </dd></dl>
 
 <div class="clearer"></div></section>
@@ -299,6 +309,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.layers.spher
 <li><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv"><code class="docutils literal notranslate"><span class="pre">SphericalConv</span></code></a><ul>
 <li><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.transform"><code class="docutils literal notranslate"><span class="pre">SphericalConv.transform()</span></code></a></li>
 <li><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.forward"><code class="docutils literal notranslate"><span class="pre">SphericalConv.forward()</span></code></a></li>
+<li><a class="reference internal" href="#neuralop.layers.spherical_convolution.SphericalConv.get_conv"><code class="docutils literal notranslate"><span class="pre">SphericalConv.get_conv()</span></code></a></li>
 </ul>
 </li>
 </ul>
diff --git a/dev/modules/generated/neuralop.losses.H1Loss.html b/dev/modules/generated/neuralop.losses.H1Loss.html
index 0b105f9..772b0f0 100644
--- a/dev/modules/generated/neuralop.losses.H1Loss.html
+++ b/dev/modules/generated/neuralop.losses.H1Loss.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -178,11 +178,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.losses" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><code class="xref py py-obj docutils literal notranslate"><span class="pre">__call__</span></code>(y_pred, y[, h])</p></td>
-<td><p><dl class="field-list simple">
-<dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><p></p></dd>
-</dl>
-</p></td>
+<td><p></p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="#neuralop.losses.H1Loss.abs" title="neuralop.losses.H1Loss.abs"><code class="xref py py-obj docutils literal notranslate"><span class="pre">abs</span></code></a>(x, y[, h])</p></td>
 <td><p>absolute H1 norm</p></td>
diff --git a/dev/modules/generated/neuralop.losses.LpLoss.html b/dev/modules/generated/neuralop.losses.LpLoss.html
index fc21b49..0c47f81 100644
--- a/dev/modules/generated/neuralop.losses.LpLoss.html
+++ b/dev/modules/generated/neuralop.losses.LpLoss.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.losses.MSELoss.html b/dev/modules/generated/neuralop.losses.MSELoss.html
index f161b82..69983d2 100644
--- a/dev/modules/generated/neuralop.losses.MSELoss.html
+++ b/dev/modules/generated/neuralop.losses.MSELoss.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.models.FNO.html b/dev/modules/generated/neuralop.models.FNO.html
index ff4a219..e7dd3da 100644
--- a/dev/modules/generated/neuralop.models.FNO.html
+++ b/dev/modules/generated/neuralop.models.FNO.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -165,141 +165,103 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.models.FNO">
 <em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">FNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/fno.html#FNO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.FNO" title="Link to this definition"></a></dt>
-<dd><p>N-Dimensional Fourier Neural Operator. The FNO learns a mapping between
-spaces of functions discretized over regular grids.</p>
-<p>The key component of an FNO is its SpectralConv layer (see <code class="docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code>), which
-is similar to a standard CNN conv layer but operates in the frequency domain.</p>
-<p>For more information, refer to <a class="reference internal" href="../../user_guide/fno.html#fno-guide"><span class="std std-ref">Fourier Neural Operators</span></a>.</p>
+<dd><p>N-Dimensional Fourier Neural Operator</p>
 <dl class="field-list">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>n_modes</strong><span class="classifier">Tuple[int]</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
+<dd class="field-odd"><dl>
+<dt><strong>n_modes</strong><span class="classifier">int tuple</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
 The dimensionality of the FNO is inferred from <code class="docutils literal notranslate"><span class="pre">len(n_modes)</span></code></p>
 </dd>
-<dt><strong>in_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in input function</p>
+<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the FNO (i.e. number of channels)</p>
 </dd>
-<dt><strong>out_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in output function</p>
+<dt><strong>in_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of input channels, by default 3</p>
 </dd>
-<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the FNO (i.e. number of channels), by default 256</p>
+<dt><strong>out_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of output channels, by default 1</p>
 </dd>
-<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
+<dt><strong>lifting_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the lifting block of the FNO, by default 256</p>
 </dd>
-<dt><strong>Documentation for more advanced parameters is below.</strong></dt><dd></dd>
-</dl>
+<dt><strong>projection_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the projection block of the FNO, by default 256</p>
 </dd>
-<dt class="field-even">Other Parameters<span class="colon">:</span></dt>
-<dd class="field-even"><dl>
-<dt><strong>lifting_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of lifting channels to hidden_channels, by default 2
-The number of liting channels in the lifting block of the FNO is
-lifting_channel_ratio * hidden_channels (e.g. default 512)</p>
-</dd>
-<dt><strong>projection_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of projection channels to hidden_channels, by default 2
-The number of projection channels in the projection block of the FNO is
-projection_channel_ratio * hidden_channels (e.g. default 512)</p>
+<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
 </dd>
-<dt><strong>positional_embedding</strong><span class="classifier">Union[str, nn.Module], optional</span></dt><dd><p>Positional embedding to apply to last channels of raw input
-before being passed through the FNO. Defaults to “grid”</p>
-<ul class="simple">
-<li><p>If “grid”, appends a grid positional embedding with default settings to</p></li>
-</ul>
-<p>the last channels of raw input. Assumes the inputs are discretized
-over a grid with entry [0,0,…] at the origin and side lengths of 1.</p>
-<ul class="simple">
-<li><p>If an initialized GridEmbedding module, uses this module directly</p></li>
-</ul>
-<p>See <code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.embeddings.GridEmbeddingND</span></code> for details.</p>
-<ul class="simple">
-<li><p>If None, does nothing</p></li>
+<dt><strong>positional_embedding</strong><span class="classifier">str literal | GridEmbedding2D | GridEmbeddingND | None</span></dt><dd><p>if “grid”, appends a grid positional embedding with default settings to 
+the last channels of raw input. Assumes the inputs are discretized
+over a grid with entry [0,0,…] at the origin and side lengths of 1.
+If an initialized GridEmbedding, uses this module directly
+See <cite>neuralop.embeddings.GridEmbeddingND</cite> for details
+if None, does nothing</p>
+</dd>
+<dt><strong>max_n_modes</strong><span class="classifier">None or int tuple, default is None</span></dt><dd><ul class="simple">
+<li><p>If not None, this allows to incrementally increase the number of
+modes in Fourier domain during training. Has to verify n &lt;= N
+for (n, m) in zip(max_n_modes, n_modes).</p></li>
+<li><p>If None, all the n_modes are used.</p></li>
 </ul>
+<p>This can be updated dynamically during training.</p>
 </dd>
-<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linear activation function module to use, by default F.gelu</p>
+<dt><strong>fno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}</span></dt><dd><p>if ‘full’, the FNO Block runs in full precision
+if ‘half’, the FFT, contraction, and inverse FFT run in half precision
+if ‘mixed’, the contraction and inverse FFT run in half precision</p>
 </dd>
-<dt><strong>norm</strong><span class="classifier">str {“ada_in”, “group_norm”, “instance_norm”}, optional</span></dt><dd><p>Normalization layer to use, by default None</p>
+<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} or None, optional</span></dt><dd><p>By default None, otherwise tanh is used before FFT in the FNO block</p>
 </dd>
-<dt><strong>complex</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether data is complex-valued (default False)
-if True, initializes complex-valued modules.</p>
+<dt><strong>use_channel_mlp</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether to use a ChannelMLP layer after each FNO block, by default False</p>
 </dd>
-<dt><strong>channel_mlp_dropout</strong><span class="classifier">float, optional</span></dt><dd><p>dropout parameter for ChannelMLP in FNO Block, by default 0</p>
+<dt><strong>channel_mlp_dropout</strong><span class="classifier">float , optional</span></dt><dd><p>droupout parameter of ChannelMLP layer, by default 0</p>
 </dd>
-<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter for ChannelMLP in FNO Block, by default 0.5</p>
+<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter of ChannelMLP layer, by default 0.5</p>
 </dd>
-<dt><strong>channel_mlp_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
+<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linearity module to use, by default F.gelu</p>
 </dd>
-<dt><strong>fno_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in FNO layers, by default ‘linear’</p>
+<dt><strong>norm</strong><span class="classifier">Literal[“ada_in”, “group_norm”, “instance_norm”], optional</span></dt><dd><p>Normalization layer to use, by default None</p>
 </dd>
-<dt><strong>resolution_scaling_factor</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>layer-wise factor by which to scale the domain resolution of function, by default None</p>
-<ul class="simple">
-<li><p>If a single number n, scales resolution by n at each layer</p></li>
-<li><p>if a list of numbers [n_0, n_1,…] scales layer i’s resolution by n_i.</p></li>
-</ul>
+<dt><strong>preactivation</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use resnet-style preactivation</p>
 </dd>
-<dt><strong>domain_padding</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
-To vary the percentage of padding used along each input dimension,
-pass in a list of percentages e.g. [p1, p2, …, pN] such that
-p1 corresponds to the percentage of padding along dim 1, etc.</p>
+<dt><strong>fno_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in fno, by default ‘linear’</p>
 </dd>
-<dt><strong>domain_padding_mode</strong><span class="classifier">str {‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
+<dt><strong>channel_mlp_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
 </dd>
-<dt><strong>fno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}, optional</span></dt><dd><p>precision mode in which to perform spectral convolution, by default “full”</p>
+<dt><strong>separable</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use a depthwise separable spectral convolution</p>
 </dd>
-<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} | None, optional</span></dt><dd><p>whether to use a tanh stabilizer in FNO block, by default None</p>
-<p>Note: stabilizer greatly improves performance in the case
-<cite>fno_block_precision=’mixed’</cite>.</p>
+<dt><strong>factorization</strong><span class="classifier">str or None, {‘tucker’, ‘cp’, ‘tt’}</span></dt><dd><p>Tensor factorization of the parameters weight to use, by default None.
+* If None, a dense tensor parametrizes the Spectral convolutions
+* Otherwise, the specified tensor factorization is used.</p>
 </dd>
-<dt><strong>max_n_modes</strong><span class="classifier">Tuple[int] | None, optional</span></dt><dd><ul class="simple">
-<li><p>If not None, this allows to incrementally increase the number of</p></li>
-</ul>
-<p>modes in Fourier domain during training. Has to verify n &lt;= N
-for (n, m) in zip(max_n_modes, n_modes).</p>
-<ul class="simple">
-<li><p>If None, all the n_modes are used.</p></li>
-</ul>
-<p>This can be updated dynamically during training.</p>
-</dd>
-<dt><strong>factorization</strong><span class="classifier">str, optional</span></dt><dd><p>Tensor factorization of the FNO layer weights to use, by default None.</p>
-<ul class="simple">
-<li><p>If None, a dense tensor parametrizes the Spectral convolutions</p></li>
-<li><p>Otherwise, the specified tensor factorization is used.</p></li>
-</ul>
+<dt><strong>joint_factorization</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether all the Fourier Layers should be parametrized by a single tensor
+(vs one per layer), by default False</p>
 </dd>
-<dt><strong>rank</strong><span class="classifier">float, optional</span></dt><dd><p>tensor rank to use in above factorization, by default 1.0</p>
+<dt><strong>rank</strong><span class="classifier">float or rank, optional</span></dt><dd><p>Rank of the tensor factorization of the Fourier weights, by default 1.0</p>
 </dd>
 <dt><strong>fixed_rank_modes</strong><span class="classifier">bool, optional</span></dt><dd><p>Modes to not factorize, by default False</p>
 </dd>
-<dt><strong>implementation</strong><span class="classifier">str {‘factorized’, ‘reconstructed’}, optional</span></dt><dd><ul class="simple">
-<li><p>If ‘factorized’, implements tensor contraction with the individual factors of the decomposition</p></li>
-<li><p>If ‘reconstructed’, implements with the reconstructed full tensorized weight.</p></li>
+<dt><strong>implementation</strong><span class="classifier">{‘factorized’, ‘reconstructed’}, optional, default is ‘factorized’</span></dt><dd><p>If factorization is not None, forward mode to use::
+* <cite>reconstructed</cite> : the full weight tensor is reconstructed from the</p>
+<blockquote>
+<div><p>factorization and used for the forward pass</p>
+</div></blockquote>
+<ul class="simple">
+<li><p><cite>factorized</cite> : the input is directly contracted with the factors of
+the decomposition</p></li>
 </ul>
 </dd>
-<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional</span></dt><dd><p>extra kwargs for tensor decomposition (see <cite>tltorch.FactorizedTensor</cite>), by default dict()</p>
+<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional, default is {}</span></dt><dd><p>Optionaly additional parameters to pass to the tensor decomposition</p>
 </dd>
-<dt><strong>separable</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>if True, use a depthwise separable spectral convolution, by default False</p>
+<dt><strong>domain_padding</strong><span class="classifier">None, float, or List[float], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
+To vary the percentage of padding used along each input dimension,
+pass in a list of percentages e.g. [p1, p2, …, pN] such that
+p1 corresponds to the percentage of padding along dim 1, etc.</p>
 </dd>
-<dt><strong>preactivation</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>whether to compute FNO forward pass with resnet-style preactivation, by default False</p>
+<dt><strong>domain_padding_mode</strong><span class="classifier">{‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
 </dd>
-<dt><strong>conv_module</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>module to use for FNOBlock’s convolutions, by default SpectralConv</p>
+<dt><strong>conv_module</strong><span class="classifier">BaseConv, optional</span></dt><dd><p>Module to use for convolutions in FNO, by default SpectralConv</p>
 </dd>
-</dl>
+<dt><strong>complex_data: bool, optional</strong></dt><dd><p>whether FNO data takes on complex values 
+in the spatial domain, by default False</p>
 </dd>
 </dl>
-<p class="rubric">Examples</p>
-<div class="doctest highlight-default notranslate"><div class="highlight"><pre><span></span><span class="gp">&gt;&gt;&gt; </span><span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">FNO</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span> <span class="o">=</span> <span class="n">FNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span>
-<span class="go">FNO(</span>
-<span class="go">(positional_embedding): GridEmbeddingND()</span>
-<span class="go">(fno_blocks): FNOBlocks(</span>
-<span class="go">    (convs): SpectralConv(</span>
-<span class="go">    (weight): ModuleList(</span>
-<span class="go">        (0-3): 4 x DenseTensor(shape=torch.Size([64, 64, 12, 7]), rank=None)</span>
-<span class="go">    )</span>
-<span class="go">    )</span>
-<span class="go">        ... torch.nn.Module printout truncated ...</span>
-</pre></div>
-</div>
-<dl class="field-list simple">
-<dt class="field-odd">Attributes<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
+</dd>
+<dt class="field-even">Attributes<span class="colon">:</span></dt>
+<dd class="field-even"><dl class="simple">
 <dt><strong>n_modes</strong></dt><dd></dd>
 </dl>
 </dd>
@@ -308,37 +270,23 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.FNO.forward" title="neuralop.models.FNO.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.FNO.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/fno.html#FNO.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.FNO.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.FNO1d.html b/dev/modules/generated/neuralop.models.FNO1d.html
index bfcc6e4..ffdb3d8 100644
--- a/dev/modules/generated/neuralop.models.FNO1d.html
+++ b/dev/modules/generated/neuralop.models.FNO1d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.models.FNO2d.html b/dev/modules/generated/neuralop.models.FNO2d.html
index 5300459..e882198 100644
--- a/dev/modules/generated/neuralop.models.FNO2d.html
+++ b/dev/modules/generated/neuralop.models.FNO2d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.models.FNO3d.html b/dev/modules/generated/neuralop.models.FNO3d.html
index 0974440..8095949 100644
--- a/dev/modules/generated/neuralop.models.FNO3d.html
+++ b/dev/modules/generated/neuralop.models.FNO3d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.models.GINO.html b/dev/modules/generated/neuralop.models.GINO.html
index 8e4f153..91012c0 100644
--- a/dev/modules/generated/neuralop.models.GINO.html
+++ b/dev/modules/generated/neuralop.models.GINO.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.models" title="neuralop.models"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.models</span></code></a>.GINO<a class="headerlink" href="#neuralop-models-gino" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.models.GINO">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">GINO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="pre">in_channels,</span> <span class="pre">out_channels,</span> <span class="pre">projection_channels=256,</span> <span class="pre">gno_coord_dim=3,</span> <span class="pre">gno_coord_embed_dim=None,</span> <span class="pre">gno_embed_max_positions=None,</span> <span class="pre">gno_radius=0.033,</span> <span class="pre">in_gno_channel_mlp_hidden_layers=[80,</span> <span class="pre">80,</span> <span class="pre">80],</span> <span class="pre">out_gno_channel_mlp_hidden_layers=[512,</span> <span class="pre">256],</span> <span class="pre">gno_channel_mlp_non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;,</span> <span class="pre">in_gno_transform_type='linear',</span> <span class="pre">out_gno_transform_type='linear',</span> <span class="pre">gno_use_open3d=False,</span> <span class="pre">gno_use_torch_scatter=True,</span> <span class="pre">out_gno_tanh=None,</span> <span class="pre">fno_in_channels=3,</span> <span class="pre">fno_n_modes=(16,</span> <span class="pre">16,</span> <span class="pre">16),</span> <span class="pre">fno_hidden_channels=64,</span> <span class="pre">lifting_channels=256,</span> <span class="pre">fno_n_layers=4,</span> <span class="pre">fno_resolution_scaling_factor=None,</span> <span class="pre">fno_incremental_n_modes=None,</span> <span class="pre">fno_block_precision='full',</span> <span class="pre">fno_use_channel_mlp=False,</span> <span class="pre">fno_channel_mlp_dropout=0,</span> <span class="pre">fno_channel_mlp_expansion=0.5,</span> <span class="pre">fno_non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;,</span> <span class="pre">fno_stabilizer=None,</span> <span class="pre">fno_norm=None,</span> <span class="pre">fno_ada_in_features=None,</span> <span class="pre">fno_ada_in_dim=1,</span> <span class="pre">fno_preactivation=False,</span> <span class="pre">fno_skip='linear',</span> <span class="pre">fno_channel_mlp_skip='soft-gating',</span> <span class="pre">fno_separable=False,</span> <span class="pre">fno_factorization=None,</span> <span class="pre">fno_rank=1.0,</span> <span class="pre">fno_joint_factorization=False,</span> <span class="pre">fno_fixed_rank_modes=False,</span> <span class="pre">fno_implementation='factorized',</span> <span class="pre">fno_decomposition_kwargs={},</span> <span class="pre">fno_conv_module=&lt;class</span> <span class="pre">'neuralop.layers.spectral_convolution.SpectralConv'&gt;,</span> <span class="pre">**kwargs</span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/gino.html#GINO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.GINO" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">GINO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="pre">in_channels,</span> <span class="pre">out_channels,</span> <span class="pre">projection_channels=256,</span> <span class="pre">gno_coord_dim=3,</span> <span class="pre">gno_coord_embed_dim=None,</span> <span class="pre">gno_embed_max_positions=None,</span> <span class="pre">gno_radius=0.033,</span> <span class="pre">in_gno_channel_mlp_hidden_layers=[80,</span> <span class="pre">80,</span> <span class="pre">80],</span> <span class="pre">out_gno_channel_mlp_hidden_layers=[512,</span> <span class="pre">256],</span> <span class="pre">gno_channel_mlp_non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;,</span> <span class="pre">in_gno_transform_type='linear',</span> <span class="pre">out_gno_transform_type='linear',</span> <span class="pre">gno_use_open3d=False,</span> <span class="pre">gno_use_torch_scatter=True,</span> <span class="pre">out_gno_tanh=None,</span> <span class="pre">fno_in_channels=3,</span> <span class="pre">fno_n_modes=(16,</span> <span class="pre">16,</span> <span class="pre">16),</span> <span class="pre">fno_hidden_channels=64,</span> <span class="pre">lifting_channels=256,</span> <span class="pre">fno_n_layers=4,</span> <span class="pre">fno_output_scaling_factor=None,</span> <span class="pre">fno_incremental_n_modes=None,</span> <span class="pre">fno_block_precision='full',</span> <span class="pre">fno_use_channel_mlp=False,</span> <span class="pre">fno_channel_mlp_dropout=0,</span> <span class="pre">fno_channel_mlp_expansion=0.5,</span> <span class="pre">fno_non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;,</span> <span class="pre">fno_stabilizer=None,</span> <span class="pre">fno_norm=None,</span> <span class="pre">fno_ada_in_features=None,</span> <span class="pre">fno_ada_in_dim=1,</span> <span class="pre">fno_preactivation=False,</span> <span class="pre">fno_skip='linear',</span> <span class="pre">fno_channel_mlp_skip='soft-gating',</span> <span class="pre">fno_separable=False,</span> <span class="pre">fno_factorization=None,</span> <span class="pre">fno_rank=1.0,</span> <span class="pre">fno_joint_factorization=False,</span> <span class="pre">fno_fixed_rank_modes=False,</span> <span class="pre">fno_implementation='factorized',</span> <span class="pre">fno_decomposition_kwargs={},</span> <span class="pre">fno_conv_module=&lt;class</span> <span class="pre">'neuralop.layers.spectral_convolution.SpectralConv'&gt;,</span> <span class="pre">**kwargs</span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/gino.html#GINO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.GINO" title="Link to this definition"></a></dt>
 <dd><p>GINO: Geometry-informed Neural Operator</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
@@ -217,7 +217,7 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 </dd>
 <dt><strong>fno_n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>number of layers in FNO, by default 4</p>
 </dd>
-<dt><strong>fno_resolution_scaling_factor</strong><span class="classifier">float | None, optional</span></dt><dd><p>factor by which to scale output of FNO, by default None</p>
+<dt><strong>fno_output_scaling_factor</strong><span class="classifier">float | None, optional</span></dt><dd><p>factor by which to scale output of FNO, by default None</p>
 </dd>
 <dt><strong>fno_incremental_n_modes</strong><span class="classifier">list[int] | None, defaults to None</span></dt><dd></dd>
 <dt><strong>if passed, sets n_modes separately for each FNO layer.</strong></dt><dd></dd>
diff --git a/dev/modules/generated/neuralop.models.SFNO.html b/dev/modules/generated/neuralop.models.SFNO.html
index 2d508bf..b61a237 100644
--- a/dev/modules/generated/neuralop.models.SFNO.html
+++ b/dev/modules/generated/neuralop.models.SFNO.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -165,173 +165,123 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.models.SFNO">
 <em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">SFNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.SFNO" title="Link to this definition"></a></dt>
-<dd><p>N-Dimensional Spherical Fourier Neural Operator. The SFNO learns a mapping between
-spaces of functions discretized over regular grids.</p>
-<p>The key component of an SFNO is its SpectralConv layer (see <code class="docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code>), which
-is similar to a standard CNN conv layer but operates in the frequency domain.</p>
-<p>For more information, refer to <span class="xref std std-ref">sfno-guide</span>.</p>
+<dd><p>N-Dimensional Spherical Fourier Neural Operator</p>
 <dl class="field-list">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>n_modes</strong><span class="classifier">Tuple[int]</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
+<dd class="field-odd"><dl>
+<dt><strong>n_modes</strong><span class="classifier">int tuple</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
 The dimensionality of the SFNO is inferred from <code class="docutils literal notranslate"><span class="pre">len(n_modes)</span></code></p>
 </dd>
-<dt><strong>in_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in input function</p>
+<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the SFNO (i.e. number of channels)</p>
 </dd>
-<dt><strong>out_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in output function</p>
+<dt><strong>in_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of input channels, by default 3</p>
 </dd>
-<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the SFNO (i.e. number of channels), by default 256</p>
+<dt><strong>out_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of output channels, by default 1</p>
 </dd>
-<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
+<dt><strong>lifting_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the lifting block of the SFNO, by default 256</p>
 </dd>
-<dt><strong>Documentation for more advanced parameters is below.</strong></dt><dd></dd>
-</dl>
+<dt><strong>projection_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the projection block of the SFNO, by default 256</p>
 </dd>
-<dt class="field-even">Other Parameters<span class="colon">:</span></dt>
-<dd class="field-even"><dl>
-<dt><strong>lifting_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of lifting channels to hidden_channels, by default 2
-The number of liting channels in the lifting block of the SFNO is
-lifting_channel_ratio * hidden_channels (e.g. default 512)</p>
-</dd>
-<dt><strong>projection_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of projection channels to hidden_channels, by default 2
-The number of projection channels in the projection block of the SFNO is
-projection_channel_ratio * hidden_channels (e.g. default 512)</p>
+<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
 </dd>
-<dt><strong>positional_embedding</strong><span class="classifier">Union[str, nn.Module], optional</span></dt><dd><p>Positional embedding to apply to last channels of raw input
-before being passed through the SFNO. Defaults to “grid”</p>
-<ul class="simple">
-<li><p>If “grid”, appends a grid positional embedding with default settings to</p></li>
-</ul>
-<p>the last channels of raw input. Assumes the inputs are discretized
-over a grid with entry [0,0,…] at the origin and side lengths of 1.</p>
-<ul class="simple">
-<li><p>If an initialized GridEmbedding module, uses this module directly</p></li>
-</ul>
-<p>See <code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.embeddings.GridEmbeddingND</span></code> for details.</p>
-<ul class="simple">
-<li><p>If None, does nothing</p></li>
+<dt><strong>positional_embedding</strong><span class="classifier">str literal | GridEmbedding2D | GridEmbeddingND | None</span></dt><dd><p>if “grid”, appends a grid positional embedding with default settings to 
+the last channels of raw input. Assumes the inputs are discretized
+over a grid with entry [0,0,…] at the origin and side lengths of 1.
+If an initialized GridEmbedding, uses this module directly
+See <cite>neuralop.embeddings.GridEmbeddingND</cite> for details
+if None, does nothing</p>
+</dd>
+<dt><strong>max_n_modes</strong><span class="classifier">None or int tuple, default is None</span></dt><dd><ul class="simple">
+<li><p>If not None, this allows to incrementally increase the number of
+modes in Fourier domain during training. Has to verify n &lt;= N
+for (n, m) in zip(max_n_modes, n_modes).</p></li>
+<li><p>If None, all the n_modes are used.</p></li>
 </ul>
+<p>This can be updated dynamically during training.</p>
 </dd>
-<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linear activation function module to use, by default F.gelu</p>
+<dt><strong>sfno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}</span></dt><dd><p>if ‘full’, the SFNO Block runs in full precision
+if ‘half’, the FFT, contraction, and inverse FFT run in half precision
+if ‘mixed’, the contraction and inverse FFT run in half precision</p>
 </dd>
-<dt><strong>norm</strong><span class="classifier">str {“ada_in”, “group_norm”, “instance_norm”}, optional</span></dt><dd><p>Normalization layer to use, by default None</p>
+<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} or None, optional</span></dt><dd><p>By default None, otherwise tanh is used before FFT in the SFNO block</p>
 </dd>
-<dt><strong>complex</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether data is complex-valued (default False)
-if True, initializes complex-valued modules.</p>
+<dt><strong>use_channel_mlp</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether to use a ChannelMLP layer after each SFNO block, by default False</p>
 </dd>
-<dt><strong>channel_mlp_dropout</strong><span class="classifier">float, optional</span></dt><dd><p>dropout parameter for ChannelMLP in SFNO Block, by default 0</p>
+<dt><strong>channel_mlp_dropout</strong><span class="classifier">float , optional</span></dt><dd><p>droupout parameter of ChannelMLP layer, by default 0</p>
 </dd>
-<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter for ChannelMLP in SFNO Block, by default 0.5</p>
+<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter of ChannelMLP layer, by default 0.5</p>
 </dd>
-<dt><strong>channel_mlp_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
+<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linearity module to use, by default F.gelu</p>
 </dd>
-<dt><strong>sfno_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in SFNO layers, by default ‘linear’</p>
+<dt><strong>norm</strong><span class="classifier">Literal[“ada_in”, “group_norm”, “instance_norm”], optional</span></dt><dd><p>Normalization layer to use, by default None</p>
 </dd>
-<dt><strong>resolution_scaling_factor</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>layer-wise factor by which to scale the domain resolution of function, by default None</p>
-<ul class="simple">
-<li><p>If a single number n, scales resolution by n at each layer</p></li>
-<li><p>if a list of numbers [n_0, n_1,…] scales layer i’s resolution by n_i.</p></li>
-</ul>
-</dd>
-<dt><strong>domain_padding</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
-To vary the percentage of padding used along each input dimension,
-pass in a list of percentages e.g. [p1, p2, …, pN] such that
-p1 corresponds to the percentage of padding along dim 1, etc.</p>
+<dt><strong>preactivation</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use resnet-style preactivation</p>
 </dd>
-<dt><strong>domain_padding_mode</strong><span class="classifier">str {‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
+<dt><strong>sfno_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in sfno, by default ‘linear’</p>
 </dd>
-<dt><strong>sfno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}, optional</span></dt><dd><p>precision mode in which to perform spectral convolution, by default “full”</p>
+<dt><strong>channel_mlp_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
 </dd>
-<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} | None, optional</span></dt><dd><p>whether to use a tanh stabilizer in SFNO block, by default None</p>
-<p>Note: stabilizer greatly improves performance in the case
-<cite>sfno_block_precision=’mixed’</cite>.</p>
+<dt><strong>separable</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use a depthwise separable spectral convolution</p>
 </dd>
-<dt><strong>max_n_modes</strong><span class="classifier">Tuple[int] | None, optional</span></dt><dd><ul class="simple">
-<li><p>If not None, this allows to incrementally increase the number of</p></li>
-</ul>
-<p>modes in Fourier domain during training. Has to verify n &lt;= N
-for (n, m) in zip(max_n_modes, n_modes).</p>
-<ul class="simple">
-<li><p>If None, all the n_modes are used.</p></li>
-</ul>
-<p>This can be updated dynamically during training.</p>
+<dt><strong>factorization</strong><span class="classifier">str or None, {‘tucker’, ‘cp’, ‘tt’}</span></dt><dd><p>Tensor factorization of the parameters weight to use, by default None.
+* If None, a dense tensor parametrizes the Spectral convolutions
+* Otherwise, the specified tensor factorization is used.</p>
 </dd>
-<dt><strong>factorization</strong><span class="classifier">str, optional</span></dt><dd><p>Tensor factorization of the SFNO layer weights to use, by default None.</p>
-<ul class="simple">
-<li><p>If None, a dense tensor parametrizes the Spectral convolutions</p></li>
-<li><p>Otherwise, the specified tensor factorization is used.</p></li>
-</ul>
+<dt><strong>joint_factorization</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether all the Fourier Layers should be parametrized by a single tensor
+(vs one per layer), by default False</p>
 </dd>
-<dt><strong>rank</strong><span class="classifier">float, optional</span></dt><dd><p>tensor rank to use in above factorization, by default 1.0</p>
+<dt><strong>rank</strong><span class="classifier">float or rank, optional</span></dt><dd><p>Rank of the tensor factorization of the Fourier weights, by default 1.0</p>
 </dd>
 <dt><strong>fixed_rank_modes</strong><span class="classifier">bool, optional</span></dt><dd><p>Modes to not factorize, by default False</p>
 </dd>
-<dt><strong>implementation</strong><span class="classifier">str {‘factorized’, ‘reconstructed’}, optional</span></dt><dd><ul class="simple">
-<li><p>If ‘factorized’, implements tensor contraction with the individual factors of the decomposition</p></li>
-<li><p>If ‘reconstructed’, implements with the reconstructed full tensorized weight.</p></li>
+<dt><strong>implementation</strong><span class="classifier">{‘factorized’, ‘reconstructed’}, optional, default is ‘factorized’</span></dt><dd><p>If factorization is not None, forward mode to use::
+* <cite>reconstructed</cite> : the full weight tensor is reconstructed from the</p>
+<blockquote>
+<div><p>factorization and used for the forward pass</p>
+</div></blockquote>
+<ul class="simple">
+<li><p><cite>factorized</cite> : the input is directly contracted with the factors of
+the decomposition</p></li>
 </ul>
 </dd>
-<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional</span></dt><dd><p>extra kwargs for tensor decomposition (see <cite>tltorch.FactorizedTensor</cite>), by default dict()</p>
+<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional, default is {}</span></dt><dd><p>Optionaly additional parameters to pass to the tensor decomposition</p>
+</dd>
+<dt><strong>domain_padding</strong><span class="classifier">None, float, or List[float], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
+To vary the percentage of padding used along each input dimension,
+pass in a list of percentages e.g. [p1, p2, …, pN] such that
+p1 corresponds to the percentage of padding along dim 1, etc.</p>
 </dd>
-<dt><strong>separable</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>if True, use a depthwise separable spectral convolution, by default False</p>
+<dt><strong>domain_padding_mode</strong><span class="classifier">{‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
 </dd>
-<dt><strong>preactivation</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>whether to compute SFNO forward pass with resnet-style preactivation, by default False</p>
+<dt><strong>conv_module</strong><span class="classifier">BaseConv, optional</span></dt><dd><p>Module to use for convolutions in SFNO, by default SpectralConv</p>
 </dd>
-<dt><strong>conv_module</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>module to use for SFNOBlock’s convolutions, by default SpectralConv</p>
+<dt><strong>complex_data: bool, optional</strong></dt><dd><p>whether SFNO data takes on complex values 
+in the spatial domain, by default False</p>
 </dd>
 </dl>
 </dd>
 </dl>
-<p class="rubric">Examples</p>
-<div class="doctest highlight-default notranslate"><div class="highlight"><pre><span></span><span class="gp">&gt;&gt;&gt; </span><span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">SFNO</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span> <span class="o">=</span> <span class="n">SFNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span>
-<span class="go">SFNO(</span>
-<span class="go">(positional_embedding): GridEmbeddingND()</span>
-<span class="go">(sfno_blocks): SFNOBlocks(</span>
-<span class="go">    (convs): SpectralConv(</span>
-<span class="go">    (weight): ModuleList(</span>
-<span class="go">        (0-3): 4 x DenseTensor(shape=torch.Size([64, 64, 12, 7]), rank=None)</span>
-<span class="go">    )</span>
-<span class="go">    )</span>
-<span class="go">        ... torch.nn.Module printout truncated ...</span>
-</pre></div>
-</div>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.SFNO.forward" title="neuralop.models.SFNO.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.SFNO.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.SFNO.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.TFNO.html b/dev/modules/generated/neuralop.models.TFNO.html
index 4f361c5..2c6a84e 100644
--- a/dev/modules/generated/neuralop.models.TFNO.html
+++ b/dev/modules/generated/neuralop.models.TFNO.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -165,173 +165,123 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.models.TFNO">
 <em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">TFNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="o"><span class="pre">*</span></span><span class="n"><span class="pre">args</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.TFNO" title="Link to this definition"></a></dt>
-<dd><p>N-Dimensional Fourier Neural Operator. The FNO learns a mapping between
-spaces of functions discretized over regular grids.</p>
-<p>The key component of an FNO is its SpectralConv layer (see <code class="docutils literal notranslate"><span class="pre">neuralop.layers.spectral_convolution</span></code>), which
-is similar to a standard CNN conv layer but operates in the frequency domain.</p>
-<p>For more information, refer to <a class="reference internal" href="../../user_guide/fno.html#fno-guide"><span class="std std-ref">Fourier Neural Operators</span></a>.</p>
+<dd><p>N-Dimensional Fourier Neural Operator</p>
 <dl class="field-list">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
-<dd class="field-odd"><dl class="simple">
-<dt><strong>n_modes</strong><span class="classifier">Tuple[int]</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
+<dd class="field-odd"><dl>
+<dt><strong>n_modes</strong><span class="classifier">int tuple</span></dt><dd><p>number of modes to keep in Fourier Layer, along each dimension
 The dimensionality of the FNO is inferred from <code class="docutils literal notranslate"><span class="pre">len(n_modes)</span></code></p>
 </dd>
-<dt><strong>in_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in input function</p>
+<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the FNO (i.e. number of channels)</p>
 </dd>
-<dt><strong>out_channels</strong><span class="classifier">int</span></dt><dd><p>Number of channels in output function</p>
+<dt><strong>in_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of input channels, by default 3</p>
 </dd>
-<dt><strong>hidden_channels</strong><span class="classifier">int</span></dt><dd><p>width of the FNO (i.e. number of channels), by default 256</p>
+<dt><strong>out_channels</strong><span class="classifier">int, optional</span></dt><dd><p>Number of output channels, by default 1</p>
 </dd>
-<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
+<dt><strong>lifting_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the lifting block of the FNO, by default 256</p>
 </dd>
-<dt><strong>Documentation for more advanced parameters is below.</strong></dt><dd></dd>
-</dl>
+<dt><strong>projection_channels</strong><span class="classifier">int, optional</span></dt><dd><p>number of hidden channels of the projection block of the FNO, by default 256</p>
 </dd>
-<dt class="field-even">Other Parameters<span class="colon">:</span></dt>
-<dd class="field-even"><dl>
-<dt><strong>lifting_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of lifting channels to hidden_channels, by default 2
-The number of liting channels in the lifting block of the FNO is
-lifting_channel_ratio * hidden_channels (e.g. default 512)</p>
-</dd>
-<dt><strong>projection_channel_ratio</strong><span class="classifier">int, optional</span></dt><dd><p>ratio of projection channels to hidden_channels, by default 2
-The number of projection channels in the projection block of the FNO is
-projection_channel_ratio * hidden_channels (e.g. default 512)</p>
+<dt><strong>n_layers</strong><span class="classifier">int, optional</span></dt><dd><p>Number of Fourier Layers, by default 4</p>
 </dd>
-<dt><strong>positional_embedding</strong><span class="classifier">Union[str, nn.Module], optional</span></dt><dd><p>Positional embedding to apply to last channels of raw input
-before being passed through the FNO. Defaults to “grid”</p>
-<ul class="simple">
-<li><p>If “grid”, appends a grid positional embedding with default settings to</p></li>
-</ul>
-<p>the last channels of raw input. Assumes the inputs are discretized
-over a grid with entry [0,0,…] at the origin and side lengths of 1.</p>
-<ul class="simple">
-<li><p>If an initialized GridEmbedding module, uses this module directly</p></li>
-</ul>
-<p>See <code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.embeddings.GridEmbeddingND</span></code> for details.</p>
-<ul class="simple">
-<li><p>If None, does nothing</p></li>
+<dt><strong>positional_embedding</strong><span class="classifier">str literal | GridEmbedding2D | GridEmbeddingND | None</span></dt><dd><p>if “grid”, appends a grid positional embedding with default settings to 
+the last channels of raw input. Assumes the inputs are discretized
+over a grid with entry [0,0,…] at the origin and side lengths of 1.
+If an initialized GridEmbedding, uses this module directly
+See <cite>neuralop.embeddings.GridEmbeddingND</cite> for details
+if None, does nothing</p>
+</dd>
+<dt><strong>max_n_modes</strong><span class="classifier">None or int tuple, default is None</span></dt><dd><ul class="simple">
+<li><p>If not None, this allows to incrementally increase the number of
+modes in Fourier domain during training. Has to verify n &lt;= N
+for (n, m) in zip(max_n_modes, n_modes).</p></li>
+<li><p>If None, all the n_modes are used.</p></li>
 </ul>
+<p>This can be updated dynamically during training.</p>
 </dd>
-<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linear activation function module to use, by default F.gelu</p>
+<dt><strong>fno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}</span></dt><dd><p>if ‘full’, the FNO Block runs in full precision
+if ‘half’, the FFT, contraction, and inverse FFT run in half precision
+if ‘mixed’, the contraction and inverse FFT run in half precision</p>
 </dd>
-<dt><strong>norm</strong><span class="classifier">str {“ada_in”, “group_norm”, “instance_norm”}, optional</span></dt><dd><p>Normalization layer to use, by default None</p>
+<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} or None, optional</span></dt><dd><p>By default None, otherwise tanh is used before FFT in the FNO block</p>
 </dd>
-<dt><strong>complex</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether data is complex-valued (default False)
-if True, initializes complex-valued modules.</p>
+<dt><strong>use_channel_mlp</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether to use a ChannelMLP layer after each FNO block, by default False</p>
 </dd>
-<dt><strong>channel_mlp_dropout</strong><span class="classifier">float, optional</span></dt><dd><p>dropout parameter for ChannelMLP in FNO Block, by default 0</p>
+<dt><strong>channel_mlp_dropout</strong><span class="classifier">float , optional</span></dt><dd><p>droupout parameter of ChannelMLP layer, by default 0</p>
 </dd>
-<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter for ChannelMLP in FNO Block, by default 0.5</p>
+<dt><strong>channel_mlp_expansion</strong><span class="classifier">float, optional</span></dt><dd><p>expansion parameter of ChannelMLP layer, by default 0.5</p>
 </dd>
-<dt><strong>channel_mlp_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
+<dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linearity module to use, by default F.gelu</p>
 </dd>
-<dt><strong>fno_skip</strong><span class="classifier">str {‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in FNO layers, by default ‘linear’</p>
+<dt><strong>norm</strong><span class="classifier">Literal[“ada_in”, “group_norm”, “instance_norm”], optional</span></dt><dd><p>Normalization layer to use, by default None</p>
 </dd>
-<dt><strong>resolution_scaling_factor</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>layer-wise factor by which to scale the domain resolution of function, by default None</p>
-<ul class="simple">
-<li><p>If a single number n, scales resolution by n at each layer</p></li>
-<li><p>if a list of numbers [n_0, n_1,…] scales layer i’s resolution by n_i.</p></li>
-</ul>
-</dd>
-<dt><strong>domain_padding</strong><span class="classifier">Union[Number, List[Number]], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
-To vary the percentage of padding used along each input dimension,
-pass in a list of percentages e.g. [p1, p2, …, pN] such that
-p1 corresponds to the percentage of padding along dim 1, etc.</p>
+<dt><strong>preactivation</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use resnet-style preactivation</p>
 </dd>
-<dt><strong>domain_padding_mode</strong><span class="classifier">str {‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
+<dt><strong>fno_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in fno, by default ‘linear’</p>
 </dd>
-<dt><strong>fno_block_precision</strong><span class="classifier">str {‘full’, ‘half’, ‘mixed’}, optional</span></dt><dd><p>precision mode in which to perform spectral convolution, by default “full”</p>
+<dt><strong>channel_mlp_skip</strong><span class="classifier">{‘linear’, ‘identity’, ‘soft-gating’}, optional</span></dt><dd><p>Type of skip connection to use in channel-mixing mlp, by default ‘soft-gating’</p>
 </dd>
-<dt><strong>stabilizer</strong><span class="classifier">str {‘tanh’} | None, optional</span></dt><dd><p>whether to use a tanh stabilizer in FNO block, by default None</p>
-<p>Note: stabilizer greatly improves performance in the case
-<cite>fno_block_precision=’mixed’</cite>.</p>
+<dt><strong>separable</strong><span class="classifier">bool, default is False</span></dt><dd><p>if True, use a depthwise separable spectral convolution</p>
 </dd>
-<dt><strong>max_n_modes</strong><span class="classifier">Tuple[int] | None, optional</span></dt><dd><ul class="simple">
-<li><p>If not None, this allows to incrementally increase the number of</p></li>
-</ul>
-<p>modes in Fourier domain during training. Has to verify n &lt;= N
-for (n, m) in zip(max_n_modes, n_modes).</p>
-<ul class="simple">
-<li><p>If None, all the n_modes are used.</p></li>
-</ul>
-<p>This can be updated dynamically during training.</p>
+<dt><strong>factorization</strong><span class="classifier">str or None, {‘tucker’, ‘cp’, ‘tt’}</span></dt><dd><p>Tensor factorization of the parameters weight to use, by default None.
+* If None, a dense tensor parametrizes the Spectral convolutions
+* Otherwise, the specified tensor factorization is used.</p>
 </dd>
-<dt><strong>factorization</strong><span class="classifier">str, optional</span></dt><dd><p>Tensor factorization of the FNO layer weights to use, by default None.</p>
-<ul class="simple">
-<li><p>If None, a dense tensor parametrizes the Spectral convolutions</p></li>
-<li><p>Otherwise, the specified tensor factorization is used.</p></li>
-</ul>
+<dt><strong>joint_factorization</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether all the Fourier Layers should be parametrized by a single tensor
+(vs one per layer), by default False</p>
 </dd>
-<dt><strong>rank</strong><span class="classifier">float, optional</span></dt><dd><p>tensor rank to use in above factorization, by default 1.0</p>
+<dt><strong>rank</strong><span class="classifier">float or rank, optional</span></dt><dd><p>Rank of the tensor factorization of the Fourier weights, by default 1.0</p>
 </dd>
 <dt><strong>fixed_rank_modes</strong><span class="classifier">bool, optional</span></dt><dd><p>Modes to not factorize, by default False</p>
 </dd>
-<dt><strong>implementation</strong><span class="classifier">str {‘factorized’, ‘reconstructed’}, optional</span></dt><dd><ul class="simple">
-<li><p>If ‘factorized’, implements tensor contraction with the individual factors of the decomposition</p></li>
-<li><p>If ‘reconstructed’, implements with the reconstructed full tensorized weight.</p></li>
+<dt><strong>implementation</strong><span class="classifier">{‘factorized’, ‘reconstructed’}, optional, default is ‘factorized’</span></dt><dd><p>If factorization is not None, forward mode to use::
+* <cite>reconstructed</cite> : the full weight tensor is reconstructed from the</p>
+<blockquote>
+<div><p>factorization and used for the forward pass</p>
+</div></blockquote>
+<ul class="simple">
+<li><p><cite>factorized</cite> : the input is directly contracted with the factors of
+the decomposition</p></li>
 </ul>
 </dd>
-<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional</span></dt><dd><p>extra kwargs for tensor decomposition (see <cite>tltorch.FactorizedTensor</cite>), by default dict()</p>
+<dt><strong>decomposition_kwargs</strong><span class="classifier">dict, optional, default is {}</span></dt><dd><p>Optionaly additional parameters to pass to the tensor decomposition</p>
+</dd>
+<dt><strong>domain_padding</strong><span class="classifier">None, float, or List[float], optional</span></dt><dd><p>If not None, percentage of padding to use, by default None
+To vary the percentage of padding used along each input dimension,
+pass in a list of percentages e.g. [p1, p2, …, pN] such that
+p1 corresponds to the percentage of padding along dim 1, etc.</p>
 </dd>
-<dt><strong>separable</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>if True, use a depthwise separable spectral convolution, by default False</p>
+<dt><strong>domain_padding_mode</strong><span class="classifier">{‘symmetric’, ‘one-sided’}, optional</span></dt><dd><p>How to perform domain padding, by default ‘one-sided’</p>
 </dd>
-<dt><strong>preactivation</strong><span class="classifier">bool, optional (<strong>DEACTIVATED</strong>)</span></dt><dd><p>whether to compute FNO forward pass with resnet-style preactivation, by default False</p>
+<dt><strong>conv_module</strong><span class="classifier">BaseConv, optional</span></dt><dd><p>Module to use for convolutions in FNO, by default SpectralConv</p>
 </dd>
-<dt><strong>conv_module</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>module to use for FNOBlock’s convolutions, by default SpectralConv</p>
+<dt><strong>complex_data: bool, optional</strong></dt><dd><p>whether FNO data takes on complex values 
+in the spatial domain, by default False</p>
 </dd>
 </dl>
 </dd>
 </dl>
-<p class="rubric">Examples</p>
-<div class="doctest highlight-default notranslate"><div class="highlight"><pre><span></span><span class="gp">&gt;&gt;&gt; </span><span class="kn">from</span> <span class="nn">neuralop.models</span> <span class="kn">import</span> <span class="n">FNO</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span> <span class="o">=</span> <span class="n">FNO</span><span class="p">(</span><span class="n">n_modes</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">),</span> <span class="n">in_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">out_channels</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">hidden_channels</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
-<span class="gp">&gt;&gt;&gt; </span><span class="n">model</span>
-<span class="go">FNO(</span>
-<span class="go">(positional_embedding): GridEmbeddingND()</span>
-<span class="go">(fno_blocks): FNOBlocks(</span>
-<span class="go">    (convs): SpectralConv(</span>
-<span class="go">    (weight): ModuleList(</span>
-<span class="go">        (0-3): 4 x DenseTensor(shape=torch.Size([64, 64, 12, 7]), rank=None)</span>
-<span class="go">    )</span>
-<span class="go">    )</span>
-<span class="go">        ... torch.nn.Module printout truncated ...</span>
-</pre></div>
-</div>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.TFNO.forward" title="neuralop.models.TFNO.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.TFNO.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.TFNO.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.TFNO1d.html b/dev/modules/generated/neuralop.models.TFNO1d.html
index 5828860..3297aba 100644
--- a/dev/modules/generated/neuralop.models.TFNO1d.html
+++ b/dev/modules/generated/neuralop.models.TFNO1d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -179,37 +179,23 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.TFNO1d.forward" title="neuralop.models.TFNO1d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.TFNO1d.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.TFNO1d.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.TFNO2d.html b/dev/modules/generated/neuralop.models.TFNO2d.html
index 51922ec..0c6e7d9 100644
--- a/dev/modules/generated/neuralop.models.TFNO2d.html
+++ b/dev/modules/generated/neuralop.models.TFNO2d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -181,37 +181,23 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.TFNO2d.forward" title="neuralop.models.TFNO2d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.TFNO2d.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.TFNO2d.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.TFNO3d.html b/dev/modules/generated/neuralop.models.TFNO3d.html
index 2f23d86..55ae525 100644
--- a/dev/modules/generated/neuralop.models.TFNO3d.html
+++ b/dev/modules/generated/neuralop.models.TFNO3d.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -183,37 +183,23 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.TFNO3d.forward" title="neuralop.models.TFNO3d.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x[, output_shape])</p></td>
-<td><p>FNO's forward pass</p></td>
+<td><p>TFNO's forward pass</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.TFNO3d.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">output_shape</span></span><span class="o"><span class="pre">=</span></span><span class="default_value"><span class="pre">None</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="headerlink" href="#neuralop.models.TFNO3d.forward" title="Link to this definition"></a></dt>
-<dd><p>FNO’s forward pass</p>
-<ol class="arabic simple">
-<li><p>Applies optional positional encoding</p></li>
-<li><dl class="simple">
-<dt>Sends inputs through a lifting layer to a high-dimensional latent</dt><dd><p>space</p>
-</dd>
-</dl>
-</li>
-<li><p>Applies optional domain padding to high-dimensional intermediate function representation</p></li>
-<li><p>Applies <cite>n_layers</cite> Fourier/FNO layers in sequence (SpectralConvolution + skip connections, nonlinearity)</p></li>
-<li><p>If domain padding was applied, domain padding is removed</p></li>
-<li><p>Projection of intermediate function representation to the output channels</p></li>
-</ol>
+<dd><p>TFNO’s forward pass</p>
 <dl class="field-list simple">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
 <dd class="field-odd"><dl class="simple">
 <dt><strong>x</strong><span class="classifier">tensor</span></dt><dd><p>input tensor</p>
 </dd>
-<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.</p>
-<ul class="simple">
-<li><p>If None, don’t specify an output shape</p></li>
-<li><p>If tuple, specifies the output-shape of the <strong>last</strong> FNO Block</p></li>
-<li><p>If tuple list, specifies the exact output-shape of each FNO Block</p></li>
-</ul>
+<dt><strong>output_shape</strong><span class="classifier">{tuple, tuple list, None}, default is None</span></dt><dd><p>Gives the option of specifying the exact output shape for odd shaped inputs.
+* If None, don’t specify an output shape
+* If tuple, specifies the output-shape of the <strong>last</strong> FNO Block
+* If tuple list, specifies the exact output-shape of each FNO Block</p>
 </dd>
 </dl>
 </dd>
diff --git a/dev/modules/generated/neuralop.models.UNO.html b/dev/modules/generated/neuralop.models.UNO.html
index fb85c54..1a491b2 100644
--- a/dev/modules/generated/neuralop.models.UNO.html
+++ b/dev/modules/generated/neuralop.models.UNO.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -164,7 +164,7 @@
 <h1><a class="reference internal" href="../api.html#module-neuralop.models" title="neuralop.models"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.models</span></code></a>.UNO<a class="headerlink" href="#neuralop-models-uno" title="Link to this heading"></a></h1>
 <dl class="py class">
 <dt class="sig sig-object py" id="neuralop.models.UNO">
-<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">UNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">hidden_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">lifting_channels=256</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">projection_channels=256</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">positional_embedding='grid'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers=4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_out_channels=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_n_modes=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_scalings=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">horizontal_skips_map=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">incremental_n_modes=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlp_dropout=0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlp_expansion=0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">norm=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">preactivation=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_skip='linear'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">horizontal_skip='linear'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlp_skip='soft-gating'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank=1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">integral_operator=&lt;class</span> <span class="pre">'neuralop.layers.spectral_convolution.SpectralConv'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">operator_block=&lt;class</span> <span class="pre">'neuralop.layers.fno_block.FNOBlocks'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation='factorized'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs={}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">domain_padding=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">domain_padding_mode='one-sided'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">**kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/uno.html#UNO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.UNO" title="Link to this definition"></a></dt>
+<em class="property"><span class="pre">class</span><span class="w"> </span></em><span class="sig-prename descclassname"><span class="pre">neuralop.models.</span></span><span class="sig-name descname"><span class="pre">UNO</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">in_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">out_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">hidden_channels</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">lifting_channels=256</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">projection_channels=256</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">positional_embedding='grid'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">n_layers=4</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_out_channels=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_n_modes=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">uno_scalings=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">horizontal_skips_map=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">incremental_n_modes=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">use_channel_mlp=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlpdropout=0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlpexpansion=0.5</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">non_linearity=&lt;built-in</span> <span class="pre">function</span> <span class="pre">gelu&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">norm=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">preactivation=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fno_skip='linear'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">horizontal_skip='linear'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">channel_mlpskip='soft-gating'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">separable=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">factorization=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">rank=1.0</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">joint_factorization=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fixed_rank_modes=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">integral_operator=&lt;class</span> <span class="pre">'neuralop.layers.spectral_convolution.SpectralConv'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">operator_block=&lt;class</span> <span class="pre">'neuralop.layers.fno_block.FNOBlocks'&gt;</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">implementation='factorized'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">decomposition_kwargs={}</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">domain_padding=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">domain_padding_mode='one-sided'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">fft_norm='forward'</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">normalizer=None</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">verbose=False</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">**kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/uno.html#UNO"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.UNO" title="Link to this definition"></a></dt>
 <dd><p>U-Shaped Neural Operator <a href="#id2"><span class="problematic" id="id1">[1]_</span></a></p>
 <dl class="field-list">
 <dt class="field-odd">Parameters<span class="colon">:</span></dt>
@@ -209,9 +209,10 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 </ul>
 <p>This can be updated dynamically during training.</p>
 </dd>
-<dt><strong>channel_mlp_dropout: float, optional</strong></dt><dd><p>dropout parameter for channelMLP after each FNO Block</p>
+<dt><strong>use_channel_mlp</strong><span class="classifier">bool, optional</span></dt><dd><p>Whether to use an ChannelMLP layer after each FNO block, by default False</p>
 </dd>
-<dt><strong>channel_mlp_expansions: float, optional</strong></dt><dd><p>expansion parameter for channelMLP after each FNO block</p>
+<dt><strong>ChannelMLP</strong><span class="classifier">dict, optional</span></dt><dd><p>Parameters of the ChannelMLP, by default None
+{‘expansion’: float, ‘dropout’: float}</p>
 </dd>
 <dt><strong>non_linearity</strong><span class="classifier">nn.Module, optional</span></dt><dd><p>Non-Linearity module to use, by default F.gelu</p>
 </dd>
@@ -253,14 +254,14 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.models" titl
 <table class="autosummary longtable docutils align-default">
 <tbody>
 <tr class="row-odd"><td><p><a class="reference internal" href="#neuralop.models.UNO.forward" title="neuralop.models.UNO.forward"><code class="xref py py-obj docutils literal notranslate"><span class="pre">forward</span></code></a>(x, **kwargs)</p></td>
-<td><p>Defines the computation performed at every call.</p></td>
+<td><p>Define the computation performed at every call.</p></td>
 </tr>
 </tbody>
 </table>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.models.UNO.forward">
 <span class="sig-name descname"><span class="pre">forward</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">x</span></span></em>, <em class="sig-param"><span class="o"><span class="pre">**</span></span><span class="n"><span class="pre">kwargs</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/models/uno.html#UNO.forward"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.models.UNO.forward" title="Link to this definition"></a></dt>
-<dd><p>Defines the computation performed at every call.</p>
+<dd><p>Define the computation performed at every call.</p>
 <p>Should be overridden by all subclasses.</p>
 <div class="admonition note">
 <p class="admonition-title">Note</p>
diff --git a/dev/modules/generated/neuralop.models.base_model.available_models.html b/dev/modules/generated/neuralop.models.base_model.available_models.html
index b8b875b..e842bca 100644
--- a/dev/modules/generated/neuralop.models.base_model.available_models.html
+++ b/dev/modules/generated/neuralop.models.base_model.available_models.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.models.base_model.get_model.html b/dev/modules/generated/neuralop.models.base_model.get_model.html
index def6a66..3152bb8 100644
--- a/dev/modules/generated/neuralop.models.base_model.get_model.html
+++ b/dev/modules/generated/neuralop.models.base_model.get_model.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.training.IncrementalFNOTrainer.html b/dev/modules/generated/neuralop.training.IncrementalFNOTrainer.html
index e6e191d..68d31c6 100644
--- a/dev/modules/generated/neuralop.training.IncrementalFNOTrainer.html
+++ b/dev/modules/generated/neuralop.training.IncrementalFNOTrainer.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -168,12 +168,6 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.training" ti
 <dd><p>IncrementalFNOTrainer subclasses the Trainer 
 to implement specific logic for the Incremental-FNO
 as described in <a href="#id3"><span class="problematic" id="id1">[1]_</span></a>.</p>
-<p class="rubric">References</p>
-<dl class="simple" id="id2">
-<dt>George, R., Zhao, J., Kossaifi, J., Li, Z., and Anandkumar, A. (2024)</dt><dd><p>“Incremental Spatial and Spectral Learning of Neural Operators for Solving Large-Scale PDEs”.
-ArXiv preprint, <a class="reference external" href="https://arxiv.org/pdf/2211.15188">https://arxiv.org/pdf/2211.15188</a></p>
-</dd>
-</dl>
 <p class="rubric">Methods</p>
 <table class="autosummary longtable docutils align-default">
 <tbody>
@@ -191,6 +185,12 @@ <h1><a class="reference internal" href="../api.html#module-neuralop.training" ti
 </tr>
 </tbody>
 </table>
+<p class="rubric">References</p>
+<dl class="simple" id="id2">
+<dt>George, R., Zhao, J., Kossaifi, J., Li, Z., and Anandkumar, A. (2024)</dt><dd><p>“Incremental Spatial and Spectral Learning of Neural Operators for Solving Large-Scale PDEs”.
+ArXiv preprint, <a class="reference external" href="https://arxiv.org/pdf/2211.15188">https://arxiv.org/pdf/2211.15188</a></p>
+</dd>
+</dl>
 <dl class="py method">
 <dt class="sig sig-object py" id="neuralop.training.IncrementalFNOTrainer.train_one_epoch">
 <span class="sig-name descname"><span class="pre">train_one_epoch</span></span><span class="sig-paren">(</span><em class="sig-param"><span class="n"><span class="pre">epoch</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">train_loader</span></span></em>, <em class="sig-param"><span class="n"><span class="pre">training_loss</span></span></em><span class="sig-paren">)</span><a class="reference internal" href="../../_modules/neuralop/training/incremental.html#IncrementalFNOTrainer.train_one_epoch"><span class="viewcode-link"><span class="pre">[source]</span></span></a><a class="headerlink" href="#neuralop.training.IncrementalFNOTrainer.train_one_epoch" title="Link to this definition"></a></dt>
diff --git a/dev/modules/generated/neuralop.training.Trainer.html b/dev/modules/generated/neuralop.training.Trainer.html
index 0140a6f..12e230c 100644
--- a/dev/modules/generated/neuralop.training.Trainer.html
+++ b/dev/modules/generated/neuralop.training.Trainer.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.html b/dev/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.html
deleted file mode 100644
index fc77b8d..0000000
--- a/dev/modules/generated/neuralop.training.callbacks.BasicLoggerCallback.html
+++ /dev/null
@@ -1,207 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.training.callbacks.BasicLoggerCallback &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-training-callbacks-basicloggercallback">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.training.callbacks</span></code>.BasicLoggerCallback<a class="headerlink" href="#neuralop-training-callbacks-basicloggercallback" title="Link to this heading"></a></h1>
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.training.callbacks.Callback.html b/dev/modules/generated/neuralop.training.callbacks.Callback.html
deleted file mode 100644
index 51e28f8..0000000
--- a/dev/modules/generated/neuralop.training.callbacks.Callback.html
+++ /dev/null
@@ -1,207 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.training.callbacks.Callback &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-training-callbacks-callback">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.training.callbacks</span></code>.Callback<a class="headerlink" href="#neuralop-training-callbacks-callback" title="Link to this heading"></a></h1>
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/modules/generated/neuralop.training.callbacks.CheckpointCallback.html b/dev/modules/generated/neuralop.training.callbacks.CheckpointCallback.html
deleted file mode 100644
index 9ee64b0..0000000
--- a/dev/modules/generated/neuralop.training.callbacks.CheckpointCallback.html
+++ /dev/null
@@ -1,207 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>neuralop.training.callbacks.CheckpointCallback &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../../index.html">
-            <img src="../../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="../../user_guide/index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../user_guide/index.html">User guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="neuralop-training-callbacks-checkpointcallback">
-<h1><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.training.callbacks</span></code>.CheckpointCallback<a class="headerlink" href="#neuralop-training-callbacks-checkpointcallback" title="Link to this heading"></a></h1>
-<div class="clearer"></div></section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/objects.inv b/dev/objects.inv
index 8941110..bb3ec0f 100644
Binary files a/dev/objects.inv and b/dev/objects.inv differ
diff --git a/dev/py-modindex.html b/dev/py-modindex.html
index f38b35c..3a47e8c 100644
--- a/dev/py-modindex.html
+++ b/dev/py-modindex.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -147,11 +147,6 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="modules/api.html#module-neuralop.layers"><code class="xref">neuralop.layers</code></a></td><td>
        <em></em></td></tr>
-     <tr class="cg-1">
-       <td></td>
-       <td>&#160;&#160;&#160;
-       <a href="modules/api.html#module-neuralop.layers.embeddings"><code class="xref">neuralop.layers.embeddings</code></a></td><td>
-       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
diff --git a/dev/search.html b/dev/search.html
index d587713..400b225 100644
--- a/dev/search.html
+++ b/dev/search.html
@@ -16,7 +16,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/searchindex.js b/dev/searchindex.js
index fb3cb6d..7a26a56 100644
--- a/dev/searchindex.js
+++ b/dev/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"alltitles": {"2D poisson equation": [[59, "d-poisson-equation"]], "A simple Darcy-Flow dataset": [[6, "a-simple-darcy-flow-dataset"]], "A simple Darcy-Flow spectrum analysis": [[7, "a-simple-darcy-flow-spectrum-analysis"]], "API reference": [[13, "api-reference"]], "As an Iterative Solver": [[59, "as-an-iterative-solver"]], "Building the documentation": [[11, "building-the-documentation"]], "Cloning the github repository": [[11, "cloning-the-github-repository"]], "Computation times": [[9, "computation-times"], [56, "computation-times"]], "Conclusion": [[57, "conclusion"], [59, "conclusion"]], "Data": [[13, "data"]], "DataProcessors": [[13, "dataprocessors"]], "Distributed Training": [[61, "distributed-training"]], "Experiments": [[57, "experiments"]], "Experiments: Poisson Equations": [[59, "experiments-poisson-equations"]], "Experiments: generalization of resolution": [[59, "experiments-generalization-of-resolution"]], "FNO": [[13, "fno"]], "Fourier Layer": [[57, "fourier-layer"]], "Fourier Neural Operators": [[57, "fourier-neural-operators"]], "Framework of Neural Operators": [[57, "framework-of-neural-operators"]], "Gallery of examples": [[1, "gallery-of-examples"]], "Geometry-Informed Neural Operators (GINO)": [[13, "geometry-informed-neural-operators-gino"]], "Graph Neural Networks": [[59, "graph-neural-networks"]], "Implementation": [[57, "implementation"]], "Import the library": [[6, "import-the-library"], [7, "import-the-library"]], "Installing NeuralOperator": [[11, "installing-neuraloperator"]], "Installing with pip (recommended)": [[11, "installing-with-pip-recommended"]], "Introduction": [[59, "introduction"]], "Kernel Formulation": [[59, "kernel-formulation"]], "Layers": [[13, "module-neuralop.layers"]], "Limitation of Fixed Discretization": [[59, "limitation-of-fixed-discretization"]], "Load the dataset": [[6, "load-the-dataset"]], "Model Dispatching": [[13, "model-dispatching"]], "Models": [[13, "models"]], "Neural Operators: an Introduction": [[59, "neural-operators-an-introduction"]], "Neural operator layers": [[13, "neural-operator-layers"]], "Nystrom Approximation": [[59, "nystrom-approximation"]], "Operator Learning": [[59, "operator-learning"]], "Operator learning": [[57, "operator-learning"]], "Other resolution invariant operations": [[13, "other-resolution-invariant-operations"]], "Pre-requisite": [[11, "pre-requisite"]], "Problem Setting": [[59, "problem-setting"]], "Quick-Start": [[60, "quick-start"]], "Quickstart": [[10, "quickstart"]], "References": [[57, "references"], [59, "references"]], "Running the tests": [[11, "running-the-tests"]], "Short summary": [[7, "short-summary"]], "Spherical Fourier Neural Operators (SFNO)": [[13, "spherical-fourier-neural-operators-sfno"]], "Tensorized FNO (TFNO)": [[13, "tensorized-fno-tfno"]], "The Trainer class": [[61, "the-trainer-class"]], "Training": [[13, "training"]], "Training a SFNO on the spherical Shallow Water equations": [[3, "training-a-sfno-on-the-spherical-shallow-water-equations"]], "Training a TFNO on Darcy-Flow": [[0, "training-a-tfno-on-darcy-flow"]], "Training a neural operator on Darcy-Flow - Author Robert Joseph George": [[8, "training-a-neural-operator-on-darcy-flow-author-robert-joseph-george"]], "Training an FNO on Darcy-Flow": [[2, "training-an-fno-on-darcy-flow"]], "Training neural operator models": [[61, "training-neural-operator-models"]], "U-NO on Darcy-Flow": [[4, "u-no-on-darcy-flow"]], "U-shaped Neural Operators (U-NO)": [[13, "u-shaped-neural-operators-u-no"]], "User guide": [[58, "user-guide"]], "Using torchtnt to count FLOPS": [[5, "using-torchtnt-to-count-flops"]], "Visualizing the data": [[6, "visualizing-the-data"]], "neuralop.data.datasets.load_darcy_flow_small": [[14, "neuralop-data-datasets-load-darcy-flow-small"]], "neuralop.data.transforms.data_processors.DefaultDataProcessor": [[15, "neuralop-data-transforms-data-processors-defaultdataprocessor"]], "neuralop.data.transforms.data_processors.MGPatchingDataProcessor": [[16, "neuralop-data-transforms-data-processors-mgpatchingdataprocessor"]], "neuralop.datasets.data_transforms.DefaultDataProcessor": [[17, "neuralop-datasets-data-transforms-defaultdataprocessor"]], "neuralop.datasets.data_transforms.MGPatchingDataProcessor": [[18, "neuralop-datasets-data-transforms-mgpatchingdataprocessor"]], "neuralop.datasets.load_darcy_flow_small": [[19, "neuralop-datasets-load-darcy-flow-small"]], "neuralop.layers.embeddings.GridEmbedding2D": [[20, "neuralop-layers-embeddings-gridembedding2d"]], "neuralop.layers.embeddings.GridEmbeddingND": [[21, "neuralop-layers-embeddings-gridembeddingnd"]], "neuralop.layers.embeddings.SinusoidalEmbedding2D": [[22, "neuralop-layers-embeddings-sinusoidalembedding2d"]], "neuralop.layers.gno_block.GNOBlock": [[23, "neuralop-layers-gno-block-gnoblock"]], "neuralop.layers.integral_transform.IntegralTransform": [[24, "neuralop-layers-integral-transform-integraltransform"]], "neuralop.layers.neighbor_search.NeighborSearch": [[25, "neuralop-layers-neighbor-search-neighborsearch"]], "neuralop.layers.neighbor_search.native_neighbor_search": [[26, "neuralop-layers-neighbor-search-native-neighbor-search"]], "neuralop.layers.padding.DomainPadding": [[27, "neuralop-layers-padding-domainpadding"]], "neuralop.layers.skip_connections.SoftGating": [[28, "neuralop-layers-skip-connections-softgating"]], "neuralop.layers.skip_connections.skip_connection": [[29, "neuralop-layers-skip-connections-skip-connection"]], "neuralop.layers.spectral_convolution.SpectralConv": [[30, "neuralop-layers-spectral-convolution-spectralconv"]], "neuralop.layers.spectral_convolution.SpectralConv1d": [[31, "neuralop-layers-spectral-convolution-spectralconv1d"]], "neuralop.layers.spectral_convolution.SpectralConv2d": [[32, "neuralop-layers-spectral-convolution-spectralconv2d"]], "neuralop.layers.spectral_convolution.SpectralConv3d": [[33, "neuralop-layers-spectral-convolution-spectralconv3d"]], "neuralop.layers.spherical_convolution.SphericalConv": [[34, "neuralop-layers-spherical-convolution-sphericalconv"]], "neuralop.losses.H1Loss": [[35, "neuralop-losses-h1loss"]], "neuralop.losses.LpLoss": [[36, "neuralop-losses-lploss"]], "neuralop.losses.MSELoss": [[37, "neuralop-losses-mseloss"]], "neuralop.models.FNO": [[12, "neuralop-models-fno"], [38, "neuralop-models-fno"]], "neuralop.models.FNO1d": [[39, "neuralop-models-fno1d"]], "neuralop.models.FNO2d": [[40, "neuralop-models-fno2d"]], "neuralop.models.FNO3d": [[41, "neuralop-models-fno3d"]], "neuralop.models.GINO": [[42, "neuralop-models-gino"]], "neuralop.models.SFNO": [[43, "neuralop-models-sfno"]], "neuralop.models.TFNO": [[44, "neuralop-models-tfno"]], "neuralop.models.TFNO1d": [[45, "neuralop-models-tfno1d"]], "neuralop.models.TFNO2d": [[46, "neuralop-models-tfno2d"]], "neuralop.models.TFNO3d": [[47, "neuralop-models-tfno3d"]], "neuralop.models.UNO": [[48, "neuralop-models-uno"]], "neuralop.models.base_model.available_models": [[49, "neuralop-models-base-model-available-models"]], "neuralop.models.base_model.get_model": [[50, "neuralop-models-base-model-get-model"]], "neuralop.training.IncrementalFNOTrainer": [[51, "neuralop-training-incrementalfnotrainer"]], "neuralop.training.Trainer": [[52, "neuralop-training-trainer"]], "neuralop.training.callbacks.BasicLoggerCallback": [[53, "neuralop-training-callbacks-basicloggercallback"]], "neuralop.training.callbacks.Callback": [[54, "neuralop-training-callbacks-callback"]], "neuralop.training.callbacks.CheckpointCallback": [[55, "neuralop-training-callbacks-checkpointcallback"]], "poisson equation": [[59, "poisson-equation"]]}, "docnames": ["auto_examples/checkpoint_FNO_darcy", "auto_examples/index", "auto_examples/plot_FNO_darcy", "auto_examples/plot_SFNO_swe", "auto_examples/plot_UNO_darcy", "auto_examples/plot_count_flops", "auto_examples/plot_darcy_flow", "auto_examples/plot_darcy_flow_spectrum", "auto_examples/plot_incremental_FNO_darcy", "auto_examples/sg_execution_times", "index", "install", "modules/_autosummary/neuralop.models.FNO", "modules/api", "modules/generated/neuralop.data.datasets.load_darcy_flow_small", "modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor", "modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor", "modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor", "modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor", "modules/generated/neuralop.datasets.load_darcy_flow_small", "modules/generated/neuralop.layers.embeddings.GridEmbedding2D", "modules/generated/neuralop.layers.embeddings.GridEmbeddingND", "modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D", "modules/generated/neuralop.layers.gno_block.GNOBlock", "modules/generated/neuralop.layers.integral_transform.IntegralTransform", "modules/generated/neuralop.layers.neighbor_search.NeighborSearch", "modules/generated/neuralop.layers.neighbor_search.native_neighbor_search", "modules/generated/neuralop.layers.padding.DomainPadding", "modules/generated/neuralop.layers.skip_connections.SoftGating", "modules/generated/neuralop.layers.skip_connections.skip_connection", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d", "modules/generated/neuralop.layers.spherical_convolution.SphericalConv", "modules/generated/neuralop.losses.H1Loss", "modules/generated/neuralop.losses.LpLoss", "modules/generated/neuralop.losses.MSELoss", "modules/generated/neuralop.models.FNO", "modules/generated/neuralop.models.FNO1d", "modules/generated/neuralop.models.FNO2d", "modules/generated/neuralop.models.FNO3d", "modules/generated/neuralop.models.GINO", "modules/generated/neuralop.models.SFNO", "modules/generated/neuralop.models.TFNO", "modules/generated/neuralop.models.TFNO1d", "modules/generated/neuralop.models.TFNO2d", "modules/generated/neuralop.models.TFNO3d", "modules/generated/neuralop.models.UNO", "modules/generated/neuralop.models.base_model.available_models", "modules/generated/neuralop.models.base_model.get_model", "modules/generated/neuralop.training.IncrementalFNOTrainer", "modules/generated/neuralop.training.Trainer", "modules/generated/neuralop.training.callbacks.BasicLoggerCallback", "modules/generated/neuralop.training.callbacks.Callback", "modules/generated/neuralop.training.callbacks.CheckpointCallback", "sg_execution_times", "user_guide/fno", "user_guide/index", "user_guide/neural_operators", "user_guide/quickstart", "user_guide/training"], "envversion": {"sphinx": 61, "sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.todo": 2, "sphinx.ext.viewcode": 1}, "filenames": ["auto_examples/checkpoint_FNO_darcy.rst", "auto_examples/index.rst", "auto_examples/plot_FNO_darcy.rst", "auto_examples/plot_SFNO_swe.rst", "auto_examples/plot_UNO_darcy.rst", "auto_examples/plot_count_flops.rst", "auto_examples/plot_darcy_flow.rst", "auto_examples/plot_darcy_flow_spectrum.rst", "auto_examples/plot_incremental_FNO_darcy.rst", "auto_examples/sg_execution_times.rst", "index.rst", "install.rst", "modules/_autosummary/neuralop.models.FNO.rst", "modules/api.rst", "modules/generated/neuralop.data.datasets.load_darcy_flow_small.rst", "modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.rst", "modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.rst", "modules/generated/neuralop.datasets.data_transforms.DefaultDataProcessor.rst", "modules/generated/neuralop.datasets.data_transforms.MGPatchingDataProcessor.rst", "modules/generated/neuralop.datasets.load_darcy_flow_small.rst", "modules/generated/neuralop.layers.embeddings.GridEmbedding2D.rst", "modules/generated/neuralop.layers.embeddings.GridEmbeddingND.rst", "modules/generated/neuralop.layers.embeddings.SinusoidalEmbedding2D.rst", "modules/generated/neuralop.layers.gno_block.GNOBlock.rst", "modules/generated/neuralop.layers.integral_transform.IntegralTransform.rst", "modules/generated/neuralop.layers.neighbor_search.NeighborSearch.rst", "modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.rst", "modules/generated/neuralop.layers.padding.DomainPadding.rst", "modules/generated/neuralop.layers.skip_connections.SoftGating.rst", "modules/generated/neuralop.layers.skip_connections.skip_connection.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.rst", "modules/generated/neuralop.layers.spherical_convolution.SphericalConv.rst", "modules/generated/neuralop.losses.H1Loss.rst", "modules/generated/neuralop.losses.LpLoss.rst", "modules/generated/neuralop.losses.MSELoss.rst", "modules/generated/neuralop.models.FNO.rst", "modules/generated/neuralop.models.FNO1d.rst", "modules/generated/neuralop.models.FNO2d.rst", "modules/generated/neuralop.models.FNO3d.rst", "modules/generated/neuralop.models.GINO.rst", "modules/generated/neuralop.models.SFNO.rst", "modules/generated/neuralop.models.TFNO.rst", "modules/generated/neuralop.models.TFNO1d.rst", "modules/generated/neuralop.models.TFNO2d.rst", "modules/generated/neuralop.models.TFNO3d.rst", "modules/generated/neuralop.models.UNO.rst", "modules/generated/neuralop.models.base_model.available_models.rst", "modules/generated/neuralop.models.base_model.get_model.rst", "modules/generated/neuralop.training.IncrementalFNOTrainer.rst", "modules/generated/neuralop.training.Trainer.rst", "modules/generated/neuralop.training.callbacks.BasicLoggerCallback.rst", "modules/generated/neuralop.training.callbacks.Callback.rst", "modules/generated/neuralop.training.callbacks.CheckpointCallback.rst", "sg_execution_times.rst", "user_guide/fno.rst", "user_guide/index.rst", "user_guide/neural_operators.rst", "user_guide/quickstart.rst", "user_guide/training.rst"], "indexentries": {"fno (class in neuralop.models)": [[12, "neuralop.models.FNO", false], [38, "neuralop.models.FNO", false]], "fno1d (class in neuralop.models)": [[39, "neuralop.models.FNO1d", false]], "fno2d (class in neuralop.models)": [[40, "neuralop.models.FNO2d", false]], "fno3d (class in neuralop.models)": [[41, "neuralop.models.FNO3d", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv method)": [[30, "neuralop.layers.spectral_convolution.SpectralConv.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv1d method)": [[31, "neuralop.layers.spectral_convolution.SpectralConv1d.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv2d method)": [[32, "neuralop.layers.spectral_convolution.SpectralConv2d.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv3d method)": [[33, "neuralop.layers.spectral_convolution.SpectralConv3d.forward", false]], "forward() (neuralop.layers.spherical_convolution.sphericalconv method)": [[34, "neuralop.layers.spherical_convolution.SphericalConv.forward", false]], "forward() (neuralop.models.fno method)": [[12, "neuralop.models.FNO.forward", false], [38, "neuralop.models.FNO.forward", false]], "forward() (neuralop.models.sfno method)": [[43, "neuralop.models.SFNO.forward", false]], "forward() (neuralop.models.tfno method)": [[44, "neuralop.models.TFNO.forward", false]], "forward() (neuralop.models.tfno1d method)": [[45, "neuralop.models.TFNO1d.forward", false]], "forward() (neuralop.models.tfno2d method)": [[46, "neuralop.models.TFNO2d.forward", false]], "forward() (neuralop.models.tfno3d method)": [[47, "neuralop.models.TFNO3d.forward", false]], "module": [[13, "module-neuralop.data.datasets", false], [13, "module-neuralop.data.transforms.data_processors", false], [13, "module-neuralop.layers", false], [13, "module-neuralop.layers.embeddings", false], [13, "module-neuralop.layers.integral_transform", false], [13, "module-neuralop.layers.neighbor_search", false], [13, "module-neuralop.layers.padding", false], [13, "module-neuralop.layers.skip_connections", false], [13, "module-neuralop.layers.spectral_convolution", false], [13, "module-neuralop.layers.spherical_convolution", false], [13, "module-neuralop.losses", false], [13, "module-neuralop.models", false], [13, "module-neuralop.models.base_model", false], [13, "module-neuralop.training", false]], "neuralop.data.datasets": [[13, "module-neuralop.data.datasets", false]], "neuralop.data.transforms.data_processors": [[13, "module-neuralop.data.transforms.data_processors", false]], "neuralop.layers": [[13, "module-neuralop.layers", false]], "neuralop.layers.embeddings": [[13, "module-neuralop.layers.embeddings", false]], "neuralop.layers.integral_transform": [[13, "module-neuralop.layers.integral_transform", false]], "neuralop.layers.neighbor_search": [[13, "module-neuralop.layers.neighbor_search", false]], "neuralop.layers.padding": [[13, "module-neuralop.layers.padding", false]], "neuralop.layers.skip_connections": [[13, "module-neuralop.layers.skip_connections", false]], "neuralop.layers.spectral_convolution": [[13, "module-neuralop.layers.spectral_convolution", false]], "neuralop.layers.spherical_convolution": [[13, "module-neuralop.layers.spherical_convolution", false]], "neuralop.losses": [[13, "module-neuralop.losses", false]], "neuralop.models": [[13, "module-neuralop.models", false]], "neuralop.models.base_model": [[13, "module-neuralop.models.base_model", false]], "neuralop.training": [[13, "module-neuralop.training", false]], "sfno (class in neuralop.models)": [[43, "neuralop.models.SFNO", false]], "spectralconv (class in neuralop.layers.spectral_convolution)": [[30, "neuralop.layers.spectral_convolution.SpectralConv", false]], "spectralconv1d (class in neuralop.layers.spectral_convolution)": [[31, "neuralop.layers.spectral_convolution.SpectralConv1d", false]], "spectralconv2d (class in neuralop.layers.spectral_convolution)": [[32, "neuralop.layers.spectral_convolution.SpectralConv2d", false]], "spectralconv3d (class in neuralop.layers.spectral_convolution)": [[33, "neuralop.layers.spectral_convolution.SpectralConv3d", false]], "sphericalconv (class in neuralop.layers.spherical_convolution)": [[34, "neuralop.layers.spherical_convolution.SphericalConv", false]], "tfno (class in neuralop.models)": [[44, "neuralop.models.TFNO", false]], "tfno1d (class in neuralop.models)": [[45, "neuralop.models.TFNO1d", false]], "tfno2d (class in neuralop.models)": [[46, "neuralop.models.TFNO2d", false]], "tfno3d (class in neuralop.models)": [[47, "neuralop.models.TFNO3d", false]], "transform() (neuralop.layers.spectral_convolution.spectralconv method)": [[30, "neuralop.layers.spectral_convolution.SpectralConv.transform", false]], "transform() (neuralop.layers.spherical_convolution.sphericalconv method)": [[34, "neuralop.layers.spherical_convolution.SphericalConv.transform", false]]}, "objects": {"neuralop": [[13, 0, 0, "-", "layers"], [13, 0, 0, "-", "losses"], [13, 0, 0, "-", "models"], [13, 0, 0, "-", "training"]], "neuralop.data": [[13, 0, 0, "-", "datasets"]], "neuralop.data.datasets": [[14, 1, 1, "", "load_darcy_flow_small"]], "neuralop.data.transforms": [[13, 0, 0, "-", "data_processors"]], "neuralop.data.transforms.data_processors": [[15, 2, 1, "", "DefaultDataProcessor"], [16, 2, 1, "", "MGPatchingDataProcessor"]], "neuralop.data.transforms.data_processors.DefaultDataProcessor": [[15, 3, 1, "", "forward"], [15, 3, 1, "", "postprocess"], [15, 3, 1, "", "preprocess"], [15, 3, 1, "", "to"]], "neuralop.data.transforms.data_processors.MGPatchingDataProcessor": [[16, 3, 1, "", "forward"], [16, 3, 1, "", "postprocess"], [16, 3, 1, "", "preprocess"], [16, 3, 1, "", "to"]], "neuralop.datasets": [[19, 1, 1, "", "load_darcy_flow_small"]], "neuralop.datasets.data_transforms": [[17, 4, 1, "", "DefaultDataProcessor"], [18, 4, 1, "", "MGPatchingDataProcessor"]], "neuralop.layers": [[13, 0, 0, "-", "embeddings"], [13, 0, 0, "-", "integral_transform"], [13, 0, 0, "-", "neighbor_search"], [13, 0, 0, "-", "padding"], [13, 0, 0, "-", "skip_connections"], [13, 0, 0, "-", "spectral_convolution"], [13, 0, 0, "-", "spherical_convolution"]], "neuralop.layers.embeddings": [[20, 2, 1, "", "GridEmbedding2D"], [21, 2, 1, "", "GridEmbeddingND"], [22, 2, 1, "", "SinusoidalEmbedding2D"]], "neuralop.layers.embeddings.GridEmbedding2D": [[20, 3, 1, "", "forward"], [20, 3, 1, "", "grid"]], "neuralop.layers.embeddings.GridEmbeddingND": [[21, 3, 1, "", "forward"], [21, 3, 1, "", "grid"]], "neuralop.layers.embeddings.SinusoidalEmbedding2D": [[22, 3, 1, "", "forward"]], "neuralop.layers.integral_transform": [[24, 2, 1, "", "IntegralTransform"]], "neuralop.layers.integral_transform.IntegralTransform": [[24, 3, 1, "", "forward"]], "neuralop.layers.neighbor_search": [[25, 2, 1, "", "NeighborSearch"], [26, 1, 1, "", "native_neighbor_search"]], "neuralop.layers.neighbor_search.NeighborSearch": [[25, 3, 1, "", "forward"]], "neuralop.layers.padding": [[27, 2, 1, "", "DomainPadding"]], "neuralop.layers.padding.DomainPadding": [[27, 3, 1, "", "forward"], [27, 3, 1, "", "pad"], [27, 3, 1, "", "unpad"]], "neuralop.layers.skip_connections": [[28, 2, 1, "", "SoftGating"], [29, 1, 1, "", "skip_connection"]], "neuralop.layers.skip_connections.SoftGating": [[28, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution": [[30, 2, 1, "", "SpectralConv"], [31, 2, 1, "", "SpectralConv1d"], [32, 2, 1, "", "SpectralConv2d"], [33, 2, 1, "", "SpectralConv3d"]], "neuralop.layers.spectral_convolution.SpectralConv": [[30, 3, 1, "", "forward"], [30, 3, 1, "", "transform"]], "neuralop.layers.spectral_convolution.SpectralConv1d": [[31, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution.SpectralConv2d": [[32, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution.SpectralConv3d": [[33, 3, 1, "", "forward"]], "neuralop.layers.spherical_convolution": [[34, 2, 1, "", "SphericalConv"]], "neuralop.layers.spherical_convolution.SphericalConv": [[34, 3, 1, "", "forward"], [34, 3, 1, "", "transform"]], "neuralop.losses": [[35, 2, 1, "", "H1Loss"], [36, 2, 1, "", "LpLoss"], [37, 2, 1, "", "MSELoss"]], "neuralop.losses.H1Loss": [[35, 3, 1, "", "abs"], [35, 3, 1, "", "compute_terms"], [35, 3, 1, "", "reduce_all"], [35, 3, 1, "", "rel"], [35, 3, 1, "", "uniform_h"]], "neuralop.losses.LpLoss": [[36, 3, 1, "", "abs"], [36, 3, 1, "", "reduce_all"], [36, 3, 1, "", "rel"], [36, 3, 1, "", "uniform_h"]], "neuralop.models": [[38, 2, 1, "", "FNO"], [39, 2, 1, "", "FNO1d"], [40, 2, 1, "", "FNO2d"], [41, 2, 1, "", "FNO3d"], [42, 2, 1, "", "GINO"], [43, 2, 1, "", "SFNO"], [44, 2, 1, "", "TFNO"], [45, 2, 1, "", "TFNO1d"], [46, 2, 1, "", "TFNO2d"], [47, 2, 1, "", "TFNO3d"], [48, 2, 1, "", "UNO"], [13, 0, 0, "-", "base_model"]], "neuralop.models.FNO": [[38, 3, 1, "", "forward"]], "neuralop.models.GINO": [[42, 3, 1, "", "forward"]], "neuralop.models.SFNO": [[43, 3, 1, "", "forward"]], "neuralop.models.TFNO": [[44, 3, 1, "", "forward"]], "neuralop.models.TFNO1d": [[45, 3, 1, "", "forward"]], "neuralop.models.TFNO2d": [[46, 3, 1, "", "forward"]], "neuralop.models.TFNO3d": [[47, 3, 1, "", "forward"]], "neuralop.models.UNO": [[48, 3, 1, "", "forward"]], "neuralop.models.base_model": [[49, 1, 1, "", "available_models"], [50, 1, 1, "", "get_model"]], "neuralop.training": [[51, 2, 1, "", "IncrementalFNOTrainer"], [52, 2, 1, "", "Trainer"]], "neuralop.training.IncrementalFNOTrainer": [[51, 3, 1, "", "loss_gap"], [51, 3, 1, "", "train_one_epoch"]], "neuralop.training.Trainer": [[52, 3, 1, "", "checkpoint"], [52, 3, 1, "", "eval_one_batch"], [52, 3, 1, "", "evaluate"], [52, 3, 1, "", "log_eval"], [52, 3, 1, "", "log_training"], [52, 3, 1, "", "on_epoch_start"], [52, 3, 1, "", "resume_state_from_dir"], [52, 3, 1, "", "train"], [52, 3, 1, "", "train_one_batch"], [52, 3, 1, "", "train_one_epoch"]]}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "function", "Python function"], "2": ["py", "class", "Python class"], "3": ["py", "method", "Python method"], "4": ["py", "attribute", "Python attribute"]}, "objtypes": {"0": "py:module", "1": "py:function", "2": "py:class", "3": "py:method", "4": "py:attribute"}, "terms": {"": [5, 7, 12, 13, 15, 16, 24, 27, 38, 42, 43, 44, 45, 46, 47, 51, 57, 59, 61], "0": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 16, 20, 21, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 48, 51, 56, 57, 59], "00": [9, 56], "000": [9, 56, 57], "0001": [2, 4, 8], "0008": 3, "001": [8, 51], "005": 57, "0064": 2, "008": [2, 4, 8], "0086": 57, "0098": 57, "01": [9, 56], "0108": 57, "0109": 57, "0128": 57, "0139": 57, "0142": 57, "0146": 57, "0149": 57, "0158": 57, "0160": 57, "0189": 57, "0200": 57, "0212": 57, "0217": 57, "0219": 57, "0221": 57, "0225": 57, "0244": 57, "0245": 57, "0251": 57, "0253": 57, "0255": 57, "0259": 57, "0298": 57, "0299": 57, "03": 8, "0322": 3, "033": 42, "0383": 57, "0391": 57, "0392": [8, 57], "0393": 57, "0395": 57, "0398": 57, "04": 8, "04143996722996235": 8, "0445": 57, "0461": 57, "0493": 57, "05": 10, "0520": 57, "06": [2, 3, 4, 8], "07": 8, "0701": 57, "0727": 57, "0820": 57, "08481": 10, "08895": 10, "0958": 57, "0965": 8, "0973": 57, "0x7f03bbb1be20": 5, "0x7f2f6dd18a00": 4, "0x7f2f6dd4d5a0": 4, "0x7f2f6dee84f0": 4, "0x7f746c2a2b90": 8, "0x7f746c2a2fe0": 8, "0x7f746c3ab1f0": 8, "0x7f746c5a3d90": 3, "0x7f746f238df0": 3, "0x7fca76f46830": 2, "0x7fca77766020": 2, "0x7fca77798ca0": 2, "1": [0, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 15, 16, 20, 21, 24, 27, 28, 30, 34, 35, 36, 38, 42, 43, 44, 48, 51, 52, 57, 59], "10": [0, 3, 7, 8, 51, 57], "100": [0, 2, 4, 6, 7, 8, 10, 59], "1000": [0, 2, 4, 10, 57], "10000": [22, 57], "100000": 59, "1000x": 57, "1011435": 57, "1024": 57, "104": 7, "1051": 3, "1073741824": 5, "10876385319232941": 2, "1097": 57, "11": 8, "1124073472": 5, "1126": 2, "1129": 2, "1150": [15, 16], "1168": 57, "1188385": 2, "1190": 57, "1192": 2, "12": [2, 3, 4, 8, 12, 38, 43, 44], "1268": 4, "127": 57, "12799895572662354": 4, "128": [3, 4, 5], "128x128": [0, 2, 3, 7], "13": 8, "1351": 4, "1356": 2, "13569302693009377": 3, "1359": 2, "1367": 2, "1384": 4, "138412032": 5, "139": 7, "1391": 3, "14": 8, "140": 8, "1407": 57, "141": 57, "1419": 2, "144": 2, "15": [2, 3, 4, 8, 57], "15188": 51, "1527": 4, "1543": 4, "1556": 57, "16": [0, 2, 3, 4, 6, 7, 8, 10, 14, 42, 59], "1624": 2, "1628": 3, "1629": 4, "1634": 2, "1636": 2, "1651": 2, "1671": 2, "16_h1": [2, 4, 8], "16_l2": [2, 4, 8], "16x16": 6, "17": 8, "1702": 4, "1711": 4, "1748": 2, "18": [2, 3, 4, 8, 57], "1814": 2, "1827": 2, "1858": 2, "186": 6, "1860": 4, "1865": 2, "1868": 2, "1877": 57, "1882": 2, "1893": 57, "19": 8, "1913": [15, 16], "1914": [15, 16], "1922": 2, "1938": 3, "1942": 2, "1967": 4, "1982": 57, "1998": 8, "1d": [31, 39, 45], "1e": [0, 2, 3, 4, 8, 57], "1st": 6, "2": [0, 2, 3, 4, 5, 6, 7, 8, 12, 15, 16, 21, 28, 29, 30, 36, 38, 43, 44, 48, 57, 59], "20": [0, 2, 3, 4, 7, 8, 10, 57], "200": [3, 59], "2010": 10, "2017": 59, "2020": [10, 57, 59], "2021": [10, 57], "2022": 48, "2023": 34, "2024": 51, "2041": 4, "2048": 57, "2056": 8, "2071": 4, "2075": [4, 8], "2077": 8, "2095": 2, "21": 57, "2108": 10, "211": 57, "2110305": 8, "2119": 2, "2129": 2, "2163": 3, "2186": 8, "2211": 51, "2213": 8, "2220": 8, "2240": 4, "2249": 8, "2262": 8, "2263": 8, "2268": 57, "2281": 4, "2293": 8, "2300": 4, "2301": 2, "2311": 57, "2313": 57, "2321": 8, "2324": [15, 16], "2325": [15, 16], "2327": 8, "2336": 2, "2344": 8, "2346": 8, "2382": [15, 16], "2388": 8, "23881882071495056": 8, "2389": 8, "2391": 8, "24": 57, "241": 59, "2417": 8, "2436": 2, "2462": 8, "2470445056": 5, "2484": 8, "2490": 8, "25": 57, "2505": 3, "2516": 8, "2522": 4, "2534": 4, "254": [4, 9, 56], "2547": 8, "256": [4, 12, 38, 42, 43, 44, 48, 57], "2580": 3, "26": 42, "2609": 8, "2642": 3, "2650": 8, "2656": 8, "266": 57, "2668": 3, "2683": 8, "268435456": 5, "2700097": 4, "272629760": 5, "2744": 8, "2753": 57, "275555": 3, "2758": 8, "2760": 8, "2774": 8, "2781": 3, "2793": 8, "28": [7, 57], "2827": 8, "283185307179586": [35, 36], "2855": 57, "2868": 8, "2872": 8, "2896": 2, "2983": 3, "2_": 57, "2d": [7, 20, 32, 40, 46, 48, 57, 58], "2nd": 6, "3": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 25, 38, 42, 43, 44, 48, 57, 59], "30": [0, 2, 3, 4, 8, 57], "302": 5, "3024": 8, "3028": 2, "3040": 8, "3064": 8, "3072": 8, "3098": 8, "3132": 2, "3154": 2, "3155": 8, "3172": 8, "3198": 8, "32": [0, 2, 3, 4, 6, 7, 8, 10, 14, 48, 59], "3203": 2, "3235": 8, "3238": 57, "32_h1": [2, 4, 8], "32_l2": [2, 4, 8], "32x32": 6, "33": [4, 9, 56], "3326": [2, 8], "3391": 8, "3392": 8, "3419": 8, "3420": [15, 16], "3434": 3, "3483": 4, "35": 4, "3511": 8, "3536": 8, "3597": 8, "36": 4, "3651": 8, "3683": 8, "3690": 8, "3741": [15, 16], "3745": 8, "3766": 8, "3769": 8, "38": 57, "3807": 2, "3812": 3, "3841": 8, "3889": 8, "3897": 2, "3904": 8, "3922": 8, "3938": 8, "398870412260294": 2, "3d": [7, 25, 33, 41, 47, 57], "4": [0, 2, 3, 4, 5, 6, 7, 8, 12, 38, 42, 43, 44, 48, 57], "4002": 8, "4004": 4, "4026": 8, "4096": 57, "411697438785008": 8, "4117": 8, "4120": 8, "4129": 8, "4136": 8, "414": 57, "4146": 8, "4164": 8, "4182": 8, "4194304": 5, "42": 0, "421": 57, "4253": 8, "4267": 8, "4273": 8, "43": 4, "4369": 3, "439005568623543": 4, "44": 4, "4443": [15, 16], "4482": 8, "451": 57, "4539": 8, "4542": 3, "4551": 8, "4566": 8, "4576": 4, "4672": 8, "4673": 8, "4694": 8, "47": 57, "4703": 8, "4715": 4, "4735": 3, "4739": 3, "4793": 8, "48": 57, "4821": 4, "4826": 3, "4890558464": 5, "4896": 8, "491": 57, "4938": 8, "4974": 4, "4983": 4, "4d": [15, 16], "5": [2, 3, 4, 7, 8, 10, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 51, 57, 59], "50": [0, 2, 3, 4, 6, 7, 8, 57], "500": 7, "5000": 7, "50331648": 5, "5040": 8, "5065": 2, "5112": [15, 16], "5113": [15, 16], "512": [12, 38, 42, 43, 44, 57], "517": 57, "5185": 2, "52": 4, "521": 3, "5245": 3, "5250": 3, "53": 2, "5304": 4, "5328": 3, "5358347818255424": 2, "537": 57, "54": 2, "5407": 4, "5427721077203751": 3, "5466": 8, "5479": 8, "55": 2, "5565": 3, "5571": 8, "558": 57, "5593": [15, 16], "5634": 8, "5682": 3, "5798": 4, "5917": 8, "5956": 4, "6": [2, 3, 4, 8, 35, 36, 57], "60": 57, "6035": 8, "61": 4, "6111": 8, "6122": [15, 16], "6166": 8, "6233": 2, "6245": 8, "63": 4, "64": [0, 2, 3, 4, 5, 10, 12, 38, 42, 43, 44, 48, 57], "641": 57, "6417": 8, "6421": 3, "6453": 4, "6485": 8, "6503": 4, "6512": 3, "6566": 4, "6586": 4, "66": 2, "6615": 8, "6651": 8, "6678": 2, "67": 57, "6737": 8, "6777": 8, "6873": 4, "6875": 4, "6886": 8, "6948": 8, "7": [2, 3, 4, 6, 8, 12, 38, 43, 44, 57], "724": 57, "7263": [2, 8], "73": 3, "7338": 4, "7358115278184414": 3, "7513": 8, "7625": 8, "7655": 8, "7665": 8, "7753": 3, "78": 57, "7822": 8, "7932": 8, "8": [4, 8, 9, 56], "80": [42, 57], "8183": 8, "8192": 57, "8209": 4, "8236": 8, "8269": 8, "8288": 2, "84": 3, "8454": 8, "85": 57, "8652": 3, "8821": 4, "8851": 8, "8e": [0, 2, 3, 4, 8], "9": [2, 3, 4, 8], "91": 3, "9194": 4, "950": 57, "96": 4, "9616": 4, "9626": 8, "98": [2, 3, 4, 6, 8], "99": 57, "999": [2, 3, 4, 8], "9998": 4, "9999": 8, "9999673664569855": 4, "A": [1, 9, 10, 20, 21, 24, 29, 51, 52, 56, 57], "And": [10, 57, 59], "As": [57, 58], "At": 59, "But": 59, "By": [7, 15, 42, 57, 59], "For": [7, 12, 24, 25, 38, 39, 40, 41, 43, 44, 45, 46, 47, 48, 57, 59, 61], "If": [8, 10, 11, 12, 24, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59], "In": [0, 2, 3, 4, 5, 6, 7, 8, 13, 15, 16, 30, 57, 59], "It": [7, 10, 11, 13, 57, 59], "Its": [15, 16], "NO": [1, 9, 48, 56], "NOs": 61, "On": 57, "That": [57, 59], "The": [6, 7, 10, 11, 12, 15, 16, 24, 27, 30, 38, 43, 44, 57, 58, 59, 60], "Then": [11, 24, 59], "There": 57, "These": 59, "To": [5, 10, 12, 13, 38, 43, 44, 57, 59, 61], "_": [5, 48, 51, 52, 57, 59], "__init__": [5, 57], "_a": 59, "_description_": 35, "_isht_cach": 3, "_l2": 3, "_sht_cach": 3, "_type_": 35, "a_j": 59, "ab": [10, 35, 36], "abil": 13, "abl": 59, "about": [57, 59], "abov": [12, 38, 42, 43, 44, 57, 59], "absolut": [35, 36, 37, 59], "accept": [15, 16], "accord": [35, 36, 59, 61], "accordingli": 50, "accumul": 8, "accur": 59, "accuraci": [57, 59], "achiev": [57, 59], "across": [7, 24, 35, 36, 52, 61], "act": [57, 59], "activ": [12, 28, 30, 31, 32, 33, 34, 38, 42, 43, 44, 57, 59], "actual": [0, 2, 3, 4, 50], "ada_in": [12, 38, 42, 43, 44], "adamw": [0, 2, 3, 4, 8], "adapt": 42, "add": [6, 7, 51, 57, 59], "add_subplot": [2, 3, 4, 6, 8], "addit": [7, 13, 15, 16, 30, 42, 48, 59], "adjust": [50, 61], "advanc": [12, 38, 43, 44], "advantag": [13, 57, 59], "after": [7, 42, 48], "afterward": [16, 20, 22, 48], "again": [7, 8, 30, 34, 59], "against": [24, 57], "aggreg": 59, "ai": 57, "aim": [57, 59, 60], "airfoil": 59, "al": 59, "algorithm": [8, 51, 59], "alia": [17, 18], "alias": [30, 34], "all": [1, 7, 8, 10, 11, 12, 15, 16, 20, 22, 24, 25, 30, 34, 35, 36, 38, 42, 43, 44, 48, 52, 56, 57, 59, 60, 61], "all_error": 52, "all_metr": 52, "allow": [7, 12, 30, 34, 38, 43, 44, 48, 57, 61], "almost": 59, "along": [12, 30, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48], "alreadi": [35, 36, 59], "also": [10, 13, 30, 34, 50, 57, 59, 61], "although": [16, 20, 22, 48, 57], "among": [57, 59], "amount": [27, 30, 57], "an": [1, 9, 10, 11, 12, 24, 27, 28, 29, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48, 50, 56, 57, 58], "anaconda": 11, "analys": 7, "analysi": [1, 9, 56], "analyt": 59, "analyz": 7, "anandkumar": [10, 34, 51, 57, 59], "andrew": [10, 57, 59], "ani": [7, 10, 13, 27, 57, 59], "anima": [10, 34, 57, 59], "anoth": [57, 59], "anymor": 59, "anyon": 61, "api": [10, 28, 61], "append": [6, 12, 38, 43, 44, 48], "appli": [7, 10, 12, 13, 27, 28, 30, 34, 38, 43, 44, 45, 46, 47, 48, 57], "applic": [13, 57, 59, 60], "approxim": [57, 58], "ar": [6, 8, 10, 11, 12, 15, 16, 24, 30, 34, 38, 43, 44, 48, 57, 59, 60, 61], "arang": 7, "arbitrari": [13, 25, 26, 57], "arch": 50, "architectur": [13, 48, 57, 59], "archiveprefix": 10, "area": 59, "aren": 50, "arg": [12, 15, 16, 19, 38, 39, 40, 41, 43, 44, 45, 46, 47], "argument": [15, 16, 50], "aris": 59, "around": 24, "art": 57, "articl": [10, 57], "arxiv": [10, 51], "ashiqur": 48, "associ": [13, 20, 21], "assum": [12, 16, 24, 38, 43, 44, 48, 59], "ast825": 7, "astronomi": 7, "asynchron": [15, 16], "attempt": 7, "attribut": [12, 30, 34, 35, 36, 38], "author": [1, 7, 9, 10, 56], "auto": [30, 31, 32, 33, 34], "auto_exampl": [9, 10], "auto_examples_jupyt": 1, "auto_examples_python": 1, "autoencod": 57, "autom": [10, 13, 61], "automat": [8, 13, 27, 30], "avail": [49, 59], "averag": [52, 59], "avg_lasso_loss": [2, 3, 4, 8, 51, 52], "avg_loss": [2, 3, 4, 8, 51, 52], "avoid": [30, 34], "awesom": 59, "ax": [2, 3, 4, 6, 7, 8], "axi": 7, "azizzadenesh": [10, 48, 57, 59], "b": [10, 24, 25, 48, 59], "b_r": 25, "back": 59, "backend": 61, "backward": 5, "ball": 25, "base": [5, 6, 8, 13, 34, 51, 57, 59], "basi": [30, 34, 57], "basic": [10, 52], "batch": [2, 3, 4, 6, 7, 15, 16, 20, 21, 24, 27, 28, 29, 42, 52, 57, 61], "batch_siz": [0, 2, 3, 4, 5, 6, 7, 8, 10, 14, 30, 31, 32, 33, 34], "batchsiz": [7, 57], "baust": 34, "bayesian": 57, "bear": 59, "becaus": [7, 57, 59], "becom": [57, 59], "been": 59, "befor": [8, 12, 15, 38, 42, 43, 44, 51], "begin": 52, "behavior": 7, "being": [12, 24, 38, 43, 44], "below": [5, 12, 15, 16, 38, 43, 44], "benchmark": [57, 59], "besid": 59, "best": [7, 10, 52, 57], "beta": [2, 3, 4, 8], "better": 57, "between": [10, 12, 13, 25, 26, 27, 35, 36, 37, 38, 42, 43, 44, 59, 60], "beyond": 30, "bhattacharya": [10, 57, 59], "bia": [2, 3, 4, 15, 16, 28, 29, 30, 31, 32, 33, 34, 57], "bibtex": 10, "big": 59, "bixi": 57, "black": 57, "block": [12, 13, 38, 42, 43, 44, 45, 46, 47, 48, 57], "blog": 59, "bmm": 5, "bodi": 59, "boilerpl": [13, 61], "bold": 59, "bonev": 34, "bool": [8, 12, 15, 24, 25, 28, 29, 30, 38, 42, 43, 44, 48, 51, 52], "bori": 34, "both": [6, 27, 52, 57, 59], "bottom": 57, "bound": 59, "boundari": 57, "box": [10, 57], "boxi": 57, "br": 57, "buffer": [7, 8, 15, 16], "build": [13, 24, 60], "built": [24, 42, 48], "bunch": 50, "burger": 57, "buriged": [10, 57, 59], "burn": 57, "c": [10, 24, 57], "cach": [20, 21], "calcul": 8, "call": [11, 15, 16, 20, 22, 48], "callabl": [24, 51], "can": [2, 3, 4, 7, 8, 10, 11, 12, 13, 15, 16, 30, 34, 38, 43, 44, 48, 52, 57, 59, 61], "cannot": [30, 59], "captur": [7, 57], "care": [16, 20, 22, 30, 48, 61], "carlo": [57, 59], "case": [7, 12, 30, 32, 33, 38, 43, 44, 50, 52, 61], "cast": [15, 16, 59], "cat": 7, "cd": 11, "cdata": 57, "cdot": [57, 59], "cdoubl": [15, 16], "center": [26, 59], "certain": 59, "cfloat": 57, "ch7": 7, "chain": 57, "chang": [7, 8, 30, 34, 59], "channel": [6, 12, 13, 14, 27, 28, 29, 30, 31, 32, 33, 34, 38, 42, 43, 44, 45, 46, 47, 48, 57], "channel_dim": 14, "channel_mlp": [3, 4, 24], "channel_mlp_dropout": [12, 38, 43, 44, 48], "channel_mlp_expans": [12, 38, 43, 44, 48], "channel_mlp_lay": 24, "channel_mlp_non_linear": 24, "channel_mlp_skip": [3, 4, 12, 38, 43, 44, 48], "channelmlp": [2, 3, 4, 12, 38, 42, 43, 44, 48], "channels_last": [15, 16], "chaotic": 57, "check": [5, 7, 13, 57, 59, 61], "checkpoint": [0, 10, 52], "checkpoint_fno_darci": [0, 9, 56], "choic": 57, "choos": 8, "christian": 34, "circ": 57, "cite": 10, "ckpt": 52, "class": [5, 12, 13, 15, 16, 20, 21, 22, 24, 25, 27, 28, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 51, 52, 57, 58, 59], "classic": [57, 59], "closer": 59, "closest": 30, "cmap": [2, 4, 6, 8], "cnn": [12, 38, 43, 44, 57], "coars": 57, "code": [0, 1, 2, 3, 4, 5, 6, 7, 8, 13, 57], "coeffcient": 57, "coeffici": [57, 59], "collat": 6, "collect": [5, 52, 59], "com": [11, 57], "combin": 57, "come": [10, 11, 59], "common": 59, "compar": [2, 3, 4, 5, 8, 57, 59], "compat": 28, "compl_mul2d": 57, "complex": [12, 15, 16, 30, 31, 32, 33, 34, 38, 43, 44, 52, 57], "complex128": [15, 16], "complex_data": [], "complexdensetensor": 3, "compon": [12, 38, 43, 44, 60], "comprehens": 10, "compris": 59, "comput": [5, 12, 15, 16, 20, 22, 24, 35, 36, 37, 38, 42, 43, 44, 48, 51, 57, 59, 61], "compute_term": 35, "concaten": [20, 21], "conclus": 58, "concret": 59, "condit": [57, 59], "conduct": 57, "config": [50, 57], "configur": [13, 50, 57], "confirm": 59, "connect": [12, 29, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48, 57], "consid": [57, 59], "consist": 57, "constant": [24, 35, 36], "constitu": 7, "construct": [57, 59], "contain": [15, 16, 24], "context": 59, "continu": [57, 59], "continuum": 57, "contract": [10, 12, 30, 38, 42, 43, 44, 48], "conv": [2, 3, 4, 5, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44], "conv1d": [2, 3, 4], "conv_modul": [12, 38, 43, 44], "conveni": [59, 60], "convent": 57, "converg": 57, "convert": [7, 10, 15, 16], "convolut": [5, 12, 13, 34, 38, 42, 43, 44, 48, 57, 59], "convolv": 57, "coordin": [13, 25, 26, 42], "copi": 5, "corr": 10, "correct_bia": [2, 3, 4, 8], "correspond": [7, 12, 28, 29, 34, 38, 43, 44, 50, 52], "cosineannealinglr": [0, 2, 3, 4, 8], "cost": [52, 57], "could": 59, "count": [1, 9, 56], "count_model_param": [0, 2, 3, 4, 8], "cp": [30, 34, 42, 48], "cpu": [0, 2, 3, 4, 5, 8, 15, 16, 20, 21, 24, 51, 52], "cr": [24, 25], "crack": 57, "creat": [0, 2, 3, 4, 5, 6, 8, 10, 13, 35, 36, 52, 57, 59], "cretiz": 57, "crucial": 59, "cuda": [3, 8, 15, 16, 20, 21], "current": 52, "cylind": 59, "d": [0, 2, 3, 4, 8, 13, 24, 25, 35, 36, 57, 59], "d1": [24, 27, 30, 31, 32, 33, 34], "d2": 24, "d3": 24, "dai": 59, "darci": [1, 3, 9, 10, 56, 57, 59], "data": [0, 2, 3, 4, 7, 8, 10, 12, 20, 21, 25, 26, 30, 35, 36, 38, 42, 43, 44, 52, 57, 59, 60, 61], "data_channel": 50, "data_dict": [15, 16], "data_load": 52, "data_loss": [2, 3, 4, 8], "data_processor": [0, 2, 4, 6, 7, 8, 10, 51, 52], "data_root": 14, "data_transform": 8, "dataload": [3, 51, 52], "dataset": [0, 1, 2, 3, 4, 7, 8, 9, 10, 13, 52, 56, 60], "dataset_indic": 8, "dataset_nam": 7, "dataset_pr": 7, "dataset_resolut": 8, "datset": 7, "dave": [7, 14], "db": [2, 4, 6, 7, 8], "deactiv": [12, 38, 43, 44], "deal": [30, 34, 57, 59], "decod": 57, "decompos": 7, "decomposit": [10, 12, 30, 38, 42, 43, 44, 48, 57], "decomposition_kwarg": [12, 30, 31, 32, 33, 34, 38, 43, 44, 48], "deconvolut": 57, "decreas": [51, 57], "deep": [57, 59], "deepcopi": 5, "def": [5, 57], "default": [5, 6, 8, 12, 15, 24, 27, 28, 29, 30, 34, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 52], "defaultdict": 5, "defin": [7, 16, 20, 22, 24, 42, 48, 57, 59], "deform": 57, "degrad": 57, "delta": [57, 59], "delta_x": 59, "demonstr": [0, 2, 3, 4, 5, 6, 7, 8], "denot": [48, 57, 59], "dens": [3, 10, 12, 30, 38, 43, 44, 48], "densetensor": [2, 4, 12, 38, 43, 44], "depend": [6, 7, 11, 13, 24, 57, 59], "depth": [41, 47], "depthwis": [12, 38, 42, 43, 44, 48], "deriv": [35, 59], "describ": 51, "descript": [24, 60], "design": 57, "desir": [15, 16, 27], "detach": [2, 3, 4, 8], "detail": [7, 12, 38, 43, 44, 48, 57, 61], "determinist": [15, 16], "develop": 59, "devic": [0, 2, 3, 4, 5, 8, 15, 16, 20, 21, 30, 31, 32, 33, 34, 51, 52, 57, 61], "di": 57, "diagon": 24, "dict": [5, 12, 15, 24, 30, 31, 32, 33, 38, 42, 43, 44, 48, 50, 52], "dictionari": [15, 52], "differ": [7, 30, 35, 57, 59], "differenti": [10, 57, 59], "difficult": 59, "diffus": 57, "dim": [6, 7, 12, 15, 21, 24, 27, 30, 35, 36, 38, 43, 44], "dimens": [7, 8, 12, 13, 24, 30, 35, 36, 38, 42, 43, 44, 48, 57, 59], "dimension": [12, 28, 29, 30, 35, 36, 38, 43, 44, 45, 46, 47, 57, 59], "directli": [10, 12, 13, 30, 38, 42, 43, 44, 48, 57, 59], "directori": 52, "dirichlet": 57, "discret": [12, 35, 36, 38, 43, 44, 48, 57, 58], "displai": 59, "distribiut": 11, "distribut": [7, 57, 58, 59], "distributeddataparallel": 61, "dn": [27, 30, 31, 32, 33, 34], "do": [10, 13, 57, 59, 61], "doc": [10, 11, 57], "document": [12, 38, 43, 44, 61], "doe": [12, 38, 43, 44, 48, 51, 57, 59], "domain": [7, 12, 13, 27, 30, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59, 61], "domain_pad": [4, 12, 27, 38, 43, 44, 48], "domain_padding_mod": [12, 38, 43, 44, 48], "domainpad": 4, "don": [12, 38, 43, 44, 45, 46, 47, 59], "dot": [57, 59], "doubl": [15, 16], "download": [0, 1, 2, 3, 4, 5, 6, 7, 8], "downsampl": [30, 34], "draw": 57, "drawback": 59, "drawn": 61, "driven": [57, 59], "dropout": [12, 38, 42, 43, 44, 48], "dtype": [7, 15, 16, 20, 21, 30, 31, 32, 33, 34, 57], "dure": [5, 12, 16, 30, 38, 43, 44, 48, 52], "dy": [24, 57, 59], "dynam": [12, 30, 34, 38, 43, 44, 48, 57, 59], "e": [11, 12, 15, 16, 30, 34, 38, 43, 44, 48, 57, 59], "each": [5, 8, 12, 13, 24, 25, 26, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48, 52, 57, 59], "easi": 61, "easier": 59, "easili": [11, 57, 60, 61], "eaxmpl": 48, "edg": [57, 59], "edit": 11, "edu": 7, "effici": [10, 57, 59], "effort": 59, "einsum": 57, "either": 36, "elast": [57, 59], "electr": 57, "element": [57, 59], "elif": 5, "ellipt": [57, 59], "els": [3, 8], "embed": [6, 12, 13, 38, 42, 43, 44, 48], "emploi": 59, "emsp": 10, "enabl": 10, "encod": [12, 14, 16, 20, 21, 38, 43, 44, 45, 46, 47, 57, 59], "encode_input": 14, "encode_output": [7, 14], "encount": 59, "end": [0, 2, 3, 4, 5, 6, 7, 8, 60], "endpoint": 22, "energi": 7, "engin": 57, "enough": 59, "entir": [24, 52], "entri": [12, 38, 43, 44, 48], "enumer": 3, "env": [15, 16], "ep": [2, 3, 4, 8, 59], "epoch": [0, 2, 3, 4, 8, 51, 52, 57], "epoch_gap": 8, "epoch_train_tim": [2, 3, 4, 8, 51], "eprint": 10, "equat": [1, 9, 10, 56, 57, 58], "equiangular": [3, 34], "equival": [10, 11, 57, 59], "error": [24, 37, 52, 57, 59], "especi": 59, "estim": [5, 57, 59], "et": 59, "etc": [12, 38, 43, 44], "euclidean": 59, "eval": [2, 3, 4, 8, 15, 52], "eval_interv": [0, 2, 3, 4, 10, 51, 52], "eval_loss": [0, 2, 3, 4, 8, 10, 52], "eval_metr": 52, "eval_one_batch": 52, "eval_step_loss": 52, "evalu": [52, 57, 59, 61], "evaluate_al": 52, "even": [30, 59], "everi": [16, 20, 22, 48], "everywher": 57, "exact": [12, 38, 43, 44, 45, 46, 47], "examin": 7, "exampl": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 15, 16, 24, 38, 43, 44, 48, 52, 56, 57, 59], "example_fno": 10, "exclud": [28, 29], "execut": [9, 56], "exist": [16, 35, 36, 57], "expans": [12, 38, 42, 43, 44, 48], "expect": [13, 15], "expens": 59, "experi": [11, 24, 58], "experiment": 10, "explain": 8, "explicit": 57, "express": 59, "extra": [12, 38, 43, 44], "extrapol": 59, "f": [0, 2, 3, 4, 5, 6, 8, 12, 24, 38, 42, 43, 44, 48, 52, 57, 59], "f_y": 24, "fact": 57, "factor": [0, 3, 10, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48], "factorizedspectralconv": 57, "factorizedtensor": [12, 38, 43, 44], "fairli": 59, "fallback": 42, "fals": [0, 2, 3, 4, 6, 7, 8, 10, 12, 14, 15, 16, 22, 24, 27, 28, 29, 30, 31, 32, 33, 34, 35, 38, 42, 43, 44, 48, 51, 52], "famili": 57, "fashion": 61, "fast": 57, "faster": [57, 59], "fc": [2, 3, 4, 5], "fcn": 57, "fdm": 57, "featur": [29, 42, 59], "feed": 59, "feedforward": [57, 59], "fem": 57, "few": [2, 3, 4, 8, 10, 59], "fft": [30, 42, 57], "fft_norm": [30, 31, 32, 33, 48], "field": [7, 57], "fig": [2, 3, 4, 6, 7, 8], "figsiz": [2, 3, 4, 6, 7, 8], "figur": [2, 3, 4, 6, 7, 8, 57, 59], "file": [9, 56], "filter": 57, "final": [8, 42, 57, 59], "find": [13, 25, 26, 59], "fine": [57, 59], "finit": [35, 57, 59], "first": [6, 7, 10, 57, 59], "fit": [2, 3, 4, 8], "five": 48, "fix": 58, "fix_x_bnd": 35, "fix_y_bnd": 35, "fix_z_bnd": 35, "fixed_rank_mod": [12, 30, 31, 32, 33, 34, 38, 43, 44, 48], "flattened1dconv": [2, 3, 4], "float": [5, 7, 12, 15, 16, 25, 26, 27, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 48, 51, 52], "float16": [15, 16], "float32": [30, 31, 32, 33, 34], "float64": [15, 16], "flop": [1, 9, 56], "flop_count": 5, "flop_count_dict": 5, "floptensordispatchmod": 5, "flow": [1, 3, 9, 10, 56, 57], "fluid": [7, 57, 59], "flush": [0, 2, 3, 4, 8], "fno": [0, 1, 3, 5, 6, 8, 9, 10, 30, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 51, 56, 57], "fno_ada_in_dim": 42, "fno_ada_in_featur": 42, "fno_backward_flop": 5, "fno_block": [2, 3, 4, 5, 12, 38, 44, 48], "fno_block_precis": [12, 30, 31, 32, 33, 34, 38, 42, 44], "fno_channel_mlp_dropout": 42, "fno_channel_mlp_expans": 42, "fno_channel_mlp_skip": 42, "fno_conv_modul": 42, "fno_decomposition_kwarg": 42, "fno_factor": 42, "fno_fixed_rank_mod": 42, "fno_forward_flop": 5, "fno_hidden_channel": 42, "fno_implement": 42, "fno_in_channel": 42, "fno_incremental_n_mod": 42, "fno_joint_factor": 42, "fno_n_lay": 42, "fno_n_mod": 42, "fno_non_linear": 42, "fno_norm": 42, "fno_preactiv": 42, "fno_projection_channel": 42, "fno_rank": 42, "fno_resolution_scaling_factor": 42, "fno_separ": 42, "fno_skip": [2, 3, 4, 5, 12, 38, 42, 44, 48], "fno_stabil": 42, "fno_use_channel_mlp": 42, "fnoblock": [2, 3, 4, 12, 38, 44, 48], "focu": 59, "follow": [10, 24, 57, 59, 61], "font": 7, "forc": 57, "form": [10, 13, 27, 30, 57, 59], "formal": 59, "format": [7, 15, 16, 24, 25, 59], "former": [16, 20, 22, 48], "formul": [13, 57, 58], "forward": [5, 10, 12, 15, 16, 20, 21, 22, 24, 25, 27, 28, 30, 31, 32, 33, 34, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59], "four": 57, "fourier": [0, 2, 3, 7, 10, 12, 30, 34, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 58], "fourier_lay": 57, "frac": 59, "fraction": 27, "framework": [58, 59], "free": [11, 59], "frequenc": [7, 12, 38, 43, 44, 57], "from": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 24, 26, 27, 30, 38, 42, 43, 44, 48, 50, 51, 52, 56, 57, 59, 61], "from_checkpoint": 10, "ftdm": 5, "full": [0, 2, 3, 4, 5, 6, 7, 8, 12, 13, 30, 31, 32, 33, 34, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 57, 60], "fulli": 57, "function": [5, 7, 10, 12, 13, 16, 20, 22, 24, 30, 34, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 51, 52, 57, 59, 60, 61], "further": 59, "furthermor": 59, "g": [12, 15, 16, 30, 34, 38, 43, 44, 59], "g_a": 59, "gain": 7, "galleri": [0, 2, 3, 4, 5, 6, 7, 8, 56], "gap": 8, "gate": [12, 28, 29, 38, 42, 43, 44, 48], "gauss": 34, "gelu": [12, 24, 38, 42, 43, 44, 48], "gener": [0, 1, 2, 3, 4, 5, 6, 7, 8, 11, 13, 20, 21, 30, 31, 32, 33, 34, 52, 57, 58], "geometr": 42, "geometri": 42, "georg": [1, 7, 9, 51, 56], "get": [6, 42, 59], "get_fram": 7, "get_max_flop": 5, "gilmer": 59, "git": 11, "github": 59, "give": [12, 38, 43, 44, 45, 46, 47, 57, 59], "given": [15, 16, 24, 28, 50, 52, 57, 59], "global": 57, "gno": [24, 42, 57], "gno_channel_mlp_non_linear": 42, "gno_coord_dim": 42, "gno_coord_embed_dim": 42, "gno_embed_max_posit": 42, "gno_radiu": 42, "gno_use_open3d": 42, "gno_use_torch_scatt": 42, "go": [0, 2, 3, 4, 5, 6, 7, 8], "goal": 59, "good": [57, 59], "govern": [10, 59, 61], "gpu": [2, 3, 4, 8, 57, 61], "gpu1": [15, 16], "gradient": [8, 61], "grai": [2, 4, 6, 8], "graph": [13, 24, 57, 58], "great": 59, "greatli": [12, 38, 43, 44], "green": 59, "grid": [6, 7, 12, 20, 21, 34, 38, 42, 43, 44, 48, 50, 57, 59], "grid_boundari": [20, 21], "gridembed": [12, 38, 43, 44, 48], "gridembedding2d": [6, 48], "gridembeddingnd": [2, 3, 4, 12, 38, 43, 44, 48], "gridi": 7, "gridx": 7, "gridz": 7, "ground": [2, 3, 4, 8, 15], "ground_truth": 52, "group": [2, 3, 4, 8], "group_norm": [12, 38, 43, 44], "guid": [10, 43], "h": [35, 36, 57], "h1": [0, 2, 3, 4, 8, 35], "h1loss": [0, 2, 3, 4, 8], "ha": [0, 2, 3, 4, 12, 13, 16, 30, 34, 38, 43, 44, 48, 57, 59], "half": [12, 15, 16, 38, 43, 44], "hand": 57, "hao": 57, "happen": 59, "hard": [57, 59], "harder": 7, "harmon": 13, "have": [6, 7, 10, 11, 13, 28, 29, 34, 50, 57, 59], "height": [28, 39, 40, 41, 45, 46, 47], "help": 57, "henc": [24, 59], "henceforth": 59, "here": [6, 11, 59, 60], "hidden": [42, 48, 59], "hidden_channel": [0, 2, 3, 4, 5, 8, 10, 12, 38, 43, 44, 48], "high": [7, 12, 38, 43, 44, 45, 46, 47, 59], "higher": [7, 57], "highli": 7, "hold": [52, 61], "home": [7, 14], "hook": [16, 20, 22, 48], "horizont": 48, "horizontal_skip": [4, 48], "horizontal_skips_map": [4, 48], "host": [15, 16], "how": [0, 2, 3, 4, 5, 6, 7, 8, 12, 38, 43, 44, 48, 59], "howev": [2, 3, 4, 8, 30, 34, 57, 59], "html": 11, "http": [7, 10, 11, 51, 57, 59], "hundr": 59, "hundt": 34, "hydrologi": 59, "i": [2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 15, 16, 24, 27, 28, 29, 30, 31, 32, 33, 34, 38, 42, 43, 44, 45, 46, 47, 48, 50, 52, 57, 59, 61], "i_1": 30, "i_n": 30, "iclr": 10, "icml": 34, "ideal": 59, "ident": [12, 29, 30, 34, 38, 42, 43, 44, 48], "idx": 52, "ignor": [7, 16, 20, 22, 30, 48], "ignore_w": [15, 16], "ii": [2, 3, 4, 8], "illustr": 57, "imag": [57, 59], "implement": [10, 12, 24, 25, 26, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 51, 58, 61], "implicit": 59, "import": [0, 2, 3, 4, 5, 8, 10, 11, 12, 38, 43, 44, 57, 59], "improv": [10, 12, 38, 43, 44, 59], "imshow": [2, 3, 4, 6, 8], "in_channel": [0, 2, 3, 4, 5, 8, 10, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 57], "in_featur": [15, 16, 28, 29], "in_gno_channel_mlp_hidden_lay": 42, "in_gno_transform_typ": 42, "in_norm": [8, 15, 16], "includ": [8, 10, 13, 57, 59], "incompress": 57, "incr": 8, "increas": [8, 12, 30, 38, 43, 44, 48, 51, 57], "increment": [8, 12, 38, 43, 44, 48, 51], "incremental_buff": [8, 51], "incremental_grad": [8, 51], "incremental_grad_ep": [8, 51], "incremental_grad_max_it": [8, 51], "incremental_loss_ep": [8, 51], "incremental_loss_gap": [8, 51], "incremental_max_it": [8, 51], "incremental_n_mod": 48, "incremental_res_gap": 8, "incremental_resolut": 8, "incrementaldataprocessor": 8, "incrementalfnotrain": 8, "incrementaltrain": 8, "inde": 59, "indefinit": 59, "indeped": 57, "independ": [24, 57], "index": [2, 3, 4, 6, 7, 8, 11, 52, 59], "indic": [8, 25, 31, 57], "individu": [12, 30, 38, 43, 44, 52, 60], "ineffici": 57, "infer": [12, 13, 38, 43, 44, 52, 57], "inferenc": 15, "infinit": 59, "inform": [10, 12, 38, 42, 43, 44, 59], "infti": 57, "inherit": 51, "init": 30, "init_std": [30, 31, 32, 33, 34], "initi": [7, 8, 12, 38, 43, 44, 48, 57, 59], "initial_lr": [2, 3, 4, 8], "input": [2, 3, 4, 6, 8, 10, 12, 13, 15, 24, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 52, 57, 59], "input_geom": 42, "input_grid": 34, "insight": 7, "instal": [10, 24, 61], "instanc": [13, 16, 20, 22, 42, 48, 57], "instance_norm": [12, 38, 43, 44], "instanci": 50, "instansi": 24, "instanti": 50, "instead": [16, 20, 22, 30, 48, 57, 59], "insuffici": 57, "int": [5, 12, 16, 21, 27, 28, 29, 30, 31, 32, 33, 34, 35, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 51, 52, 57], "int_": [24, 59], "int_d": 59, "integ": 30, "integr": [13, 15, 16, 24, 48, 57, 59], "integral_oper": 48, "integraltransform": 42, "integrate_lat": 42, "interest": 57, "interfac": [13, 61], "intermedi": [12, 38, 43, 44, 45, 46, 47], "interpol": [57, 59], "interv": 52, "introduc": [57, 59], "introduct": 58, "invari": [6, 10, 57, 59], "invers": [57, 59], "involv": [57, 59], "io": 59, "ioxi": 57, "ipynb": [0, 2, 3, 4, 5, 6, 7, 8], "irfft": 57, "irfft2": 57, "irrespect": 57, "is_avail": [3, 8], "isinst": 5, "issu": 24, "item": [5, 6], "iter": [6, 8, 58], "its": [7, 12, 13, 24, 38, 42, 43, 44, 57], "j": [15, 16, 24, 25, 51, 59], "jaideep": 34, "jmlr": 10, "joint_factor": [34, 48], "joseph": [1, 7, 9, 56], "journal": 10, "jpg": 59, "jupyt": [0, 1, 2, 3, 4, 5, 6, 7, 8], "just": [2, 3, 4, 7, 8, 10, 30, 34, 57, 59], "k": [7, 10, 24, 57, 59], "k_": 57, "k_0": 57, "k_l": 57, "kamyar": [10, 48, 57, 59], "kappa": [57, 59], "kappa_": 59, "karthik": 34, "kashinath": 34, "kaushik": [10, 57, 59], "keep": [8, 12, 13, 30, 38, 39, 40, 41, 43, 44, 45, 46, 47], "kei": [12, 15, 24, 38, 43, 44, 52, 57], "kernel": [13, 24, 57, 58], "kernel_s": [2, 3, 4], "keyword": [15, 16, 50], "kind": [29, 57], "known": 24, "kossaifi": 51, "kovachki": [10, 57, 59], "kovachki2021neur": 10, "kurth": 34, "kwarg": [12, 19, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50], "l": [35, 36, 57, 59], "l2": [0, 2, 3, 4, 8], "l2loss": [0, 2, 3, 4, 8], "label": [7, 59], "lambda": 5, "larg": [51, 59], "larger": [2, 3, 4, 8], "lasso": 52, "last": [7, 12, 30, 38, 43, 44, 45, 46, 47, 48, 52], "latent": [12, 38, 42, 43, 44, 45, 46, 47, 57], "latent_queri": 42, "later": [10, 52, 57], "latter": [16, 20, 22, 48], "layer": [6, 10, 12, 38, 40, 41, 42, 43, 44, 45, 46, 47, 48, 58, 60], "ldot": 59, "leaf": 5, "learn": [10, 11, 12, 13, 30, 34, 38, 43, 44, 51, 52, 58, 60, 61], "least": [15, 59], "left": [57, 59], "leg": 7, "legend": 7, "legendr": 34, "len": [12, 38, 43, 44], "length": [7, 12, 38, 43, 44, 48], "less": [8, 59], "let": [5, 24, 57, 59], "level": 16, "lg": 10, "li": [7, 10, 51, 57, 59], "li2020fouri": 10, "librari": [10, 60, 61], "lift": [2, 3, 4, 5, 12, 38, 42, 43, 44, 45, 46, 47, 48, 59], "lifting_channel": [42, 48], "lifting_channel_ratio": [12, 38, 43, 44], "light": 59, "like": [13, 50, 57, 59, 61], "limit": [57, 58], "linear": [4, 12, 15, 16, 24, 28, 29, 38, 42, 43, 44, 48, 57, 59], "linear_kernelonli": 24, "linearchannelmlp": 24, "linearli": 57, "linestyl": 7, "linewidth": 7, "linspac": 7, "linux": 24, "list": [8, 12, 24, 27, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49], "lite": [12, 38, 43, 44], "liter": [20, 21, 48], "liu": [10, 57, 59], "lno": 57, "load": [0, 2, 3, 4, 7, 8, 10, 16, 20, 21, 61], "load_darcy_flow_smal": [0, 2, 4, 6, 7, 8, 10], "load_spherical_sw": 3, "loader": [52, 60], "loader_nam": 52, "loc": 7, "local": [5, 57], "locat": 57, "log": [7, 52, 57], "log_ev": 52, "log_output": [51, 52], "log_prefix": 52, "log_train": 52, "logic": [10, 30, 51, 61], "long": 27, "look": 7, "loop": [10, 61], "lose": 57, "loss": [0, 2, 3, 4, 8, 13, 15, 51, 52, 61], "loss_dict": 52, "loss_gap": 51, "loss_nam": 52, "lot": 57, "low": [57, 59], "lower": 57, "lowest": 57, "lp": 36, "lploss": [0, 2, 3, 4, 8], "lr": [0, 2, 3, 4, 8, 52], "lr_schedul": [0, 2, 3, 4, 8, 52], "m": [10, 12, 24, 25, 38, 43, 44, 48, 59], "m_k": 30, "m_n": 30, "machin": [13, 59, 61], "made": 59, "mai": [59, 61], "main": [11, 57, 60], "major": 57, "make": [11, 27, 59, 61], "mani": [2, 3, 4, 8, 59], "manual": 6, "manual_se": 7, "map": [10, 12, 13, 24, 30, 34, 38, 43, 44, 48, 57, 59, 60], "mapsto": [57, 59], "markov": 57, "match": [27, 59], "materi": 57, "math": 59, "mathbb": [57, 59], "mathcal": [57, 59], "mathemat": [7, 57, 59], "mathrm": [57, 59], "matplotlib": [0, 2, 3, 4, 6, 7, 8], "matric": 57, "matrix": [57, 59], "max": [5, 42, 57], "max_n_mod": [8, 12, 30, 31, 32, 33, 34, 38, 43, 44], "max_posit": 22, "max_valu": 5, "maximilian": 34, "maximum": [5, 8, 30], "mayb": 59, "mb": [2, 3, 4, 8, 9, 56], "mcmc": 57, "md": 48, "mean": [5, 37, 57, 59, 61], "measur": 59, "mem": [9, 56], "memori": [2, 3, 4, 8, 15, 16], "memory_format": [15, 16], "mesh": [13, 25, 26, 42, 57, 59], "messag": 59, "method": [12, 15, 16, 20, 21, 22, 24, 25, 27, 28, 30, 31, 32, 33, 34, 35, 36, 37, 38, 42, 43, 44, 45, 46, 47, 48, 51, 52, 57, 59], "metric": [51, 52], "mgno": 57, "middl": [57, 59], "might": 7, "mind": [8, 59], "minim": [2, 3, 4, 8, 13, 52], "minut": [2, 3, 4, 5, 6, 7, 8, 57], "misc": 10, "mit": 57, "mix": [12, 38, 43, 44], "mixed_precis": [51, 52], "ml": 10, "mlp": [12, 24, 38, 43, 44], "mode": [7, 8, 11, 12, 13, 30, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 51, 57], "mode1": 57, "mode2": 57, "model": [0, 2, 3, 4, 5, 6, 8, 10, 15, 16, 51, 52, 57, 58, 59, 60], "model_input": 5, "modes1": 57, "modes2": 57, "modes_depth": [41, 47], "modes_height": [39, 41, 45, 47], "modes_width": [41, 47], "modifi": [7, 15, 16], "modul": [12, 13, 15, 16, 20, 22, 24, 29, 38, 42, 43, 44, 48, 50, 51, 52, 57, 60], "modular": 61, "module2d": [28, 29], "moduledict": [3, 4], "modulelist": [2, 3, 4, 12, 38, 43, 44], "monitor": 52, "mont": [57, 59], "month": 59, "more": [2, 3, 4, 7, 8, 10, 12, 38, 43, 44, 52, 57, 59, 61], "most": [13, 59, 61], "motion": 59, "motiv": [57, 59], "move": [15, 16], "mpi": 61, "mpi4pi": 61, "mpiexec": 61, "mru": [20, 21], "much": [7, 13, 59, 61], "multi": [50, 61], "multipl": [2, 3, 4, 8, 57, 61], "multipli": 57, "multipol": 57, "must": [24, 50], "my_script": 61, "myneurop": [7, 14], "n": [0, 2, 3, 4, 7, 8, 10, 12, 13, 24, 25, 30, 38, 43, 44, 48, 57, 59, 61], "n_0": [12, 38, 43, 44], "n_1": [12, 38, 43, 44], "n_dim": [28, 29], "n_e": 59, "n_epoch": [0, 2, 3, 4, 8, 10, 51, 52], "n_gpu": 61, "n_gridpts_1": 42, "n_gridpts_n": 42, "n_i": [12, 38, 43, 44], "n_in": 42, "n_layer": [4, 12, 34, 38, 43, 44, 45, 46, 47, 48], "n_mode": [0, 2, 3, 5, 8, 10, 12, 13, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 57], "n_modes_height": [40, 46], "n_modes_width": [40, 46], "n_out": 42, "n_param": [0, 2, 3, 4, 8], "n_test": [0, 2, 3, 4, 6, 7, 8, 10, 14], "n_train": [0, 2, 3, 4, 6, 7, 8, 10, 14], "nabla": [57, 59], "name": [35, 36, 52], "nativ": [24, 25, 26, 42], "natur": 59, "navier": [0, 2, 3, 7, 57], "nd": 21, "necessari": [35, 57], "need": [7, 11, 16, 20, 21, 22, 24, 30, 34, 48, 59, 61], "neighbor": [13, 24, 25, 26, 42], "neighborhood": [13, 25, 26, 42, 59], "neighbors_index": 24, "neighbors_row_split": 24, "neighborsearch": 24, "neq": 59, "nest": 5, "net": 57, "network": [10, 57, 58], "neural": [0, 1, 2, 3, 4, 9, 10, 12, 30, 34, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 51, 52, 56, 58, 60], "neuralop": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 13, 57, 60], "neuraloper": 10, "new": 59, "new_val": 5, "newli": 57, "next": 6, "nikola": [10, 57, 59], "nn": [12, 15, 16, 24, 28, 29, 38, 42, 43, 44, 48, 50, 57], "nn_1": 59, "nn_2": 59, "node": [5, 59], "noisi": 57, "non": [7, 12, 15, 16, 24, 38, 43, 44, 48, 57], "non_block": [15, 16], "non_linear": [12, 38, 43, 44, 48], "none": [2, 3, 4, 8, 12, 15, 16, 24, 28, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 51, 52], "nonlinear": [12, 24, 38, 42, 43, 44, 45, 46, 47], "nonlinear_kernelonli": 24, "norm": [12, 35, 36, 38, 43, 44, 48], "normal": [12, 15, 30, 35, 36, 38, 42, 43, 44, 48], "note": [2, 3, 4, 7, 8, 12, 25, 27, 38, 43, 44, 57, 59], "notebook": [0, 1, 2, 3, 4, 5, 6, 7, 8], "noth": [12, 38, 43, 44, 48], "notic": [57, 59], "nour": [0, 2, 3, 4], "now": [11, 57], "np": 7, "nu": 57, "num_channel": 22, "number": [2, 3, 4, 5, 7, 8, 12, 13, 29, 30, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 52, 57, 59], "numer": [57, 59], "numnber": 8, "numpi": [2, 3, 4, 7, 8, 11], "nystrom": 58, "o": [57, 59], "object": [2, 3, 4, 5, 8, 10, 52], "observ": [57, 59], "octob": 57, "odd": [12, 30, 38, 43, 44, 45, 46, 47], "off": [57, 59], "offer": 13, "offici": 10, "ohio": 7, "on_epoch_start": 52, "onc": 11, "one": [2, 3, 4, 6, 7, 8, 12, 15, 16, 20, 22, 24, 27, 29, 36, 38, 42, 43, 44, 48, 52, 57, 59], "ones": [15, 16], "onli": [7, 8, 15, 16, 24, 28, 30, 31, 32, 33, 57, 59], "open": 59, "open3d": [25, 42], "oper": [0, 1, 2, 3, 4, 5, 9, 10, 11, 12, 30, 34, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 51, 52, 56, 58, 60], "operator_block": 48, "optim": [0, 2, 3, 4, 8, 10, 52], "option": [8, 10, 11, 12, 15, 27, 29, 30, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 52], "optionali": [30, 42, 48], "order": [57, 59], "org": [10, 51], "organ": 5, "origin": [7, 8, 12, 38, 43, 44, 48, 57], "ortho": 34, "other": [7, 8, 12, 34, 38, 43, 44, 57, 59], "otherwis": [5, 12, 24, 30, 38, 42, 43, 44, 48], "our": [0, 2, 3, 4, 6, 7, 13, 24, 57, 59, 61], "out": [2, 3, 4, 8, 10, 15, 16, 42, 57, 59], "out_channel": [0, 2, 3, 4, 5, 8, 10, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 57], "out_featur": [15, 16, 28, 29], "out_ft": 57, "out_gno_channel_mlp_hidden_lay": 42, "out_gno_tanh": 42, "out_gno_transform_typ": 42, "out_norm": [8, 15, 16], "outperform": 57, "output": [2, 3, 4, 5, 8, 12, 15, 16, 20, 21, 24, 29, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48, 52, 57, 59], "output_encod": 8, "output_grid": 34, "output_queri": 42, "output_shap": [12, 30, 34, 38, 43, 44, 45, 46, 47], "over": [12, 24, 38, 43, 44, 48], "overal": [7, 59], "overrid": 52, "overridden": [16, 20, 22, 48], "overwritten": 52, "own": [10, 13, 57, 60, 61], "p": [0, 2, 3, 4, 8, 36], "p1": [12, 38, 43, 44], "p2": [12, 38, 43, 44], "p_k": 59, "packag": [0, 2, 3, 4, 6, 8, 11], "pad": [12, 13, 38, 43, 44, 45, 46, 47, 48], "padding_fract": 16, "padding_mod": 27, "page": [11, 57, 61], "pain": [11, 59], "pair": 59, "panel": 57, "paper": [10, 57, 59], "parallel": 61, "param": 8, "paramat": [7, 8], "paramet": [0, 2, 3, 4, 8, 10, 12, 13, 15, 16, 20, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 51, 52, 57], "parameter": [42, 57], "parametr": [10, 12, 24, 38, 43, 44, 48, 57], "part": [11, 57], "partial": [10, 57, 59], "partial_": 57, "partial_t": 57, "partial_x": 57, "pass": [5, 6, 8, 10, 12, 16, 20, 22, 27, 30, 31, 32, 33, 34, 38, 42, 43, 44, 45, 46, 47, 48, 59], "patch": 50, "path": 52, "pathak": 34, "pattern": 57, "pca": 57, "pcann": 57, "pde": [13, 51, 57, 59, 60, 61], "pdf": [7, 51], "peopl": 59, "per": [5, 35, 36, 42, 48, 52, 57], "percentag": [12, 27, 38, 43, 44, 48], "perform": [12, 15, 16, 20, 22, 30, 34, 38, 43, 44, 48, 57, 59], "period": 57, "permut": 7, "phi": 59, "physic": [7, 57, 59], "piec": 59, "pin": [15, 16], "pip": [10, 61], "pixel": [57, 59], "place": [15, 16, 57], "pleas": [10, 30], "plot": [2, 3, 4, 7, 8, 52], "plot_count_flop": [5, 9, 56], "plot_darcy_flow": [6, 9, 56], "plot_darcy_flow_spectrum": [7, 9, 56], "plot_fno_darci": [2, 9, 56], "plot_incremental_fno_darci": [8, 9, 56], "plot_sfno_sw": [3, 9, 56], "plot_uno_darci": [4, 9, 56], "plt": [0, 2, 3, 4, 6, 7, 8], "pn": [12, 38, 43, 44], "png": 59, "po": [6, 20, 21], "pod": 57, "point": [5, 15, 16, 24, 25, 26, 42, 57, 59], "pointwis": [42, 57], "poisson": 58, "popular": 57, "pose": 59, "posit": [6, 7, 12, 13, 20, 21, 38, 42, 43, 44, 45, 46, 47, 48], "positional_embed": [2, 3, 4, 6, 12, 38, 43, 44, 48], "positional_encod": 10, "posixpath": 14, "possibl": [15, 16, 25, 59], "post": [15, 59], "posterior": 57, "postprocess": [15, 16], "potenti": 57, "practic": [2, 3, 4, 8, 57, 59], "pre": 15, "preactiv": [12, 38, 42, 43, 44, 48], "precis": [12, 38, 42, 43, 44], "predict": [2, 3, 4, 8, 52, 59], "prefer": [31, 32, 33], "prefix": 52, "prepackag": 10, "preprint": 51, "preprocess": [2, 4, 6, 15, 16], "preprocessor": 10, "present": 57, "pressur": 57, "previou": [10, 57], "primarili": 59, "primaryclass": 10, "print": [0, 2, 3, 4, 5, 6, 7, 8, 50], "printout": [12, 38, 43, 44], "problem": [57, 58], "process": [7, 15, 59, 61], "processor": 15, "product": 7, "project": [2, 3, 4, 5, 12, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59], "projection_channel": [0, 2, 3, 4, 5, 42, 48], "projection_channel_ratio": [12, 38, 43, 44], "prop": 7, "propag": 57, "properli": 59, "properti": 59, "propos": 57, "proprtion": 24, "prototyp": 59, "provid": [7, 10, 11, 13, 28, 30, 31, 32, 33, 35, 36, 50, 52, 57, 60, 61], "pseudo": 57, "pure": 42, "purpos": [57, 59], "puzzl": 57, "py": [0, 2, 3, 4, 5, 6, 7, 8, 9, 56, 61], "pyplot": [0, 2, 3, 4, 6, 7, 8], "pytest": 11, "python": [0, 1, 2, 3, 4, 5, 6, 7, 8, 11, 13, 61], "pytorch": [10, 11, 13, 24, 25, 26, 42, 57, 60, 61], "qquad": 57, "quad": [57, 59], "qualiti": 59, "quasilinear": 57, "queri": [25, 26, 42, 59], "quick": 58, "quickli": [2, 3, 4, 8], "quit": 59, "r": [11, 25, 51, 57, 59], "radiu": [25, 26, 42], "rahman": 48, "rand": 57, "randn": 5, "random": 7, "rang": [2, 4, 8], "rank": [0, 2, 3, 4, 10, 12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 57], "rate": [52, 57], "ratio": [12, 38, 43, 44], "raw": [2, 3, 4, 8, 12, 13, 15, 38, 43, 44, 48], "rbm": 57, "rc": 7, "re": [5, 6, 7, 8], "read": [50, 57], "readi": [11, 60], "real": [30, 57, 59], "realiz": 59, "realli": 59, "reason": 59, "receiv": 13, "recent": 59, "recip": [16, 20, 22, 48], "reconstruct": [12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48], "recov": 57, "recurr": 57, "recurs": 5, "reduc": [35, 36, 57], "reduce_al": [35, 36], "reduce_dim": [3, 35, 36], "reduct": [35, 36, 37, 42], "redund": 30, "refer": [7, 12, 31, 32, 33, 34, 38, 43, 44, 51, 58, 61], "regim": 57, "region": 59, "regist": [16, 20, 22, 48], "regress": 57, "regular": [0, 2, 3, 4, 8, 10, 12, 20, 21, 38, 43, 44, 52, 59], "rel": [35, 36], "relat": 59, "relev": 57, "reli": 57, "relu": [57, 59], "remain": 24, "remov": [7, 12, 27, 38, 43, 44, 45, 46, 47], "repeat": 7, "repres": [7, 57], "represent": [7, 12, 38, 43, 44, 45, 46, 47, 59], "requir": [5, 6, 7, 11, 15, 16, 25, 57], "requirements_doc": 11, "research": 7, "reset": 5, "reshap": 7, "residu": 57, "resnet": [12, 38, 42, 43, 44, 48, 57], "resolut": [0, 2, 3, 4, 6, 7, 8, 10, 12, 20, 21, 27, 38, 43, 44, 57, 58], "resolution_scaling_factor": [12, 27, 30, 31, 32, 33, 34, 38, 43, 44], "resolv": 57, "resourc": 5, "respect": [15, 16, 57, 59], "restrict": 57, "result": [11, 52, 57, 59], "resum": [0, 52], "resume_from_dir": [0, 52], "resume_state_from_dir": 52, "return": [5, 15, 16, 20, 21, 25, 28, 29, 30, 31, 32, 33, 34, 35, 36, 50, 51, 52, 57], "return_output": 52, "review": 57, "reynold": 57, "rfft": 57, "rfft2": 57, "riemann": 24, "right": [30, 57, 59], "rigor": 59, "rnn": 57, "robert": [1, 7, 9, 56], "root": 61, "ross": 48, "roughli": 59, "round": 30, "row": 59, "run": [2, 3, 4, 5, 6, 7, 8, 16, 20, 22, 48, 52, 57, 61], "ryden": 7, "safeti": 50, "sai": 57, "same": [34, 57, 59], "sampl": [2, 3, 4, 6, 7, 8, 52, 57, 59], "saniti": 59, "save": [0, 10, 52, 59], "save_best": 52, "save_checkpoint": 10, "save_dir": [0, 52], "save_everi": [0, 52], "save_fold": 10, "save_nam": 10, "save_training_st": 52, "scalar": [36, 42, 51, 59], "scale": [7, 12, 27, 30, 34, 38, 42, 43, 44, 48, 51, 57, 59], "schedul": [0, 2, 3, 4, 8, 10, 52], "scienc": 57, "scientif": 59, "scipi": 11, "scratch": 57, "script": [2, 3, 4, 5, 6, 7, 8], "search": [5, 13, 25, 26, 42], "second": [2, 3, 4, 5, 6, 7, 8, 57, 59], "see": [10, 12, 15, 16, 24, 31, 32, 33, 34, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 52], "seed": 7, "segment_csr": 24, "self": [3, 15, 16, 35, 36, 52, 57], "semi": 59, "send": [12, 38, 43, 44, 45, 46, 47], "sens": 59, "separ": [12, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48], "sequenc": [12, 38, 43, 44, 45, 46, 47], "seri": 57, "set": [7, 8, 12, 15, 16, 24, 25, 38, 42, 43, 44, 48, 57, 58], "set_alpha": 7, "set_titl": [2, 3, 4, 6, 8], "set_xlim": 7, "set_ylim": 7, "set_yscal": 7, "sever": [29, 59], "sfno": [1, 9, 34, 56], "sfno_block": 43, "sfno_block_precis": 43, "sfno_skip": 43, "sfnoblock": 43, "shall": 57, "shallow": [1, 9, 56], "shape": [2, 3, 4, 6, 7, 8, 12, 24, 25, 28, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59], "share": 57, "ship": [0, 2, 3, 4, 6, 8, 11, 13], "shot": 57, "should": [8, 16, 20, 22, 24, 30, 34, 42, 48, 59], "show": [2, 3, 4, 6, 7, 8, 10, 57, 59], "shown": [57, 59], "sht": 3, "sht_grid": [3, 34], "sht_handl": 3, "sht_norm": 34, "side": [12, 27, 38, 43, 44, 48], "sigma": [57, 59], "sigma_1": 57, "sigma_l": 57, "signal": 7, "signatur": [15, 16], "silent": [16, 20, 22, 48], "sim": 59, "similar": [10, 12, 15, 16, 38, 43, 44, 57, 59, 61], "similarli": [30, 34, 59], "simpl": [1, 2, 9, 15, 20, 56, 57, 59, 61], "simpli": [10, 11, 57], "simul": 59, "sinc": [16, 20, 22, 48, 57, 59], "singl": [12, 15, 30, 35, 36, 38, 42, 43, 44, 48, 52], "singular": 59, "sinusoid": 57, "size": [2, 3, 4, 6, 7, 8, 12, 20, 21, 24, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 38, 43, 44, 57, 59, 61], "size_i": 7, "size_x": 7, "size_z": 7, "skip": [12, 29, 30, 34, 38, 42, 43, 44, 45, 46, 47, 48], "skip_typ": 29, "slice": 8, "slow": 57, "small": [0, 2, 3, 4, 6, 7, 8, 13, 59], "smaller": 59, "so": [7, 10, 24, 30, 34, 57, 59, 61], "sobolev": 35, "soft": [12, 28, 29, 38, 42, 43, 44, 48], "softgat": 3, "solut": [57, 59], "solv": [7, 51, 57, 59], "solver": [57, 58], "some": [7, 13, 24, 50, 57, 59], "sometim": 59, "sophist": 59, "sourc": [0, 1, 2, 3, 4, 5, 6, 7, 8, 12, 14, 15, 16, 20, 21, 22, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 48, 49, 50, 51, 52, 59], "space": [10, 12, 24, 25, 38, 42, 43, 44, 45, 46, 47, 57, 59, 60], "spars": 57, "spatial": [7, 13, 20, 21, 30, 51, 57, 59], "spatial_dim": [20, 21], "speak": 59, "special": 59, "specif": [7, 13, 30, 51, 59, 61], "specifi": [12, 24, 30, 38, 43, 44, 45, 46, 47, 48], "spectraconv": [31, 32, 33], "spectral": [7, 12, 13, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 51, 57], "spectral_convolut": [12, 38, 42, 43, 44, 48, 57], "spectralconv": [2, 4, 12, 13, 34, 38, 42, 43, 44, 48], "spectralconv2d": 57, "spectralconvolut": [12, 38, 43, 44, 45, 46, 47], "spectrum": [1, 9, 56], "spectrum_2d": 7, "speed": [10, 57, 61], "spefic": 24, "sphere": 34, "spheric": [1, 9, 34, 43, 56], "sphericalconv": 3, "sphinx": [0, 1, 2, 3, 4, 5, 6, 7, 8], "squar": [37, 59], "squeez": [2, 3, 4, 6, 7, 8], "stabil": [12, 38, 42, 43, 44], "stabl": 34, "standard": [10, 12, 13, 38, 43, 44, 57, 59, 61], "start": [8, 11, 58, 59], "starting_mod": 8, "state": [7, 52, 57], "std": 30, "stdout": [0, 2, 3, 4, 8, 52], "steadi": 57, "steepli": 59, "step": [6, 7, 57, 59], "step_loss_valu": 52, "still": [57, 59], "stitch": 16, "stoke": [0, 2, 3, 7, 57], "storag": 59, "store": 59, "str": [12, 16, 20, 21, 24, 30, 34, 38, 42, 43, 44, 48, 51, 52], "strictli": 8, "stride": [2, 3, 4], "string": 50, "structur": [7, 57, 59], "stuart": [10, 57, 59], "stub": 52, "studi": 7, "style": [12, 38, 42, 43, 44, 48], "sub": 8, "subclass": [16, 20, 22, 48, 51], "subdict": 50, "subject": 59, "submodul": 5, "subplot": 7, "subsampling_r": 8, "subset": [24, 59], "substitut": 57, "subsurfac": 57, "suffici": [51, 57, 59], "sum": [24, 35, 36, 37, 59], "sum_": 59, "super": 57, "supervis": 59, "support": 13, "suppos": 24, "suptitl": [2, 3, 4, 6, 8], "sure": 27, "surrog": 57, "svg": 59, "sy": [0, 2, 3, 4, 8], "symmetr": [12, 27, 38, 43, 44, 48], "system": [57, 61], "t": [7, 12, 38, 43, 44, 45, 46, 47, 50, 57, 59], "t_max": [0, 2, 3, 4, 8], "tabl": 59, "take": [7, 16, 20, 22, 27, 29, 30, 48, 52, 57, 59], "taken": [57, 61], "tanh": [12, 38, 42, 43, 44], "target": [35, 36], "task": [7, 57, 59], "techniqu": 59, "technologi": 57, "technologyreview": 57, "tempor": 57, "tensor": [0, 3, 7, 8, 10, 12, 15, 16, 20, 21, 24, 25, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 42, 43, 44, 45, 46, 47, 48, 51, 52], "tensorized_spectral_conv": [30, 31, 32, 33, 34], "tensorli": 11, "term": [35, 57, 59], "termin": 11, "test": [0, 2, 3, 4, 6, 7, 8, 10, 13, 52, 57, 59, 61], "test_batch_s": [0, 2, 3, 4, 6, 7, 8, 10, 14], "test_load": [0, 2, 3, 4, 6, 7, 8, 10, 52], "test_loader_nam": 52, "test_resolut": [0, 2, 3, 4, 6, 7, 8, 10, 14], "test_sampl": [2, 3, 4, 8], "text": [57, 59], "tf": 57, "tfno": [1, 9, 10, 56], "th": 48, "than": [8, 57, 59], "thankfulli": 59, "thei": [57, 59], "them": [16, 20, 22, 48, 57], "therefor": [30, 57, 59], "thi": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 20, 22, 24, 27, 28, 30, 31, 32, 33, 34, 38, 43, 44, 48, 52, 57, 59, 61], "thing": [57, 59, 61], "think": 57, "thorsten": 34, "three": [57, 59], "threshold": 8, "through": [7, 10, 12, 38, 43, 44, 45, 46, 47, 52], "thu": 59, "tight_layout": [2, 3, 4, 6, 8], "till": 7, "time": [2, 3, 4, 5, 6, 7, 8, 52, 57, 59], "titl": [7, 10], "tltorch": [12, 38, 43, 44], "tmlr": 48, "too": [30, 34], "tool": [7, 10, 11, 60], "top": 57, "torch": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 20, 21, 24, 25, 26, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 51, 52, 57], "torch_doctest_cuda1": [15, 16], "torch_scatt": [24, 42], "torchtnt": [1, 9, 56], "torchvis": [10, 13], "toru": 57, "total": [2, 3, 4, 5, 6, 7, 8, 9, 56, 59], "trade": [57, 59], "tradit": [57, 59], "train": [1, 4, 6, 9, 10, 12, 15, 30, 38, 43, 44, 48, 56, 57, 58, 59, 60], "train_dataset": 6, "train_err": [2, 3, 4, 8, 51, 52], "train_load": [0, 2, 3, 4, 6, 7, 8, 10, 51, 52], "train_loss": [0, 2, 3, 4, 8, 10], "train_one_batch": 52, "train_one_epoch": [51, 52], "train_resolut": 3, "trainer": [0, 2, 3, 4, 8, 10, 51, 58], "training_loss": [0, 2, 3, 4, 8, 10, 51, 52], "training_st": 52, "transfer": 57, "transform": [7, 8, 10, 13, 24, 30, 34, 42, 57, 59], "transform_typ": 24, "tri": [15, 16], "triangul": 59, "triangular": 57, "true": [0, 2, 3, 4, 8, 10, 12, 14, 15, 16, 20, 21, 24, 25, 30, 31, 32, 33, 34, 38, 42, 43, 44, 48, 57, 59], "truncat": [12, 38, 43, 44, 57], "truth": [2, 3, 4, 8, 15], "truth_sp": 7, "try": 24, "tt": [30, 42, 48], "tucker": [0, 10, 30, 42, 48], "tupl": [12, 13, 30, 38, 42, 43, 44, 45, 46, 47, 48, 52], "turbul": [7, 57], "two": [7, 24, 25, 26, 35, 36, 37, 57, 59], "txt": 11, "type": [12, 24, 29, 38, 42, 43, 44, 48], "typic": [7, 27, 30, 34], "u": [1, 9, 11, 48, 56, 57, 59], "u_": 59, "u_0": [57, 59], "u_j": 59, "u_t": 59, "unchang": [15, 16], "unclear": 59, "under": 59, "underli": [7, 59], "understand": 57, "understood": 10, "unfortun": [57, 59], "uni": 11, "uniform": [57, 59], "uniform_h": [35, 36], "uniformli": 59, "union": [12, 38, 43, 44], "uniqu": 59, "unit": 57, "unknown": 59, "unlik": 10, "unnorm": 15, "uno": 4, "uno_n_mod": [4, 48], "uno_out_channel": [4, 48], "uno_sc": [4, 48], "unpad": 27, "unseen": 59, "unsqueez": [2, 3, 4, 6, 8], "up": [8, 10, 57, 61], "updat": [8, 11, 12, 30, 38, 43, 44, 48, 59], "upsampl": [30, 34], "us": [0, 1, 2, 3, 6, 7, 8, 9, 10, 11, 12, 13, 15, 24, 25, 27, 29, 30, 34, 38, 42, 43, 44, 48, 50, 52, 56, 57, 59, 60, 61], "use_distribut": [0, 2, 3, 4, 10, 51, 52], "use_open3d": 25, "use_torch_scatt": 24, "usecas": [13, 30, 34], "user": [7, 61], "userwarn": 7, "usual": [57, 59], "util": [0, 2, 3, 4, 5, 7, 8, 13, 52, 60], "v": [42, 48, 57, 59], "v_": [57, 59], "v_0": 59, "v_t": 59, "val": 15, "valid": 52, "valu": [5, 12, 30, 34, 38, 43, 44, 51, 52], "vari": [12, 38, 43, 44, 59], "variabl": 7, "varianc": 8, "variou": [8, 57], "vector": [26, 57, 59], "veloc": [7, 57], "verbos": [0, 2, 3, 4, 8, 10, 27, 48, 51, 52], "veri": [2, 3, 4, 8, 57, 59, 61], "verifi": [12, 38, 43, 44, 48], "version": [13, 24, 42, 59], "via": [57, 59], "view": [6, 57, 59], "viscos": 57, "viscou": 57, "volum": [10, 24], "vortic": 57, "w": [28, 42, 57, 59], "w_0": 57, "wa": [12, 38, 43, 44, 45, 46, 47], "wai": [57, 61], "wait": 8, "walk": 10, "wandb": 52, "wandb_log": [0, 2, 3, 4, 10, 51, 52], "want": [7, 8, 11, 30, 34, 57, 59], "warn": 50, "water": [1, 9, 56], "wave": 57, "wavenumb": 7, "we": [0, 2, 3, 4, 5, 6, 7, 8, 10, 13, 30, 57, 59, 61], "weak": 59, "weight": [2, 3, 4, 10, 12, 15, 16, 24, 28, 30, 38, 42, 43, 44, 48, 57], "weight_decai": [0, 2, 3, 4, 8], "weights1": 57, "weights2": 57, "well": [7, 10, 11, 57, 59], "when": [8, 15, 16, 52, 57, 59], "where": [20, 21, 28, 57, 59], "whether": [12, 15, 24, 25, 27, 29, 30, 38, 42, 43, 44, 48, 52, 59], "which": [6, 7, 8, 12, 13, 24, 25, 26, 38, 42, 43, 44, 52, 57, 59], "while": [16, 20, 22, 48, 57], "whole": [24, 57], "whose": [15, 16], "width": [12, 28, 38, 40, 41, 42, 43, 44, 46, 47, 48], "wise": [12, 14, 38, 43, 44, 57], "within": [16, 20, 22, 25, 42, 48, 52], "word": 59, "work": [13, 27, 30, 34, 57, 59], "workflow": 10, "world": [57, 59, 61], "would": [2, 3, 4, 8], "wrap": [15, 17, 18], "wrapper": 29, "written": [57, 59], "www": [7, 57], "x": [2, 3, 4, 6, 7, 8, 12, 15, 22, 24, 25, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 42, 43, 44, 45, 46, 47, 48, 57, 59], "x_1": 59, "x_ft": 57, "x_in": 3, "x_k": 59, "xdoctest": [15, 16], "xlabel": 7, "xtick": [2, 3, 4, 8], "xx": 57, "y": [2, 3, 4, 6, 7, 8, 15, 24, 25, 35, 36, 57, 59], "y_": 24, "y_1": 24, "y_2": 24, "y_j": 24, "year": [10, 59], "ylabel": 7, "ylim": 7, "you": [10, 11, 13, 24, 30, 34, 59, 60, 61], "your": [7, 10, 11, 13, 30, 34, 60, 61], "ytick": [2, 3, 4, 8], "z": [10, 51], "zachari": 48, "zero": [27, 57, 61], "zhao": 51, "zip": [1, 12, 38, 43, 44, 48], "zongyi": [7, 10, 57, 59]}, "titles": ["Training a TFNO on Darcy-Flow", "Gallery of examples", "Training an FNO on Darcy-Flow", "Training a SFNO on the spherical Shallow Water equations", "U-NO on Darcy-Flow", "Using <cite>torchtnt</cite> to count FLOPS", "A simple Darcy-Flow dataset", "A simple Darcy-Flow spectrum analysis", "Training a neural operator on Darcy-Flow - Author Robert Joseph George", "Computation times", "Neural Operators in PyTorch", "Installing NeuralOperator", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO", "API reference", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.datasets</span></code>.load_darcy_flow_small", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.transforms.data_processors</span></code>.DefaultDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.transforms.data_processors</span></code>.MGPatchingDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.datasets.data_transforms</span></code>.DefaultDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.datasets.data_transforms</span></code>.MGPatchingDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.datasets</span></code>.load_darcy_flow_small", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.embeddings</span></code>.GridEmbedding2D", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.embeddings</span></code>.GridEmbeddingND", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.embeddings</span></code>.SinusoidalEmbedding2D", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.gno_block</span></code>.GNOBlock", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.integral_transform</span></code>.IntegralTransform", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.neighbor_search</span></code>.NeighborSearch", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.neighbor_search</span></code>.native_neighbor_search", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.padding</span></code>.DomainPadding", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.skip_connections</span></code>.SoftGating", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.skip_connections</span></code>.skip_connection", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spherical_convolution</span></code>.SphericalConv", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.H1Loss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.LpLoss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.MSELoss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.GINO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.SFNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.UNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models.base_model</span></code>.available_models", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models.base_model</span></code>.get_model", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training</span></code>.IncrementalFNOTrainer", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training</span></code>.Trainer", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training.callbacks</span></code>.BasicLoggerCallback", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training.callbacks</span></code>.Callback", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training.callbacks</span></code>.CheckpointCallback", "Computation times", "Fourier Neural Operators", "User guide", "Neural Operators: an Introduction", "Quick-Start", "Training neural operator models"], "titleterms": {"2d": 59, "A": [6, 7], "As": 59, "NO": [4, 13], "The": 61, "an": [2, 59], "analysi": 7, "api": 13, "approxim": 59, "author": 8, "available_model": 49, "base_model": [49, 50], "basicloggercallback": 53, "build": 11, "callback": [53, 54, 55], "checkpointcallback": 55, "class": 61, "clone": 11, "comput": [9, 56], "conclus": [57, 59], "count": 5, "darci": [0, 2, 4, 6, 7, 8], "data": [6, 13, 14, 15, 16], "data_processor": [15, 16], "data_transform": [17, 18], "dataprocessor": 13, "dataset": [6, 14, 17, 18, 19], "defaultdataprocessor": [15, 17], "discret": 59, "dispatch": 13, "distribut": 61, "document": 11, "domainpad": 27, "embed": [20, 21, 22], "equat": [3, 59], "exampl": 1, "experi": [57, 59], "fix": 59, "flop": 5, "flow": [0, 2, 4, 6, 7, 8], "fno": [2, 12, 13, 38], "fno1d": 39, "fno2d": 40, "fno3d": 41, "formul": 59, "fourier": [13, 57], "framework": 57, "galleri": 1, "gener": 59, "geometri": 13, "georg": 8, "get_model": 50, "gino": [13, 42], "github": 11, "gno_block": 23, "gnoblock": 23, "graph": 59, "gridembedding2d": 20, "gridembeddingnd": 21, "guid": 58, "h1loss": 35, "implement": 57, "import": [6, 7], "incrementalfnotrain": 51, "inform": 13, "instal": 11, "integral_transform": 24, "integraltransform": 24, "introduct": 59, "invari": 13, "iter": 59, "joseph": 8, "kernel": 59, "layer": [13, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 57], "learn": [57, 59], "librari": [6, 7], "limit": 59, "load": 6, "load_darcy_flow_smal": [14, 19], "loss": [35, 36, 37], "lploss": 36, "mgpatchingdataprocessor": [16, 18], "model": [12, 13, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 61], "mseloss": 37, "native_neighbor_search": 26, "neighbor_search": [25, 26], "neighborsearch": 25, "network": 59, "neural": [8, 13, 57, 59, 61], "neuralop": [12, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55], "neuraloper": 11, "nystrom": 59, "oper": [8, 13, 57, 59, 61], "other": 13, "pad": 27, "pip": 11, "poisson": 59, "pre": 11, "problem": 59, "quick": 60, "quickstart": 10, "recommend": 11, "refer": [13, 57, 59], "repositori": 11, "requisit": 11, "resolut": [13, 59], "robert": 8, "run": 11, "set": 59, "sfno": [3, 13, 43], "shallow": 3, "shape": 13, "short": 7, "simpl": [6, 7], "sinusoidalembedding2d": 22, "skip_connect": [28, 29], "softgat": 28, "solver": 59, "spectral_convolut": [30, 31, 32, 33], "spectralconv": 30, "spectralconv1d": 31, "spectralconv2d": 32, "spectralconv3d": 33, "spectrum": 7, "spheric": [3, 13], "spherical_convolut": 34, "sphericalconv": 34, "start": 60, "summari": 7, "tensor": 13, "test": 11, "tfno": [0, 13, 44], "tfno1d": 45, "tfno2d": 46, "tfno3d": 47, "time": [9, 56], "torchtnt": 5, "train": [0, 2, 3, 8, 13, 51, 52, 53, 54, 55, 61], "trainer": [52, 61], "transform": [15, 16], "u": [4, 13], "uno": 48, "us": 5, "user": 58, "visual": 6, "water": 3}})
\ No newline at end of file
+Search.setIndex({"alltitles": {"2D poisson equation": [[48, "d-poisson-equation"]], "A simple Darcy-Flow dataset": [[6, null]], "A simple Darcy-Flow spectrum analysis": [[7, null]], "API reference": [[12, null]], "As an Iterative Solver": [[48, "as-an-iterative-solver"]], "Building the documentation": [[11, "building-the-documentation"]], "Cloning the github repository": [[11, "cloning-the-github-repository"]], "Computation times": [[9, null], [45, null]], "Conclusion": [[46, "conclusion"], [48, "conclusion"]], "Data": [[12, "data"]], "DataProcessors": [[12, "dataprocessors"]], "Distributed Training": [[50, "distributed-training"]], "Experiments": [[46, "experiments"]], "Experiments: Poisson Equations": [[48, "experiments-poisson-equations"]], "Experiments: generalization of resolution": [[48, "experiments-generalization-of-resolution"]], "FNO": [[12, "fno"]], "Fourier Layer": [[46, "fourier-layer"]], "Fourier Neural Operators": [[46, null]], "Framework of Neural Operators": [[46, "framework-of-neural-operators"]], "Gallery of examples": [[1, null]], "Geometry-Informed Neural Operators (GINO)": [[12, "geometry-informed-neural-operators-gino"]], "Graph Neural Networks": [[48, "graph-neural-networks"]], "Implementation": [[46, "implementation"]], "Import the library": [[6, "import-the-library"], [7, "import-the-library"]], "Installing NeuralOperator": [[11, null]], "Installing with pip (recommended)": [[11, "installing-with-pip-recommended"]], "Introduction": [[48, "introduction"]], "Kernel Formulation": [[48, "kernel-formulation"]], "Layers": [[12, "module-neuralop.layers"]], "Limitation of Fixed Discretization": [[48, "limitation-of-fixed-discretization"]], "Load the dataset": [[6, "load-the-dataset"]], "Model Dispatching": [[12, "model-dispatching"]], "Models": [[12, "models"]], "Neural Operators: an Introduction": [[48, null]], "Neural operator Layers": [[12, "neural-operator-layers"]], "Nystrom Approximation": [[48, "nystrom-approximation"]], "Operator Learning": [[48, "operator-learning"]], "Operator learning": [[46, "operator-learning"]], "Other resolution invariant operations": [[12, "other-resolution-invariant-operations"]], "Pre-requisite": [[11, "pre-requisite"]], "Problem Setting": [[48, "problem-setting"]], "Quick-Start": [[49, null]], "Quickstart": [[10, null]], "References": [[46, "references"], [48, "references"]], "Running the tests": [[11, "running-the-tests"]], "Short summary": [[7, "short-summary"]], "Spherical Fourier Neural Operators (SFNO)": [[12, "spherical-fourier-neural-operators-sfno"]], "Tensorized FNO (TFNO)": [[12, "tensorized-fno-tfno"]], "The Trainer class": [[50, "the-trainer-class"]], "Training": [[12, "training"]], "Training a SFNO on the spherical Shallow Water equations": [[3, null]], "Training a TFNO on Darcy-Flow": [[0, null], [2, null]], "Training a neural operator on Darcy-Flow - Author Robert Joseph George": [[8, null]], "Training neural operator models": [[50, null]], "U-NO on Darcy-Flow": [[4, null]], "U-shaped Neural Operators (U-NO)": [[12, "u-shaped-neural-operators-u-no"]], "User guide": [[47, null]], "Using torchtnt to count FLOPS": [[5, null]], "Visualizing the data": [[6, "visualizing-the-data"]], "neuralop.data.datasets.load_darcy_flow_small": [[13, null]], "neuralop.data.transforms.data_processors.DefaultDataProcessor": [[14, null]], "neuralop.data.transforms.data_processors.MGPatchingDataProcessor": [[15, null]], "neuralop.layers.integral_transform.IntegralTransform": [[16, null]], "neuralop.layers.neighbor_search.NeighborSearch": [[17, null]], "neuralop.layers.neighbor_search.native_neighbor_search": [[18, null]], "neuralop.layers.padding.DomainPadding": [[19, null]], "neuralop.layers.skip_connections.SoftGating": [[20, null]], "neuralop.layers.skip_connections.skip_connection": [[21, null]], "neuralop.layers.spectral_convolution.SpectralConv": [[22, null]], "neuralop.layers.spectral_convolution.SpectralConv1d": [[23, null]], "neuralop.layers.spectral_convolution.SpectralConv2d": [[24, null]], "neuralop.layers.spectral_convolution.SpectralConv3d": [[25, null]], "neuralop.layers.spherical_convolution.SphericalConv": [[26, null]], "neuralop.losses.H1Loss": [[27, null]], "neuralop.losses.LpLoss": [[28, null]], "neuralop.losses.MSELoss": [[29, null]], "neuralop.models.FNO": [[30, null]], "neuralop.models.FNO1d": [[31, null]], "neuralop.models.FNO2d": [[32, null]], "neuralop.models.FNO3d": [[33, null]], "neuralop.models.GINO": [[34, null]], "neuralop.models.SFNO": [[35, null]], "neuralop.models.TFNO": [[36, null]], "neuralop.models.TFNO1d": [[37, null]], "neuralop.models.TFNO2d": [[38, null]], "neuralop.models.TFNO3d": [[39, null]], "neuralop.models.UNO": [[40, null]], "neuralop.models.base_model.available_models": [[41, null]], "neuralop.models.base_model.get_model": [[42, null]], "neuralop.training.IncrementalFNOTrainer": [[43, null]], "neuralop.training.Trainer": [[44, null]], "poisson equation": [[48, "poisson-equation"]]}, "docnames": ["auto_examples/checkpoint_FNO_darcy", "auto_examples/index", "auto_examples/plot_FNO_darcy", "auto_examples/plot_SFNO_swe", "auto_examples/plot_UNO_darcy", "auto_examples/plot_count_flops", "auto_examples/plot_darcy_flow", "auto_examples/plot_darcy_flow_spectrum", "auto_examples/plot_incremental_FNO_darcy", "auto_examples/sg_execution_times", "index", "install", "modules/api", "modules/generated/neuralop.data.datasets.load_darcy_flow_small", "modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor", "modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor", "modules/generated/neuralop.layers.integral_transform.IntegralTransform", "modules/generated/neuralop.layers.neighbor_search.NeighborSearch", "modules/generated/neuralop.layers.neighbor_search.native_neighbor_search", "modules/generated/neuralop.layers.padding.DomainPadding", "modules/generated/neuralop.layers.skip_connections.SoftGating", "modules/generated/neuralop.layers.skip_connections.skip_connection", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d", "modules/generated/neuralop.layers.spherical_convolution.SphericalConv", "modules/generated/neuralop.losses.H1Loss", "modules/generated/neuralop.losses.LpLoss", "modules/generated/neuralop.losses.MSELoss", "modules/generated/neuralop.models.FNO", "modules/generated/neuralop.models.FNO1d", "modules/generated/neuralop.models.FNO2d", "modules/generated/neuralop.models.FNO3d", "modules/generated/neuralop.models.GINO", "modules/generated/neuralop.models.SFNO", "modules/generated/neuralop.models.TFNO", "modules/generated/neuralop.models.TFNO1d", "modules/generated/neuralop.models.TFNO2d", "modules/generated/neuralop.models.TFNO3d", "modules/generated/neuralop.models.UNO", "modules/generated/neuralop.models.base_model.available_models", "modules/generated/neuralop.models.base_model.get_model", "modules/generated/neuralop.training.IncrementalFNOTrainer", "modules/generated/neuralop.training.Trainer", "sg_execution_times", "user_guide/fno", "user_guide/index", "user_guide/neural_operators", "user_guide/quickstart", "user_guide/training"], "envversion": {"sphinx": 62, "sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.todo": 2, "sphinx.ext.viewcode": 1}, "filenames": ["auto_examples/checkpoint_FNO_darcy.rst", "auto_examples/index.rst", "auto_examples/plot_FNO_darcy.rst", "auto_examples/plot_SFNO_swe.rst", "auto_examples/plot_UNO_darcy.rst", "auto_examples/plot_count_flops.rst", "auto_examples/plot_darcy_flow.rst", "auto_examples/plot_darcy_flow_spectrum.rst", "auto_examples/plot_incremental_FNO_darcy.rst", "auto_examples/sg_execution_times.rst", "index.rst", "install.rst", "modules/api.rst", "modules/generated/neuralop.data.datasets.load_darcy_flow_small.rst", "modules/generated/neuralop.data.transforms.data_processors.DefaultDataProcessor.rst", "modules/generated/neuralop.data.transforms.data_processors.MGPatchingDataProcessor.rst", "modules/generated/neuralop.layers.integral_transform.IntegralTransform.rst", "modules/generated/neuralop.layers.neighbor_search.NeighborSearch.rst", "modules/generated/neuralop.layers.neighbor_search.native_neighbor_search.rst", "modules/generated/neuralop.layers.padding.DomainPadding.rst", "modules/generated/neuralop.layers.skip_connections.SoftGating.rst", "modules/generated/neuralop.layers.skip_connections.skip_connection.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv1d.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv2d.rst", "modules/generated/neuralop.layers.spectral_convolution.SpectralConv3d.rst", "modules/generated/neuralop.layers.spherical_convolution.SphericalConv.rst", "modules/generated/neuralop.losses.H1Loss.rst", "modules/generated/neuralop.losses.LpLoss.rst", "modules/generated/neuralop.losses.MSELoss.rst", "modules/generated/neuralop.models.FNO.rst", "modules/generated/neuralop.models.FNO1d.rst", "modules/generated/neuralop.models.FNO2d.rst", "modules/generated/neuralop.models.FNO3d.rst", "modules/generated/neuralop.models.GINO.rst", "modules/generated/neuralop.models.SFNO.rst", "modules/generated/neuralop.models.TFNO.rst", "modules/generated/neuralop.models.TFNO1d.rst", "modules/generated/neuralop.models.TFNO2d.rst", "modules/generated/neuralop.models.TFNO3d.rst", "modules/generated/neuralop.models.UNO.rst", "modules/generated/neuralop.models.base_model.available_models.rst", "modules/generated/neuralop.models.base_model.get_model.rst", "modules/generated/neuralop.training.IncrementalFNOTrainer.rst", "modules/generated/neuralop.training.Trainer.rst", "sg_execution_times.rst", "user_guide/fno.rst", "user_guide/index.rst", "user_guide/neural_operators.rst", "user_guide/quickstart.rst", "user_guide/training.rst"], "indexentries": {"abs() (neuralop.losses.h1loss method)": [[27, "neuralop.losses.H1Loss.abs", false]], "abs() (neuralop.losses.lploss method)": [[28, "neuralop.losses.LpLoss.abs", false]], "available_models() (in module neuralop.models.base_model)": [[41, "neuralop.models.base_model.available_models", false]], "checkpoint() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.checkpoint", false]], "compute_terms() (neuralop.losses.h1loss method)": [[27, "neuralop.losses.H1Loss.compute_terms", false]], "defaultdataprocessor (class in neuralop.data.transforms.data_processors)": [[14, "neuralop.data.transforms.data_processors.DefaultDataProcessor", false]], "domainpadding (class in neuralop.layers.padding)": [[19, "neuralop.layers.padding.DomainPadding", false]], "eval_one_batch() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.eval_one_batch", false]], "evaluate() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.evaluate", false]], "fno (class in neuralop.models)": [[30, "neuralop.models.FNO", false]], "fno1d (class in neuralop.models)": [[31, "neuralop.models.FNO1d", false]], "fno2d (class in neuralop.models)": [[32, "neuralop.models.FNO2d", false]], "fno3d (class in neuralop.models)": [[33, "neuralop.models.FNO3d", false]], "forward() (neuralop.data.transforms.data_processors.defaultdataprocessor method)": [[14, "neuralop.data.transforms.data_processors.DefaultDataProcessor.forward", false]], "forward() (neuralop.data.transforms.data_processors.mgpatchingdataprocessor method)": [[15, "neuralop.data.transforms.data_processors.MGPatchingDataProcessor.forward", false]], "forward() (neuralop.layers.integral_transform.integraltransform method)": [[16, "neuralop.layers.integral_transform.IntegralTransform.forward", false]], "forward() (neuralop.layers.neighbor_search.neighborsearch method)": [[17, "neuralop.layers.neighbor_search.NeighborSearch.forward", false]], "forward() (neuralop.layers.padding.domainpadding method)": [[19, "neuralop.layers.padding.DomainPadding.forward", false]], "forward() (neuralop.layers.skip_connections.softgating method)": [[20, "neuralop.layers.skip_connections.SoftGating.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv method)": [[22, "neuralop.layers.spectral_convolution.SpectralConv.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv1d method)": [[23, "neuralop.layers.spectral_convolution.SpectralConv1d.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv2d method)": [[24, "neuralop.layers.spectral_convolution.SpectralConv2d.forward", false]], "forward() (neuralop.layers.spectral_convolution.spectralconv3d method)": [[25, "neuralop.layers.spectral_convolution.SpectralConv3d.forward", false]], "forward() (neuralop.layers.spherical_convolution.sphericalconv method)": [[26, "neuralop.layers.spherical_convolution.SphericalConv.forward", false]], "forward() (neuralop.models.fno method)": [[30, "neuralop.models.FNO.forward", false]], "forward() (neuralop.models.gino method)": [[34, "neuralop.models.GINO.forward", false]], "forward() (neuralop.models.sfno method)": [[35, "neuralop.models.SFNO.forward", false]], "forward() (neuralop.models.tfno method)": [[36, "neuralop.models.TFNO.forward", false]], "forward() (neuralop.models.tfno1d method)": [[37, "neuralop.models.TFNO1d.forward", false]], "forward() (neuralop.models.tfno2d method)": [[38, "neuralop.models.TFNO2d.forward", false]], "forward() (neuralop.models.tfno3d method)": [[39, "neuralop.models.TFNO3d.forward", false]], "forward() (neuralop.models.uno method)": [[40, "neuralop.models.UNO.forward", false]], "get_conv() (neuralop.layers.spectral_convolution.spectralconv method)": [[22, "neuralop.layers.spectral_convolution.SpectralConv.get_conv", false]], "get_conv() (neuralop.layers.spherical_convolution.sphericalconv method)": [[26, "neuralop.layers.spherical_convolution.SphericalConv.get_conv", false]], "get_model() (in module neuralop.models.base_model)": [[42, "neuralop.models.base_model.get_model", false]], "gino (class in neuralop.models)": [[34, "neuralop.models.GINO", false]], "h1loss (class in neuralop.losses)": [[27, "neuralop.losses.H1Loss", false]], "incrementalfnotrainer (class in neuralop.training)": [[43, "neuralop.training.IncrementalFNOTrainer", false]], "integraltransform (class in neuralop.layers.integral_transform)": [[16, "neuralop.layers.integral_transform.IntegralTransform", false]], "load_darcy_flow_small() (in module neuralop.data.datasets)": [[13, "neuralop.data.datasets.load_darcy_flow_small", false]], "log_eval() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.log_eval", false]], "log_training() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.log_training", false]], "loss_gap() (neuralop.training.incrementalfnotrainer method)": [[43, "neuralop.training.IncrementalFNOTrainer.loss_gap", false]], "lploss (class in neuralop.losses)": [[28, "neuralop.losses.LpLoss", false]], "mgpatchingdataprocessor (class in neuralop.data.transforms.data_processors)": [[15, "neuralop.data.transforms.data_processors.MGPatchingDataProcessor", false]], "module": [[12, "module-neuralop.data.datasets", false], [12, "module-neuralop.data.transforms.data_processors", false], [12, "module-neuralop.layers", false], [12, "module-neuralop.layers.integral_transform", false], [12, "module-neuralop.layers.neighbor_search", false], [12, "module-neuralop.layers.padding", false], [12, "module-neuralop.layers.skip_connections", false], [12, "module-neuralop.layers.spectral_convolution", false], [12, "module-neuralop.layers.spherical_convolution", false], [12, "module-neuralop.losses", false], [12, "module-neuralop.models", false], [12, "module-neuralop.models.base_model", false], [12, "module-neuralop.training", false]], "mseloss (class in neuralop.losses)": [[29, "neuralop.losses.MSELoss", false]], "native_neighbor_search() (in module neuralop.layers.neighbor_search)": [[18, "neuralop.layers.neighbor_search.native_neighbor_search", false]], "neighborsearch (class in neuralop.layers.neighbor_search)": [[17, "neuralop.layers.neighbor_search.NeighborSearch", false]], "neuralop.data.datasets": [[12, "module-neuralop.data.datasets", false]], "neuralop.data.transforms.data_processors": [[12, "module-neuralop.data.transforms.data_processors", false]], "neuralop.layers": [[12, "module-neuralop.layers", false]], "neuralop.layers.integral_transform": [[12, "module-neuralop.layers.integral_transform", false]], "neuralop.layers.neighbor_search": [[12, "module-neuralop.layers.neighbor_search", false]], "neuralop.layers.padding": [[12, "module-neuralop.layers.padding", false]], "neuralop.layers.skip_connections": [[12, "module-neuralop.layers.skip_connections", false]], "neuralop.layers.spectral_convolution": [[12, "module-neuralop.layers.spectral_convolution", false]], "neuralop.layers.spherical_convolution": [[12, "module-neuralop.layers.spherical_convolution", false]], "neuralop.losses": [[12, "module-neuralop.losses", false]], "neuralop.models": [[12, "module-neuralop.models", false]], "neuralop.models.base_model": [[12, "module-neuralop.models.base_model", false]], "neuralop.training": [[12, "module-neuralop.training", false]], "on_epoch_start() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.on_epoch_start", false]], "pad() (neuralop.layers.padding.domainpadding method)": [[19, "neuralop.layers.padding.DomainPadding.pad", false]], "postprocess() (neuralop.data.transforms.data_processors.defaultdataprocessor method)": [[14, "neuralop.data.transforms.data_processors.DefaultDataProcessor.postprocess", false]], "postprocess() (neuralop.data.transforms.data_processors.mgpatchingdataprocessor method)": [[15, "neuralop.data.transforms.data_processors.MGPatchingDataProcessor.postprocess", false]], "preprocess() (neuralop.data.transforms.data_processors.defaultdataprocessor method)": [[14, "neuralop.data.transforms.data_processors.DefaultDataProcessor.preprocess", false]], "preprocess() (neuralop.data.transforms.data_processors.mgpatchingdataprocessor method)": [[15, "neuralop.data.transforms.data_processors.MGPatchingDataProcessor.preprocess", false]], "reduce_all() (neuralop.losses.h1loss method)": [[27, "neuralop.losses.H1Loss.reduce_all", false]], "reduce_all() (neuralop.losses.lploss method)": [[28, "neuralop.losses.LpLoss.reduce_all", false]], "rel() (neuralop.losses.h1loss method)": [[27, "neuralop.losses.H1Loss.rel", false]], "rel() (neuralop.losses.lploss method)": [[28, "neuralop.losses.LpLoss.rel", false]], "resume_state_from_dir() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.resume_state_from_dir", false]], "sfno (class in neuralop.models)": [[35, "neuralop.models.SFNO", false]], "skip_connection() (in module neuralop.layers.skip_connections)": [[21, "neuralop.layers.skip_connections.skip_connection", false]], "softgating (class in neuralop.layers.skip_connections)": [[20, "neuralop.layers.skip_connections.SoftGating", false]], "spectralconv (class in neuralop.layers.spectral_convolution)": [[22, "neuralop.layers.spectral_convolution.SpectralConv", false]], "spectralconv1d (class in neuralop.layers.spectral_convolution)": [[23, "neuralop.layers.spectral_convolution.SpectralConv1d", false]], "spectralconv2d (class in neuralop.layers.spectral_convolution)": [[24, "neuralop.layers.spectral_convolution.SpectralConv2d", false]], "spectralconv3d (class in neuralop.layers.spectral_convolution)": [[25, "neuralop.layers.spectral_convolution.SpectralConv3d", false]], "sphericalconv (class in neuralop.layers.spherical_convolution)": [[26, "neuralop.layers.spherical_convolution.SphericalConv", false]], "tfno (class in neuralop.models)": [[36, "neuralop.models.TFNO", false]], "tfno1d (class in neuralop.models)": [[37, "neuralop.models.TFNO1d", false]], "tfno2d (class in neuralop.models)": [[38, "neuralop.models.TFNO2d", false]], "tfno3d (class in neuralop.models)": [[39, "neuralop.models.TFNO3d", false]], "to() (neuralop.data.transforms.data_processors.defaultdataprocessor method)": [[14, "neuralop.data.transforms.data_processors.DefaultDataProcessor.to", false]], "to() (neuralop.data.transforms.data_processors.mgpatchingdataprocessor method)": [[15, "neuralop.data.transforms.data_processors.MGPatchingDataProcessor.to", false]], "train() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.train", false]], "train_one_batch() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.train_one_batch", false]], "train_one_epoch() (neuralop.training.incrementalfnotrainer method)": [[43, "neuralop.training.IncrementalFNOTrainer.train_one_epoch", false]], "train_one_epoch() (neuralop.training.trainer method)": [[44, "neuralop.training.Trainer.train_one_epoch", false]], "trainer (class in neuralop.training)": [[44, "neuralop.training.Trainer", false]], "transform() (neuralop.layers.spectral_convolution.spectralconv method)": [[22, "neuralop.layers.spectral_convolution.SpectralConv.transform", false]], "transform() (neuralop.layers.spherical_convolution.sphericalconv method)": [[26, "neuralop.layers.spherical_convolution.SphericalConv.transform", false]], "uniform_h() (neuralop.losses.h1loss method)": [[27, "neuralop.losses.H1Loss.uniform_h", false]], "uniform_h() (neuralop.losses.lploss method)": [[28, "neuralop.losses.LpLoss.uniform_h", false]], "uno (class in neuralop.models)": [[40, "neuralop.models.UNO", false]], "unpad() (neuralop.layers.padding.domainpadding method)": [[19, "neuralop.layers.padding.DomainPadding.unpad", false]]}, "objects": {"neuralop": [[12, 0, 0, "-", "layers"], [12, 0, 0, "-", "losses"], [12, 0, 0, "-", "models"], [12, 0, 0, "-", "training"]], "neuralop.data": [[12, 0, 0, "-", "datasets"]], "neuralop.data.datasets": [[13, 1, 1, "", "load_darcy_flow_small"]], "neuralop.data.transforms": [[12, 0, 0, "-", "data_processors"]], "neuralop.data.transforms.data_processors": [[14, 2, 1, "", "DefaultDataProcessor"], [15, 2, 1, "", "MGPatchingDataProcessor"]], "neuralop.data.transforms.data_processors.DefaultDataProcessor": [[14, 3, 1, "", "forward"], [14, 3, 1, "", "postprocess"], [14, 3, 1, "", "preprocess"], [14, 3, 1, "", "to"]], "neuralop.data.transforms.data_processors.MGPatchingDataProcessor": [[15, 3, 1, "", "forward"], [15, 3, 1, "", "postprocess"], [15, 3, 1, "", "preprocess"], [15, 3, 1, "", "to"]], "neuralop.layers": [[12, 0, 0, "-", "integral_transform"], [12, 0, 0, "-", "neighbor_search"], [12, 0, 0, "-", "padding"], [12, 0, 0, "-", "skip_connections"], [12, 0, 0, "-", "spectral_convolution"], [12, 0, 0, "-", "spherical_convolution"]], "neuralop.layers.integral_transform": [[16, 2, 1, "", "IntegralTransform"]], "neuralop.layers.integral_transform.IntegralTransform": [[16, 3, 1, "", "forward"]], "neuralop.layers.neighbor_search": [[17, 2, 1, "", "NeighborSearch"], [18, 1, 1, "", "native_neighbor_search"]], "neuralop.layers.neighbor_search.NeighborSearch": [[17, 3, 1, "", "forward"]], "neuralop.layers.padding": [[19, 2, 1, "", "DomainPadding"]], "neuralop.layers.padding.DomainPadding": [[19, 3, 1, "", "forward"], [19, 3, 1, "", "pad"], [19, 3, 1, "", "unpad"]], "neuralop.layers.skip_connections": [[20, 2, 1, "", "SoftGating"], [21, 1, 1, "", "skip_connection"]], "neuralop.layers.skip_connections.SoftGating": [[20, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution": [[22, 2, 1, "", "SpectralConv"], [23, 2, 1, "", "SpectralConv1d"], [24, 2, 1, "", "SpectralConv2d"], [25, 2, 1, "", "SpectralConv3d"]], "neuralop.layers.spectral_convolution.SpectralConv": [[22, 3, 1, "", "forward"], [22, 3, 1, "", "get_conv"], [22, 3, 1, "", "transform"]], "neuralop.layers.spectral_convolution.SpectralConv1d": [[23, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution.SpectralConv2d": [[24, 3, 1, "", "forward"]], "neuralop.layers.spectral_convolution.SpectralConv3d": [[25, 3, 1, "", "forward"]], "neuralop.layers.spherical_convolution": [[26, 2, 1, "", "SphericalConv"]], "neuralop.layers.spherical_convolution.SphericalConv": [[26, 3, 1, "", "forward"], [26, 3, 1, "", "get_conv"], [26, 3, 1, "", "transform"]], "neuralop.losses": [[27, 2, 1, "", "H1Loss"], [28, 2, 1, "", "LpLoss"], [29, 2, 1, "", "MSELoss"]], "neuralop.losses.H1Loss": [[27, 3, 1, "", "abs"], [27, 3, 1, "", "compute_terms"], [27, 3, 1, "", "reduce_all"], [27, 3, 1, "", "rel"], [27, 3, 1, "", "uniform_h"]], "neuralop.losses.LpLoss": [[28, 3, 1, "", "abs"], [28, 3, 1, "", "reduce_all"], [28, 3, 1, "", "rel"], [28, 3, 1, "", "uniform_h"]], "neuralop.models": [[30, 2, 1, "", "FNO"], [31, 2, 1, "", "FNO1d"], [32, 2, 1, "", "FNO2d"], [33, 2, 1, "", "FNO3d"], [34, 2, 1, "", "GINO"], [35, 2, 1, "", "SFNO"], [36, 2, 1, "", "TFNO"], [37, 2, 1, "", "TFNO1d"], [38, 2, 1, "", "TFNO2d"], [39, 2, 1, "", "TFNO3d"], [40, 2, 1, "", "UNO"], [12, 0, 0, "-", "base_model"]], "neuralop.models.FNO": [[30, 3, 1, "", "forward"]], "neuralop.models.GINO": [[34, 3, 1, "", "forward"]], "neuralop.models.SFNO": [[35, 3, 1, "", "forward"]], "neuralop.models.TFNO": [[36, 3, 1, "", "forward"]], "neuralop.models.TFNO1d": [[37, 3, 1, "", "forward"]], "neuralop.models.TFNO2d": [[38, 3, 1, "", "forward"]], "neuralop.models.TFNO3d": [[39, 3, 1, "", "forward"]], "neuralop.models.UNO": [[40, 3, 1, "", "forward"]], "neuralop.models.base_model": [[41, 1, 1, "", "available_models"], [42, 1, 1, "", "get_model"]], "neuralop.training": [[43, 2, 1, "", "IncrementalFNOTrainer"], [44, 2, 1, "", "Trainer"]], "neuralop.training.IncrementalFNOTrainer": [[43, 3, 1, "", "loss_gap"], [43, 3, 1, "", "train_one_epoch"]], "neuralop.training.Trainer": [[44, 3, 1, "", "checkpoint"], [44, 3, 1, "", "eval_one_batch"], [44, 3, 1, "", "evaluate"], [44, 3, 1, "", "log_eval"], [44, 3, 1, "", "log_training"], [44, 3, 1, "", "on_epoch_start"], [44, 3, 1, "", "resume_state_from_dir"], [44, 3, 1, "", "train"], [44, 3, 1, "", "train_one_batch"], [44, 3, 1, "", "train_one_epoch"]]}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "function", "Python function"], "2": ["py", "class", "Python class"], "3": ["py", "method", "Python method"]}, "objtypes": {"0": "py:module", "1": "py:function", "2": "py:class", "3": "py:method"}, "terms": {"": [5, 7, 12, 14, 15, 16, 19, 30, 34, 35, 36, 37, 38, 39, 43, 46, 48, 50], "0": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 14, 15, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 40, 43, 45, 46, 48], "00": [9, 45], "000": [9, 45, 46], "0001": [2, 4, 8], "0008": 3, "001": [8, 43], "005": 46, "008": [2, 4, 8], "0086": 46, "0098": 46, "01": [9, 45], "0108": 46, "0109": 46, "0128": 46, "0136": 2, "0139": 46, "0142": 46, "0146": 46, "0149": 46, "0158": 46, "0160": 46, "0189": 46, "02": [9, 45], "0200": 46, "0212": 46, "0217": 46, "0219": 46, "0221": 46, "0225": 46, "0244": 46, "0245": 46, "0251": 46, "0253": 46, "0255": 46, "0259": 46, "0278": 3, "0298": 46, "0299": 46, "030": [3, 9, 45], "033": 34, "0383": 46, "0391": 46, "0392": 46, "0393": 46, "0395": 46, "0398": 46, "04": [9, 45], "0422": 8, "0445": 46, "0461": 46, "0493": 46, "05": 10, "0520": 46, "0576": 8, "06": [2, 3, 4, 8], "0619": 3, "065": [5, 9, 45], "0676": 8, "07": [9, 45], "0701": 46, "0714": 8, "0727": 46, "0820": 46, "08481": 10, "08895": 10, "0958": 46, "0973": 46, "0983": 2, "0x7fea8ebc0ee0": 3, "0x7fea8ec2a2e0": 3, "0x7fea8ec5f790": 8, "0x7feaa01afac0": 2, "0x7feaa01aff40": 2, "0x7feaa01bcbe0": 2, "0x7feaa0415d00": 8, "0x7feab52594c0": 4, "0x7feab5259a00": 4, "0x7feab5259dc0": 4, "0x7feab52b2e50": 5, "0x7feab84cca90": 8, "1": [0, 2, 3, 4, 5, 6, 7, 8, 10, 13, 14, 15, 16, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 40, 43, 44, 46, 48], "10": [0, 2, 3, 7, 8, 43, 46], "100": [0, 2, 4, 6, 7, 8, 10, 48], "1000": [0, 2, 4, 10, 46], "10000": 46, "100000": 48, "1000x": 46, "1011435": 46, "1024": 46, "104": 7, "1073741824": 5, "1097": 46, "11": 8, "1150": [14, 15], "1157627904": 5, "1168": [2, 46], "1190": 46, "12": [2, 3, 4, 8, 9, 45], "1228": 2, "1254": 4, "127": 46, "128": [3, 4, 5], "128x128": [0, 2, 3, 7], "1292": 2, "13": [2, 8], "1300": 8, "1316939406096935": 4, "1337": 4, "1341": 2, "1350": 4, "13755767822265624": 3, "138412032": 5, "1389": 2, "1394": 2, "14": 8, "1403": 2, "1407": 46, "141": 46, "1432": 3, "15": [2, 3, 4, 8, 46], "1506": 2, "15188": 43, "1533": 2, "1545": 4, "1556": 46, "15859518039226533": 2, "1596": 2, "1598": 3, "16": [0, 2, 4, 6, 7, 8, 10, 13, 34, 48], "1602": 2, "1604": 2, "16421420609951018": 4, "1649": 4, "1699": 2, "16_h1": [2, 4, 8], "16_l2": [2, 4, 8], "16x16": 6, "17": 8, "172": [2, 4, 6, 7, 8], "1735": 2, "1738": 2, "1762": 4, "18": [2, 3, 4, 8, 46], "1803": 2, "1804": 4, "1816": 4, "1877": 46, "1885": 8, "1886": 4, "1887": 2, "1893": 46, "19": 8, "1903": 4, "1910": 4, "1913": [14, 15], "1914": [14, 15], "1959": 2, "1982": 46, "19837799549102783": 8, "1984": 8, "1d": [23, 31, 37], "1e": [0, 2, 3, 4, 8, 46], "1st": 6, "2": [0, 2, 3, 4, 5, 6, 7, 8, 14, 15, 20, 21, 22, 28, 40, 46, 48], "20": [0, 2, 3, 4, 7, 8, 10, 46], "200": [3, 48], "2010": 10, "2017": 48, "2020": [10, 46, 48], "2021": [10, 46], "2022": 40, "2023": 26, "2024": 43, "2034": 8, "2048": [4, 46], "2068": 4, "21": [8, 46], "2108": 10, "211": 46, "2119329": 8, "2121": 3, "2147": 8, "2155": 4, "2172": 4, "2174": 8, "2176": 2, "2186": 8, "22": 8, "2202": 8, "2211": 43, "2232": 8, "2267": 8, "2268": 46, "2272": 8, "2296": 8, "23": 8, "2311": [8, 46], "2313": 46, "2323": 4, "2324": [14, 15], "2325": [14, 15], "2368": 4, "2376": 3, "2382": [14, 15], "2390": 2, "24": 46, "2404": 8, "241": 48, "2420": 8, "2477": 8, "2496": 8, "25": [3, 9, 45, 46], "2503999488": 5, "2504": 8, "2542": 2, "2555": 8, "256": [2, 3, 4, 30, 34, 35, 36, 40, 46], "2569": 3, "2593": 8, "2597": 4, "26": [2, 34], "2621": 8, "2623": 8, "2624": 2, "2629": 2, "2630": 8, "2655": 3, "266": 46, "2665921": 4, "2673": 3, "268435456": 5, "2685": 4, "2714": 8, "272629760": 5, "2739": 2, "2747": 2, "2753": 46, "2754": 8, "2755": 3, "2769": 8, "2783": 8, "278435": 3, "279": [7, 9, 45], "2795": 8, "28": [2, 7, 46], "2818": 2, "2820": 8, "2826": 8, "2829": 8, "283185307179586": [27, 28], "2840": 8, "2855": 46, "2891": 8, "29": 8, "2975": 8, "2978": 8, "2985": 8, "2_": 46, "2d": [7, 24, 32, 38, 40, 46, 47], "2nd": 6, "3": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 14, 15, 17, 30, 34, 35, 36, 40, 46, 48], "30": [0, 2, 3, 4, 8, 46], "3013": 8, "3022": 3, "3024": 8, "3041": 8, "3091": 3, "31": 8, "3102": 8, "3157": 3, "3172": 2, "3178346639999745": 8, "3179": 8, "3189": 3, "32": [0, 2, 3, 4, 6, 7, 8, 10, 13, 40, 48], "3210": 4, "3212": 2, "3221": 3, "3232": 3, "3238": 46, "3279": 8, "3280": 8, "32_h1": [2, 4, 8], "32_l2": [2, 4, 8], "32x32": 6, "3320": 8, "3368": 2, "3371": 8, "3394": 8, "3395": 8, "3418": 8, "3420": [14, 15], "3422": 8, "3434": 8, "3467": 8, "3530": 8, "3548": 3, "3582": 8, "3596": 2, "3600": 8, "3631": 8, "3649": [2, 8], "3661": 8, "3662": 8, "3676": 2, "3741": [14, 15], "3785": 8, "3786": 8, "3794": 8, "38": 46, "3807": 8, "3833": 8, "3834": 3, "3843": 8, "3897": 4, "3915": 8, "3946": 8, "3987": 4, "3d": [7, 17, 25, 33, 39, 46], "4": [0, 2, 3, 4, 5, 6, 7, 8, 22, 30, 34, 35, 36, 40, 46], "40": 3, "4001": 4, "4008": 8, "4053": 8, "4055": 8, "4073": 8, "4078": 8, "4096": 46, "41": 3, "4114261440000746": 3, "414": 46, "415": [2, 9, 45], "4156": 8, "4194304": 5, "42": [0, 2], "4201": 8, "421": 46, "4213": 8, "4252": 8, "4255": 8, "4258": 8, "429": [6, 9, 45], "4326": 2, "4391": 8, "4395": 8, "44": [3, 9, 45], "4408": 8, "4443": [8, 14, 15], "4473": 8, "4499": 8, "451": 46, "4515": 8, "4567": 8, "46": [3, 4], "4604": 3, "4640": 3, "4651": 3, "4668": 8, "4696": 8, "47": [3, 4, 46], "4747": 2, "48": [4, 46], "4848": 8, "485": [9, 45], "491": [4, 9, 45, 46], "4924112896": 5, "497358972000029": 4, "4d": [14, 15], "5": [2, 3, 4, 7, 8, 10, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 43, 46, 48], "50": [0, 2, 3, 4, 6, 7, 8, 46], "500": 7, "5000": 7, "5093": 8, "5112": [14, 15], "5113": [14, 15], "512": [34, 46], "5165": 8, "517": 46, "5216": 8, "523257": 2, "5249": 2, "5251": 2, "5348": 8, "5357": 8, "537": 46, "54": [2, 9, 45], "5407": 8, "5430": 4, "550230712890625": 3, "5567": 3, "5568": 4, "558": 46, "5593": [14, 15], "5647": 8, "5652": 4, "5729": [3, 4], "5858": 4, "5890": 8, "5908": 8, "5989": 4, "5999": 4, "6": [2, 3, 4, 8, 27, 28, 46], "60": 46, "6063": 4, "6085": 8, "61": 4, "6114": 8, "6122": [14, 15], "6165": 3, "63": 2, "6300": 8, "6347": 2, "6383": 4, "6390": 3, "64": [0, 2, 3, 4, 5, 10, 34, 40, 46], "641": 46, "642554324999992": 2, "6456": 8, "6494": 8, "65": 2, "66": 2, "6641": 8, "6661": 8, "6667": 8, "67": 46, "6716": 8, "6751": 3, "6852": 8, "69": 2, "7": [2, 3, 4, 6, 8, 46], "7031": 8, "7071": 2, "7171": 4, "7238": 4, "724": 46, "7315": 4, "7319": 8, "7433": 8, "7436": 8, "7456": 4, "7626": 4, "7750": 8, "776": [8, 9, 45], "78": 46, "7885": 4, "7909": 4, "7922": 4, "7927": 8, "8": [4, 8, 9, 45], "80": [34, 46], "8002": 2, "8192": 46, "8339713641575406": 8, "8340": 8, "83886080": 5, "8414": 3, "8484": 3, "85": 46, "8936": 4, "8e": [0, 2, 3, 4, 8], "9": [2, 3, 4, 8], "9003": 2, "93": [2, 4, 6, 7, 8], "950": 46, "9559": 8, "956099387258291": 2, "96": 4, "9693": 4, "98": [2, 3, 4, 6, 8], "99": 46, "999": [2, 3, 4, 8], "9999": 8, "A": [1, 9, 10, 16, 21, 43, 44, 45, 46], "And": [10, 46, 48], "As": [46, 47], "At": 48, "But": 48, "By": [7, 14, 30, 34, 35, 36, 46, 48], "For": [7, 16, 17, 31, 32, 33, 37, 38, 39, 40, 46, 48, 50], "If": [8, 10, 11, 16, 22, 26, 30, 34, 35, 36, 37, 38, 39, 40, 46, 48], "In": [0, 2, 3, 4, 5, 6, 7, 8, 12, 14, 15, 22, 46, 48], "It": [2, 4, 6, 7, 8, 10, 11, 12, 46, 48], "Its": [14, 15], "NO": [1, 9, 40, 45], "NOs": 50, "On": 46, "That": [46, 48], "The": [6, 7, 10, 11, 14, 15, 16, 19, 22, 26, 30, 35, 36, 46, 47, 48, 49], "Then": [11, 16, 48], "There": 46, "These": 48, "To": [5, 10, 12, 30, 35, 36, 46, 48, 50], "_": [5, 40, 43, 44, 46, 48], "__init__": [5, 46], "_a": 48, "_description_": 27, "_isht_cach": 3, "_l2": 3, "_sht_cach": 3, "_test_": [2, 4, 6, 7, 8], "_type_": 27, "a_j": 48, "ab": [10, 27, 28], "abil": 12, "abl": 48, "about": [46, 48], "abov": [34, 46, 48], "absolut": [27, 28, 29, 48], "accept": [14, 15], "accord": [27, 28, 48, 50], "accordingli": 42, "accumul": 8, "accur": 48, "accuraci": [46, 48], "achiev": [46, 48], "across": [7, 16, 27, 28, 44, 50], "act": [46, 48], "activ": [20, 22, 23, 24, 25, 26, 34, 46, 48], "actual": [0, 2, 3, 4, 42], "ada_in": [30, 34, 35, 36], "adamw": [0, 2, 3, 4, 8], "adapt": 34, "add": [6, 7, 43, 46, 48], "add_safe_glob": [2, 4, 6, 7, 8], "add_subplot": [2, 3, 4, 6, 8], "addit": [7, 12, 14, 15, 22, 30, 34, 35, 36, 40, 48], "adjust": [42, 50], "advantag": [12, 46, 48], "after": [7, 30, 34, 35, 36, 40], "afterward": [15, 40], "again": [7, 8, 22, 26, 48], "against": [16, 46], "aggreg": 48, "ai": 46, "aim": [46, 48, 49], "airfoil": 48, "al": 48, "algorithm": [8, 43, 48], "alias": [22, 26], "all": [1, 7, 8, 10, 11, 14, 15, 16, 17, 22, 26, 27, 28, 30, 34, 35, 36, 40, 44, 45, 46, 48, 49, 50], "all_error": 44, "all_metr": 44, "allow": [2, 4, 6, 7, 8, 22, 26, 30, 35, 36, 40, 46, 50], "allowlist": [2, 4, 6, 7, 8], "almost": 48, "along": [22, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40], "alreadi": [27, 28, 48], "also": [10, 12, 22, 26, 42, 46, 48, 50], "although": [15, 40, 46], "among": [46, 48], "amount": [19, 22, 46], "an": [2, 4, 6, 7, 8, 10, 11, 16, 19, 20, 21, 22, 26, 30, 34, 35, 36, 37, 38, 39, 40, 42, 46, 47], "anaconda": 11, "analys": 7, "analysi": [1, 9, 45], "analyt": 48, "analyz": 7, "anandkumar": [10, 26, 43, 46, 48], "andrew": [10, 46, 48], "ani": [2, 4, 6, 7, 8, 10, 12, 19, 46, 48], "anima": [10, 26, 46, 48], "anoth": [46, 48], "anymor": 48, "anyon": 50, "api": [10, 20, 50], "append": [6, 30, 35, 36, 40], "appli": [7, 10, 12, 19, 20, 22, 26, 40, 46], "applic": [12, 46, 48, 49], "approxim": [46, 47], "ar": [2, 4, 6, 7, 8, 10, 11, 14, 15, 16, 22, 26, 30, 35, 36, 40, 46, 48, 49, 50], "arang": 7, "arbitrari": [2, 4, 6, 7, 8, 12, 17, 18, 46], "arch": 42, "architectur": [12, 40, 46, 48], "archiveprefix": 10, "area": 48, "aren": 42, "arg": [14, 15, 30, 31, 32, 33, 35, 36, 37, 38, 39], "argument": [14, 15, 42], "aris": 48, "around": 16, "art": 46, "articl": [10, 46], "arxiv": [10, 43], "as_posix": [2, 4, 6, 7, 8], "ashiqur": 40, "associ": 12, "assum": [15, 16, 30, 35, 36, 40, 48], "ast825": 7, "astronomi": 7, "asynchron": [14, 15], "attempt": 7, "attribut": [22, 26, 27, 28, 30], "author": [1, 7, 9, 10, 45], "auto": [22, 23, 24, 25, 26], "auto_exampl": [9, 10], "auto_examples_jupyt": 1, "auto_examples_python": 1, "autoencod": 46, "autom": [10, 12, 50], "automat": [8, 12, 19, 22], "avail": [41, 48], "averag": [44, 48], "avg_lasso_loss": [2, 3, 4, 8, 43, 44], "avg_loss": [2, 3, 4, 8, 43, 44], "avoid": [22, 26], "awesom": 48, "ax": [2, 3, 4, 6, 7, 8], "axi": 7, "azizzadenesh": [10, 40, 46, 48], "b": [10, 16, 17, 40, 48], "b_r": 17, "back": 48, "backend": 50, "backward": 5, "ball": 17, "base": [5, 6, 8, 12, 26, 43, 46, 48], "baseconv": [30, 35, 36], "basi": [22, 26, 46], "basic": [10, 44], "batch": [2, 3, 4, 6, 7, 14, 15, 16, 19, 20, 21, 34, 44, 46, 50], "batch_siz": [0, 2, 3, 4, 5, 6, 7, 8, 10, 13, 22, 23, 24, 25, 26], "batchsiz": [7, 46], "baust": 26, "bayesian": 46, "bear": 48, "becaus": [7, 46, 48], "becom": [46, 48], "been": 48, "befor": [8, 14, 30, 34, 35, 36, 43], "begin": 44, "behavior": 7, "being": 16, "below": [5, 14, 15], "benchmark": [46, 48], "besid": 48, "best": [7, 10, 44, 46], "beta": [2, 3, 4, 8], "better": 46, "between": [10, 12, 17, 18, 19, 27, 28, 29, 34, 48, 49], "beyond": 22, "bhattacharya": [10, 46, 48], "bia": [2, 3, 4, 14, 15, 20, 21, 22, 23, 24, 25, 26, 46], "bibtex": 10, "big": 48, "bixi": 46, "black": 46, "blob": [2, 4, 6, 7, 8], "block": [12, 30, 34, 35, 36, 37, 38, 39, 40, 46], "blog": 48, "bmm": 5, "bodi": 48, "boilerpl": [12, 50], "bold": 48, "bonev": 26, "bool": [8, 14, 16, 17, 20, 21, 22, 23, 24, 25, 30, 34, 35, 36, 40, 43, 44], "bori": 26, "both": [6, 19, 44, 46, 48], "bottom": 46, "bound": 48, "boundari": 46, "box": [10, 46], "boxi": 46, "br": 46, "buffer": [7, 8, 14, 15], "build": [12, 16, 49], "built": [16, 34, 40], "bunch": 42, "burger": 46, "buriged": [10, 46, 48], "burn": 46, "c": [10, 16, 46], "calcul": 8, "call": [11, 14, 15, 40], "callabl": [16, 43], "can": [2, 3, 4, 7, 8, 10, 11, 12, 14, 15, 22, 26, 30, 35, 36, 40, 44, 46, 48, 50], "cannot": [22, 48], "captur": [7, 46], "care": [15, 22, 40, 50], "carlo": [46, 48], "case": [2, 4, 6, 7, 8, 22, 24, 25, 42, 44, 50], "cast": [14, 15, 48], "cat": 7, "cd": 11, "cdata": 46, "cdot": [46, 48], "cdoubl": [14, 15], "center": [18, 48], "certain": 48, "cfloat": 46, "ch7": 7, "chain": 46, "chang": [7, 8, 22, 26, 48], "channel": [6, 13, 19, 20, 21, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46], "channel_dim": 13, "channel_mlp": 16, "channel_mlp_dropout": [30, 35, 36], "channel_mlp_expans": [30, 35, 36], "channel_mlp_lay": 16, "channel_mlp_non_linear": 16, "channel_mlp_skip": [30, 35, 36], "channel_mlpdropout": 40, "channel_mlpexpans": 40, "channel_mlpskip": 40, "channelmlp": [2, 3, 4, 30, 34, 35, 36, 40], "channels_last": [14, 15], "chaotic": 46, "check": [5, 7, 12, 46, 48, 50], "checkpoint": [0, 10, 44], "checkpoint_fno_darci": [0, 9, 45], "choic": 46, "choos": 8, "christian": 26, "circ": 46, "cite": 10, "ckpt": 44, "class": [5, 12, 14, 15, 16, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 43, 44, 46, 47, 48], "classic": [46, 48], "closer": 48, "closest": 22, "cmap": [2, 4, 6, 8], "cnn": 46, "coars": 46, "code": [0, 1, 2, 3, 4, 5, 6, 7, 8, 12, 46], "coeffcient": 46, "coeffici": [46, 48], "collat": 6, "collect": [5, 44, 48], "com": [2, 4, 6, 7, 8, 11, 46], "combin": 46, "come": [10, 11, 48], "common": 48, "compar": [2, 3, 4, 5, 8, 46, 48], "compat": 20, "compl_mul2d": 46, "complex": [14, 15, 22, 30, 35, 36, 44, 46], "complex128": [14, 15], "complex_data": [22, 23, 24, 25, 30, 35, 36], "complexdensetensor": 3, "compon": 49, "comprehens": 10, "compris": 48, "comput": [5, 14, 15, 16, 27, 28, 29, 34, 40, 43, 46, 48, 50], "compute_term": 27, "conclus": 47, "concret": 48, "condit": [46, 48], "conduct": 46, "config": [42, 46], "configur": [12, 42, 46], "confirm": 48, "connect": [21, 22, 26, 30, 34, 35, 36, 40, 46], "consid": [46, 48], "consist": 46, "constant": [16, 27, 28], "constitu": 7, "construct": [2, 4, 6, 7, 8, 46, 48], "contain": [14, 15, 16], "context": 48, "continu": [46, 48], "continuum": 46, "contract": [10, 22, 30, 34, 35, 36, 40], "control": [2, 4, 6, 7, 8], "conv": [2, 3, 4, 5, 22, 23, 24, 25, 26, 34], "conv1d": [2, 3, 4], "conv_modul": [30, 35, 36], "conveni": [48, 49], "convent": 46, "converg": 46, "convert": [7, 10, 14, 15], "convolut": [5, 12, 22, 26, 30, 34, 35, 36, 40, 46, 48], "convolv": 46, "coordin": [12, 17, 18, 34], "copi": 5, "corr": 10, "correct_bia": [2, 3, 4, 8], "correspond": [7, 20, 21, 26, 30, 35, 36, 42, 44], "cosineannealinglr": [0, 2, 3, 4, 8], "cost": [44, 46], "could": [2, 4, 6, 7, 8, 48], "count": [1, 9, 45], "count_model_param": [0, 2, 3, 4, 8], "cp": [22, 26, 30, 34, 35, 36, 40], "cpu": [0, 2, 3, 4, 5, 8, 14, 15, 16, 43, 44], "cr": [16, 17], "crack": 46, "creat": [0, 2, 3, 4, 5, 6, 8, 10, 12, 27, 28, 44, 46, 48], "cretiz": 46, "crucial": 48, "cuda": [3, 8, 14, 15], "current": [2, 4, 6, 7, 8, 44], "cylind": 48, "d": [0, 2, 3, 4, 8, 12, 16, 17, 27, 28, 46, 48], "d1": [16, 19, 22, 23, 24, 25, 26], "d2": 16, "d3": 16, "dai": 48, "darci": [1, 3, 9, 10, 45, 46, 48], "data": [0, 2, 3, 4, 7, 8, 10, 17, 18, 22, 27, 28, 30, 34, 35, 36, 44, 46, 48, 49, 50], "data_channel": 42, "data_dict": [14, 15], "data_load": 44, "data_loss": [2, 3, 4, 8], "data_processor": [0, 2, 4, 6, 7, 8, 10, 43, 44], "data_root": 13, "data_transform": 8, "dataload": [3, 43, 44], "dataset": [0, 1, 2, 3, 4, 7, 8, 9, 10, 12, 44, 45, 49], "dataset_indic": 8, "dataset_nam": [2, 4, 6, 7, 8], "dataset_pr": 7, "dataset_resolut": 8, "datset": 7, "db": [2, 4, 6, 7, 8], "deal": [22, 26, 46, 48], "decod": 46, "decompos": 7, "decomposit": [10, 22, 30, 34, 35, 36, 40, 46], "decomposition_kwarg": [22, 23, 24, 25, 26, 30, 35, 36, 40], "deconvolut": 46, "decreas": [43, 46], "deep": [46, 48], "deepcopi": 5, "def": [5, 46], "default": [2, 4, 5, 6, 7, 8, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 37, 38, 39, 40, 44], "defaultdict": 5, "defin": [7, 15, 16, 34, 40, 46, 48], "deform": 46, "degrad": 46, "delta": [46, 48], "delta_x": 48, "demonstr": [0, 2, 3, 4, 5, 6, 7, 8], "denot": [40, 46, 48], "dens": [3, 10, 22, 30, 35, 36, 40], "densetensor": 4, "depend": [6, 7, 11, 12, 16, 46, 48], "depth": [33, 39], "depthwis": [30, 34, 35, 36, 40], "deriv": [27, 48], "describ": 43, "descript": [16, 49], "design": 46, "desir": [14, 15, 19], "detach": [2, 3, 4, 8], "detail": [2, 4, 6, 7, 8, 30, 35, 36, 40, 46, 50], "determinist": [14, 15], "develop": 48, "devic": [0, 2, 3, 4, 5, 8, 14, 15, 22, 23, 24, 25, 26, 43, 44, 46, 50], "di": 46, "diagon": 16, "dict": [5, 14, 16, 22, 23, 24, 25, 30, 34, 35, 36, 40, 42, 44], "dictionari": [14, 44], "differ": [7, 22, 27, 46, 48], "differenti": [10, 46, 48], "difficult": 48, "diffus": 46, "dim": [6, 7, 14, 16, 19, 22, 27, 28, 30, 35, 36], "dimens": [7, 8, 12, 16, 22, 27, 28, 30, 34, 35, 36, 40, 46, 48], "dimension": [20, 21, 22, 27, 28, 30, 35, 36, 46, 48], "directli": [10, 12, 22, 30, 34, 35, 36, 40, 46, 48], "directori": 44, "dirichlet": 46, "discret": [27, 28, 30, 35, 36, 40, 46, 47], "displai": 48, "distribiut": 11, "distribut": [7, 46, 47, 48], "distributeddataparallel": 50, "dn": [19, 22, 23, 24, 25, 26], "do": [10, 12, 46, 48, 50], "doc": [10, 11, 46], "document": 50, "doe": [30, 35, 36, 40, 43, 46, 48], "domain": [7, 12, 19, 22, 30, 34, 35, 36, 40, 46, 48, 50], "domain_pad": [4, 19, 30, 35, 36, 40], "domain_padding_mod": [30, 35, 36, 40], "domainpad": 4, "don": [2, 4, 6, 7, 8, 30, 35, 36, 37, 38, 39, 48], "dot": [46, 48], "doubl": [14, 15], "download": [0, 1, 2, 3, 4, 5, 6, 7, 8], "downsampl": [22, 26], "draw": 46, "drawback": 48, "drawn": 50, "driven": [46, 48], "dropout": [34, 40], "droupout": [30, 35, 36], "dtype": [7, 14, 15, 22, 23, 24, 25, 26, 46], "dure": [2, 4, 5, 6, 7, 8, 15, 22, 30, 35, 36, 40, 44], "dy": [16, 46, 48], "dynam": [22, 26, 30, 35, 36, 40, 46, 48], "e": [11, 14, 15, 22, 26, 30, 35, 36, 40, 46, 48], "each": [5, 8, 12, 16, 17, 18, 22, 26, 30, 34, 35, 36, 37, 38, 39, 40, 44, 46, 48], "easi": 50, "easier": 48, "easili": [11, 46, 49, 50], "eaxmpl": 40, "edg": [46, 48], "edit": 11, "edu": 7, "effici": [10, 46, 48], "effort": 48, "einsum": 46, "either": 28, "elast": [46, 48], "electr": 46, "element": [46, 48], "elif": 5, "ellipt": [46, 48], "els": [3, 8], "embed": [6, 30, 34, 35, 36, 40], "emploi": 48, "emsp": 10, "enabl": 10, "encod": [13, 15, 46, 48], "encode_input": 13, "encode_output": [7, 13], "encount": 48, "end": [0, 2, 3, 4, 5, 6, 7, 8, 49], "energi": 7, "engin": 46, "enough": 48, "entir": [16, 44], "entri": [30, 35, 36, 40], "enumer": 3, "env": [14, 15], "ep": [2, 3, 4, 8, 48], "epoch": [0, 2, 3, 4, 8, 43, 44, 46], "epoch_gap": 8, "epoch_train_tim": [2, 3, 4, 8, 43], "eprint": 10, "equat": [1, 9, 10, 45, 46, 47], "equiangular": 26, "equival": [10, 11, 46, 48], "error": [16, 29, 44, 46, 48], "especi": 48, "estim": [5, 46, 48], "et": 48, "etc": [30, 35, 36], "euclidean": 48, "eval": [2, 3, 4, 8, 14, 44], "eval_interv": [0, 2, 3, 4, 10, 43, 44], "eval_loss": [0, 2, 3, 4, 8, 10, 44], "eval_metr": 44, "eval_one_batch": 44, "eval_step_loss": 44, "evalu": [44, 46, 48, 50], "evaluate_al": 44, "even": [22, 48], "everi": [15, 40], "everywher": 46, "exact": [30, 35, 36, 37, 38, 39], "examin": 7, "exampl": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 14, 15, 16, 40, 44, 45, 46, 48], "example_fno": 10, "exclud": [20, 21], "execut": [2, 4, 6, 7, 8, 9, 45], "exist": [15, 27, 28, 46], "expans": [30, 34, 35, 36, 40], "expect": [12, 14], "expens": 48, "experi": [11, 16, 47], "experiment": [2, 4, 6, 7, 8, 10], "explain": 8, "explicit": 46, "explicitli": [2, 4, 6, 7, 8], "express": 48, "extrapol": 48, "f": [0, 2, 3, 4, 5, 6, 7, 8, 16, 30, 34, 35, 36, 40, 44, 46, 48], "f_y": 16, "fact": 46, "factor": [0, 2, 3, 10, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40], "factorizedspectralconv": 46, "fairli": 48, "fallback": 34, "fals": [0, 2, 3, 4, 6, 7, 8, 10, 13, 14, 15, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 34, 35, 36, 40, 43, 44], "famili": 46, "fashion": 50, "fast": 46, "faster": [46, 48], "fc": [2, 3, 4, 5], "fcn": 46, "fdm": 46, "featur": [2, 4, 6, 7, 8, 21, 34, 48], "feed": 48, "feedforward": [46, 48], "fem": 46, "few": [2, 3, 4, 8, 10, 48], "fft": [22, 30, 34, 35, 36, 46], "fft_norm": [22, 23, 24, 25, 40], "field": [7, 46], "fig": [2, 3, 4, 6, 7, 8], "figsiz": [2, 3, 4, 6, 7, 8], "figur": [2, 3, 4, 6, 7, 8, 46, 48], "file": [2, 4, 6, 7, 8, 9, 45], "filter": 46, "final": [8, 34, 46, 48], "find": [12, 17, 18, 48], "fine": [46, 48], "finit": [27, 46, 48], "first": [6, 7, 10, 46, 48], "fit": [2, 3, 4, 8], "five": 40, "fix": 47, "fix_x_bnd": 27, "fix_y_bnd": 27, "fix_z_bnd": 27, "fixed_rank_mod": [22, 23, 24, 25, 26, 30, 35, 36, 40], "flattened1dconv": [2, 3, 4], "flip": [2, 4, 6, 7, 8], "float": [5, 7, 14, 15, 17, 18, 19, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 40, 43, 44], "float16": [14, 15], "float32": 26, "float64": [14, 15], "flop": [1, 9, 45], "flop_count": 5, "flop_count_dict": 5, "floptensordispatchmod": 5, "flow": [1, 3, 9, 10, 45, 46], "fluid": [7, 46, 48], "flush": [0, 2, 3, 4, 8], "fno": [0, 2, 3, 5, 6, 8, 10, 22, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 43, 46], "fno_ada_in_dim": 34, "fno_ada_in_featur": 34, "fno_backward_flop": 5, "fno_block": [2, 3, 4, 5, 40], "fno_block_precis": [22, 23, 24, 25, 30, 34, 36], "fno_channel_mlp_dropout": 34, "fno_channel_mlp_expans": 34, "fno_channel_mlp_skip": 34, "fno_conv_modul": 34, "fno_decomposition_kwarg": 34, "fno_factor": 34, "fno_fixed_rank_mod": 34, "fno_forward_flop": 5, "fno_hidden_channel": 34, "fno_implement": 34, "fno_in_channel": 34, "fno_incremental_n_mod": 34, "fno_joint_factor": 34, "fno_n_lay": 34, "fno_n_mod": 34, "fno_non_linear": 34, "fno_norm": 34, "fno_output_scaling_factor": 34, "fno_preactiv": 34, "fno_projection_channel": 34, "fno_rank": 34, "fno_separ": 34, "fno_skip": [2, 3, 4, 5, 30, 34, 36, 40], "fno_stabil": 34, "fno_use_channel_mlp": 34, "fnoblock": [2, 3, 4, 40], "focu": 48, "follow": [10, 16, 46, 48, 50], "font": 7, "forc": 46, "form": [10, 12, 19, 22, 46, 48], "formal": 48, "format": [7, 14, 15, 16, 17, 48], "former": [15, 40], "formul": [12, 46, 47], "forward": [5, 10, 14, 15, 16, 17, 19, 20, 22, 23, 24, 25, 26, 30, 34, 35, 36, 37, 38, 39, 40, 46, 48], "four": 46, "fourier": [0, 2, 3, 7, 10, 22, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 47], "fourier_lay": 46, "frac": 48, "fraction": 19, "framework": [47, 48], "free": [11, 48], "frequenc": [7, 46], "from": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 16, 18, 19, 22, 26, 30, 34, 35, 36, 40, 42, 43, 44, 45, 46, 48, 50], "from_checkpoint": 10, "ftdm": 5, "full": [0, 2, 3, 4, 5, 6, 7, 8, 12, 22, 23, 24, 25, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 46, 49], "fulli": 46, "function": [2, 4, 5, 6, 7, 8, 10, 12, 15, 16, 22, 26, 27, 28, 34, 40, 43, 44, 46, 48, 49, 50], "further": 48, "furthermor": 48, "futur": [2, 4, 6, 7, 8], "futurewarn": [2, 4, 6, 7, 8], "g": [14, 15, 22, 26, 30, 35, 36, 48], "g_a": 48, "gain": 7, "galleri": [0, 2, 3, 4, 5, 6, 7, 8, 45], "gap": 8, "gate": [20, 21, 30, 34, 35, 36, 40], "gauss": 26, "gelu": [16, 30, 34, 35, 36, 40], "gener": [0, 1, 2, 3, 4, 5, 6, 7, 8, 11, 12, 22, 23, 24, 25, 26, 44, 46, 47], "geometr": 34, "geometri": 34, "georg": [1, 7, 9, 43, 45], "get": [6, 34, 48], "get_conv": [22, 26], "get_fram": 7, "get_max_flop": 5, "gilmer": 48, "git": 11, "github": [2, 4, 6, 7, 8, 48], "give": [30, 35, 36, 37, 38, 39, 46, 48], "given": [14, 15, 16, 20, 42, 44, 46, 48], "global": 46, "gno": [16, 34, 46], "gno_channel_mlp_non_linear": 34, "gno_coord_dim": 34, "gno_coord_embed_dim": 34, "gno_embed_max_posit": 34, "gno_radiu": 34, "gno_use_open3d": 34, "gno_use_torch_scatt": 34, "go": [0, 2, 3, 4, 5, 6, 7, 8], "goal": 48, "good": [46, 48], "govern": [10, 48, 50], "gpu": [2, 3, 4, 8, 46, 50], "gpu1": [14, 15], "gradient": [8, 50], "grai": [2, 4, 6, 8], "graph": [12, 16, 46, 47], "great": 48, "green": 48, "grid": [6, 7, 26, 30, 34, 35, 36, 40, 42, 46, 48], "gridembed": [30, 35, 36, 40], "gridembedding2d": [6, 30, 35, 36, 40], "gridembeddingnd": [2, 3, 4, 30, 35, 36, 40], "gridi": 7, "gridx": 7, "gridz": 7, "ground": [2, 3, 4, 8, 14], "ground_truth": 44, "group": [2, 3, 4, 8], "group_norm": [30, 35, 36], "guid": 10, "h": [27, 28, 46], "h1": [0, 2, 3, 4, 8, 27], "h1loss": [0, 2, 3, 4, 8], "ha": [0, 2, 3, 4, 12, 15, 22, 26, 30, 35, 36, 40, 46, 48], "half": [14, 15, 30, 35, 36], "hand": 46, "hao": 46, "happen": 48, "hard": [46, 48], "harder": 7, "harmon": 12, "have": [2, 4, 6, 7, 8, 10, 11, 12, 20, 21, 26, 42, 46, 48], "height": [20, 31, 32, 33, 37, 38, 39], "help": 46, "henc": [16, 48], "henceforth": 48, "here": [6, 11, 48, 49], "hidden": [30, 34, 35, 36, 40, 48], "hidden_channel": [0, 2, 3, 4, 5, 8, 10, 30, 35, 36, 40], "high": [7, 48], "higher": [7, 46], "highli": 7, "hold": [44, 50], "home": [2, 4, 6, 7, 8, 13], "hook": [15, 40], "horizont": 40, "horizontal_skip": [4, 40], "horizontal_skips_map": [4, 40], "host": [14, 15], "how": [0, 2, 3, 4, 5, 6, 7, 8, 30, 35, 36, 40, 48], "howev": [2, 3, 4, 8, 22, 26, 46, 48], "html": 11, "http": [2, 4, 6, 7, 8, 10, 11, 43, 46, 48], "hundr": 48, "hundt": 26, "hydrologi": 48, "i": [2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 14, 15, 16, 19, 20, 21, 22, 23, 24, 25, 26, 30, 34, 35, 36, 37, 38, 39, 40, 42, 44, 46, 48, 50], "i_1": 22, "i_n": 22, "iclr": 10, "icml": 26, "ideal": 48, "ident": [21, 22, 26, 30, 34, 35, 36, 40], "idx": 44, "ignor": [7, 15, 22, 40], "ignore_w": [14, 15], "ii": [2, 3, 4, 8], "illustr": 46, "imag": [46, 48], "implement": [10, 16, 17, 18, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 43, 47, 50], "implicit": 48, "implicitli": [2, 4, 6, 7, 8], "import": [0, 2, 3, 4, 5, 8, 10, 11, 46, 48], "improv": [10, 48], "imshow": [2, 3, 4, 6, 8], "in_channel": [0, 2, 3, 4, 5, 8, 10, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46], "in_featur": [14, 15, 20, 21], "in_gno_channel_mlp_hidden_lay": 34, "in_gno_transform_typ": 34, "in_norm": [8, 14, 15], "includ": [8, 10, 12, 46, 48], "incompress": 46, "incr": 8, "increas": [8, 22, 30, 35, 36, 40, 43, 46], "increment": [8, 30, 35, 36, 40, 43], "incremental_buff": [8, 43], "incremental_grad": [8, 43], "incremental_grad_ep": [8, 43], "incremental_grad_max_it": [8, 43], "incremental_loss_ep": [8, 43], "incremental_loss_gap": [8, 43], "incremental_max_it": [8, 43], "incremental_n_mod": 40, "incremental_res_gap": 8, "incremental_resolut": 8, "incrementaldataprocessor": 8, "incrementalfnotrain": 8, "incrementaltrain": 8, "inde": 48, "indefinit": 48, "indeped": 46, "independ": [16, 46], "index": [2, 3, 4, 6, 7, 8, 11, 22, 23, 24, 25, 26, 44, 48], "indic": [8, 17, 22, 23, 24, 25, 26, 46], "individu": [22, 44, 49], "ineffici": 46, "infer": [12, 30, 35, 36, 44, 46], "inferenc": 14, "infinit": 48, "inform": [10, 34, 48], "infti": 46, "inherit": 43, "init": 22, "init_std": [22, 23, 24, 25, 26], "initi": [7, 8, 30, 35, 36, 40, 46, 48], "initial_lr": [2, 3, 4, 8], "input": [2, 3, 4, 6, 8, 10, 12, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 37, 38, 39, 40, 44, 46, 48], "input_geom": 34, "input_grid": 26, "insight": 7, "instal": [10, 16, 50], "instanc": [12, 15, 34, 40, 46], "instance_norm": [30, 35, 36], "instanci": 42, "instansi": 16, "instanti": 42, "instead": [15, 22, 40, 46, 48], "insuffici": 46, "int": [5, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 43, 44, 46], "int_": [16, 48], "int_d": 48, "integ": 22, "integr": [12, 14, 15, 16, 40, 46, 48], "integral_oper": 40, "integraltransform": 34, "integrate_lat": 34, "interest": 46, "interfac": [12, 50], "interpol": [46, 48], "interv": 44, "introduc": [46, 48], "introduct": 47, "invari": [6, 10, 46, 48], "invers": [30, 35, 36, 46, 48], "involv": [46, 48], "io": 48, "ioxi": 46, "ipynb": [0, 2, 3, 4, 5, 6, 7, 8], "irfft": 46, "irfft2": 46, "irrespect": 46, "is_avail": [3, 8], "isinst": 5, "issu": [2, 4, 6, 7, 8, 16], "item": [5, 6], "iter": [6, 8, 47], "its": [7, 12, 16, 34, 46], "j": [14, 15, 16, 17, 43, 48], "jaideep": 26, "jmlr": 10, "joinpath": [2, 4, 6, 7, 8], "joint": [22, 26], "joint_factor": [22, 23, 24, 25, 26, 30, 35, 36, 40], "joseph": [1, 7, 9, 45], "journal": 10, "jpg": 48, "jupyt": [0, 1, 2, 3, 4, 5, 6, 7, 8], "just": [2, 3, 4, 7, 8, 10, 22, 26, 46, 48], "k": [7, 10, 16, 46, 48], "k_": 46, "k_0": 46, "k_l": 46, "kamyar": [10, 40, 46, 48], "kappa": [46, 48], "kappa_": 48, "karthik": 26, "kashinath": 26, "kaushik": [10, 46, 48], "keep": [8, 12, 22, 30, 31, 32, 33, 35, 36, 37, 38, 39], "kei": [14, 16, 44, 46], "kernel": [12, 16, 46, 47], "kernel_s": [2, 3, 4], "keyword": [14, 15, 42], "kind": [21, 46], "known": 16, "kossaifi": 43, "kovachki": [10, 46, 48], "kovachki2021neur": 10, "kurth": 26, "kwarg": [30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 42], "l": [27, 28, 46, 48], "l2": [0, 2, 3, 4, 8], "l2loss": [0, 2, 3, 4, 8], "label": [7, 48], "lambda": 5, "larg": [43, 48], "larger": [2, 3, 4, 8], "lasso": 44, "last": [7, 22, 30, 35, 36, 37, 38, 39, 40, 44], "latent": [34, 46], "latent_queri": 34, "later": [10, 44, 46], "latter": [15, 40], "layer": [6, 10, 30, 32, 33, 34, 35, 36, 38, 39, 40, 47, 49], "layer_index": [22, 26], "ldot": 48, "leaf": 5, "learn": [10, 11, 12, 22, 26, 43, 44, 47, 49, 50], "least": [14, 48], "left": [46, 48], "leg": 7, "legend": 7, "legendr": 26, "len": [30, 35, 36], "length": [7, 30, 35, 36, 40], "less": [8, 48], "let": [5, 16, 46, 48], "level": 15, "lg": 10, "li": [7, 10, 43, 46, 48], "li2020fouri": 10, "librari": [10, 49, 50], "lift": [2, 3, 4, 5, 30, 34, 35, 36, 40, 48], "lifting_channel": [30, 34, 35, 36, 40], "light": 48, "like": [12, 42, 46, 48, 50], "limit": [2, 4, 6, 7, 8, 46, 47], "linear": [14, 15, 16, 20, 21, 30, 34, 35, 36, 40, 46, 48], "linear_kernelonli": 16, "linearchannelmlp": 16, "linearli": 46, "linestyl": 7, "linewidth": 7, "linspac": 7, "linux": 16, "list": [8, 16, 19, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41], "liter": [30, 35, 36, 40], "liu": [10, 46, 48], "lno": 46, "load": [0, 2, 3, 4, 7, 8, 10, 15, 50], "load_darcy_flow_smal": [0, 2, 4, 6, 7, 8, 10], "load_spherical_sw": 3, "loader": [44, 49], "loader_nam": 44, "loc": 7, "local": [5, 46], "locat": 46, "log": [7, 44, 46], "log_ev": 44, "log_output": [43, 44], "log_prefix": 44, "log_train": 44, "logic": [10, 22, 43, 50], "long": 19, "longer": [2, 4, 6, 7, 8], "look": 7, "loop": [10, 50], "lose": 46, "loss": [0, 2, 3, 4, 8, 12, 14, 43, 44, 50], "loss_dict": 44, "loss_gap": 43, "loss_nam": 44, "lot": 46, "low": [46, 48], "lower": 46, "lowest": 46, "lp": 28, "lploss": [0, 2, 3, 4, 8], "lr": [0, 2, 3, 4, 8, 44], "lr_schedul": [0, 2, 3, 4, 8, 44], "m": [10, 16, 17, 30, 35, 36, 40, 48], "m_k": 22, "m_n": 22, "machin": [12, 48, 50], "made": 48, "mai": [48, 50], "main": [2, 4, 6, 7, 8, 11, 22, 26, 46, 49], "major": 46, "make": [11, 19, 48, 50], "malici": [2, 4, 6, 7, 8], "mani": [2, 3, 4, 8, 48], "manual": 6, "manual_se": 7, "map": [10, 12, 16, 22, 26, 40, 46, 48, 49], "mapsto": [46, 48], "markov": 46, "match": [19, 48], "materi": 46, "math": 48, "mathbb": [46, 48], "mathcal": [46, 48], "mathemat": [7, 46, 48], "mathrm": [46, 48], "matplotlib": [0, 2, 3, 4, 6, 7, 8], "matric": 46, "matrix": [46, 48], "max": [5, 34, 46], "max_n_mod": [8, 22, 23, 24, 25, 26, 30, 35, 36], "max_valu": 5, "maximilian": 26, "maximum": [5, 8, 22], "mayb": 48, "mb": [2, 3, 4, 8, 9, 45], "mcmc": 46, "md": [2, 4, 6, 7, 8, 40], "mean": [5, 29, 46, 48, 50], "measur": 48, "mem": [9, 45], "memori": [2, 3, 4, 8, 14, 15], "memory_format": [14, 15], "mesh": [12, 17, 18, 34, 46, 48], "messag": 48, "method": [14, 15, 16, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 34, 35, 36, 37, 38, 39, 40, 43, 44, 46, 48], "metric": [43, 44], "mgno": 46, "middl": [46, 48], "might": 7, "mind": [8, 48], "minim": [2, 3, 4, 8, 12, 44], "minut": [2, 3, 4, 5, 6, 7, 8, 46], "misc": 10, "mit": 46, "mix": [30, 35, 36], "mixed_precis": [43, 44], "ml": 10, "mlp": [16, 30, 35, 36], "mode": [2, 4, 6, 7, 8, 11, 12, 22, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 43, 46], "mode1": 46, "mode2": 46, "model": [0, 2, 3, 4, 5, 6, 7, 8, 10, 14, 15, 43, 44, 46, 47, 48, 49], "model_input": 5, "modes1": 46, "modes2": 46, "modes_depth": [33, 39], "modes_height": [31, 33, 37, 39], "modes_width": [33, 39], "modifi": [7, 14, 15], "modul": [2, 4, 6, 7, 8, 12, 14, 15, 16, 21, 30, 34, 35, 36, 40, 42, 43, 44, 46, 49], "modular": 50, "module2d": [20, 21], "moduledict": [3, 4], "modulelist": [2, 3, 4], "monitor": 44, "mont": [46, 48], "month": 48, "more": [2, 3, 4, 6, 7, 8, 10, 44, 46, 48, 50], "most": [12, 48, 50], "motion": 48, "motiv": [46, 48], "move": [14, 15], "mpi": 50, "mpi4pi": 50, "mpiexec": 50, "much": [7, 12, 48, 50], "multi": [42, 50], "multipl": [2, 3, 4, 8, 46, 50], "multipli": 46, "multipol": 46, "must": [16, 42], "my_script": 50, "n": [0, 2, 3, 4, 7, 8, 10, 12, 16, 17, 22, 30, 35, 36, 40, 46, 48, 50], "n_dim": [20, 21], "n_e": 48, "n_epoch": [0, 2, 3, 4, 8, 10, 43, 44], "n_gpu": 50, "n_gridpts_1": 34, "n_gridpts_n": 34, "n_in": 34, "n_layer": [4, 22, 23, 24, 25, 26, 30, 35, 36, 40], "n_mode": [0, 2, 3, 5, 8, 10, 12, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46], "n_modes_height": [32, 38], "n_modes_width": [32, 38], "n_out": 34, "n_param": [0, 2, 3, 4, 8], "n_test": [0, 2, 3, 4, 6, 7, 8, 10, 13], "n_train": [0, 2, 3, 4, 6, 7, 8, 10, 13], "nabla": [46, 48], "name": [27, 28, 44], "nativ": [16, 17, 18, 34], "natur": 48, "navier": [0, 2, 3, 7, 46], "necessari": [27, 46], "need": [7, 11, 15, 16, 22, 26, 40, 48, 50], "neighbor": [12, 16, 17, 18, 34], "neighborhood": [12, 17, 18, 34, 48], "neighbors_index": 16, "neighbors_row_split": 16, "neighborsearch": 16, "neq": 48, "nest": 5, "net": 46, "network": [10, 46, 47], "neural": [0, 1, 2, 3, 4, 9, 10, 22, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 47, 49], "neuralop": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 46, 49], "neuraloper": [2, 4, 6, 7, 8, 10, 13], "new": 48, "new_val": 5, "newli": 46, "next": 6, "nikola": [10, 46, 48], "nn": [14, 15, 16, 20, 21, 30, 34, 35, 36, 40, 42, 46], "nn_1": 48, "nn_2": 48, "node": [5, 48], "noisi": 46, "non": [7, 14, 15, 16, 30, 35, 36, 40, 46], "non_block": [14, 15], "non_linear": [30, 35, 36, 40], "none": [2, 3, 4, 8, 14, 15, 16, 20, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 37, 38, 39, 40, 43, 44], "nonlinear": [16, 34], "nonlinear_kernelonli": 16, "norm": [27, 28, 30, 35, 36, 40], "normal": [14, 22, 27, 28, 30, 34, 35, 36, 40], "note": [2, 3, 4, 7, 8, 17, 19, 46, 48], "notebook": [0, 1, 2, 3, 4, 5, 6, 7, 8], "noth": [30, 35, 36, 40], "notic": [46, 48], "nour": [0, 2, 3, 4], "now": [11, 46], "np": 7, "nu": 46, "number": [2, 3, 4, 5, 7, 8, 12, 21, 22, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 44, 46, 48], "numer": [46, 48], "numnber": 8, "numpi": [2, 3, 4, 7, 8, 11], "nystrom": 47, "o": [46, 48], "object": [2, 3, 4, 5, 6, 7, 8, 10, 44], "observ": [46, 48], "octob": 46, "odd": [22, 30, 35, 36, 37, 38, 39], "off": [46, 48], "offer": 12, "offici": 10, "ohio": 7, "on_epoch_start": 44, "onc": 11, "one": [2, 3, 4, 6, 7, 8, 14, 15, 16, 19, 21, 22, 26, 28, 30, 34, 35, 36, 40, 44, 46, 48], "ones": [14, 15], "onli": [7, 8, 14, 15, 16, 20, 22, 23, 24, 25, 46, 48], "open": [2, 4, 6, 7, 8, 48], "open3d": [17, 34], "oper": [0, 1, 2, 3, 4, 5, 9, 10, 11, 22, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44, 45, 47, 49], "operator_block": 40, "optim": [0, 2, 3, 4, 8, 10, 44], "option": [8, 10, 11, 14, 19, 21, 22, 27, 28, 30, 34, 35, 36, 37, 38, 39, 40, 44], "optionali": [22, 30, 34, 35, 36, 40], "order": [46, 48], "org": [10, 43], "organ": 5, "origin": [7, 8, 30, 35, 36, 40, 46], "ortho": 26, "other": [7, 8, 26, 46, 48], "otherwis": [5, 16, 22, 30, 34, 35, 36, 40], "our": [0, 2, 3, 4, 6, 7, 12, 16, 46, 48, 50], "out": [2, 3, 4, 8, 10, 14, 15, 34, 46, 48], "out_channel": [3, 4, 5, 8, 10, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46], "out_featur": [14, 15, 20, 21], "out_ft": 46, "out_gno_channel_mlp_hidden_lay": 34, "out_gno_tanh": 34, "out_gno_transform_typ": 34, "out_norm": [8, 14, 15], "outperform": 46, "output": [2, 3, 4, 5, 8, 14, 15, 16, 21, 22, 26, 30, 34, 35, 36, 37, 38, 39, 40, 44, 46, 48], "output_encod": 8, "output_grid": 26, "output_queri": 34, "output_scaling_factor": [19, 22, 23, 24, 25, 26], "output_shap": [22, 26, 30, 35, 36, 37, 38, 39], "over": [16, 30, 35, 36, 40], "overal": [7, 48], "overrid": 44, "overridden": [15, 40], "overwritten": 44, "own": [10, 12, 46, 49, 50], "p": [0, 2, 3, 4, 8, 28], "p1": [30, 35, 36], "p2": [30, 35, 36], "p_k": 48, "packag": [0, 2, 3, 4, 6, 8, 11], "pad": [12, 30, 35, 36, 40], "padding_fract": 15, "padding_mod": 19, "page": [11, 46, 50], "pain": [11, 48], "pair": 48, "panel": 46, "paper": [10, 46, 48], "parallel": 50, "param": 8, "paramat": [7, 8], "paramet": [0, 2, 3, 4, 8, 10, 12, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 42, 43, 44, 46], "parameter": [34, 46], "parametr": [10, 16, 22, 26, 30, 35, 36, 40, 46], "part": [11, 46], "partial": [10, 46, 48], "partial_": 46, "partial_t": 46, "partial_x": 46, "pass": [5, 6, 8, 10, 15, 19, 22, 23, 24, 25, 26, 30, 34, 35, 36, 37, 38, 39, 40, 48], "patch": 42, "path": [2, 4, 6, 7, 8, 44], "pathak": 26, "pattern": 46, "pca": 46, "pcann": 46, "pde": [12, 43, 46, 48, 49, 50], "pdf": [7, 43], "peopl": 48, "per": [5, 22, 27, 28, 30, 34, 35, 36, 40, 44, 46], "percentag": [19, 30, 35, 36, 40], "perform": [14, 15, 22, 26, 30, 35, 36, 40, 46, 48], "period": 46, "permut": 7, "phi": 48, "physic": [7, 46, 48], "pickl": [2, 4, 6, 7, 8], "piec": 48, "pin": [14, 15], "pip": [10, 50], "pixel": [46, 48], "place": [14, 15, 46], "pleas": [2, 4, 6, 7, 8, 10, 22], "plot": [2, 3, 4, 7, 8, 44], "plot_count_flop": [5, 9, 45], "plot_darcy_flow": [6, 9, 45], "plot_darcy_flow_spectrum": [7, 9, 45], "plot_fno_darci": [2, 9, 45], "plot_incremental_fno_darci": [8, 9, 45], "plot_sfno_sw": [3, 9, 45], "plot_uno_darci": [4, 9, 45], "plt": [0, 2, 3, 4, 6, 7, 8], "pn": [30, 35, 36], "png": 48, "po": 6, "pod": 46, "point": [5, 14, 15, 16, 17, 18, 34, 46, 48], "pointwis": [34, 46], "poisson": 47, "popular": 46, "pose": 48, "posit": [6, 7, 30, 34, 35, 36, 40], "positional_embed": [2, 3, 4, 6, 30, 35, 36, 40], "positional_encod": 10, "posixpath": 13, "possibl": [2, 4, 6, 7, 8, 14, 15, 17, 48], "post": [14, 48], "posterior": 46, "postprocess": [14, 15], "potenti": 46, "practic": [2, 3, 4, 8, 46, 48], "pre": 14, "preactiv": [30, 34, 35, 36, 40], "precis": [30, 34, 35, 36], "predict": [2, 3, 4, 8, 44, 48], "prefer": [23, 24, 25], "prefix": 44, "prepackag": 10, "preprint": 43, "preprocess": [2, 4, 6, 14, 15], "preprocessor": 10, "present": 46, "pressur": 46, "previou": [10, 46], "primarili": 48, "primaryclass": 10, "print": [0, 2, 3, 4, 5, 6, 7, 8, 42], "problem": [46, 47], "process": [7, 14, 48, 50], "processor": 14, "product": 7, "project": [2, 3, 4, 5, 30, 34, 35, 36, 40, 46, 48], "projection_channel": [0, 2, 3, 4, 5, 30, 34, 35, 36, 40], "prop": 7, "propag": 46, "properli": 48, "properti": 48, "propos": 46, "proprtion": 16, "prototyp": 48, "provid": [7, 10, 11, 12, 20, 22, 23, 24, 25, 27, 28, 42, 44, 46, 49, 50], "pseudo": 46, "pt": [2, 4, 6, 7, 8], "pt_dataset": [2, 4, 6, 7, 8], "pure": 34, "purpos": [46, 48], "puzzl": 46, "py": [0, 2, 3, 4, 5, 6, 7, 8, 9, 45, 50], "pyplot": [0, 2, 3, 4, 6, 7, 8], "pytest": 11, "python": [0, 1, 2, 3, 4, 5, 6, 7, 8, 11, 12, 50], "pytorch": [2, 4, 6, 7, 8, 10, 11, 12, 16, 17, 18, 34, 46, 49, 50], "qquad": 46, "quad": [46, 48], "qualiti": 48, "quasilinear": 46, "queri": [17, 18, 34, 48], "quick": 47, "quickli": [2, 3, 4, 8], "quit": 48, "r": [11, 17, 43, 46, 48], "radiu": [17, 18, 34], "rahman": 40, "rand": 46, "randn": 5, "random": 7, "rang": [2, 4, 8], "rank": [0, 2, 3, 4, 10, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46], "rate": [44, 46], "raw": [2, 3, 4, 8, 12, 14, 30, 35, 36, 40], "rbm": 46, "rc": 7, "re": [2, 4, 5, 6, 7, 8], "read": [42, 46], "readi": [11, 49], "real": [22, 46, 48], "realiz": 48, "realli": 48, "reason": 48, "receiv": 12, "recent": 48, "recip": [15, 40], "recommend": [2, 4, 6, 7, 8], "reconstruct": [22, 23, 24, 25, 26, 30, 34, 35, 36, 40], "recov": 46, "recurr": 46, "recurs": 5, "reduc": [27, 28, 46], "reduce_al": [27, 28], "reduce_dim": [3, 27, 28], "reduct": [27, 28, 29, 34], "redund": 22, "refer": [7, 23, 24, 25, 26, 43, 47, 50], "regim": 46, "region": 48, "regist": [15, 40], "regress": 46, "regular": [0, 2, 3, 4, 8, 10, 44, 48], "rel": [27, 28], "relat": [2, 4, 6, 7, 8, 48], "releas": [2, 4, 6, 7, 8], "relev": 46, "reli": 46, "relu": [46, 48], "remain": 16, "remov": [7, 19], "repeat": 7, "repres": [7, 46], "represent": [7, 48], "requir": [5, 6, 7, 11, 14, 15, 17, 46], "requirements_doc": 11, "research": 7, "reset": 5, "reshap": 7, "residu": 46, "resnet": [30, 34, 35, 36, 40, 46], "resolut": [0, 2, 3, 4, 6, 7, 8, 10, 19, 46, 47], "resolv": 46, "resourc": 5, "respect": [14, 15, 46, 48], "restrict": 46, "result": [11, 44, 46, 48], "resum": [0, 44], "resume_from_dir": [0, 44], "resume_state_from_dir": 44, "return": [5, 14, 15, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 42, 43, 44, 46], "return_output": 44, "review": 46, "reynold": 46, "rfft": 46, "rfft2": 46, "riemann": 16, "right": [22, 46, 48], "rigor": 48, "rnn": 46, "robert": [1, 7, 9, 45], "root": 50, "root_dir": [2, 4, 6, 7, 8], "ross": 40, "roughli": 48, "round": 22, "row": 48, "run": [2, 3, 4, 5, 6, 7, 8, 15, 30, 35, 36, 40, 44, 46, 50], "runner": [2, 4, 6, 7, 8, 13], "ryden": 7, "safeti": 42, "sai": 46, "same": [26, 46, 48], "sampl": [2, 3, 4, 6, 7, 8, 44, 46, 48], "saniti": 48, "save": [0, 10, 44, 48], "save_best": 44, "save_checkpoint": 10, "save_dir": [0, 44], "save_everi": [0, 44], "save_fold": 10, "save_nam": 10, "save_training_st": 44, "scalar": [28, 34, 43, 48], "scale": [7, 19, 22, 26, 34, 40, 43, 46, 48], "schedul": [0, 2, 3, 4, 8, 10, 44], "scienc": 46, "scientif": 48, "scipi": 11, "scratch": 46, "script": [2, 3, 4, 5, 6, 7, 8], "search": [5, 12, 17, 18, 34], "second": [2, 3, 4, 5, 6, 7, 8, 46, 48], "secur": [2, 4, 6, 7, 8], "see": [2, 4, 6, 7, 8, 10, 14, 15, 16, 23, 24, 25, 26, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 44], "seed": 7, "segment_csr": 16, "self": [14, 15, 27, 28, 44, 46], "semi": 48, "sens": 48, "separ": [22, 23, 24, 25, 26, 30, 34, 35, 36, 40], "seri": 46, "serial": [2, 4, 6, 7, 8], "set": [2, 4, 6, 7, 8, 14, 15, 16, 17, 30, 34, 35, 36, 40, 46, 47], "set_alpha": 7, "set_titl": [2, 3, 4, 6, 8], "set_xlim": 7, "set_ylim": 7, "set_yscal": 7, "sever": [21, 48], "sfno": [1, 9, 26, 45], "sfno_block_precis": 35, "sfno_skip": 35, "shall": 46, "shallow": [1, 9, 45], "shape": [2, 3, 4, 6, 7, 8, 16, 17, 20, 30, 34, 35, 36, 37, 38, 39, 40, 46, 48], "share": [22, 26, 46], "ship": [0, 2, 3, 4, 6, 8, 11, 12], "shot": 46, "should": [8, 15, 16, 22, 26, 30, 34, 35, 36, 40, 48], "show": [2, 3, 4, 6, 7, 8, 10, 46, 48], "shown": [46, 48], "sht": 3, "sht_grid": 26, "sht_handl": 3, "sht_norm": 26, "side": [19, 30, 35, 36, 40], "sigma": [46, 48], "sigma_1": 46, "sigma_l": 46, "signal": 7, "signatur": [14, 15], "silent": [15, 40], "sim": 48, "similar": [10, 14, 15, 46, 48, 50], "similarli": [22, 26, 48], "simpl": [1, 9, 14, 45, 46, 48, 50], "simpli": [10, 11, 46], "simul": 48, "sinc": [15, 40, 46, 48], "singl": [14, 22, 27, 28, 30, 34, 35, 36, 40, 44], "singular": 48, "sinusoid": 46, "size": [2, 3, 4, 6, 7, 8, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 46, 48, 50], "size_i": 7, "size_x": 7, "size_z": 7, "skip": [21, 22, 26, 30, 34, 35, 36, 40], "skip_typ": 21, "slice": 8, "slow": 46, "small": [0, 2, 3, 4, 6, 7, 8, 12, 48], "smaller": 48, "so": [7, 10, 16, 22, 26, 46, 48, 50], "sobolev": 27, "soft": [20, 21, 30, 34, 35, 36, 40], "solut": [46, 48], "solv": [7, 43, 46, 48], "solver": [46, 47], "some": [7, 12, 16, 42, 46, 48], "sometim": 48, "sophist": 48, "sourc": [0, 1, 2, 3, 4, 5, 6, 7, 8, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 40, 41, 42, 43, 44, 48], "space": [10, 16, 17, 34, 46, 48, 49], "spars": 46, "spatial": [7, 12, 22, 30, 35, 36, 43, 46, 48], "speak": 48, "special": 48, "specif": [7, 12, 22, 43, 48, 50], "specifi": [16, 22, 30, 35, 36, 37, 38, 39, 40], "spectraconv": [23, 24, 25], "spectral": [7, 12, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 43, 46], "spectral_convolut": [34, 40, 46], "spectralconv": [2, 4, 12, 26, 30, 34, 35, 36, 40], "spectralconv2d": 46, "spectrum": [1, 9, 45], "spectrum_2d": 7, "speed": [10, 46, 50], "spefic": 16, "sphere": 26, "spheric": [1, 9, 26, 35, 45], "sphericalconv": 3, "sphinx": [0, 1, 2, 3, 4, 5, 6, 7, 8], "squar": [29, 48], "squeez": [2, 3, 4, 6, 7, 8], "stabil": [30, 34, 35, 36], "stabl": 26, "standard": [10, 12, 46, 48, 50], "start": [2, 4, 6, 7, 8, 11, 47, 48], "starting_mod": 8, "state": [7, 44, 46], "std": 22, "stdout": [0, 2, 3, 4, 8, 44], "steadi": 46, "steepli": 48, "step": [6, 7, 46, 48], "step_loss_valu": 44, "still": [46, 48], "stitch": 15, "stoke": [0, 2, 3, 7, 46], "storag": 48, "store": 48, "str": [15, 16, 22, 26, 30, 34, 35, 36, 40, 43, 44], "strictli": 8, "stride": [2, 3, 4], "string": 42, "structur": [7, 46, 48], "stuart": [10, 46, 48], "stub": 44, "studi": 7, "style": [30, 34, 35, 36, 40], "sub": [8, 22, 26], "subclass": [15, 40, 43], "subdict": 42, "subject": 48, "submodul": 5, "subplot": 7, "subsampling_r": 8, "subset": [16, 48], "substitut": 46, "subsurfac": 46, "suffici": [43, 46, 48], "sum": [16, 27, 28, 29, 48], "sum_": 48, "super": 46, "supervis": 48, "support": 12, "suppos": 16, "suptitl": [2, 3, 4, 6, 8], "sure": 19, "surrog": 46, "svg": 48, "sy": [0, 2, 3, 4, 8], "symmetr": [19, 30, 35, 36, 40], "system": [46, 50], "t": [2, 4, 6, 7, 8, 30, 35, 36, 37, 38, 39, 42, 46, 48], "t_max": [0, 2, 3, 4, 8], "tabl": 48, "take": [7, 15, 19, 21, 22, 30, 35, 36, 40, 44, 46, 48], "taken": [46, 50], "tanh": [30, 34, 35, 36], "target": [27, 28], "task": [7, 46, 48], "techniqu": 48, "technologi": 46, "technologyreview": 46, "tempor": 46, "tensor": [0, 2, 3, 7, 8, 10, 14, 15, 16, 17, 18, 22, 23, 24, 25, 26, 27, 28, 29, 30, 34, 35, 36, 37, 38, 39, 40, 43, 44], "tensorized_spectral_conv": [22, 23, 24, 25, 26], "tensorli": 11, "term": [27, 46, 48], "termin": 11, "test": [0, 2, 3, 4, 6, 7, 8, 10, 12, 44, 46, 48, 50], "test_batch_s": [0, 2, 3, 4, 6, 7, 8, 10, 13], "test_load": [0, 2, 3, 4, 6, 7, 8, 10, 44], "test_loader_nam": 44, "test_resolut": [0, 2, 3, 4, 6, 7, 8, 10, 13], "test_sampl": [2, 3, 4, 8], "text": [46, 48], "tf": 46, "tfno": [1, 9, 10, 30, 35, 37, 38, 39, 45], "th": 40, "than": [8, 46, 48], "thankfulli": 48, "thei": [2, 4, 6, 7, 8, 46, 48], "them": [15, 40, 46], "therefor": [22, 46, 48], "thi": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 14, 15, 16, 19, 20, 22, 23, 24, 25, 26, 30, 35, 36, 40, 44, 46, 48, 50], "thing": [46, 48, 50], "think": 46, "thorsten": 26, "three": [46, 48], "threshold": 8, "through": [7, 10, 44], "thu": 48, "tight_layout": [2, 3, 4, 6, 8], "till": 7, "time": [2, 3, 4, 5, 6, 7, 8, 44, 46, 48], "titl": [7, 10], "tmlr": 40, "too": [22, 26], "tool": [7, 10, 11, 49], "top": 46, "torch": [0, 2, 3, 4, 5, 6, 7, 8, 10, 11, 14, 15, 16, 17, 18, 22, 23, 24, 25, 26, 27, 28, 34, 43, 44, 46], "torch_doctest_cuda1": [14, 15], "torch_scatt": [16, 34], "torchtnt": [1, 9, 45], "torchvis": [10, 12], "toru": 46, "total": [2, 3, 4, 5, 6, 7, 8, 9, 45, 48], "trade": [46, 48], "tradit": [46, 48], "train": [1, 4, 6, 9, 10, 14, 22, 30, 35, 36, 40, 45, 46, 47, 48, 49], "train_dataset": 6, "train_err": [2, 3, 4, 8, 43, 44], "train_load": [0, 2, 3, 4, 6, 7, 8, 10, 43, 44], "train_loss": [0, 2, 3, 4, 8, 10], "train_one_batch": 44, "train_one_epoch": [43, 44], "train_resolut": 3, "trainer": [0, 2, 3, 4, 8, 10, 43, 47], "training_loss": [0, 2, 3, 4, 8, 10, 43, 44], "training_st": 44, "transfer": 46, "transform": [7, 8, 10, 12, 16, 22, 26, 34, 46, 48], "transform_typ": 16, "tri": [14, 15], "triangul": 48, "triangular": 46, "true": [0, 2, 3, 4, 6, 7, 8, 10, 13, 14, 15, 16, 17, 22, 23, 24, 25, 26, 30, 34, 35, 36, 40, 46, 48], "truncat": 46, "truth": [2, 3, 4, 8, 14], "truth_sp": 7, "try": 16, "tt": [22, 30, 34, 35, 36, 40], "tucker": [0, 2, 10, 22, 30, 34, 35, 36, 40], "tuckertensor": 2, "tupl": [12, 22, 30, 34, 35, 36, 37, 38, 39, 40, 44], "turbul": [7, 46], "two": [7, 16, 17, 18, 27, 28, 29, 46, 48], "txt": 11, "type": [16, 21, 30, 34, 35, 36, 40], "typic": [7, 19, 22, 26], "u": [1, 9, 11, 40, 45, 46, 48], "u_": 48, "u_0": [46, 48], "u_j": 48, "u_t": 48, "unchang": [14, 15], "unclear": 48, "under": 48, "underli": [7, 48], "understand": 46, "understood": 10, "unfortun": [46, 48], "uni": 11, "uniform": [46, 48], "uniform_h": [27, 28], "uniformli": 48, "uniqu": 48, "unit": 46, "unknown": 48, "unless": [2, 4, 6, 7, 8], "unlik": 10, "unnorm": 14, "uno": 4, "uno_n_mod": [4, 40], "uno_out_channel": [4, 40], "uno_sc": [4, 40], "unpad": 19, "unpickl": [2, 4, 6, 7, 8], "unseen": 48, "unsqueez": [2, 3, 4, 6, 8], "untrust": [2, 4, 6, 7, 8], "up": [8, 10, 46, 50], "updat": [8, 11, 22, 30, 35, 36, 40, 48], "upsampl": [22, 26], "us": [0, 1, 2, 3, 4, 6, 7, 8, 9, 10, 11, 12, 14, 16, 17, 19, 21, 22, 26, 30, 34, 35, 36, 40, 42, 44, 45, 46, 48, 49, 50], "use_channel_mlp": [30, 35, 36, 40], "use_distribut": [0, 2, 3, 4, 10, 43, 44], "use_open3d": 17, "use_torch_scatt": 16, "usecas": [12, 22, 26], "user": [2, 4, 6, 7, 8, 50], "userwarn": 7, "usual": [46, 48], "util": [0, 2, 3, 4, 5, 7, 8, 12, 44, 49], "v": [22, 30, 34, 35, 36, 40, 46, 48], "v_": [46, 48], "v_0": 48, "v_t": 48, "val": 14, "valid": 44, "valu": [2, 4, 5, 6, 7, 8, 22, 26, 30, 35, 36, 43, 44], "vari": [30, 35, 36, 48], "variabl": 7, "varianc": 8, "variou": [8, 46], "vector": [18, 46, 48], "veloc": [7, 46], "verbos": [0, 2, 3, 4, 8, 10, 19, 40, 43, 44], "veri": [2, 3, 4, 8, 46, 48, 50], "verifi": [30, 35, 36, 40], "version": [12, 16, 34, 48], "via": [2, 4, 6, 7, 8, 46, 48], "view": [6, 46, 48], "viscos": 46, "viscou": 46, "volum": [10, 16], "vortic": 46, "w": [20, 34, 46, 48], "w_0": 46, "wai": [46, 50], "wait": 8, "walk": 10, "wandb": 44, "wandb_log": [0, 2, 3, 4, 10, 43, 44], "want": [7, 8, 11, 22, 26, 46, 48], "warn": 42, "water": [1, 9, 45], "wave": 46, "wavenumb": 7, "we": [0, 2, 3, 4, 5, 6, 7, 8, 10, 12, 22, 46, 48, 50], "weak": 48, "weight": [2, 3, 4, 10, 14, 15, 16, 20, 22, 30, 34, 35, 36, 40, 46], "weight_decai": [0, 2, 3, 4, 8], "weights1": 46, "weights2": 46, "weights_onli": [2, 4, 6, 7, 8], "well": [7, 10, 11, 46, 48], "when": [8, 14, 15, 44, 46, 48], "where": [2, 4, 6, 7, 8, 20, 46, 48], "whether": [14, 16, 17, 19, 21, 22, 30, 34, 35, 36, 40, 44, 48], "which": [2, 4, 6, 7, 8, 12, 16, 17, 18, 34, 44, 46, 48], "while": [15, 40, 46], "whole": [16, 46], "whose": [14, 15], "width": [20, 30, 32, 33, 34, 35, 36, 38, 39, 40], "wise": [13, 46], "within": [15, 17, 34, 40, 44], "word": 48, "work": [2, 4, 6, 7, 8, 12, 13, 19, 22, 26, 46, 48], "workflow": 10, "world": [46, 48, 50], "would": [2, 3, 4, 8], "wrap": 14, "wrapper": 21, "written": [46, 48], "www": [7, 46], "x": [2, 3, 4, 6, 7, 8, 14, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 34, 35, 36, 37, 38, 39, 40, 46, 48], "x_1": 48, "x_ft": 46, "x_in": 3, "x_k": 48, "xdoctest": [14, 15], "xlabel": 7, "xtick": [2, 3, 4, 8], "xx": 46, "y": [2, 3, 4, 6, 7, 8, 14, 16, 17, 27, 28, 46, 48], "y_": 16, "y_1": 16, "y_2": 16, "y_j": 16, "year": [10, 48], "ylabel": 7, "ylim": 7, "you": [2, 4, 6, 7, 8, 10, 11, 12, 16, 22, 26, 48, 49, 50], "your": [7, 10, 11, 12, 22, 26, 49, 50], "ytick": [2, 3, 4, 8], "z": [10, 43], "zachari": 40, "zero": [19, 46, 50], "zhao": 43, "zip": [0, 1, 2, 3, 4, 5, 6, 7, 8, 30, 35, 36, 40], "zongyi": [7, 10, 46, 48]}, "titles": ["Training a TFNO on Darcy-Flow", "Gallery of examples", "Training a TFNO on Darcy-Flow", "Training a SFNO on the spherical Shallow Water equations", "U-NO on Darcy-Flow", "Using <cite>torchtnt</cite> to count FLOPS", "A simple Darcy-Flow dataset", "A simple Darcy-Flow spectrum analysis", "Training a neural operator on Darcy-Flow - Author Robert Joseph George", "Computation times", "Neural Operators in PyTorch", "Installing NeuralOperator", "API reference", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.datasets</span></code>.load_darcy_flow_small", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.transforms.data_processors</span></code>.DefaultDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.data.transforms.data_processors</span></code>.MGPatchingDataProcessor", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.integral_transform</span></code>.IntegralTransform", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.neighbor_search</span></code>.NeighborSearch", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.neighbor_search</span></code>.native_neighbor_search", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.padding</span></code>.DomainPadding", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.skip_connections</span></code>.SoftGating", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.skip_connections</span></code>.skip_connection", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spectral_convolution</span></code>.SpectralConv3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.layers.spherical_convolution</span></code>.SphericalConv", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.H1Loss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.LpLoss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.losses</span></code>.MSELoss", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.FNO3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.GINO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.SFNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO1d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO2d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.TFNO3d", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models</span></code>.UNO", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models.base_model</span></code>.available_models", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.models.base_model</span></code>.get_model", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training</span></code>.IncrementalFNOTrainer", "<code class=\"xref py py-mod docutils literal notranslate\"><span class=\"pre\">neuralop.training</span></code>.Trainer", "Computation times", "Fourier Neural Operators", "User guide", "Neural Operators: an Introduction", "Quick-Start", "Training neural operator models"], "titleterms": {"2d": 48, "A": [6, 7], "As": 48, "NO": [4, 12], "The": 50, "an": 48, "analysi": 7, "api": 12, "approxim": 48, "author": 8, "available_model": 41, "base_model": [41, 42], "build": 11, "class": 50, "clone": 11, "comput": [9, 45], "conclus": [46, 48], "count": 5, "darci": [0, 2, 4, 6, 7, 8], "data": [6, 12, 13, 14, 15], "data_processor": [14, 15], "dataprocessor": 12, "dataset": [6, 13], "defaultdataprocessor": 14, "discret": 48, "dispatch": 12, "distribut": 50, "document": 11, "domainpad": 19, "equat": [3, 48], "exampl": 1, "experi": [46, 48], "fix": 48, "flop": 5, "flow": [0, 2, 4, 6, 7, 8], "fno": [12, 30], "fno1d": 31, "fno2d": 32, "fno3d": 33, "formul": 48, "fourier": [12, 46], "framework": 46, "galleri": 1, "gener": 48, "geometri": 12, "georg": 8, "get_model": 42, "gino": [12, 34], "github": 11, "graph": 48, "guid": 47, "h1loss": 27, "implement": 46, "import": [6, 7], "incrementalfnotrain": 43, "inform": 12, "instal": 11, "integral_transform": 16, "integraltransform": 16, "introduct": 48, "invari": 12, "iter": 48, "joseph": 8, "kernel": 48, "layer": [12, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 46], "learn": [46, 48], "librari": [6, 7], "limit": 48, "load": 6, "load_darcy_flow_smal": 13, "loss": [27, 28, 29], "lploss": 28, "mgpatchingdataprocessor": 15, "model": [12, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 50], "mseloss": 29, "native_neighbor_search": 18, "neighbor_search": [17, 18], "neighborsearch": 17, "network": 48, "neural": [8, 12, 46, 48, 50], "neuralop": [13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "neuraloper": 11, "nystrom": 48, "oper": [8, 12, 46, 48, 50], "other": 12, "pad": 19, "pip": 11, "poisson": 48, "pre": 11, "problem": 48, "quick": 49, "quickstart": 10, "recommend": 11, "refer": [12, 46, 48], "repositori": 11, "requisit": 11, "resolut": [12, 48], "robert": 8, "run": 11, "set": 48, "sfno": [3, 12, 35], "shallow": 3, "shape": 12, "short": 7, "simpl": [6, 7], "skip_connect": [20, 21], "softgat": 20, "solver": 48, "spectral_convolut": [22, 23, 24, 25], "spectralconv": 22, "spectralconv1d": 23, "spectralconv2d": 24, "spectralconv3d": 25, "spectrum": 7, "spheric": [3, 12], "spherical_convolut": 26, "sphericalconv": 26, "start": 49, "summari": 7, "tensor": 12, "test": 11, "tfno": [0, 2, 12, 36], "tfno1d": 37, "tfno2d": 38, "tfno3d": 39, "time": [9, 45], "torchtnt": 5, "train": [0, 2, 3, 8, 12, 43, 44, 50], "trainer": [44, 50], "transform": [14, 15], "u": [4, 12], "uno": 40, "us": 5, "user": 47, "visual": 6, "water": 3}})
\ No newline at end of file
diff --git a/dev/sg_execution_times.html b/dev/sg_execution_times.html
index 83bb846..774cd4e 100644
--- a/dev/sg_execution_times.html
+++ b/dev/sg_execution_times.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -153,7 +153,7 @@
         
   <section id="computation-times">
 <span id="sphx-glr-sg-execution-times"></span><h1>Computation times<a class="headerlink" href="#computation-times" title="Link to this heading"></a></h1>
-<p><strong>01:33.254</strong> total execution time for 8 files <strong>from all galleries</strong>:</p>
+<p><strong>04:44.485</strong> total execution time for 8 files <strong>from all galleries</strong>:</p>
 <div class="docutils container">
 <style scoped>
 <link href="https://cdnjs.cloudflare.com/ajax/libs/twitter-bootstrap/5.3.0/css/bootstrap.min.css" rel="stylesheet" />
@@ -175,34 +175,34 @@
 </thead>
 <tbody>
 <tr class="row-even"><td><p><a class="reference internal" href="auto_examples/plot_UNO_darcy.html#sphx-glr-auto-examples-plot-uno-darcy-py"><span class="std std-ref">U-NO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_UNO_darcy.py</span></code>)</p></td>
-<td><p>01:33.254</p></td>
+<td><p>02:12.491</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/checkpoint_FNO_darcy.html#sphx-glr-auto-examples-checkpoint-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/checkpoint_FNO_darcy.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/plot_SFNO_swe.html#sphx-glr-auto-examples-plot-sfno-swe-py"><span class="std std-ref">Training a SFNO on the spherical Shallow Water equations</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_SFNO_swe.py</span></code>)</p></td>
+<td><p>01:25.030</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-even"><td><p><a class="reference internal" href="auto_examples/plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training an FNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_FNO_darcy.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-even"><td><p><a class="reference internal" href="auto_examples/plot_FNO_darcy.html#sphx-glr-auto-examples-plot-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_FNO_darcy.py</span></code>)</p></td>
+<td><p>00:54.415</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/plot_SFNO_swe.html#sphx-glr-auto-examples-plot-sfno-swe-py"><span class="std std-ref">Training a SFNO on the spherical Shallow Water equations</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_SFNO_swe.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/plot_incremental_FNO_darcy.html#sphx-glr-auto-examples-plot-incremental-fno-darcy-py"><span class="std std-ref">Training a neural operator on Darcy-Flow - Author Robert Joseph George</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_incremental_FNO_darcy.py</span></code>)</p></td>
+<td><p>00:07.776</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="auto_examples/plot_count_flops.html#sphx-glr-auto-examples-plot-count-flops-py"><span class="std std-ref">Using torchtnt to count FLOPS</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_count_flops.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:04.065</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/plot_darcy_flow.html#sphx-glr-auto-examples-plot-darcy-flow-py"><span class="std std-ref">A simple Darcy-Flow dataset</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_darcy_flow.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:00.429</p></td>
 <td><p>0.0</p></td>
 </tr>
 <tr class="row-even"><td><p><a class="reference internal" href="auto_examples/plot_darcy_flow_spectrum.html#sphx-glr-auto-examples-plot-darcy-flow-spectrum-py"><span class="std std-ref">A simple Darcy-Flow spectrum analysis</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_darcy_flow_spectrum.py</span></code>)</p></td>
-<td><p>00:00.000</p></td>
+<td><p>00:00.279</p></td>
 <td><p>0.0</p></td>
 </tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/plot_incremental_FNO_darcy.html#sphx-glr-auto-examples-plot-incremental-fno-darcy-py"><span class="std std-ref">Training a neural operator on Darcy-Flow - Author Robert Joseph George</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/plot_incremental_FNO_darcy.py</span></code>)</p></td>
+<tr class="row-odd"><td><p><a class="reference internal" href="auto_examples/checkpoint_FNO_darcy.html#sphx-glr-auto-examples-checkpoint-fno-darcy-py"><span class="std std-ref">Training a TFNO on Darcy-Flow</span></a> (<code class="docutils literal notranslate"><span class="pre">../../examples/checkpoint_FNO_darcy.py</span></code>)</p></td>
 <td><p>00:00.000</p></td>
 <td><p>0.0</p></td>
 </tr>
diff --git a/dev/user_guide/fno.html b/dev/user_guide/fno.html
index d648c7c..a794247 100644
--- a/dev/user_guide/fno.html
+++ b/dev/user_guide/fno.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
@@ -161,7 +161,7 @@
       <div class="container content main-content">
         
   <section id="fourier-neural-operators">
-<span id="fno-guide"></span><h1>Fourier Neural Operators<a class="headerlink" href="#fourier-neural-operators" title="Link to this heading"></a></h1>
+<h1>Fourier Neural Operators<a class="headerlink" href="#fourier-neural-operators" title="Link to this heading"></a></h1>
 <p>This page (which takes about 10 minutes to read), introduces the Fourier neural operator that solves a family of PDEs from scratch.
 It the first work that can learn resolution-invariant solution operators on Navier-Stokes equation,
 achieving state-of-the-art accuracy among all existing deep learning methods and
diff --git a/dev/user_guide/getting_started.html b/dev/user_guide/getting_started.html
deleted file mode 100644
index d981ee7..0000000
--- a/dev/user_guide/getting_started.html
+++ /dev/null
@@ -1,311 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Getting Started &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
- <script src="../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Neural Operators: an Introduction" href="neural_operators.html" />
-    <link rel="prev" title="User guide" href="index.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../index.html">
-            <img src="../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul class="current">
-<li class="toctree-l1"><a class="reference internal" href="../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1 current"><a class="reference internal" href="index.html">User guide</a><ul class="current">
-<li class="toctree-l2 current"><a class="current reference internal" href="#">Getting Started</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html">Neural Operators: an Introduction</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html">Fourier Neural Operators</a></li>
-<li class="toctree-l2"><a class="reference internal" href="training.html">Training neural operator models</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="../modules/api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="getting-started">
-<span id="id1"></span><h1>Getting Started<a class="headerlink" href="#getting-started" title="Link to this heading"></a></h1>
-<p><em>NeuralOperator</em> aims to provide you with all the tools
-to easily use, build and train neural operators for your own applications
-and learn mapping between function spaces, in PyTorch.</p>
-<section id="intro-to-operator-learning">
-<h2>Intro to operator learning<a class="headerlink" href="#intro-to-operator-learning" title="Link to this heading"></a></h2>
-<p>To get a better feel for the theory behind our neural operator models, see <a class="reference internal" href="neural_operators.html#neuralop-intro"><span class="std std-ref">Neural Operators: an Introduction</span></a> and <a class="reference internal" href="fno.html#fno-intro"><span class="std std-ref">Fourier Neural Operators</span></a>.</p>
-</section>
-<hr class="docutils" />
-<section id="interactive-examples-with-code">
-<h2>Interactive examples with code<a class="headerlink" href="#interactive-examples-with-code" title="Link to this heading"></a></h2>
-<p>To get up to speed on the code, and look through some interactive examples to help you hit the ground running,
-check out <a class="reference internal" href="../auto_examples/index.html#gallery-examples"><span class="std std-ref">Gallery of examples</span></a>.</p>
-</section>
-<hr class="docutils" />
-<section id="neuraloperator-library-structure">
-<h2>NeuralOperator library structure<a class="headerlink" href="#neuraloperator-library-structure" title="Link to this heading"></a></h2>
-<p>Here are the main components of the library:</p>
-<table class="docutils align-default">
-<thead>
-<tr class="row-odd"><th class="head"><p>Module</p></th>
-<th class="head"><p>Description</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop</span></code></p></td>
-<td><p>Main library</p></td>
-</tr>
-<tr class="row-odd"><td><p><a class="reference internal" href="../modules/api.html#module-neuralop.models" title="neuralop.models"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.models</span></code></a></p></td>
-<td><p>Full ready-to-use neural operators</p></td>
-</tr>
-<tr class="row-even"><td><p><a class="reference internal" href="../modules/api.html#module-neuralop.layers" title="neuralop.layers"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.layers</span></code></a></p></td>
-<td><p>Individual layers to build neural operators</p></td>
-</tr>
-<tr class="row-odd"><td><p><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.datasets</span></code></p></td>
-<td><p>Convenience PyTorch data loaders for PDE datasets</p></td>
-</tr>
-<tr class="row-even"><td><p><a class="reference internal" href="../modules/api.html#module-neuralop.training" title="neuralop.training"><code class="xref py py-mod docutils literal notranslate"><span class="pre">neuralop.training</span></code></a></p></td>
-<td><p>Utilities to train neural operators end-to-end</p></td>
-</tr>
-</tbody>
-</table>
-<p>The full API documentation is provided in <a class="reference internal" href="../modules/api.html#api-ref"><span class="std std-ref">API reference</span></a>.</p>
-<p>Finally, if you’re building the library from source, your repository will also include the following directories:</p>
-<table class="docutils align-default">
-<thead>
-<tr class="row-odd"><th class="head"><p>Directory</p></th>
-<th class="head"><p>Description</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p><code class="xref py py-mod docutils literal notranslate"><span class="pre">scripts</span></code></p></td>
-<td><p>Training recipe scripts for our models on sample problems</p></td>
-</tr>
-<tr class="row-odd"><td><p><code class="xref py py-mod docutils literal notranslate"><span class="pre">examples</span></code></p></td>
-<td><p>More documented interactive examples, seen in</p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    <a class="button pagination-previous" href="index.html" title="previous page" accesskey="p">
-        <span class="icon">
-            <i class="fa fa-arrow-circle-left"></i>
-        </span>
-        <span>User guide</span>
-    </a>
-    
-    
-    <a class="button pagination-next" href="neural_operators.html" title="next page" accesskey="n">
-        <span>Neural Operators: an Introduction </span>
-        <span class="icon">
-            <i class="fa fa-arrow-circle-right"></i>
-        </span>
-    </a>
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-    <div class="column is-hidden-touch is-2-desktop is-one-fifth-widescreen" id="localtoc-column">
-
-    <aside class="sticky-nav localtoc"> 
-        <p class="menu-label"> 
-            <span class="icon-text">
-                <span class="icon"><i class="fas fa-duotone fa-list"></i></span>
-                <span> On this page </span>
-            </span>
-        </p>
-
-        <div class="menu menu-list localtoc-list">
-        <ul>
-<li><a class="reference internal" href="#">Getting Started</a><ul>
-<li><a class="reference internal" href="#intro-to-operator-learning">Intro to operator learning</a></li>
-<li><a class="reference internal" href="#interactive-examples-with-code">Interactive examples with code</a></li>
-<li><a class="reference internal" href="#neuraloperator-library-structure">NeuralOperator library structure</a></li>
-</ul>
-</li>
-</ul>
-
-        </div>
-    </aside>
-    </div>
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/user_guide/index.html b/dev/user_guide/index.html
index 56f200c..2a9b33b 100644
--- a/dev/user_guide/index.html
+++ b/dev/user_guide/index.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/user_guide/index_old.html b/dev/user_guide/index_old.html
deleted file mode 100644
index a12879f..0000000
--- a/dev/user_guide/index_old.html
+++ /dev/null
@@ -1,246 +0,0 @@
-<!DOCTYPE html>
-
-<html lang="en" data-content_root="../">
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>User guide &#8212; neuraloperator 0.3.0 documentation</title> 
-<link rel="stylesheet" href="../_static/tensorly_style.css">
-<link rel="apple-touch-icon" sizes="180x180" href="../_static/favicon/apple-touch-icon.png">
-<link rel="icon" type="image/png" sizes="32x32" href="../_static/favicon/favicon-32x32.png">
-<link rel="icon" type="image/png" sizes="16x16" href="../_static/favicon/favicon-16x16.png">
-<link rel="manifest" href="../_static/favicon/site.webmanifest">
-<link rel="mask-icon" href="../_static/favicon/safari-pinned-tab.svg" color="#5bbad5">
-<link rel="shortcut icon" href="../_static/favicon/favicon.ico">
-<meta name="theme-color" content="#ffffff">
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
-
-  
-    <script src="../_static/documentation_options.js?v=e259d695"></script>
-    <script src="../_static/doctools.js?v=9a2dae69"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script async="async" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
- <script src="../_static/navbar_burger.js"></script>
- <script defer src="https://use.fontawesome.com/releases/v5.14.0/js/all.js"></script>
- 
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1, user-scalable=no">
-
-  </head>
-<body  class="has-navbar-fixed-top">
-
-  <header>
-    <navbar>
-      <nav class="navbar top-navbar is-fixed-top has-shadow is-flex-wrap-wrap" role="navigation" aria-label="main top navigation">
-        <div class="navbar-brand">
-        
-
-          <a class="navbar-item" href="../index.html">
-            <img src="../_static/neuraloperator_logo.png" height="28">
-          </a>
-          <a class="navbar-item is-hidden-desktop" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon"><i class="fab fa-github"></i></span>
-          </a>
-
-          <a role="button" class="navbar-burger" data-target="top-nav-menu" aria-label="menu" aria-expanded="false">
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-            <span aria-hidden="true"></span>
-          </a>
-
-        </div>
-        
-        <div class="navbar-menu" id="top-nav-menu">
-        
-
-          <div class="navbar-start">
-            
-              <a class="navbar-item" href="../install.html">
-              Install
-            </a>
-              <a class="navbar-item" href="index.html">
-              User Guide
-            </a>
-              <a class="navbar-item" href="../modules/api.html">
-              API
-            </a>
-              <a class="navbar-item" href="../auto_examples/index.html">
-              Examples
-            </a>
-          </div>
-        
-          <div class="navbar-end">
-            <div class="navbar-item">
-            
-            <a class="button is-hidden-touch is-dark" href="https://github.com/neuraloperator/neuraloperator" target="_blank">
-              <span class="icon-text">
-                <span class="icon is-large">
-                  <i class="fab fa-github"></i>
-                </span>
-                <span>Github</span>
-              </span>
-            </a>
-
-            </div> 
-          </div> 
-        </div> 
-
-      </nav>
-      
-    </navbar>
-  </header>
-
-
-  <div id="column-container">
-  <div class="columns is-mobile is-centered">
-	
-  
-      <div class="column is-10-mobile is-one-third-tablet is-3-desktop is-hidden-mobile" id="sidebar">
-    
-    <aside class="sticky-nav sidebar-menu">
-<div class="sidebar-search">
-  <form class="field" id="searchbox" role="search" action="../search.html" method="get">
-    <!-- <label class="label" id="searchlabel">Quick search</label> -->
-    <div class="field has-addons">
-      <div class="control is-expanded">
-        <input class="input" type="text" placeholder="Search the doc" name="q" aria-labelledby="searchlabel autocomplete="off" autocorrect="off" autocapitalize="off" spellcheck="false"/>
-      </div>
-      <div class="control">
-        <input class="button is-info" type="submit" value="Go" />
-      </div>
-    </div>
-  </form>
-  <script>document.getElementById('searchbox').style.display = "block"</script>
-
-</div>
-      
-      <div class="sidebar-menu-toc">
-      <ul>
-<li class="toctree-l1"><a class="reference internal" href="../install.html">Installing NeuralOperator</a></li>
-<li class="toctree-l1"><a class="reference internal" href="index.html">NeuralOperator User Guide</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../modules/api.html">API reference</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../auto_examples/index.html">Gallery of examples</a></li>
-</ul>
- 
-      </div>
-    </aside>
-  </div>
-  
-
-  <div class="column main-column">
-
-    
-    <div class="main-section">
-
-      
-      
-      <div class="side-menu-toggle">
-        <button class="button" id="toggle-sidebar" onclick="toggle_sidebar()">
-          <span class="icon"><i class="fa fa-bars" aria-hidden="true"></i></span>
-          <span>menu</span> 
-        </button>
-      </div>
-      
-
-      <div class="container content main-content">
-        
-  <section id="user-guide">
-<span id="id1"></span><h1>User guide<a class="headerlink" href="#user-guide" title="Link to this heading"></a></h1>
-<div class="toctree-wrapper compound">
-<ul>
-<li class="toctree-l1"><a class="reference internal" href="neural_operators.html">Neural Operators: an Introduction</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#introduction">Introduction</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#operator-learning">Operator Learning</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#limitation-of-fixed-discretization">Limitation of Fixed Discretization</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#problem-setting">Problem Setting</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#kernel-formulation">Kernel Formulation</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#as-an-iterative-solver">As an Iterative Solver</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#graph-neural-networks">Graph Neural Networks</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#nystrom-approximation">Nystrom Approximation</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#experiments-poisson-equations">Experiments: Poisson Equations</a><ul>
-<li class="toctree-l3"><a class="reference internal" href="neural_operators.html#poisson-equation">poisson equation</a></li>
-<li class="toctree-l3"><a class="reference internal" href="neural_operators.html#d-poisson-equation">2D poisson equation</a></li>
-</ul>
-</li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#experiments-generalization-of-resolution">Experiments: generalization of resolution</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#conclusion">Conclusion</a></li>
-<li class="toctree-l2"><a class="reference internal" href="neural_operators.html#references">References</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="fno.html">Fourier Neural Operators</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#operator-learning">Operator learning</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#framework-of-neural-operators">Framework of Neural Operators</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#fourier-layer">Fourier Layer</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#implementation">Implementation</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#experiments">Experiments</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#conclusion">Conclusion</a></li>
-<li class="toctree-l2"><a class="reference internal" href="fno.html#references">References</a></li>
-</ul>
-</li>
-<li class="toctree-l1"><a class="reference internal" href="training.html">Training neural operator models</a><ul>
-<li class="toctree-l2"><a class="reference internal" href="training.html#the-trainer-class">The Trainer class</a></li>
-<li class="toctree-l2"><a class="reference internal" href="training.html#distributed-training">Distributed Training</a></li>
-</ul>
-</li>
-</ul>
-</div>
-</section>
-
-
-      </div>
-
-      
-        <nav class="pagination" role="navigation" aria-label="pagination">
-    
-    
-</nav>
-
-      
-
-        <footer class="footer">
-    <div class="content has-text-centered">
-        <div class="block">
-          &copy; Copyright 2024, Jean Kossaifi, David Pitt, Nikola Kovachki, Zongyi Li and Anima Anandkumar.<br/>
-        </div>
-    </div>
-  </footer>
-
-    </div>
-
-  </div>  
-
-	
-    
-
-  
-
-  </div>  
-  </div> 
-
-  
-  <script>
-    function toggle_sidebar() {
-        var element = document.getElementById("sidebar");
-        var container = document.getElementById("column-container");
-        var localtoccolumn = document.getElementById("localtoc-column");
-        element.classList.toggle("hide-tablet");
-        element.classList.toggle("is-hidden-mobile");
-        container.classList.toggle("sidemenu-hidden");
-        localtoccolumn.classList.toggle("is-one-fifth-widescreen");
-        localtoccolumn.classList.toggle("is-2-desktop");
-        localtoccolumn.classList.toggle("is-3-desktop");
-    }
-  </script> 
-
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/dev/user_guide/neural_operators.html b/dev/user_guide/neural_operators.html
index 6643291..5b0e724 100644
--- a/dev/user_guide/neural_operators.html
+++ b/dev/user_guide/neural_operators.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/user_guide/quickstart.html b/dev/user_guide/quickstart.html
index 2ad3d3e..0f13971 100644
--- a/dev/user_guide/quickstart.html
+++ b/dev/user_guide/quickstart.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />
diff --git a/dev/user_guide/training.html b/dev/user_guide/training.html
index 2f811bf..17467de 100644
--- a/dev/user_guide/training.html
+++ b/dev/user_guide/training.html
@@ -17,7 +17,7 @@
 
     <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
     <link rel="stylesheet" type="text/css" href="../_static/tensorly_style.css?v=a02e9698" />
-    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=61a4c737" />
+    <link rel="stylesheet" type="text/css" href="../_static/sg_gallery.css?v=d2d258e8" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-binder.css?v=f4aeca0c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-dataframe.css?v=2082cf3c" />
     <link rel="stylesheet" type="text/css" href="../_static/sg_gallery-rendered-html.css?v=1277b6f3" />