diff --git a/doc_sources/msd_pytorch.rst b/doc_sources/msd_pytorch.rst
index 90a99ca..e955df8 100644
--- a/doc_sources/msd_pytorch.rst
+++ b/doc_sources/msd_pytorch.rst
@@ -52,6 +52,14 @@ msd\_pytorch.main module
     :undoc-members:
     :show-inheritance:
 
+msd\_pytorch.msd\_block module
+------------------------------
+
+.. automodule:: msd_pytorch.msd_block
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
 msd\_pytorch.msd\_model module
 ------------------------------
 
diff --git a/docs/CHANGELOG.html b/docs/CHANGELOG.html
index 80fd073..e5c48da 100644
--- a/docs/CHANGELOG.html
+++ b/docs/CHANGELOG.html
@@ -87,10 +87,16 @@
 <li class="toctree-l2"><a class="reference internal" href="#unreleased">Unreleased</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="#added">Added</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#fixed">Fixed</a></li>
+<li class="toctree-l3"><a class="reference internal" href="#removed">Removed</a></li>
 </ul>
 </li>
-<li class="toctree-l2"><a class="reference internal" href="#id1">0.6.2 - 2019-05-23</a><ul>
+<li class="toctree-l2"><a class="reference internal" href="#id1">0.7.1 - 2019-05-27</a><ul>
 <li class="toctree-l3"><a class="reference internal" href="#id2">Added</a></li>
+<li class="toctree-l3"><a class="reference internal" href="#changed">Changed</a></li>
+</ul>
+</li>
+<li class="toctree-l2"><a class="reference internal" href="#id3">0.6.2 - 2019-05-23</a><ul>
+<li class="toctree-l3"><a class="reference internal" href="#id4">Added</a></li>
 </ul>
 </li>
 </ul>
@@ -168,22 +174,45 @@ <h1>Changelog<a class="headerlink" href="#changelog" title="Permalink to this he
 <h2><a class="reference external" href="https://www.github.com/ahendriksen/msd_pytorch/compare/v0.6.2...master">Unreleased</a><a class="headerlink" href="#unreleased" title="Permalink to this headline">¶</a></h2>
 <div class="section" id="added">
 <h3>Added<a class="headerlink" href="#added" title="Permalink to this headline">¶</a></h3>
-<ul>
-<li><div class="first"><insert-features-not-in-a-release-yet></div></li>
+<ul class="simple">
+<li>Support for multi-gpu execution. Use <code class="docutils literal notranslate"><span class="pre">parallel=True</span></code> when
+constructing a <code class="docutils literal notranslate"><span class="pre">MSDRegressionModel</span></code> or <code class="docutils literal notranslate"><span class="pre">MSDSegmentationModel</span></code>.</li>
 </ul>
 </div>
 <div class="section" id="fixed">
 <h3>Fixed<a class="headerlink" href="#fixed" title="Permalink to this headline">¶</a></h3>
-<ul>
-<li><div class="first"><insert-bugs-fixed-not-in-a-release-yet></div></li>
+<ul class="simple">
+<li>Make <code class="docutils literal notranslate"><span class="pre">model.forward()</span></code> more memory-efficient.</li>
 </ul>
 </div>
+<div class="section" id="removed">
+<h3>Removed<a class="headerlink" href="#removed" title="Permalink to this headline">¶</a></h3>
+</div>
 </div>
 <div class="section" id="id1">
-<h2>0.6.2 - 2019-05-23<a class="headerlink" href="#id1" title="Permalink to this headline">¶</a></h2>
+<h2><a class="reference external" href="https://www.github.com/ahendriksen/msd_pytorch/compare/v0.6.2...v0.7.1">0.7.1</a> - 2019-05-27<a class="headerlink" href="#id1" title="Permalink to this headline">¶</a></h2>
 <div class="section" id="id2">
 <h3>Added<a class="headerlink" href="#id2" title="Permalink to this headline">¶</a></h3>
 <ul class="simple">
+<li>Add <code class="docutils literal notranslate"><span class="pre">weights_path</span></code> command-line argument to msd executable to indicate
+where to store final weights.</li>
+<li>Add <code class="docutils literal notranslate"><span class="pre">MSDBlock2d</span></code>: this is a faster and slightly more memory efficient
+implementation of the same MSD component. Many thanks to Jonas
+Adler for suggesting this way of structuring the code!</li>
+</ul>
+</div>
+<div class="section" id="changed">
+<h3>Changed<a class="headerlink" href="#changed" title="Permalink to this headline">¶</a></h3>
+<ul class="simple">
+<li>The MSD models use <code class="docutils literal notranslate"><span class="pre">MSDBlock2d</span></code> implementation by default now.</li>
+</ul>
+</div>
+</div>
+<div class="section" id="id3">
+<h2>0.6.2 - 2019-05-23<a class="headerlink" href="#id3" title="Permalink to this headline">¶</a></h2>
+<div class="section" id="id4">
+<h3>Added<a class="headerlink" href="#id4" title="Permalink to this headline">¶</a></h3>
+<ul class="simple">
 <li>Initial release.</li>
 </ul>
 </div>
diff --git a/docs/README.html b/docs/README.html
index ac45d88..0d296f9 100644
--- a/docs/README.html
+++ b/docs/README.html
@@ -280,6 +280,7 @@ <h3>Running the examples<a class="headerlink" href="#running-the-examples" title
 <h2>Authors and contributors<a class="headerlink" href="#authors-and-contributors" title="Permalink to this headline">¶</a></h2>
 <ul class="simple">
 <li><strong>Allard Hendriksen</strong> - <em>Initial work</em></li>
+<li><strong>Jonas Adler</strong> - <em>Discussions and code</em></li>
 </ul>
 <p>See also the list of <a class="reference external" href="https://github.com/ahendriksen/msd_pytorch/contributors">contributors</a> who participated in this project.</p>
 </div>
diff --git a/docs/_modules/index.html b/docs/_modules/index.html
index 29b748e..c66b775 100644
--- a/docs/_modules/index.html
+++ b/docs/_modules/index.html
@@ -150,6 +150,7 @@ <h1>All modules for which code is available</h1>
 <li><a href="msd_pytorch/errors.html">msd_pytorch.errors</a></li>
 <li><a href="msd_pytorch/image_dataset.html">msd_pytorch.image_dataset</a></li>
 <li><a href="msd_pytorch/main.html">msd_pytorch.main</a></li>
+<li><a href="msd_pytorch/msd_block.html">msd_pytorch.msd_block</a></li>
 <li><a href="msd_pytorch/msd_model.html">msd_pytorch.msd_model</a></li>
 <li><a href="msd_pytorch/msd_module.html">msd_pytorch.msd_module</a></li>
 <li><a href="msd_pytorch/msd_regression_model.html">msd_pytorch.msd_regression_model</a></li>
diff --git a/docs/_modules/msd_pytorch/main.html b/docs/_modules/msd_pytorch/main.html
index 9794ff2..ea33972 100644
--- a/docs/_modules/msd_pytorch/main.html
+++ b/docs/_modules/msd_pytorch/main.html
@@ -157,6 +157,7 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
 <span class="kn">from</span> <span class="nn">torch.nn</span> <span class="k">import</span> <span class="n">MSELoss</span>
 <span class="kn">import</span> <span class="nn">msd_pytorch</span> <span class="k">as</span> <span class="nn">mp</span>
 <span class="kn">from</span> <span class="nn">.bench</span> <span class="k">import</span> <span class="n">bench</span>
+<span class="kn">from</span> <span class="nn">pathlib</span> <span class="k">import</span> <span class="n">Path</span>
 
 <span class="n">msd_ingredient</span> <span class="o">=</span> <span class="n">Ingredient</span><span class="p">(</span><span class="s2">&quot;msd&quot;</span><span class="p">)</span>
 <span class="n">ex</span> <span class="o">=</span> <span class="n">Experiment</span><span class="p">(</span><span class="s2">&quot;MSD&quot;</span><span class="p">,</span> <span class="n">ingredients</span><span class="o">=</span><span class="p">[</span><span class="n">msd_ingredient</span><span class="p">])</span>
@@ -204,6 +205,8 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
     <span class="c1"># Benchmark specific</span>
     <span class="n">input_size</span> <span class="o">=</span> <span class="mi">1024</span>
 
+    <span class="c1"># Path where to store the final weights (msd will append &#39;.torch&#39;)</span>
+    <span class="n">weights_path</span> <span class="o">=</span> <span class="s2">&quot;weights&quot;</span>
 
 <div class="viewcode-block" id="segmentation"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.segmentation">[docs]</a><span class="nd">@ex</span><span class="o">.</span><span class="n">command</span>
 <span class="k">def</span> <span class="nf">segmentation</span><span class="p">(</span>
@@ -215,6 +218,7 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
     <span class="n">train_target_glob</span><span class="p">,</span>
     <span class="n">val_input_glob</span><span class="p">,</span>
     <span class="n">val_target_glob</span><span class="p">,</span>
+    <span class="n">weights_path</span><span class="p">,</span>
 <span class="p">):</span>
     <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Load training dataset&quot;</span><span class="p">)</span>
     <span class="c1"># Create train (always) and validation (only if specified) datasets.</span>
@@ -230,7 +234,7 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
 
     <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Create network model&quot;</span><span class="p">)</span>
     <span class="n">model</span> <span class="o">=</span> <span class="n">mp</span><span class="o">.</span><span class="n">MSDSegmentationModel</span><span class="p">(</span><span class="n">num_labels</span><span class="o">=</span><span class="n">train_ds</span><span class="o">.</span><span class="n">num_labels</span><span class="p">)</span>
-    <span class="n">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">)</span></div>
+    <span class="n">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">,</span> <span class="n">weights_path</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="regression"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.regression">[docs]</a><span class="nd">@ex</span><span class="o">.</span><span class="n">command</span>
@@ -242,6 +246,7 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
     <span class="n">train_target_glob</span><span class="p">,</span>
     <span class="n">val_input_glob</span><span class="p">,</span>
     <span class="n">val_target_glob</span><span class="p">,</span>
+    <span class="n">weights_path</span><span class="p">,</span>
 <span class="p">):</span>
     <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Load training dataset&quot;</span><span class="p">)</span>
     <span class="c1"># Create train (always) and validation (only if specified) datasets.</span>
@@ -257,7 +262,7 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
 
     <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Create network model&quot;</span><span class="p">)</span>
     <span class="n">model</span> <span class="o">=</span> <span class="n">mp</span><span class="o">.</span><span class="n">MSDRegressionModel</span><span class="p">()</span>
-    <span class="n">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">)</span></div>
+    <span class="n">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">,</span> <span class="n">weights_path</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="benchmark"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.benchmark">[docs]</a><span class="nd">@ex</span><span class="o">.</span><span class="n">command</span>
@@ -277,7 +282,12 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
     <span class="nb">print</span><span class="p">(</span><span class="n">bench</span><span class="p">(</span><span class="s2">&quot;Gradient&quot;</span><span class="p">,</span> <span class="n">t</span><span class="p">))</span></div>
 
 
-<div class="viewcode-block" id="train"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.train">[docs]</a><span class="k">def</span> <span class="nf">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">):</span>
+<div class="viewcode-block" id="train"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.train">[docs]</a><span class="k">def</span> <span class="nf">train</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">train_dl</span><span class="p">,</span> <span class="n">val_dl</span><span class="p">,</span> <span class="n">weights_path</span><span class="p">):</span>
+
+    <span class="n">weights_path</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="n">weights_path</span><span class="p">)</span><span class="o">.</span><span class="n">expanduser</span><span class="p">()</span><span class="o">.</span><span class="n">resolve</span><span class="p">()</span>
+    <span class="k">if</span> <span class="n">weights_path</span><span class="o">.</span><span class="n">exists</span><span class="p">():</span>
+        <span class="n">logging</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;Overwriting weights file </span><span class="si">{weights_path}</span><span class="s2">&quot;</span><span class="p">)</span>
+
     <span class="c1"># The network works best if the input data has mean zero and has a</span>
     <span class="c1"># standard deviation of 1. To achieve this, we get a rough estimate of</span>
     <span class="c1"># correction parameters from the training data. These parameters are</span>
@@ -307,16 +317,16 @@ <h1>Source code for msd_pytorch.main</h1><div class="highlight"><pre>
         <span class="c1"># Save network if worthwile</span>
         <span class="k">if</span> <span class="n">validation_error</span> <span class="o">&lt;</span> <span class="n">best_validation_error</span> <span class="ow">or</span> <span class="n">val_dl</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
             <span class="n">best_validation_error</span> <span class="o">=</span> <span class="n">validation_error</span>
-            <span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;msd_network_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">,</span> <span class="n">epoch</span><span class="p">)</span>
-            <span class="n">ex</span><span class="o">.</span><span class="n">add_artifact</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;msd_network_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">)</span>
+            <span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;</span><span class="si">{weights_path}</span><span class="s2">_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">,</span> <span class="n">epoch</span><span class="p">)</span>
+            <span class="n">ex</span><span class="o">.</span><span class="n">add_artifact</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;</span><span class="si">{weights_path}</span><span class="s2">_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">)</span>
 
         <span class="n">end</span> <span class="o">=</span> <span class="n">timer</span><span class="p">()</span>
         <span class="n">ex</span><span class="o">.</span><span class="n">log_scalar</span><span class="p">(</span><span class="s2">&quot;Iteration time&quot;</span><span class="p">,</span> <span class="n">end</span> <span class="o">-</span> <span class="n">start</span><span class="p">)</span>
         <span class="n">logging</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;</span><span class="si">{epoch:05}</span><span class="s2"> Iteration time: {end-start: 0.6f}&quot;</span><span class="p">)</span>
 
     <span class="c1"># Always save final network parameters</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;msd_network_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">,</span> <span class="n">epoch</span><span class="p">)</span>
-    <span class="n">ex</span><span class="o">.</span><span class="n">add_artifact</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;msd_network_epoch_</span><span class="si">{epoch}</span><span class="s2">.torch&quot;</span><span class="p">)</span></div>
+    <span class="n">model</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;</span><span class="si">{weights_path}</span><span class="s2">.torch&quot;</span><span class="p">,</span> <span class="n">epoch</span><span class="p">)</span>
+    <span class="n">ex</span><span class="o">.</span><span class="n">add_artifact</span><span class="p">(</span><span class="n">f</span><span class="s2">&quot;</span><span class="si">{weights_path}</span><span class="s2">.torch&quot;</span><span class="p">)</span></div>
 
 
 <div class="viewcode-block" id="experiment_main"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.main.experiment_main">[docs]</a><span class="nd">@ex</span><span class="o">.</span><span class="n">main</span>
diff --git a/docs/_modules/msd_pytorch/msd_block.html b/docs/_modules/msd_pytorch/msd_block.html
new file mode 100644
index 0000000..b0f6f70
--- /dev/null
+++ b/docs/_modules/msd_pytorch/msd_block.html
@@ -0,0 +1,420 @@
+
+
+<!DOCTYPE html>
+<!--[if IE 8]><html class="no-js lt-ie9" lang="en" > <![endif]-->
+<!--[if gt IE 8]><!--> <html class="no-js" lang="en" > <!--<![endif]-->
+<head>
+  <meta charset="utf-8">
+  
+  <meta name="viewport" content="width=device-width, initial-scale=1.0">
+  
+  <title>msd_pytorch.msd_block &mdash; Mixed-scale Dense Networks for PyTorch  documentation</title>
+  
+
+  
+  
+  
+  
+
+  
+  <script type="text/javascript" src="../../_static/js/modernizr.min.js"></script>
+  
+    
+      <script type="text/javascript" id="documentation_options" data-url_root="../../" src="../../_static/documentation_options.js"></script>
+        <script type="text/javascript" src="../../_static/jquery.js"></script>
+        <script type="text/javascript" src="../../_static/underscore.js"></script>
+        <script type="text/javascript" src="../../_static/doctools.js"></script>
+        <script type="text/javascript" src="../../_static/language_data.js"></script>
+    
+    <script type="text/javascript" src="../../_static/js/theme.js"></script>
+
+    
+
+  
+  <link rel="stylesheet" href="../../_static/css/theme.css" type="text/css" />
+  <link rel="stylesheet" href="../../_static/pygments.css" type="text/css" />
+    <link rel="index" title="Index" href="../../genindex.html" />
+    <link rel="search" title="Search" href="../../search.html" /> 
+</head>
+
+<body class="wy-body-for-nav">
+
+   
+  <div class="wy-grid-for-nav">
+    
+    <nav data-toggle="wy-nav-shift" class="wy-nav-side">
+      <div class="wy-side-scroll">
+        <div class="wy-side-nav-search" >
+          
+
+          
+            <a href="../../index.html" class="icon icon-home"> Mixed-scale Dense Networks for PyTorch
+          
+
+          
+          </a>
+
+          
+            
+            
+          
+
+          
+<div role="search">
+  <form id="rtd-search-form" class="wy-form" action="../../search.html" method="get">
+    <input type="text" name="q" placeholder="Search docs" />
+    <input type="hidden" name="check_keywords" value="yes" />
+    <input type="hidden" name="area" value="default" />
+  </form>
+</div>
+
+          
+        </div>
+
+        <div class="wy-menu wy-menu-vertical" data-spy="affix" role="navigation" aria-label="main navigation">
+          
+            
+            
+              
+            
+            
+              <ul>
+<li class="toctree-l1"><a class="reference internal" href="../../README.html">Mixed-scale Dense Networks for PyTorch</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../examples.html">Examples</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../modules.html">msd_pytorch</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../CHANGELOG.html">Changelog</a></li>
+</ul>
+
+            
+          
+        </div>
+      </div>
+    </nav>
+
+    <section data-toggle="wy-nav-shift" class="wy-nav-content-wrap">
+
+      
+      <nav class="wy-nav-top" aria-label="top navigation">
+        
+          <i data-toggle="wy-nav-top" class="fa fa-bars"></i>
+          <a href="../../index.html">Mixed-scale Dense Networks for PyTorch</a>
+        
+      </nav>
+
+
+      <div class="wy-nav-content">
+        
+        <div class="rst-content">
+        
+          
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+<div role="navigation" aria-label="breadcrumbs navigation">
+
+  <ul class="wy-breadcrumbs">
+    
+      <li><a href="../../index.html">Docs</a> &raquo;</li>
+        
+          <li><a href="../index.html">Module code</a> &raquo;</li>
+        
+      <li>msd_pytorch.msd_block</li>
+    
+    
+      <li class="wy-breadcrumbs-aside">
+        
+      </li>
+    
+  </ul>
+
+  
+  <hr/>
+</div>
+          <div role="main" class="document" itemscope="itemscope" itemtype="http://schema.org/Article">
+           <div itemprop="articleBody">
+            
+  <h1>Source code for msd_pytorch.msd_block</h1><div class="highlight"><pre>
+<span></span><span class="kn">import</span> <span class="nn">torch</span>
+<span class="kn">import</span> <span class="nn">conv_relu_cuda</span> <span class="k">as</span> <span class="nn">cr_cuda</span>
+<span class="kn">from</span> <span class="nn">msd_pytorch.msd_module</span> <span class="k">import</span> <span class="n">MSDFinalLayer</span><span class="p">,</span> <span class="n">init_convolution_weights</span>
+<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
+
+<span class="n">IDX_WEIGHT_START</span> <span class="o">=</span> <span class="mi">3</span>
+
+
+<div class="viewcode-block" id="MSDBlockImpl2d"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d">[docs]</a><span class="k">class</span> <span class="nc">MSDBlockImpl2d</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">autograd</span><span class="o">.</span><span class="n">Function</span><span class="p">):</span>
+<div class="viewcode-block" id="MSDBlockImpl2d.forward"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d.forward">[docs]</a>    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="n">ctx</span><span class="p">,</span> <span class="nb">input</span><span class="p">,</span> <span class="n">dilations</span><span class="p">,</span> <span class="n">bias</span><span class="p">,</span> <span class="o">*</span><span class="n">weights</span><span class="p">):</span>
+        <span class="n">depth</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">dilations</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="n">depth</span> <span class="o">==</span> <span class="nb">len</span><span class="p">(</span><span class="n">weights</span><span class="p">),</span> <span class="s2">&quot;number of weights does not match depth&quot;</span>
+
+        <span class="n">num_out_channels</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">w</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">)</span>
+        <span class="k">assert</span> <span class="p">(</span>
+            <span class="nb">len</span><span class="p">(</span><span class="n">bias</span><span class="p">)</span> <span class="o">==</span> <span class="n">num_out_channels</span>
+        <span class="p">),</span> <span class="s2">&quot;number of biases does not match number of output channels from weights&quot;</span>
+
+        <span class="n">ctx</span><span class="o">.</span><span class="n">dilations</span> <span class="o">=</span> <span class="n">dilations</span>
+        <span class="n">ctx</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+
+        <span class="n">result</span> <span class="o">=</span> <span class="nb">input</span><span class="o">.</span><span class="n">new_empty</span><span class="p">(</span>
+            <span class="nb">input</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span> <span class="nb">input</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="o">+</span> <span class="n">num_out_channels</span><span class="p">,</span> <span class="o">*</span><span class="nb">input</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:]</span>
+        <span class="p">)</span>
+
+        <span class="c1"># Copy input into result buffer</span>
+        <span class="n">result</span><span class="p">[:,</span> <span class="p">:</span> <span class="nb">input</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span> <span class="o">=</span> <span class="nb">input</span>
+
+        <span class="n">result_start</span> <span class="o">=</span> <span class="nb">input</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+        <span class="n">bias_start</span> <span class="o">=</span> <span class="mi">0</span>
+
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+            <span class="c1"># Extract variables</span>
+            <span class="n">sub_input</span> <span class="o">=</span> <span class="n">result</span><span class="p">[:,</span> <span class="p">:</span><span class="n">result_start</span><span class="p">]</span>
+            <span class="n">sub_weight</span> <span class="o">=</span> <span class="n">weights</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+            <span class="n">blocksize</span> <span class="o">=</span> <span class="n">sub_weight</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+            <span class="n">sub_bias</span> <span class="o">=</span> <span class="n">bias</span><span class="p">[</span><span class="n">bias_start</span> <span class="p">:</span> <span class="n">bias_start</span> <span class="o">+</span> <span class="n">blocksize</span><span class="p">]</span>
+            <span class="n">sub_result</span> <span class="o">=</span> <span class="n">result</span><span class="p">[:,</span> <span class="n">result_start</span> <span class="p">:</span> <span class="n">result_start</span> <span class="o">+</span> <span class="n">blocksize</span><span class="p">]</span>
+            <span class="n">dilation</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">dilations</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+
+            <span class="c1"># Compute convolution. conv_relu_forward computes the</span>
+            <span class="c1"># convolution and relu in one pass and stores the</span>
+            <span class="c1"># output in sub_result.</span>
+            <span class="n">cr_cuda</span><span class="o">.</span><span class="n">conv_relu_forward</span><span class="p">(</span>
+                <span class="n">sub_input</span><span class="p">,</span> <span class="n">sub_weight</span><span class="p">,</span> <span class="n">sub_bias</span><span class="p">,</span> <span class="n">sub_result</span><span class="p">,</span> <span class="n">dilation</span>
+            <span class="p">)</span>
+
+            <span class="c1"># Update steps etc</span>
+            <span class="n">result_start</span> <span class="o">+=</span> <span class="n">blocksize</span>
+            <span class="n">bias_start</span> <span class="o">+=</span> <span class="n">blocksize</span>
+
+        <span class="n">ctx</span><span class="o">.</span><span class="n">save_for_backward</span><span class="p">(</span><span class="n">bias</span><span class="p">,</span> <span class="n">result</span><span class="p">,</span> <span class="o">*</span><span class="n">weights</span><span class="p">)</span>
+
+        <span class="k">return</span> <span class="n">result</span></div>
+
+<div class="viewcode-block" id="MSDBlockImpl2d.backward"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d.backward">[docs]</a>    <span class="nd">@staticmethod</span>
+    <span class="k">def</span> <span class="nf">backward</span><span class="p">(</span><span class="n">ctx</span><span class="p">,</span> <span class="n">grad_output</span><span class="p">):</span>
+        <span class="n">bias</span><span class="p">,</span> <span class="n">result</span><span class="p">,</span> <span class="o">*</span><span class="n">weights</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">saved_tensors</span>
+        <span class="n">depth</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">depth</span>
+
+        <span class="n">grad_bias</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">bias</span><span class="p">)</span>
+        <span class="c1"># XXX: Could we just overwrite grad_output instead of clone?</span>
+        <span class="n">gradients</span> <span class="o">=</span> <span class="n">grad_output</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+        <span class="n">grad_weights</span> <span class="o">=</span> <span class="p">[]</span>
+
+        <span class="n">result_end</span> <span class="o">=</span> <span class="n">result</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
+        <span class="n">bias_end</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">bias</span><span class="p">)</span>
+
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+            <span class="n">idx</span> <span class="o">=</span> <span class="n">depth</span> <span class="o">-</span> <span class="mi">1</span> <span class="o">-</span> <span class="n">i</span>
+            <span class="c1"># Get subsets</span>
+            <span class="n">sub_weight</span> <span class="o">=</span> <span class="n">weights</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
+            <span class="n">blocksize</span> <span class="o">=</span> <span class="n">sub_weight</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+            <span class="n">result_start</span> <span class="o">=</span> <span class="n">result_end</span> <span class="o">-</span> <span class="n">blocksize</span>
+            <span class="n">bias_start</span> <span class="o">=</span> <span class="n">bias_end</span> <span class="o">-</span> <span class="n">blocksize</span>
+
+            <span class="n">sub_grad_output</span> <span class="o">=</span> <span class="n">gradients</span><span class="p">[:,</span> <span class="n">result_start</span><span class="p">:</span><span class="n">result_end</span><span class="p">]</span>
+            <span class="n">sub_grad_input</span> <span class="o">=</span> <span class="n">gradients</span><span class="p">[:,</span> <span class="p">:</span><span class="n">result_start</span><span class="p">]</span>
+            <span class="n">sub_result</span> <span class="o">=</span> <span class="n">result</span><span class="p">[:,</span> <span class="n">result_start</span><span class="p">:</span><span class="n">result_end</span><span class="p">]</span>
+            <span class="n">sub_input</span> <span class="o">=</span> <span class="n">result</span><span class="p">[:,</span> <span class="p">:</span><span class="n">result_start</span><span class="p">]</span>
+
+            <span class="n">dilation</span> <span class="o">=</span> <span class="n">ctx</span><span class="o">.</span><span class="n">dilations</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
+
+            <span class="c1"># Gradient w.r.t. input: conv_relu_backward_x computes the</span>
+            <span class="c1"># gradient wrt sub_input and adds the gradient to</span>
+            <span class="c1"># sub_grad_input.</span>
+            <span class="n">cr_cuda</span><span class="o">.</span><span class="n">conv_relu_backward_x</span><span class="p">(</span>
+                <span class="n">sub_result</span><span class="p">,</span> <span class="n">sub_grad_output</span><span class="p">,</span> <span class="n">sub_weight</span><span class="p">,</span> <span class="n">sub_grad_input</span><span class="p">,</span> <span class="n">dilation</span>
+            <span class="p">)</span>
+
+            <span class="c1"># Gradient w.r.t weights</span>
+            <span class="k">if</span> <span class="n">ctx</span><span class="o">.</span><span class="n">needs_input_grad</span><span class="p">[</span><span class="n">i</span> <span class="o">+</span> <span class="n">IDX_WEIGHT_START</span><span class="p">]:</span>
+                <span class="n">sub_grad_weight</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">sub_weight</span><span class="p">)</span>
+                <span class="n">cr_cuda</span><span class="o">.</span><span class="n">conv_relu_backward_k</span><span class="p">(</span>
+                    <span class="n">sub_result</span><span class="p">,</span> <span class="n">sub_grad_output</span><span class="p">,</span> <span class="n">sub_input</span><span class="p">,</span> <span class="n">sub_grad_weight</span><span class="p">,</span> <span class="n">dilation</span>
+                <span class="p">)</span>
+                <span class="n">grad_weights</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">sub_grad_weight</span><span class="p">)</span>
+            <span class="k">else</span><span class="p">:</span>
+                <span class="n">grad_weights</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="kc">None</span><span class="p">)</span>
+            <span class="c1"># Gradient of Bias</span>
+            <span class="k">if</span> <span class="n">ctx</span><span class="o">.</span><span class="n">needs_input_grad</span><span class="p">[</span><span class="mi">2</span><span class="p">]:</span>
+                <span class="n">sub_grad_bias</span> <span class="o">=</span> <span class="n">grad_bias</span><span class="p">[</span><span class="n">bias_start</span><span class="p">:</span><span class="n">bias_end</span><span class="p">]</span>
+                <span class="n">cr_cuda</span><span class="o">.</span><span class="n">conv_relu_backward_bias</span><span class="p">(</span>
+                    <span class="n">sub_result</span><span class="p">,</span> <span class="n">sub_grad_output</span><span class="p">,</span> <span class="n">sub_grad_bias</span>
+                <span class="p">)</span>
+
+            <span class="c1"># Update positions etc</span>
+            <span class="n">result_end</span> <span class="o">-=</span> <span class="n">blocksize</span>
+            <span class="n">bias_end</span> <span class="o">-=</span> <span class="n">blocksize</span>
+
+        <span class="n">grad_input</span> <span class="o">=</span> <span class="n">gradients</span><span class="p">[:,</span> <span class="p">:</span> <span class="n">weights</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]]</span>
+
+        <span class="k">return</span> <span class="p">(</span><span class="n">grad_input</span><span class="p">,</span> <span class="kc">None</span><span class="p">,</span> <span class="n">grad_bias</span><span class="p">,</span> <span class="o">*</span><span class="n">grad_weights</span><span class="p">)</span></div></div>
+
+
+<span class="n">msdblock2d</span> <span class="o">=</span> <span class="n">MSDBlockImpl2d</span><span class="o">.</span><span class="n">apply</span>
+
+
+<div class="viewcode-block" id="MSDBlock2d"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d">[docs]</a><span class="k">class</span> <span class="nc">MSDBlock2d</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+<div class="viewcode-block" id="MSDBlock2d.__init__"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.__init__">[docs]</a>    <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">in_channels</span><span class="p">,</span> <span class="n">dilations</span><span class="p">,</span> <span class="n">width</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
+        <span class="sd">&quot;&quot;&quot;Multi-scale dense block</span>
+
+<span class="sd">        Parameters</span>
+<span class="sd">        ----------</span>
+<span class="sd">        in_channels : int</span>
+<span class="sd">            Number of input channels</span>
+<span class="sd">        dilations : tuple of int</span>
+<span class="sd">            Dilation for each convolution-block</span>
+<span class="sd">        width : int</span>
+<span class="sd">            Number of channels per convolution.</span>
+
+<span class="sd">        Notes</span>
+<span class="sd">        -----</span>
+<span class="sd">        The number of output channels is in_channels + depth * width</span>
+<span class="sd">        &quot;&quot;&quot;</span>
+        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">kernel_size</span> <span class="o">=</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">dilations</span> <span class="o">=</span> <span class="n">dilations</span>
+
+        <span class="n">depth</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dilations</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">(</span><span class="n">depth</span> <span class="o">*</span> <span class="n">width</span><span class="p">))</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">weights</span> <span class="o">=</span> <span class="p">[]</span>
+        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">):</span>
+            <span class="n">n_in</span> <span class="o">=</span> <span class="n">in_channels</span> <span class="o">+</span> <span class="n">width</span> <span class="o">*</span> <span class="n">i</span>
+
+            <span class="n">weight</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">(</span><span class="n">width</span><span class="p">,</span> <span class="n">n_in</span><span class="p">,</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">kernel_size</span><span class="p">))</span>
+
+            <span class="bp">self</span><span class="o">.</span><span class="n">register_parameter</span><span class="p">(</span><span class="s2">&quot;weight</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">i</span><span class="p">),</span> <span class="n">weight</span><span class="p">)</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">weights</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">weight</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">reset_parameters</span><span class="p">()</span></div>
+
+<div class="viewcode-block" id="MSDBlock2d.reset_parameters"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.reset_parameters">[docs]</a>    <span class="k">def</span> <span class="nf">reset_parameters</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="k">for</span> <span class="n">weight</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">weights</span><span class="p">:</span>
+            <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">init</span><span class="o">.</span><span class="n">kaiming_uniform_</span><span class="p">(</span><span class="n">weight</span><span class="p">,</span> <span class="n">a</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="mi">5</span><span class="p">))</span>
+
+        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">bias</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+            <span class="c1"># TODO: improve</span>
+            <span class="n">fan_in</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">init</span><span class="o">.</span><span class="n">_calculate_fan_in_and_fan_out</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">weights</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+            <span class="n">bound</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">fan_in</span><span class="p">)</span>
+            <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">init</span><span class="o">.</span><span class="n">uniform_</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">bias</span><span class="p">,</span> <span class="o">-</span><span class="n">bound</span><span class="p">,</span> <span class="n">bound</span><span class="p">)</span></div>
+
+<div class="viewcode-block" id="MSDBlock2d.forward"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.forward">[docs]</a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">):</span>
+        <span class="c1"># This is a bit of a hack, since we require but cannot assume</span>
+        <span class="c1"># that self.parameters() remains sorted in the order that we</span>
+        <span class="c1"># added the parameters.</span>
+        <span class="c1">#</span>
+        <span class="c1"># However, we need to obtain weights in this way, because</span>
+        <span class="c1"># self.weights may become obsolete when used in multi-gpu</span>
+        <span class="c1"># settings when the weights are automatically transferred (by,</span>
+        <span class="c1"># e.g., torch.nn.DataParallel). In that case, self.weights may</span>
+        <span class="c1"># continue to point to the weight parameters on the original</span>
+        <span class="c1"># device, even when the weight parameters have been</span>
+        <span class="c1"># transferred to a different gpu.</span>
+        <span class="n">bias</span><span class="p">,</span> <span class="o">*</span><span class="n">weights</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="p">()</span>
+        <span class="k">return</span> <span class="n">MSDBlockImpl2d</span><span class="o">.</span><span class="n">apply</span><span class="p">(</span><span class="nb">input</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">dilations</span><span class="p">,</span> <span class="n">bias</span><span class="p">,</span> <span class="o">*</span><span class="n">weights</span><span class="p">)</span></div></div>
+
+
+<div class="viewcode-block" id="MSDModule2d"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d">[docs]</a><span class="k">class</span> <span class="nc">MSDModule2d</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+<div class="viewcode-block" id="MSDModule2d.__init__"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.__init__">[docs]</a>    <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span>
+        <span class="bp">self</span><span class="p">,</span> <span class="n">c_in</span><span class="p">,</span> <span class="n">c_out</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">dilations</span><span class="o">=</span><span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">6</span><span class="p">,</span> <span class="mi">7</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">9</span><span class="p">,</span> <span class="mi">10</span><span class="p">]</span>
+    <span class="p">):</span>
+        <span class="sd">&quot;&quot;&quot;Create a 2-dimensional MSD Module</span>
+
+<span class="sd">        :param c_in: # of input channels</span>
+<span class="sd">        :param c_out: # of output channels</span>
+<span class="sd">        :param depth: # of layers</span>
+<span class="sd">        :param width: # the width of the module</span>
+<span class="sd">        :param dilations: `list(int)`</span>
+
+<span class="sd">        A list of dilations to use. Default is ``[1, 2, ..., 10]``.  A</span>
+<span class="sd">        good alternative is ``[1, 2, 4, 8]``. The dilations are</span>
+<span class="sd">        repeated.</span>
+
+<span class="sd">        :returns: an MSD module</span>
+<span class="sd">        :rtype: MSDModule2d</span>
+
+<span class="sd">        &quot;&quot;&quot;</span>
+
+        <span class="nb">super</span><span class="p">(</span><span class="n">MSDModule2d</span><span class="p">,</span> <span class="bp">self</span><span class="p">)</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">c_in</span> <span class="o">=</span> <span class="n">c_in</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">c_out</span> <span class="o">=</span> <span class="n">c_out</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">depth</span> <span class="o">=</span> <span class="n">depth</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">width</span> <span class="o">=</span> <span class="n">width</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">dilations</span> <span class="o">=</span> <span class="p">[</span><span class="n">dilations</span><span class="p">[</span><span class="n">i</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="n">dilations</span><span class="p">)]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">)]</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">msd_block</span> <span class="o">=</span> <span class="n">MSDBlock2d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">c_in</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">dilations</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">final_layer</span> <span class="o">=</span> <span class="n">MSDFinalLayer</span><span class="p">(</span><span class="n">c_in</span><span class="o">=</span><span class="n">c_in</span> <span class="o">+</span> <span class="n">width</span> <span class="o">*</span> <span class="n">depth</span><span class="p">,</span> <span class="n">c_out</span><span class="o">=</span><span class="n">c_out</span><span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">reset_parameters</span><span class="p">()</span></div>
+
+<div class="viewcode-block" id="MSDModule2d.reset_parameters"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.reset_parameters">[docs]</a>    <span class="k">def</span> <span class="nf">reset_parameters</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="c1"># Initialize weights for hidden layers:</span>
+        <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">msd_block</span><span class="o">.</span><span class="n">weights</span><span class="p">:</span>
+            <span class="n">init_convolution_weights</span><span class="p">(</span>
+                <span class="n">w</span><span class="o">.</span><span class="n">data</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">c_in</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">c_out</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">width</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">depth</span>
+            <span class="p">)</span>
+
+        <span class="bp">self</span><span class="o">.</span><span class="n">msd_block</span><span class="o">.</span><span class="n">bias</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">final_layer</span><span class="o">.</span><span class="n">reset_parameters</span><span class="p">()</span></div>
+
+<div class="viewcode-block" id="MSDModule2d.forward"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.forward">[docs]</a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">):</span>
+        <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">msd_block</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
+        <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">final_layer</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
+        <span class="k">return</span> <span class="n">output</span></div></div>
+</pre></div>
+
+           </div>
+           
+          </div>
+          <footer>
+  
+
+  <hr/>
+
+  <div role="contentinfo">
+    <p>
+        &copy; Copyright 2018, Allard Hendriksen
+
+    </p>
+  </div>
+  Built with <a href="http://sphinx-doc.org/">Sphinx</a> using a <a href="https://github.com/rtfd/sphinx_rtd_theme">theme</a> provided by <a href="https://readthedocs.org">Read the Docs</a>. 
+
+</footer>
+
+        </div>
+      </div>
+
+    </section>
+
+  </div>
+  
+
+
+  <script type="text/javascript">
+      jQuery(function () {
+          SphinxRtdTheme.Navigation.enable(true);
+      });
+  </script>
+
+  
+  
+    
+   
+
+</body>
+</html>
\ No newline at end of file
diff --git a/docs/_modules/msd_pytorch/msd_model.html b/docs/_modules/msd_pytorch/msd_model.html
index a157f4b..db99976 100644
--- a/docs/_modules/msd_pytorch/msd_model.html
+++ b/docs/_modules/msd_pytorch/msd_model.html
@@ -146,7 +146,7 @@
            <div itemprop="articleBody">
             
   <h1>Source code for msd_pytorch.msd_model</h1><div class="highlight"><pre>
-<span></span><span class="kn">from</span> <span class="nn">msd_pytorch.msd_module</span> <span class="k">import</span> <span class="n">MSDModule</span>
+<span></span><span class="kn">from</span> <span class="nn">msd_pytorch.msd_block</span> <span class="k">import</span> <span class="n">MSDModule2d</span>
 <span class="kn">from</span> <span class="nn">torch.autograd</span> <span class="k">import</span> <span class="n">Variable</span>
 <span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
 <span class="kn">import</span> <span class="nn">torch</span> <span class="k">as</span> <span class="nn">t</span>
@@ -232,7 +232,7 @@ <h1>Source code for msd_pytorch.msd_model</h1><div class="highlight"><pre>
         <span class="c1"># network is saved.</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">scale_in</span> <span class="o">=</span> <span class="n">scaling_module</span><span class="p">(</span><span class="n">c_in</span><span class="p">,</span> <span class="n">c_in</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">scale_out</span> <span class="o">=</span> <span class="n">scaling_module</span><span class="p">(</span><span class="n">c_out</span><span class="p">,</span> <span class="n">c_out</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">msd</span> <span class="o">=</span> <span class="n">MSDModule</span><span class="p">(</span><span class="n">c_in</span><span class="p">,</span> <span class="n">c_out</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">dilations</span><span class="p">)</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">msd</span> <span class="o">=</span> <span class="n">MSDModule2d</span><span class="p">(</span><span class="n">c_in</span><span class="p">,</span> <span class="n">c_out</span><span class="p">,</span> <span class="n">depth</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">dilations</span><span class="p">)</span></div>
 
         <span class="c1"># It is the task of any subclass to initialize `self.net` and</span>
         <span class="c1"># call `init_optimizer` to set the trainable parameters.</span>
@@ -339,6 +339,8 @@ <h1>Source code for msd_pytorch.msd_model</h1><div class="highlight"><pre>
         <span class="k">if</span> <span class="n">target</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
             <span class="bp">self</span><span class="o">.</span><span class="n">set_target</span><span class="p">(</span><span class="n">target</span><span class="p">)</span>
 
+        <span class="bp">self</span><span class="o">.</span><span class="n">output</span> <span class="o">=</span> <span class="kc">None</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">loss</span> <span class="o">=</span> <span class="kc">None</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">input</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">loss</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">criterion</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">output</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">target</span><span class="p">)</span>
 
diff --git a/docs/_modules/msd_pytorch/msd_module.html b/docs/_modules/msd_pytorch/msd_module.html
index 52d6c3d..5eeea10 100644
--- a/docs/_modules/msd_pytorch/msd_module.html
+++ b/docs/_modules/msd_pytorch/msd_module.html
@@ -147,7 +147,6 @@
             
   <h1>Source code for msd_pytorch.msd_module</h1><div class="highlight"><pre>
 <span></span><span class="kn">import</span> <span class="nn">torch.nn</span> <span class="k">as</span> <span class="nn">nn</span>
-<span class="kn">import</span> <span class="nn">torch</span>
 <span class="kn">from</span> <span class="nn">msd_pytorch.conv</span> <span class="k">import</span> <span class="n">Conv2dInPlaceModule</span>
 <span class="kn">from</span> <span class="nn">msd_pytorch.conv_relu</span> <span class="k">import</span> <span class="n">ConvRelu2dInPlaceModule</span>
 <span class="kn">from</span> <span class="nn">msd_pytorch.stitch</span> <span class="k">import</span> <span class="n">stitchLazy</span><span class="p">,</span> <span class="n">StitchCopyModule</span><span class="p">,</span> <span class="n">StitchBuffer</span>
@@ -202,7 +201,7 @@ <h1>Source code for msd_pytorch.msd_module</h1><div class="highlight"><pre>
 <span class="sd">    :rtype:</span>
 
 <span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># The number of paramters in the convolution depends on whether</span>
+    <span class="c1"># The number of parameters in the convolution depends on whether</span>
     <span class="c1"># the convolution is 2D or 3D. We multiply all non-channel</span>
     <span class="c1"># dimensions of the weight here to get the right answer.</span>
     <span class="n">num_params</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">product</span><span class="p">(</span><span class="n">conv_weight</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">2</span><span class="p">:])</span>
@@ -285,8 +284,7 @@ <h1>Source code for msd_pytorch.msd_module</h1><div class="highlight"><pre>
         <span class="bp">self</span><span class="o">.</span><span class="n">c_in</span> <span class="o">=</span> <span class="n">c_in</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">c_out</span> <span class="o">=</span> <span class="n">c_out</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">linear</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Conv1d</span><span class="p">(</span><span class="n">c_in</span><span class="p">,</span> <span class="n">c_out</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">linear</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">linear</span><span class="o">.</span><span class="n">bias</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span></div>
+        <span class="bp">self</span><span class="o">.</span><span class="n">reset_parameters</span><span class="p">()</span></div>
 
 <div class="viewcode-block" id="MSDFinalLayer.forward"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_module.MSDFinalLayer.forward">[docs]</a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">):</span>
         <span class="n">b</span><span class="p">,</span> <span class="n">c_in</span><span class="p">,</span> <span class="o">*</span><span class="n">size</span> <span class="o">=</span> <span class="nb">input</span><span class="o">.</span><span class="n">shape</span>
@@ -296,7 +294,11 @@ <h1>Source code for msd_pytorch.msd_module</h1><div class="highlight"><pre>
         <span class="n">output</span> <span class="o">=</span> <span class="nb">input</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">b</span><span class="p">,</span> <span class="n">c_in</span><span class="p">,</span> <span class="n">tmp_size</span><span class="p">)</span>
         <span class="n">output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">linear</span><span class="p">(</span><span class="n">output</span><span class="p">)</span>
         <span class="n">output</span> <span class="o">=</span> <span class="n">output</span><span class="o">.</span><span class="n">view</span><span class="p">(</span><span class="n">b</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">c_out</span><span class="p">,</span> <span class="o">*</span><span class="n">size</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">output</span></div></div>
+        <span class="k">return</span> <span class="n">output</span></div>
+
+<div class="viewcode-block" id="MSDFinalLayer.reset_parameters"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_module.MSDFinalLayer.reset_parameters">[docs]</a>    <span class="k">def</span> <span class="nf">reset_parameters</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">linear</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">linear</span><span class="o">.</span><span class="n">bias</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span></div></div>
 
 
 <div class="viewcode-block" id="MSDModule"><a class="viewcode-back" href="../../msd_pytorch.html#msd_pytorch.msd_module.MSDModule">[docs]</a><span class="k">class</span> <span class="nc">MSDModule</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
@@ -334,22 +336,22 @@ <h1>Source code for msd_pytorch.msd_module</h1><div class="highlight"><pre>
         <span class="n">stitch_layer</span> <span class="o">=</span> <span class="n">StitchCopyModule</span><span class="p">(</span><span class="n">buffer</span><span class="p">,</span> <span class="mi">0</span><span class="p">)</span>
 
         <span class="c1"># Then we have `depth` number of hidden layers:</span>
-        <span class="n">hidden_layers</span> <span class="o">=</span> <span class="p">[</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">hidden_layers</span> <span class="o">=</span> <span class="p">[</span>
             <span class="n">MSDLayerModule</span><span class="p">(</span><span class="n">buffer</span><span class="p">,</span> <span class="n">c_in</span><span class="p">,</span> <span class="n">d</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">dilations</span><span class="p">[</span><span class="n">d</span> <span class="o">%</span> <span class="nb">len</span><span class="p">(</span><span class="n">dilations</span><span class="p">)])</span>
             <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">depth</span><span class="p">)</span>
         <span class="p">]</span>
 
         <span class="c1"># Initialize weights for hidden layers:</span>
-        <span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="n">hidden_layers</span><span class="p">:</span>
+        <span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_layers</span><span class="p">:</span>
             <span class="n">init_convolution_weights</span><span class="p">(</span>
                 <span class="n">m</span><span class="o">.</span><span class="n">convolution</span><span class="o">.</span><span class="n">weight</span><span class="o">.</span><span class="n">data</span><span class="p">,</span> <span class="n">c_in</span><span class="p">,</span> <span class="n">c_out</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">depth</span>
             <span class="p">)</span>
             <span class="n">m</span><span class="o">.</span><span class="n">convolution</span><span class="o">.</span><span class="n">bias</span><span class="o">.</span><span class="n">data</span><span class="o">.</span><span class="n">zero_</span><span class="p">()</span>
 
         <span class="n">in_front</span> <span class="o">=</span> <span class="n">units_in_front</span><span class="p">(</span><span class="n">c_in</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">depth</span><span class="p">)</span>
-        <span class="n">c_final</span> <span class="o">=</span> <span class="n">MSDFinalLayer</span><span class="p">(</span><span class="n">in_front</span><span class="p">,</span> <span class="n">c_out</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">c_final</span> <span class="o">=</span> <span class="n">MSDFinalLayer</span><span class="p">(</span><span class="n">in_front</span><span class="p">,</span> <span class="n">c_out</span><span class="p">)</span>
 
-        <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="n">stitch_layer</span><span class="p">,</span> <span class="o">*</span><span class="n">hidden_layers</span><span class="p">,</span> <span class="n">c_final</span><span class="p">)</span>
+        <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="n">stitch_layer</span><span class="p">,</span> <span class="o">*</span><span class="bp">self</span><span class="o">.</span><span class="n">hidden_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">c_final</span><span class="p">)</span>
 
         <span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="o">.</span><span class="n">cuda</span><span class="p">()</span></div>
 
diff --git a/docs/_modules/msd_pytorch/msd_regression_model.html b/docs/_modules/msd_pytorch/msd_regression_model.html
index 30da273..6bc382e 100644
--- a/docs/_modules/msd_pytorch/msd_regression_model.html
+++ b/docs/_modules/msd_pytorch/msd_regression_model.html
@@ -174,6 +174,7 @@ <h1>Source code for msd_pytorch.msd_regression_model</h1><div class="highlight">
         <span class="o">*</span><span class="p">,</span>
         <span class="n">dilations</span><span class="o">=</span><span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">6</span><span class="p">,</span> <span class="mi">7</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">9</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
         <span class="n">loss</span><span class="o">=</span><span class="s2">&quot;L2&quot;</span><span class="p">,</span>
+        <span class="n">parallel</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="p">):</span>
         <span class="sd">&quot;&quot;&quot;Create a new MSD network for regression.</span>
 
@@ -195,6 +196,12 @@ <h1>Source code for msd_pytorch.msd_regression_model</h1><div class="highlight">
 <span class="sd">        * &quot;L1&quot; - ``nn.L1Loss()``</span>
 <span class="sd">        * &quot;L2&quot; - ``nn.MSELoss()``</span>
 
+<span class="sd">        :param parallel: `bool`</span>
+
+<span class="sd">        Whether or not to execute the model on multiple GPUs.  Note</span>
+<span class="sd">        that the batch size must be a multiple of the number of</span>
+<span class="sd">        available GPUs.</span>
+
 <span class="sd">        :returns:</span>
 <span class="sd">        :rtype:</span>
 
@@ -210,6 +217,8 @@ <h1>Source code for msd_pytorch.msd_regression_model</h1><div class="highlight">
         <span class="c1"># Define the whole network:</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">scale_in</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">msd</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">scale_out</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="o">.</span><span class="n">cuda</span><span class="p">()</span>
+        <span class="k">if</span> <span class="n">parallel</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">DataParallel</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="p">)</span>
 
         <span class="c1"># Train only MSD parameters:</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">init_optimizer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">msd</span><span class="p">)</span></div></div>
diff --git a/docs/_modules/msd_pytorch/msd_segmentation_model.html b/docs/_modules/msd_pytorch/msd_segmentation_model.html
index 7c37c65..78f90fd 100644
--- a/docs/_modules/msd_pytorch/msd_segmentation_model.html
+++ b/docs/_modules/msd_pytorch/msd_segmentation_model.html
@@ -172,6 +172,7 @@ <h1>Source code for msd_pytorch.msd_segmentation_model</h1><div class="highlight
         <span class="n">width</span><span class="p">,</span>
         <span class="o">*</span><span class="p">,</span>
         <span class="n">dilations</span><span class="o">=</span><span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">6</span><span class="p">,</span> <span class="mi">7</span><span class="p">,</span> <span class="mi">8</span><span class="p">,</span> <span class="mi">9</span><span class="p">,</span> <span class="mi">10</span><span class="p">],</span>
+        <span class="n">parallel</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
     <span class="p">):</span>
         <span class="sd">&quot;&quot;&quot;Create a new MSD network for segmentation.</span>
 
@@ -185,6 +186,12 @@ <h1>Source code for msd_pytorch.msd_segmentation_model</h1><div class="highlight
 <span class="sd">        good alternative is ``[1, 2, 4, 8]``. The dilations are</span>
 <span class="sd">        repeated when there are more layers than supplied dilations.</span>
 
+<span class="sd">        :param parallel: `bool`</span>
+
+<span class="sd">        Whether or not to execute the model on multiple GPUs.  Note</span>
+<span class="sd">        that the batch size must be a multiple of the number of</span>
+<span class="sd">        available GPUs.</span>
+
 <span class="sd">        :returns:</span>
 <span class="sd">        :rtype:</span>
 
@@ -200,6 +207,9 @@ <h1>Source code for msd_pytorch.msd_segmentation_model</h1><div class="highlight
         <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">scale_in</span><span class="p">,</span> <span class="n">net_trained</span><span class="p">)</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="o">.</span><span class="n">cuda</span><span class="p">()</span>
 
+        <span class="k">if</span> <span class="n">parallel</span><span class="p">:</span>
+            <span class="bp">self</span><span class="o">.</span><span class="n">net</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">DataParallel</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">net</span><span class="p">)</span>
+
         <span class="c1"># Train all parameters apart from self.scale_in.</span>
         <span class="bp">self</span><span class="o">.</span><span class="n">init_optimizer</span><span class="p">(</span><span class="n">net_trained</span><span class="p">)</span></div>
 
diff --git a/docs/_sources/CHANGELOG.md.txt b/docs/_sources/CHANGELOG.md.txt
index 099818c..2d9091b 100644
--- a/docs/_sources/CHANGELOG.md.txt
+++ b/docs/_sources/CHANGELOG.md.txt
@@ -6,12 +6,25 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
 
 ## [Unreleased]
 ### Added
-- <insert-features-not-in-a-release-yet>
+- Support for multi-gpu execution. Use `parallel=True` when
+  constructing a `MSDRegressionModel` or `MSDSegmentationModel`.
 ### Fixed
-- <insert-bugs-fixed-not-in-a-release-yet>
+- Make `model.forward()` more memory-efficient.
+### Removed
+
+## [0.7.1] - 2019-05-27
+### Added
+- Add `weights_path` command-line argument to msd executable to indicate
+  where to store final weights.
+- Add `MSDBlock2d`: this is a faster and slightly more memory efficient
+  implementation of the same MSD component. Many thanks to Jonas
+  Adler for suggesting this way of structuring the code!
+### Changed
+- The MSD models use `MSDBlock2d` implementation by default now.
 
 ## 0.6.2 - 2019-05-23
 ### Added
 - Initial release.
 
 [Unreleased]: https://www.github.com/ahendriksen/msd_pytorch/compare/v0.6.2...master
+[0.7.1]: https://www.github.com/ahendriksen/msd_pytorch/compare/v0.6.2...v0.7.1
diff --git a/docs/_sources/README.md.txt b/docs/_sources/README.md.txt
index e08995d..1a2f790 100644
--- a/docs/_sources/README.md.txt
+++ b/docs/_sources/README.md.txt
@@ -127,6 +127,7 @@ examples folder.
 ## Authors and contributors
 
 * **Allard Hendriksen** - *Initial work*
+* **Jonas Adler** - *Discussions and code*
 
 See also the list of [contributors](https://github.com/ahendriksen/msd_pytorch/contributors) who participated in this project.
 
diff --git a/docs/_sources/msd_pytorch.rst.txt b/docs/_sources/msd_pytorch.rst.txt
index 90a99ca..e955df8 100644
--- a/docs/_sources/msd_pytorch.rst.txt
+++ b/docs/_sources/msd_pytorch.rst.txt
@@ -52,6 +52,14 @@ msd\_pytorch.main module
     :undoc-members:
     :show-inheritance:
 
+msd\_pytorch.msd\_block module
+------------------------------
+
+.. automodule:: msd_pytorch.msd_block
+    :members:
+    :undoc-members:
+    :show-inheritance:
+
 msd\_pytorch.msd\_model module
 ------------------------------
 
diff --git a/docs/genindex.html b/docs/genindex.html
index 3d020b1..ebb43cf 100644
--- a/docs/genindex.html
+++ b/docs/genindex.html
@@ -185,6 +185,10 @@ <h2 id="_">_</h2>
         <li><a href="msd_pytorch.html#msd_pytorch.image_dataset.ImageDataset.__init__">(msd_pytorch.image_dataset.ImageDataset method)</a>
 </li>
         <li><a href="msd_pytorch.html#msd_pytorch.image_dataset.ImageStack.__init__">(msd_pytorch.image_dataset.ImageStack method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.__init__">(msd_pytorch.msd_block.MSDBlock2d method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.__init__">(msd_pytorch.msd_block.MSDModule2d method)</a>
 </li>
         <li><a href="msd_pytorch.html#msd_pytorch.msd_model.MSDModel.__init__">(msd_pytorch.msd_model.MSDModel method)</a>
 </li>
@@ -225,6 +229,8 @@ <h2 id="B">B</h2>
 
       <ul>
         <li><a href="msd_pytorch.html#msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction.backward">(msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction static method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d.backward">(msd_pytorch.msd_block.MSDBlockImpl2d static method)</a>
 </li>
         <li><a href="msd_pytorch.html#msd_pytorch.relu_inplace.ReLUInplaceFunction.backward">(msd_pytorch.relu_inplace.ReLUInplaceFunction static method)</a>
 </li>
@@ -289,6 +295,12 @@ <h2 id="F">F</h2>
         <li><a href="msd_pytorch.html#msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction.forward">(msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction static method)</a>
 </li>
         <li><a href="msd_pytorch.html#msd_pytorch.conv_relu.ConvRelu2dInPlaceModule.forward">(msd_pytorch.conv_relu.ConvRelu2dInPlaceModule method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.forward">(msd_pytorch.msd_block.MSDBlock2d method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d.forward">(msd_pytorch.msd_block.MSDBlockImpl2d static method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.forward">(msd_pytorch.msd_block.MSDModule2d method)</a>
 </li>
         <li><a href="msd_pytorch.html#msd_pytorch.msd_model.MSDModel.forward">(msd_pytorch.msd_model.MSDModel method)</a>
 </li>
@@ -380,20 +392,28 @@ <h2 id="M">M</h2>
       <li><a href="msd_pytorch.html#module-msd_pytorch.image_dataset">msd_pytorch.image_dataset (module)</a>
 </li>
       <li><a href="msd_pytorch.html#module-msd_pytorch.main">msd_pytorch.main (module)</a>
+</li>
+      <li><a href="msd_pytorch.html#module-msd_pytorch.msd_block">msd_pytorch.msd_block (module)</a>
 </li>
       <li><a href="msd_pytorch.html#module-msd_pytorch.msd_model">msd_pytorch.msd_model (module)</a>
 </li>
       <li><a href="msd_pytorch.html#module-msd_pytorch.msd_module">msd_pytorch.msd_module (module)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="msd_pytorch.html#module-msd_pytorch.msd_regression_model">msd_pytorch.msd_regression_model (module)</a>
 </li>
+  </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="msd_pytorch.html#module-msd_pytorch.msd_segmentation_model">msd_pytorch.msd_segmentation_model (module)</a>
 </li>
       <li><a href="msd_pytorch.html#module-msd_pytorch.relu_inplace">msd_pytorch.relu_inplace (module)</a>
 </li>
       <li><a href="msd_pytorch.html#module-msd_pytorch.stitch">msd_pytorch.stitch (module)</a>
+</li>
+      <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d">MSDBlock2d (class in msd_pytorch.msd_block)</a>
+</li>
+      <li><a href="msd_pytorch.html#msd_pytorch.msd_block.msdblock2d">msdblock2d() (in module msd_pytorch.msd_block)</a>
+</li>
+      <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlockImpl2d">MSDBlockImpl2d (class in msd_pytorch.msd_block)</a>
 </li>
       <li><a href="msd_pytorch.html#msd_pytorch.msd_module.MSDFinalLayer">MSDFinalLayer (class in msd_pytorch.msd_module)</a>
 </li>
@@ -402,6 +422,8 @@ <h2 id="M">M</h2>
       <li><a href="msd_pytorch.html#msd_pytorch.msd_model.MSDModel">MSDModel (class in msd_pytorch.msd_model)</a>
 </li>
       <li><a href="msd_pytorch.html#msd_pytorch.msd_module.MSDModule">MSDModule (class in msd_pytorch.msd_module)</a>
+</li>
+      <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d">MSDModule2d (class in msd_pytorch.msd_block)</a>
 </li>
       <li><a href="msd_pytorch.html#msd_pytorch.msd_regression_model.MSDRegressionModel">MSDRegressionModel (class in msd_pytorch.msd_regression_model)</a>
 </li>
@@ -435,13 +457,21 @@ <h2 id="R">R</h2>
   <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="msd_pytorch.html#msd_pytorch.main.regression">regression() (in module msd_pytorch.main)</a>
 </li>
-  </ul></td>
-  <td style="width: 33%; vertical-align: top;"><ul>
       <li><a href="msd_pytorch.html#msd_pytorch.relu_inplace.ReLUInplaceFunction">ReLUInplaceFunction (class in msd_pytorch.relu_inplace)</a>
 </li>
       <li><a href="msd_pytorch.html#msd_pytorch.relu_inplace.ReLUInplaceModule">ReLUInplaceModule (class in msd_pytorch.relu_inplace)</a>
 </li>
   </ul></td>
+  <td style="width: 33%; vertical-align: top;"><ul>
+      <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDBlock2d.reset_parameters">reset_parameters() (msd_pytorch.msd_block.MSDBlock2d method)</a>
+
+      <ul>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_block.MSDModule2d.reset_parameters">(msd_pytorch.msd_block.MSDModule2d method)</a>
+</li>
+        <li><a href="msd_pytorch.html#msd_pytorch.msd_module.MSDFinalLayer.reset_parameters">(msd_pytorch.msd_module.MSDFinalLayer method)</a>
+</li>
+      </ul></li>
+  </ul></td>
 </tr></table>
 
 <h2 id="S">S</h2>
diff --git a/docs/index.html b/docs/index.html
index 6427105..b9bba21 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -167,7 +167,8 @@ <h1>Welcome to the documentation of Mixed-scale Dense Networks for PyTorch!<a cl
 </li>
 <li class="toctree-l1"><a class="reference internal" href="CHANGELOG.html">Changelog</a><ul>
 <li class="toctree-l2"><a class="reference internal" href="CHANGELOG.html#unreleased">Unreleased</a></li>
-<li class="toctree-l2"><a class="reference internal" href="CHANGELOG.html#id1">0.6.2 - 2019-05-23</a></li>
+<li class="toctree-l2"><a class="reference internal" href="CHANGELOG.html#id1">0.7.1 - 2019-05-27</a></li>
+<li class="toctree-l2"><a class="reference internal" href="CHANGELOG.html#id3">0.6.2 - 2019-05-23</a></li>
 </ul>
 </li>
 </ul>
diff --git a/docs/modules.html b/docs/modules.html
index f06e8ac..f1d913c 100644
--- a/docs/modules.html
+++ b/docs/modules.html
@@ -164,6 +164,7 @@ <h1>msd_pytorch<a class="headerlink" href="#msd-pytorch" title="Permalink to thi
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.errors">msd_pytorch.errors module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.image_dataset">msd_pytorch.image_dataset module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.main">msd_pytorch.main module</a></li>
+<li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.msd_block">msd_pytorch.msd_block module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.msd_model">msd_pytorch.msd_model module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.msd_module">msd_pytorch.msd_module module</a></li>
 <li class="toctree-l2"><a class="reference internal" href="msd_pytorch.html#module-msd_pytorch.msd_regression_model">msd_pytorch.msd_regression_model module</a></li>
diff --git a/docs/msd_pytorch.html b/docs/msd_pytorch.html
index e9321fc..f08ac17 100644
--- a/docs/msd_pytorch.html
+++ b/docs/msd_pytorch.html
@@ -92,6 +92,7 @@
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.errors">msd_pytorch.errors module</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.image_dataset">msd_pytorch.image_dataset module</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.main">msd_pytorch.main module</a></li>
+<li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.msd_block">msd_pytorch.msd_block module</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.msd_model">msd_pytorch.msd_model module</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.msd_module">msd_pytorch.msd_module module</a></li>
 <li class="toctree-l3"><a class="reference internal" href="#module-msd_pytorch.msd_regression_model">msd_pytorch.msd_regression_model module</a></li>
@@ -637,17 +638,159 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 
 <dl class="function">
 <dt id="msd_pytorch.main.regression">
-<code class="descclassname">msd_pytorch.main.</code><code class="descname">regression</code><span class="sig-paren">(</span><em>msd</em>, <em>epochs</em>, <em>batch_size</em>, <em>train_input_glob</em>, <em>train_target_glob</em>, <em>val_input_glob</em>, <em>val_target_glob</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#regression"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.regression" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">msd_pytorch.main.</code><code class="descname">regression</code><span class="sig-paren">(</span><em>msd</em>, <em>epochs</em>, <em>batch_size</em>, <em>train_input_glob</em>, <em>train_target_glob</em>, <em>val_input_glob</em>, <em>val_target_glob</em>, <em>weights_path</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#regression"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.regression" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="function">
 <dt id="msd_pytorch.main.segmentation">
-<code class="descclassname">msd_pytorch.main.</code><code class="descname">segmentation</code><span class="sig-paren">(</span><em>msd</em>, <em>epochs</em>, <em>labels</em>, <em>batch_size</em>, <em>train_input_glob</em>, <em>train_target_glob</em>, <em>val_input_glob</em>, <em>val_target_glob</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#segmentation"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.segmentation" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">msd_pytorch.main.</code><code class="descname">segmentation</code><span class="sig-paren">(</span><em>msd</em>, <em>epochs</em>, <em>labels</em>, <em>batch_size</em>, <em>train_input_glob</em>, <em>train_target_glob</em>, <em>val_input_glob</em>, <em>val_target_glob</em>, <em>weights_path</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#segmentation"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.segmentation" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 <dl class="function">
 <dt id="msd_pytorch.main.train">
-<code class="descclassname">msd_pytorch.main.</code><code class="descname">train</code><span class="sig-paren">(</span><em>model</em>, <em>epochs</em>, <em>train_dl</em>, <em>val_dl</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#train"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.train" title="Permalink to this definition">¶</a></dt>
+<code class="descclassname">msd_pytorch.main.</code><code class="descname">train</code><span class="sig-paren">(</span><em>model</em>, <em>epochs</em>, <em>train_dl</em>, <em>val_dl</em>, <em>weights_path</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/main.html#train"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.main.train" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</div>
+<div class="section" id="module-msd_pytorch.msd_block">
+<span id="msd-pytorch-msd-block-module"></span><h2>msd_pytorch.msd_block module<a class="headerlink" href="#module-msd_pytorch.msd_block" title="Permalink to this headline">¶</a></h2>
+<dl class="class">
+<dt id="msd_pytorch.msd_block.MSDBlock2d">
+<em class="property">class </em><code class="descclassname">msd_pytorch.msd_block.</code><code class="descname">MSDBlock2d</code><span class="sig-paren">(</span><em>in_channels</em>, <em>dilations</em>, <em>width=1</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlock2d"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlock2d" title="Permalink to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.modules.module.Module</span></code></p>
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDBlock2d.__init__">
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>in_channels</em>, <em>dilations</em>, <em>width=1</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlock2d.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlock2d.__init__" title="Permalink to this definition">¶</a></dt>
+<dd><p>Multi-scale dense block</p>
+<dl class="docutils">
+<dt>in_channels <span class="classifier-delimiter">:</span> <span class="classifier">int</span></dt>
+<dd>Number of input channels</dd>
+<dt>dilations <span class="classifier-delimiter">:</span> <span class="classifier">tuple of int</span></dt>
+<dd>Dilation for each convolution-block</dd>
+<dt>width <span class="classifier-delimiter">:</span> <span class="classifier">int</span></dt>
+<dd>Number of channels per convolution.</dd>
+</dl>
+<p>The number of output channels is in_channels + depth * width</p>
+</dd></dl>
+
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDBlock2d.forward">
+<code class="descname">forward</code><span class="sig-paren">(</span><em>input</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlock2d.forward"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlock2d.forward" title="Permalink to this definition">¶</a></dt>
+<dd><p>Defines the computation performed at every call.</p>
+<p>Should be overridden by all subclasses.</p>
+<div class="admonition note">
+<p class="first admonition-title">Note</p>
+<p class="last">Although the recipe for forward pass needs to be defined within
+this function, one should call the <code class="xref py py-class docutils literal notranslate"><span class="pre">Module</span></code> instance afterwards
+instead of this since the former takes care of running the
+registered hooks while the latter silently ignores them.</p>
+</div>
+</dd></dl>
+
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDBlock2d.reset_parameters">
+<code class="descname">reset_parameters</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlock2d.reset_parameters"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlock2d.reset_parameters" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="class">
+<dt id="msd_pytorch.msd_block.MSDBlockImpl2d">
+<em class="property">class </em><code class="descclassname">msd_pytorch.msd_block.</code><code class="descname">MSDBlockImpl2d</code><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlockImpl2d"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlockImpl2d" title="Permalink to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">torch.autograd.function.Function</span></code></p>
+<dl class="staticmethod">
+<dt id="msd_pytorch.msd_block.MSDBlockImpl2d.backward">
+<em class="property">static </em><code class="descname">backward</code><span class="sig-paren">(</span><em>ctx</em>, <em>grad_output</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlockImpl2d.backward"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlockImpl2d.backward" title="Permalink to this definition">¶</a></dt>
+<dd><p>Defines a formula for differentiating the operation.</p>
+<p>This function is to be overridden by all subclasses.</p>
+<p>It must accept a context <code class="xref py py-attr docutils literal notranslate"><span class="pre">ctx</span></code> as the first argument, followed by
+as many outputs did <a class="reference internal" href="#msd_pytorch.msd_block.MSDBlockImpl2d.forward" title="msd_pytorch.msd_block.MSDBlockImpl2d.forward"><code class="xref py py-func docutils literal notranslate"><span class="pre">forward()</span></code></a> return, and it should return as many
+tensors, as there were inputs to <a class="reference internal" href="#msd_pytorch.msd_block.MSDBlockImpl2d.forward" title="msd_pytorch.msd_block.MSDBlockImpl2d.forward"><code class="xref py py-func docutils literal notranslate"><span class="pre">forward()</span></code></a>. Each argument is the
+gradient w.r.t the given output, and each returned value should be the
+gradient w.r.t. the corresponding input.</p>
+<p>The context can be used to retrieve tensors saved during the forward
+pass. It also has an attribute <code class="xref py py-attr docutils literal notranslate"><span class="pre">ctx.needs_input_grad</span></code> as a tuple
+of booleans representing whether each input needs gradient. E.g.,
+<a class="reference internal" href="#msd_pytorch.msd_block.MSDBlockImpl2d.backward" title="msd_pytorch.msd_block.MSDBlockImpl2d.backward"><code class="xref py py-func docutils literal notranslate"><span class="pre">backward()</span></code></a> will have <code class="docutils literal notranslate"><span class="pre">ctx.needs_input_grad[0]</span> <span class="pre">=</span> <span class="pre">True</span></code> if the
+first input to <a class="reference internal" href="#msd_pytorch.msd_block.MSDBlockImpl2d.forward" title="msd_pytorch.msd_block.MSDBlockImpl2d.forward"><code class="xref py py-func docutils literal notranslate"><span class="pre">forward()</span></code></a> needs gradient computated w.r.t. the
+output.</p>
+</dd></dl>
+
+<dl class="staticmethod">
+<dt id="msd_pytorch.msd_block.MSDBlockImpl2d.forward">
+<em class="property">static </em><code class="descname">forward</code><span class="sig-paren">(</span><em>ctx</em>, <em>input</em>, <em>dilations</em>, <em>bias</em>, <em>*weights</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDBlockImpl2d.forward"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDBlockImpl2d.forward" title="Permalink to this definition">¶</a></dt>
+<dd><p>Performs the operation.</p>
+<p>This function is to be overridden by all subclasses.</p>
+<p>It must accept a context ctx as the first argument, followed by any
+number of arguments (tensors or other types).</p>
+<p>The context can be used to store tensors that can be then retrieved
+during the backward pass.</p>
+</dd></dl>
+
+</dd></dl>
+
+<dl class="class">
+<dt id="msd_pytorch.msd_block.MSDModule2d">
+<em class="property">class </em><code class="descclassname">msd_pytorch.msd_block.</code><code class="descname">MSDModule2d</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDModule2d"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDModule2d" title="Permalink to this definition">¶</a></dt>
+<dd><p>Bases: <code class="xref py py-class docutils literal notranslate"><span class="pre">torch.nn.modules.module.Module</span></code></p>
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDModule2d.__init__">
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDModule2d.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDModule2d.__init__" title="Permalink to this definition">¶</a></dt>
+<dd><p>Create a 2-dimensional MSD Module</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><ul class="first last simple">
+<li><strong>c_in</strong> – # of input channels</li>
+<li><strong>c_out</strong> – # of output channels</li>
+<li><strong>depth</strong> – # of layers</li>
+<li><strong>width</strong> – # the width of the module</li>
+<li><strong>dilations</strong> – <cite>list(int)</cite></li>
+</ul>
+</td>
+</tr>
+</tbody>
+</table>
+<p>A list of dilations to use. Default is <code class="docutils literal notranslate"><span class="pre">[1,</span> <span class="pre">2,</span> <span class="pre">...,</span> <span class="pre">10]</span></code>.  A
+good alternative is <code class="docutils literal notranslate"><span class="pre">[1,</span> <span class="pre">2,</span> <span class="pre">4,</span> <span class="pre">8]</span></code>. The dilations are
+repeated.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body">an MSD module</td>
+</tr>
+<tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body"><a class="reference internal" href="#msd_pytorch.msd_block.MSDModule2d" title="msd_pytorch.msd_block.MSDModule2d">MSDModule2d</a></td>
+</tr>
+</tbody>
+</table>
+</dd></dl>
+
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDModule2d.forward">
+<code class="descname">forward</code><span class="sig-paren">(</span><em>input</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDModule2d.forward"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDModule2d.forward" title="Permalink to this definition">¶</a></dt>
+<dd><p>Defines the computation performed at every call.</p>
+<p>Should be overridden by all subclasses.</p>
+<div class="admonition note">
+<p class="first admonition-title">Note</p>
+<p class="last">Although the recipe for forward pass needs to be defined within
+this function, one should call the <code class="xref py py-class docutils literal notranslate"><span class="pre">Module</span></code> instance afterwards
+instead of this since the former takes care of running the
+registered hooks while the latter silently ignores them.</p>
+</div>
+</dd></dl>
+
+<dl class="method">
+<dt id="msd_pytorch.msd_block.MSDModule2d.reset_parameters">
+<code class="descname">reset_parameters</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_block.html#MSDModule2d.reset_parameters"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_block.MSDModule2d.reset_parameters" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
+</dd></dl>
+
+<dl class="function">
+<dt id="msd_pytorch.msd_block.msdblock2d">
+<code class="descclassname">msd_pytorch.msd_block.</code><code class="descname">msdblock2d</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="headerlink" href="#msd_pytorch.msd_block.msdblock2d" title="Permalink to this definition">¶</a></dt>
 <dd></dd></dl>
 
 </div>
@@ -1055,6 +1198,11 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 </div>
 </dd></dl>
 
+<dl class="method">
+<dt id="msd_pytorch.msd_module.MSDFinalLayer.reset_parameters">
+<code class="descname">reset_parameters</code><span class="sig-paren">(</span><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_module.html#MSDFinalLayer.reset_parameters"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_module.MSDFinalLayer.reset_parameters" title="Permalink to this definition">¶</a></dt>
+<dd></dd></dl>
+
 </dd></dl>
 
 <dl class="class">
@@ -1248,7 +1396,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 <span id="msd-pytorch-msd-regression-model-module"></span><h2>msd_pytorch.msd_regression_model module<a class="headerlink" href="#module-msd_pytorch.msd_regression_model" title="Permalink to this headline">¶</a></h2>
 <dl class="class">
 <dt id="msd_pytorch.msd_regression_model.MSDRegressionModel">
-<em class="property">class </em><code class="descclassname">msd_pytorch.msd_regression_model.</code><code class="descname">MSDRegressionModel</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], loss='L2'</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_regression_model.html#MSDRegressionModel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_regression_model.MSDRegressionModel" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">msd_pytorch.msd_regression_model.</code><code class="descname">MSDRegressionModel</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], loss='L2', parallel=False</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_regression_model.html#MSDRegressionModel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_regression_model.MSDRegressionModel" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <a class="reference internal" href="#msd_pytorch.msd_model.MSDModel" title="msd_pytorch.msd_model.MSDModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">msd_pytorch.msd_model.MSDModel</span></code></a></p>
 <p>An MSD network for regression.</p>
 <p>This class provides helper methods for using the MSD network
@@ -1258,7 +1406,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 the helper methods and attributes.</p>
 <dl class="method">
 <dt id="msd_pytorch.msd_regression_model.MSDRegressionModel.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], loss='L2'</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_regression_model.html#MSDRegressionModel.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_regression_model.MSDRegressionModel.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>c_in, c_out, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], loss='L2', parallel=False</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_regression_model.html#MSDRegressionModel.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_regression_model.MSDRegressionModel.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>Create a new MSD network for regression.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -1296,6 +1444,17 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 <col class="field-name" />
 <col class="field-body" />
 <tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>parallel</strong> – <cite>bool</cite></td>
+</tr>
+</tbody>
+</table>
+<p>Whether or not to execute the model on multiple GPUs.  Note
+that the batch size must be a multiple of the number of
+available GPUs.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
 <tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body"></td>
 </tr>
 <tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body"></td>
@@ -1311,7 +1470,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 <span id="msd-pytorch-msd-segmentation-model-module"></span><h2>msd_pytorch.msd_segmentation_model module<a class="headerlink" href="#module-msd_pytorch.msd_segmentation_model" title="Permalink to this headline">¶</a></h2>
 <dl class="class">
 <dt id="msd_pytorch.msd_segmentation_model.MSDSegmentationModel">
-<em class="property">class </em><code class="descclassname">msd_pytorch.msd_segmentation_model.</code><code class="descname">MSDSegmentationModel</code><span class="sig-paren">(</span><em>c_in, num_labels, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_segmentation_model.html#MSDSegmentationModel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_segmentation_model.MSDSegmentationModel" title="Permalink to this definition">¶</a></dt>
+<em class="property">class </em><code class="descclassname">msd_pytorch.msd_segmentation_model.</code><code class="descname">MSDSegmentationModel</code><span class="sig-paren">(</span><em>c_in, num_labels, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], parallel=False</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_segmentation_model.html#MSDSegmentationModel"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_segmentation_model.MSDSegmentationModel" title="Permalink to this definition">¶</a></dt>
 <dd><p>Bases: <a class="reference internal" href="#msd_pytorch.msd_model.MSDModel" title="msd_pytorch.msd_model.MSDModel"><code class="xref py py-class docutils literal notranslate"><span class="pre">msd_pytorch.msd_model.MSDModel</span></code></a></p>
 <p>An MSD network for segmentation.</p>
 <p>This class provides helper methods for using the MSD network
@@ -1321,7 +1480,7 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 the helper methods and attributes.</p>
 <dl class="method">
 <dt id="msd_pytorch.msd_segmentation_model.MSDSegmentationModel.__init__">
-<code class="descname">__init__</code><span class="sig-paren">(</span><em>c_in, num_labels, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_segmentation_model.html#MSDSegmentationModel.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_segmentation_model.MSDSegmentationModel.__init__" title="Permalink to this definition">¶</a></dt>
+<code class="descname">__init__</code><span class="sig-paren">(</span><em>c_in, num_labels, depth, width, *, dilations=[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], parallel=False</em><span class="sig-paren">)</span><a class="reference internal" href="_modules/msd_pytorch/msd_segmentation_model.html#MSDSegmentationModel.__init__"><span class="viewcode-link">[source]</span></a><a class="headerlink" href="#msd_pytorch.msd_segmentation_model.MSDSegmentationModel.__init__" title="Permalink to this definition">¶</a></dt>
 <dd><p>Create a new MSD network for segmentation.</p>
 <table class="docutils field-list" frame="void" rules="none">
 <col class="field-name" />
@@ -1345,6 +1504,17 @@ <h2>Submodules<a class="headerlink" href="#submodules" title="Permalink to this
 <col class="field-name" />
 <col class="field-body" />
 <tbody valign="top">
+<tr class="field-odd field"><th class="field-name">Parameters:</th><td class="field-body"><strong>parallel</strong> – <cite>bool</cite></td>
+</tr>
+</tbody>
+</table>
+<p>Whether or not to execute the model on multiple GPUs.  Note
+that the batch size must be a multiple of the number of
+available GPUs.</p>
+<table class="docutils field-list" frame="void" rules="none">
+<col class="field-name" />
+<col class="field-body" />
+<tbody valign="top">
 <tr class="field-odd field"><th class="field-name">Returns:</th><td class="field-body"></td>
 </tr>
 <tr class="field-even field"><th class="field-name">Return type:</th><td class="field-body"></td>
diff --git a/docs/objects.inv b/docs/objects.inv
index bad7ced..ffadd32 100644
Binary files a/docs/objects.inv and b/docs/objects.inv differ
diff --git a/docs/py-modindex.html b/docs/py-modindex.html
index b09d8fb..ca4e8d1 100644
--- a/docs/py-modindex.html
+++ b/docs/py-modindex.html
@@ -193,6 +193,11 @@ <h1>Python Module Index</h1>
        <td>&#160;&#160;&#160;
        <a href="msd_pytorch.html#module-msd_pytorch.main"><code class="xref">msd_pytorch.main</code></a></td><td>
        <em></em></td></tr>
+     <tr class="cg-1">
+       <td></td>
+       <td>&#160;&#160;&#160;
+       <a href="msd_pytorch.html#module-msd_pytorch.msd_block"><code class="xref">msd_pytorch.msd_block</code></a></td><td>
+       <em></em></td></tr>
      <tr class="cg-1">
        <td></td>
        <td>&#160;&#160;&#160;
diff --git a/docs/searchindex.js b/docs/searchindex.js
index 2955e92..c1e2155 100644
--- a/docs/searchindex.js
+++ b/docs/searchindex.js
@@ -1 +1 @@
-Search.setIndex({docnames:["CHANGELOG","LICENSE","README","examples","index","modules","msd_pytorch"],envversion:{"sphinx.domains.c":1,"sphinx.domains.changeset":1,"sphinx.domains.cpp":1,"sphinx.domains.javascript":1,"sphinx.domains.math":2,"sphinx.domains.python":1,"sphinx.domains.rst":1,"sphinx.domains.std":1,"sphinx.ext.todo":1,"sphinx.ext.viewcode":1,sphinx:55},filenames:["CHANGELOG.md","LICENSE.md","README.md","examples.rst","index.rst","modules.rst","msd_pytorch.rst"],objects:{"":{msd_pytorch:[6,0,0,"-"]},"msd_pytorch.bench":{TimeitResult:[6,1,1,""],bench:[6,4,1,""]},"msd_pytorch.bench.TimeitResult":{__init__:[6,2,1,""],average:[6,3,1,""],stdev:[6,3,1,""]},"msd_pytorch.conv":{Conv2dInPlaceFunction:[6,1,1,""],Conv2dInPlaceModule:[6,1,1,""],conv2dInPlace:[6,4,1,""]},"msd_pytorch.conv.Conv2dInPlaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.conv.Conv2dInPlaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.conv_relu":{ConvRelu2dInPlaceFunction:[6,1,1,""],ConvRelu2dInPlaceModule:[6,1,1,""],conv_relu2dInPlace:[6,4,1,""]},"msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.conv_relu.ConvRelu2dInPlaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.errors":{Error:[6,6,1,""],InputError:[6,6,1,""]},"msd_pytorch.errors.InputError":{__init__:[6,2,1,""]},"msd_pytorch.image_dataset":{ImageDataset:[6,1,1,""],ImageStack:[6,1,1,""]},"msd_pytorch.image_dataset.ImageDataset":{__init__:[6,2,1,""],num_labels:[6,3,1,""]},"msd_pytorch.image_dataset.ImageStack":{__init__:[6,2,1,""],find_images:[6,2,1,""],num_labels:[6,3,1,""]},"msd_pytorch.main":{benchmark:[6,4,1,""],experiment_main:[6,4,1,""],main_function:[6,4,1,""],regression:[6,4,1,""],segmentation:[6,4,1,""],train:[6,4,1,""]},"msd_pytorch.msd_model":{MSDModel:[6,1,1,""],scaling_module:[6,4,1,""]},"msd_pytorch.msd_model.MSDModel":{__init__:[6,2,1,""],forward:[6,2,1,""],get_loss:[6,2,1,""],get_output:[6,2,1,""],init_optimizer:[6,2,1,""],learn:[6,2,1,""],load:[6,2,1,""],print:[6,2,1,""],save:[6,2,1,""],set_input:[6,2,1,""],set_normalization:[6,2,1,""],set_target:[6,2,1,""],train:[6,2,1,""],validate:[6,2,1,""]},"msd_pytorch.msd_module":{MSDFinalLayer:[6,1,1,""],MSDLayerModule:[6,1,1,""],MSDModule:[6,1,1,""],init_convolution_weights:[6,4,1,""],stitchLazy:[6,4,1,""],units_in_front:[6,4,1,""]},"msd_pytorch.msd_module.MSDFinalLayer":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.msd_module.MSDLayerModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.msd_module.MSDModule":{__init__:[6,2,1,""],forward:[6,2,1,""],init_buffers:[6,2,1,""]},"msd_pytorch.msd_regression_model":{MSDRegressionModel:[6,1,1,""]},"msd_pytorch.msd_regression_model.MSDRegressionModel":{__init__:[6,2,1,""]},"msd_pytorch.msd_segmentation_model":{MSDSegmentationModel:[6,1,1,""]},"msd_pytorch.msd_segmentation_model.MSDSegmentationModel":{__init__:[6,2,1,""],set_normalization:[6,2,1,""],set_target:[6,2,1,""]},"msd_pytorch.relu_inplace":{ReLUInplaceFunction:[6,1,1,""],ReLUInplaceModule:[6,1,1,""]},"msd_pytorch.relu_inplace.ReLUInplaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.relu_inplace.ReLUInplaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch":{StitchBuffer:[6,1,1,""],StitchCopyFunction:[6,1,1,""],StitchCopyModule:[6,1,1,""],StitchLazyFunction:[6,1,1,""],StitchLazyModule:[6,1,1,""],StitchSlowFunction:[6,1,1,""],stitchCopy:[6,4,1,""],stitchLazy:[6,4,1,""],stitchSlow:[6,4,1,""]},"msd_pytorch.stitch.StitchBuffer":{__init__:[6,2,1,""],like_:[6,2,1,""],zero_:[6,2,1,""]},"msd_pytorch.stitch.StitchCopyFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.stitch.StitchCopyModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch.StitchLazyFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.stitch.StitchLazyModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch.StitchSlowFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},msd_pytorch:{bench:[6,0,0,"-"],conv:[6,0,0,"-"],conv_relu:[6,0,0,"-"],errors:[6,0,0,"-"],image_dataset:[6,0,0,"-"],main:[6,0,0,"-"],msd_model:[6,0,0,"-"],msd_module:[6,0,0,"-"],msd_regression_model:[6,0,0,"-"],msd_segmentation_model:[6,0,0,"-"],relu_inplace:[6,0,0,"-"],stitch:[6,0,0,"-"]}},objnames:{"0":["py","module","Python module"],"1":["py","class","Python class"],"2":["py","method","Python method"],"3":["py","attribute","Python attribute"],"4":["py","function","Python function"],"5":["py","staticmethod","Python static method"],"6":["py","exception","Python exception"]},objtypes:{"0":"py:module","1":"py:class","2":"py:method","3":"py:attribute","4":"py:function","5":"py:staticmethod","6":"py:exception"},terms:{"1x1":6,"boolean":6,"case":6,"class":6,"default":[3,6],"final":[3,6],"float":6,"function":[2,3,6],"import":3,"int":6,"new":6,"public":[1,2],"return":6,"short":3,"static":6,"true":[3,6],"while":6,But:1,FOR:1,For:[1,3,6],Its:6,The:[0,1,2,3,6],These:[3,6],Use:6,__init__:6,aahendriksen:2,about:[2,6],academi:6,accept:6,access:6,accomplish:6,accumul:6,accur:6,achiev:3,add:[1,6],addit:6,adher:0,after:[3,6],afterward:6,again:3,against:2,ahendriksen:2,all:[0,2,6],all_run:6,allard:[1,2],along:1,alreadi:6,also:[1,2,6],altern:[2,6],although:6,alwai:2,anaconda:2,analysi:6,ani:[1,2,6],appli:1,applic:1,argument:[2,6],associ:6,assum:6,attribut:6,author:4,autograd:6,automat:2,avail:2,averag:6,backward:6,base:[0,6],batch:3,batch_siz:[3,6],been:6,befor:6,below:3,bench:5,benchmark:6,best:[3,6],best_validation_error:3,between:3,bia:6,bool:6,both:6,branch:2,brief:2,buffer:6,bxcxhxw:6,c_in:[2,3,6],c_out:[2,3,6],calcul:6,call:6,can:[1,2,3,6],card:2,care:6,cat:[2,6],chang:[0,6],changelog:4,channel:[2,3,6],check:2,clone:2,code:[2,3],collapse_channel:6,collect:6,color:6,com:2,come:6,command:2,compat:2,compil:2,comput:[3,6],concaten:6,consid:1,contact:1,contain:[2,6],content:[4,5],context:6,contribut:4,contributor:4,conv2dinplac:6,conv2dinplacefunct:6,conv2dinplacemodul:6,conv3d:6,conv:5,conv_cuda:6,conv_relu2dinplac:6,conv_relu:5,conv_weight:6,convert:6,convnd:6,convolut:6,convrelu2dinplacefunct:6,convrelu2dinplacemodul:6,copi:[1,6],copyright:1,correct:3,correspond:6,count:6,cours:6,cpp:2,cpu:6,creat:[3,6],ctx:6,cuda:[2,6],cudatoolkit:2,current:6,cxhxw:6,daniel:6,data:[2,3,6],dataload:[3,6],dataset:[3,6],defin:6,dens:[1,3,6],depend:6,depth:[2,3,6],descent:6,describ:[2,6],descript:2,detail:[1,2],dev:2,deviat:[3,6],devic:6,did:6,differenti:6,dilat:[2,3,6],dimens:6,dimension:6,direct:2,directli:6,directori:[2,6],disclaim:1,disk:[3,6],distribut:[1,6],divid:6,document:[0,2,6],doe:[1,6],doi:6,doing:[2,3,6],done:[3,6],dure:6,each:6,easier:2,effici:6,either:[1,2,3,6],electron:1,els:3,employ:1,empti:3,epoch:[2,3,6],error:[3,5],estim:3,even:1,everi:6,exampl:[4,6],except:6,execut:6,expand:[2,6],expandus:[2,6],expect:[2,3],experiment_main:6,explan:6,explicitli:3,factor:6,fals:[3,6],fast:6,featur:2,few:2,file:[0,2,6],filesystem:6,filetyp:6,find_imag:6,first:[1,6],fit:1,float32:6,folder:2,follow:[1,2,3,6],forg:2,format:[0,6],former:6,formula:6,forward:6,foundat:1,free:[1,2],from:[3,6],front:6,futur:6,gener:[1,2],get:[1,3,4,6],get_loss:6,get_output:6,git:2,github:2,give:3,given:6,glob:[2,3,6],gnu:[1,2],goe:6,good:[3,6],gpl:1,grad:6,grad_output:6,gradcheck:6,gradient:6,grai:6,graphic:2,gxx:2,handl:6,has:[3,6],have:[1,2,6],height:6,help:6,helper:6,henc:6,hendriksen:[1,2],hidden:6,high:2,hold:6,home:[2,6],hook:6,hope:1,how:[1,3,4,6],html:1,http:[1,2,6],ignor:6,imag:[2,6],image_dataset:5,imagedataset:[3,6],imageio:6,imagestack:6,img:3,implement:[1,2,6],impli:1,improv:6,in_channel:6,includ:[2,6],incorpor:1,index:[4,6],indic:[3,6],ineffici:6,inf:3,info:6,inform:[1,6],init_buff:6,init_convolution_weight:6,init_optim:6,initi:[0,2,6],input1:6,input2:6,input:[2,3,6],input_path_specifi:6,input_s:6,inputerror:6,instanc:[3,6],instead:[1,6],integ:[3,6],integr:6,intend:3,intermedi:6,introduct:3,invoc:6,issu:2,its:2,jpeg:[2,6],june:1,just_one_imag:[2,6],keep:0,kernel:6,kernel_s:6,l1loss:6,label:[2,3,6],last:6,later:1,latter:6,layer:6,layer_depth:6,lazi:6,learn:[2,6],least:6,left:3,lesser:1,level:[2,6],lgpl:1,librari:1,licens:[1,4],life:2,like_:6,limit:2,line:2,link:1,linux:2,list:[2,3,6],load:[3,6],loop:6,loss:[2,3,6],lost:[3,6],machin:2,magic:6,mai:[1,2,6],mail:1,main:5,main_funct:6,make:[2,6],manag:[2,6],mani:6,master:2,match:[2,6],mean:[3,6],measur:6,mechan:6,merchant:1,messag:6,method:6,mini:3,minibatch:6,mix:[1,3,6],mltestdata:3,model:[3,6],modifi:[1,6],modul:[4,5],more:[1,2,6],moreov:2,msd:[2,3,6],msd_model:5,msd_modul:5,msd_network_epoch_:3,msd_pytorch:[2,3,4],msd_regression_model:5,msd_segmentation_model:5,msdfinallay:6,msdlayermodul:6,msdmodel:6,msdmodul:6,msdregressionmodel:[3,6],msdsegmentationmodel:[3,6],mseloss:6,multipl:6,must:6,naiv:6,name:6,nation:6,nativ:2,natur:6,necessari:1,need:[2,6],needs_input_grad:6,network:[1,3,6],neural:6,new_shap:6,newli:6,noisi:3,none:[3,6],nonetyp:6,normal:[3,6],notabl:0,noth:6,num_epoch:6,num_label:[3,6],number:[2,3,6],numpi:3,nvcc:2,object:6,one:[2,6],onli:6,open:2,oper:6,option:[1,2,6],org:[1,6],other:[2,6],our:2,out:2,out_channel:6,output:[2,3,6],overridden:6,overview:2,packag:[2,3,4,5],page:[3,4],pair:6,paper:1,paragraph:2,paramet:[3,6],part:6,particip:2,particular:1,pass:6,path:[2,6],path_specifi:6,pattern:[2,3,6],pelt:6,per:6,perform:[3,6],permit:1,philosophi:1,pip:2,pixel:6,pleas:[1,2],pna:6,png:[2,3,6],point:[2,6],possibl:[2,6],practic:6,precis:6,prefer:6,previou:6,primari:6,print:[3,6],proceed:6,program:1,programm:1,project:[0,2],properti:6,proprietari:1,provid:6,publish:1,pull:2,purpos:1,python:2,pytorch:[1,3,6],question:2,rais:6,rang:3,read:1,receiv:1,recip:6,recommend:[2,3],redistribut:1,refer:6,regist:6,regress:[2,3,6],releas:0,reload:[3,6],relu_inplac:5,reluinplacefunct:6,reluinplacemodul:6,remark:2,renorm:6,repeat:6,repeatedli:6,repres:6,request:2,resolv:[2,6],respect:6,respons:6,retain:6,retriev:6,reus:6,rough:3,run:6,runtimeerror:6,same:6,save:[3,6],scale:[1,3,6],scaling_modul:6,scan10:6,scan1:6,scan:[2,6],scheme:[2,3],school:1,scienc:6,score:6,search:4,see:[1,2,6],segment:[2,3,6],self:6,semant:0,set:[2,3,6],set_input:6,set_norm:[3,6],set_target:6,sethian:6,setup:2,shape:6,share:6,ship:2,should:[1,2,6],shuffl:3,sign:1,signatur:6,silent:6,similar:6,similarli:2,simpl:3,simpli:2,sinc:6,singl:[2,6],size:[3,6],slow:6,softwar:[1,2],solver:6,some:[2,6],sometim:6,sort:6,sourc:6,sparingli:6,specif:[2,6],specifi:[2,3,6],stabl:6,stack:6,standard:[2,3,6],start:[3,4],std:6,stdev:6,step:[2,3,6],stitch:5,stitchbuff:6,stitchcopi:6,stitchcopyfunct:6,stitchcopymodul:6,stitchlazi:6,stitchlazyfunct:6,stitchlazymodul:6,stitchslow:6,stitchslowfunct:6,store:[3,6],stride:6,string:6,subclass:6,submit:2,submodul:5,subroutin:1,suppli:6,support:6,suppos:6,symlink:[2,6],take:[2,6],taken:6,target:[2,3,6],target_path_specifi:6,task:3,tensor:6,term:1,termin:2,test:6,than:6,thei:[3,6],them:6,therefor:6,thi:[0,1,2,3,6],thread:6,three:6,through:6,tif:[2,3,6],tiff:[3,6],tild:[2,6],time:6,timeit:6,timeitresult:6,timer:6,too:3,toolkit:2,top:6,torch:[3,6],torchvis:2,train:[2,3,6],train_d:3,train_dl:[3,6],train_error:3,train_imag:[2,6],train_input_glob:[2,3,6],train_target_glob:[2,3,6],trainable_net:6,transpar:6,trigger:2,tupl:6,two:6,type:6,under:[1,2],unit:6,units_in_front:6,unreleas:4,updat:[3,6],use:[1,2,3,6],used:[2,3,6],useful:[1,6],using:[2,3,6],util:[3,6],val_d:3,val_dl:[3,6],val_input_glob:[2,3,6],val_target_glob:[2,3,6],valid:[2,3,6],validation_error:3,valu:[3,6],version:[0,1,2],wai:[2,6],want:[1,6],warranti:1,weight:6,welcom:2,were:6,what:1,when:[3,6],where:6,whether:6,which:[2,3,6],who:2,why:1,width:[2,3,6],within:6,without:1,work:[1,2,3],worst:6,worthwil:3,write:6,www:1,x64:2,you:[1,2,3,6],your:[1,2],zero:[3,6],zero_:6},titles:["Changelog","&lt;no title&gt;","Mixed-scale Dense Networks for PyTorch","Examples","Welcome to the documentation of Mixed-scale Dense Networks for PyTorch!","msd_pytorch","msd_pytorch package"],titleterms:{Added:0,Using:2,author:2,bench:6,changelog:0,conda:2,content:6,contribut:2,contributor:2,conv:6,conv_relu:6,dens:[2,4],document:4,error:6,exampl:[2,3],fix:0,from:2,get:2,how:2,image_dataset:6,indic:4,instal:2,licens:2,main:6,mix:[2,4],modul:6,msd_model:6,msd_modul:6,msd_pytorch:[5,6],msd_regression_model:6,msd_segmentation_model:6,network:[2,4],packag:6,pytorch:[2,4],relu_inplac:6,requir:2,run:2,scale:[2,4],sourc:2,start:2,stitch:6,submodul:6,tabl:4,tool:2,unreleas:0,welcom:4}})
\ No newline at end of file
+Search.setIndex({docnames:["CHANGELOG","LICENSE","README","examples","index","modules","msd_pytorch"],envversion:{"sphinx.domains.c":1,"sphinx.domains.changeset":1,"sphinx.domains.cpp":1,"sphinx.domains.javascript":1,"sphinx.domains.math":2,"sphinx.domains.python":1,"sphinx.domains.rst":1,"sphinx.domains.std":1,"sphinx.ext.todo":1,"sphinx.ext.viewcode":1,sphinx:55},filenames:["CHANGELOG.md","LICENSE.md","README.md","examples.rst","index.rst","modules.rst","msd_pytorch.rst"],objects:{"":{msd_pytorch:[6,0,0,"-"]},"msd_pytorch.bench":{TimeitResult:[6,1,1,""],bench:[6,4,1,""]},"msd_pytorch.bench.TimeitResult":{__init__:[6,2,1,""],average:[6,3,1,""],stdev:[6,3,1,""]},"msd_pytorch.conv":{Conv2dInPlaceFunction:[6,1,1,""],Conv2dInPlaceModule:[6,1,1,""],conv2dInPlace:[6,4,1,""]},"msd_pytorch.conv.Conv2dInPlaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.conv.Conv2dInPlaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.conv_relu":{ConvRelu2dInPlaceFunction:[6,1,1,""],ConvRelu2dInPlaceModule:[6,1,1,""],conv_relu2dInPlace:[6,4,1,""]},"msd_pytorch.conv_relu.ConvRelu2dInPlaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.conv_relu.ConvRelu2dInPlaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.errors":{Error:[6,6,1,""],InputError:[6,6,1,""]},"msd_pytorch.errors.InputError":{__init__:[6,2,1,""]},"msd_pytorch.image_dataset":{ImageDataset:[6,1,1,""],ImageStack:[6,1,1,""]},"msd_pytorch.image_dataset.ImageDataset":{__init__:[6,2,1,""],num_labels:[6,3,1,""]},"msd_pytorch.image_dataset.ImageStack":{__init__:[6,2,1,""],find_images:[6,2,1,""],num_labels:[6,3,1,""]},"msd_pytorch.main":{benchmark:[6,4,1,""],experiment_main:[6,4,1,""],main_function:[6,4,1,""],regression:[6,4,1,""],segmentation:[6,4,1,""],train:[6,4,1,""]},"msd_pytorch.msd_block":{MSDBlock2d:[6,1,1,""],MSDBlockImpl2d:[6,1,1,""],MSDModule2d:[6,1,1,""],msdblock2d:[6,4,1,""]},"msd_pytorch.msd_block.MSDBlock2d":{__init__:[6,2,1,""],forward:[6,2,1,""],reset_parameters:[6,2,1,""]},"msd_pytorch.msd_block.MSDBlockImpl2d":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.msd_block.MSDModule2d":{__init__:[6,2,1,""],forward:[6,2,1,""],reset_parameters:[6,2,1,""]},"msd_pytorch.msd_model":{MSDModel:[6,1,1,""],scaling_module:[6,4,1,""]},"msd_pytorch.msd_model.MSDModel":{__init__:[6,2,1,""],forward:[6,2,1,""],get_loss:[6,2,1,""],get_output:[6,2,1,""],init_optimizer:[6,2,1,""],learn:[6,2,1,""],load:[6,2,1,""],print:[6,2,1,""],save:[6,2,1,""],set_input:[6,2,1,""],set_normalization:[6,2,1,""],set_target:[6,2,1,""],train:[6,2,1,""],validate:[6,2,1,""]},"msd_pytorch.msd_module":{MSDFinalLayer:[6,1,1,""],MSDLayerModule:[6,1,1,""],MSDModule:[6,1,1,""],init_convolution_weights:[6,4,1,""],stitchLazy:[6,4,1,""],units_in_front:[6,4,1,""]},"msd_pytorch.msd_module.MSDFinalLayer":{__init__:[6,2,1,""],forward:[6,2,1,""],reset_parameters:[6,2,1,""]},"msd_pytorch.msd_module.MSDLayerModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.msd_module.MSDModule":{__init__:[6,2,1,""],forward:[6,2,1,""],init_buffers:[6,2,1,""]},"msd_pytorch.msd_regression_model":{MSDRegressionModel:[6,1,1,""]},"msd_pytorch.msd_regression_model.MSDRegressionModel":{__init__:[6,2,1,""]},"msd_pytorch.msd_segmentation_model":{MSDSegmentationModel:[6,1,1,""]},"msd_pytorch.msd_segmentation_model.MSDSegmentationModel":{__init__:[6,2,1,""],set_normalization:[6,2,1,""],set_target:[6,2,1,""]},"msd_pytorch.relu_inplace":{ReLUInplaceFunction:[6,1,1,""],ReLUInplaceModule:[6,1,1,""]},"msd_pytorch.relu_inplace.ReLUInplaceFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.relu_inplace.ReLUInplaceModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch":{StitchBuffer:[6,1,1,""],StitchCopyFunction:[6,1,1,""],StitchCopyModule:[6,1,1,""],StitchLazyFunction:[6,1,1,""],StitchLazyModule:[6,1,1,""],StitchSlowFunction:[6,1,1,""],stitchCopy:[6,4,1,""],stitchLazy:[6,4,1,""],stitchSlow:[6,4,1,""]},"msd_pytorch.stitch.StitchBuffer":{__init__:[6,2,1,""],like_:[6,2,1,""],zero_:[6,2,1,""]},"msd_pytorch.stitch.StitchCopyFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.stitch.StitchCopyModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch.StitchLazyFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},"msd_pytorch.stitch.StitchLazyModule":{__init__:[6,2,1,""],forward:[6,2,1,""]},"msd_pytorch.stitch.StitchSlowFunction":{backward:[6,5,1,""],forward:[6,5,1,""]},msd_pytorch:{bench:[6,0,0,"-"],conv:[6,0,0,"-"],conv_relu:[6,0,0,"-"],errors:[6,0,0,"-"],image_dataset:[6,0,0,"-"],main:[6,0,0,"-"],msd_block:[6,0,0,"-"],msd_model:[6,0,0,"-"],msd_module:[6,0,0,"-"],msd_regression_model:[6,0,0,"-"],msd_segmentation_model:[6,0,0,"-"],relu_inplace:[6,0,0,"-"],stitch:[6,0,0,"-"]}},objnames:{"0":["py","module","Python module"],"1":["py","class","Python class"],"2":["py","method","Python method"],"3":["py","attribute","Python attribute"],"4":["py","function","Python function"],"5":["py","staticmethod","Python static method"],"6":["py","exception","Python exception"]},objtypes:{"0":"py:module","1":"py:class","2":"py:method","3":"py:attribute","4":"py:function","5":"py:staticmethod","6":"py:exception"},terms:{"1x1":6,"boolean":6,"case":6,"class":6,"default":[0,3,6],"final":[0,3,6],"float":6,"function":[2,3,6],"import":3,"int":6,"new":6,"public":[1,2],"return":6,"short":3,"static":6,"true":[0,3,6],"while":6,But:1,FOR:1,For:[1,3,6],Its:6,The:[0,1,2,3,6],These:[3,6],Use:[0,6],__init__:6,aahendriksen:2,about:[2,6],academi:6,accept:6,access:6,accomplish:6,accumul:6,accur:6,achiev:3,add:[0,1,6],addit:6,adher:0,adler:[0,2],after:[3,6],afterward:6,again:3,against:2,ahendriksen:2,all:[0,2,6],all_run:6,allard:[1,2],along:1,alreadi:6,also:[1,2,6],altern:[2,6],although:6,alwai:2,anaconda:2,analysi:6,ani:[1,2,6],appli:1,applic:1,argument:[0,2,6],associ:6,assum:6,attribut:6,author:4,autograd:6,automat:2,avail:[2,6],averag:6,backward:6,base:[0,6],batch:[3,6],batch_siz:[3,6],been:6,befor:6,below:3,bench:5,benchmark:6,best:[3,6],best_validation_error:3,between:3,bia:6,block:6,bool:6,both:6,branch:2,brief:2,buffer:6,bxcxhxw:6,c_in:[2,3,6],c_out:[2,3,6],calcul:6,call:6,can:[1,2,3,6],card:2,care:6,cat:[2,6],chang:6,changelog:4,channel:[2,3,6],check:2,clone:2,code:[0,2,3],collapse_channel:6,collect:6,color:6,com:2,come:6,command:[0,2],compat:2,compil:2,compon:0,comput:[3,6],concaten:6,consid:1,construct:0,contact:1,contain:[2,6],content:[4,5],context:6,contribut:4,contributor:4,conv2dinplac:6,conv2dinplacefunct:6,conv2dinplacemodul:6,conv3d:6,conv:5,conv_cuda:6,conv_relu2dinplac:6,conv_relu:5,conv_weight:6,convert:6,convnd:6,convolut:6,convrelu2dinplacefunct:6,convrelu2dinplacemodul:6,copi:[1,6],copyright:1,correct:3,correspond:6,count:6,cours:6,cpp:2,cpu:6,creat:[3,6],ctx:6,cuda:[2,6],cudatoolkit:2,current:6,cxhxw:6,daniel:6,data:[2,3,6],dataload:[3,6],dataset:[3,6],defin:6,dens:[1,3,6],depend:6,depth:[2,3,6],descent:6,describ:[2,6],descript:2,detail:[1,2],dev:2,deviat:[3,6],devic:6,did:6,differenti:6,dilat:[2,3,6],dimens:6,dimension:6,direct:2,directli:6,directori:[2,6],disclaim:1,discuss:2,disk:[3,6],distribut:[1,6],divid:6,document:[0,2,6],doe:[1,6],doi:6,doing:[2,3,6],done:[3,6],dure:6,each:6,easier:2,effici:[0,6],either:[1,2,3,6],electron:1,els:3,employ:1,empti:3,epoch:[2,3,6],error:[3,5],estim:3,even:1,everi:6,exampl:[4,6],except:6,execut:[0,6],expand:[2,6],expandus:[2,6],expect:[2,3],experiment_main:6,explan:6,explicitli:3,factor:6,fals:[3,6],fast:6,faster:0,featur:2,few:2,file:[0,2,6],filesystem:6,filetyp:6,find_imag:6,first:[1,6],fit:1,float32:6,folder:2,follow:[1,2,3,6],forg:2,format:[0,6],former:6,formula:6,forward:[0,6],foundat:1,free:[1,2],from:[3,6],front:6,futur:6,gener:[1,2],get:[1,3,4,6],get_loss:6,get_output:6,git:2,github:2,give:3,given:6,glob:[2,3,6],gnu:[1,2],goe:6,good:[3,6],gpl:1,gpu:[0,6],grad:6,grad_output:6,gradcheck:6,gradient:6,grai:6,graphic:2,gxx:2,handl:6,has:[3,6],have:[1,2,6],height:6,help:6,helper:6,henc:6,hendriksen:[1,2],hidden:6,high:2,hold:6,home:[2,6],hook:6,hope:1,how:[1,3,4,6],html:1,http:[1,2,6],ignor:6,imag:[2,6],image_dataset:5,imagedataset:[3,6],imageio:6,imagestack:6,img:3,implement:[0,1,2,6],impli:1,improv:6,in_channel:6,includ:[2,6],incorpor:1,index:[4,6],indic:[0,3,6],ineffici:6,inf:3,info:6,inform:[1,6],init_buff:6,init_convolution_weight:6,init_optim:6,initi:[0,2,6],input1:6,input2:6,input:[2,3,6],input_path_specifi:6,input_s:6,inputerror:6,instanc:[3,6],instead:[1,6],integ:[3,6],integr:6,intend:3,intermedi:6,introduct:3,invoc:6,issu:2,its:2,jona:[0,2],jpeg:[2,6],june:1,just_one_imag:[2,6],keep:0,kernel:6,kernel_s:6,l1loss:6,label:[2,3,6],last:6,later:1,latter:6,layer:6,layer_depth:6,lazi:6,learn:[2,6],least:6,left:3,lesser:1,level:[2,6],lgpl:1,librari:1,licens:[1,4],life:2,like_:6,limit:2,line:[0,2],link:1,linux:2,list:[2,3,6],load:[3,6],loop:6,loss:[2,3,6],lost:[3,6],machin:2,magic:6,mai:[1,2,6],mail:1,main:5,main_funct:6,make:[0,2,6],manag:[2,6],mani:[0,6],master:2,match:[2,6],mean:[3,6],measur:6,mechan:6,memori:0,merchant:1,messag:6,method:6,mini:3,minibatch:6,mix:[1,3,6],mltestdata:3,model:[0,3,6],modifi:[1,6],modul:[4,5],more:[0,1,2,6],moreov:2,msd:[0,2,3,6],msd_block:5,msd_model:5,msd_modul:5,msd_network_epoch_:3,msd_pytorch:[2,3,4],msd_regression_model:5,msd_segmentation_model:5,msdblock2d:[0,6],msdblockimpl2d:6,msdfinallay:6,msdlayermodul:6,msdmodel:6,msdmodul:6,msdmodule2d:6,msdregressionmodel:[0,3,6],msdsegmentationmodel:[0,3,6],mseloss:6,multi:[0,6],multipl:6,must:6,naiv:6,name:6,nation:6,nativ:2,natur:6,necessari:1,need:[2,6],needs_input_grad:6,network:[1,3,6],neural:6,new_shap:6,newli:6,noisi:3,none:[3,6],nonetyp:6,normal:[3,6],notabl:0,note:6,noth:6,now:0,num_epoch:6,num_label:[3,6],number:[2,3,6],numpi:3,nvcc:2,object:6,one:[2,6],onli:6,open:2,oper:6,option:[1,2,6],org:[1,6],other:[2,6],our:2,out:2,out_channel:6,output:[2,3,6],overridden:6,overview:2,packag:[2,3,4,5],page:[3,4],pair:6,paper:1,paragraph:2,parallel:[0,6],paramet:[3,6],part:6,particip:2,particular:1,pass:6,path:[2,6],path_specifi:6,pattern:[2,3,6],pelt:6,per:6,perform:[3,6],permit:1,philosophi:1,pip:2,pixel:6,pleas:[1,2],pna:6,png:[2,3,6],point:[2,6],possibl:[2,6],practic:6,precis:6,prefer:6,previou:6,primari:6,print:[3,6],proceed:6,program:1,programm:1,project:[0,2],properti:6,proprietari:1,provid:6,publish:1,pull:2,purpos:1,python:2,pytorch:[1,3,6],question:2,rais:6,rang:3,read:1,receiv:1,recip:6,recommend:[2,3],redistribut:1,refer:6,regist:6,regress:[2,3,6],releas:0,reload:[3,6],relu_inplac:5,reluinplacefunct:6,reluinplacemodul:6,remark:2,renorm:6,repeat:6,repeatedli:6,repres:6,request:2,reset_paramet:6,resolv:[2,6],respect:6,respons:6,retain:6,retriev:6,reus:6,rough:3,run:6,runtimeerror:6,same:[0,6],save:[3,6],scale:[1,3,6],scaling_modul:6,scan10:6,scan1:6,scan:[2,6],scheme:[2,3],school:1,scienc:6,score:6,search:4,see:[1,2,6],segment:[2,3,6],self:6,semant:0,set:[2,3,6],set_input:6,set_norm:[3,6],set_target:6,sethian:6,setup:2,shape:6,share:6,ship:2,should:[1,2,6],shuffl:3,sign:1,signatur:6,silent:6,similar:6,similarli:2,simpl:3,simpli:2,sinc:6,singl:[2,6],size:[3,6],slightli:0,slow:6,softwar:[1,2],solver:6,some:[2,6],sometim:6,sort:6,sourc:6,sparingli:6,specif:[2,6],specifi:[2,3,6],stabl:6,stack:6,standard:[2,3,6],start:[3,4],std:6,stdev:6,step:[2,3,6],stitch:5,stitchbuff:6,stitchcopi:6,stitchcopyfunct:6,stitchcopymodul:6,stitchlazi:6,stitchlazyfunct:6,stitchlazymodul:6,stitchslow:6,stitchslowfunct:6,store:[0,3,6],stride:6,string:6,structur:0,subclass:6,submit:2,submodul:5,subroutin:1,suggest:0,suppli:6,support:[0,6],suppos:6,symlink:[2,6],take:[2,6],taken:6,target:[2,3,6],target_path_specifi:6,task:3,tensor:6,term:1,termin:2,test:6,than:6,thank:0,thei:[3,6],them:6,therefor:6,thi:[0,1,2,3,6],thread:6,three:6,through:6,tif:[2,3,6],tiff:[3,6],tild:[2,6],time:6,timeit:6,timeitresult:6,timer:6,too:3,toolkit:2,top:6,torch:[3,6],torchvis:2,train:[2,3,6],train_d:3,train_dl:[3,6],train_error:3,train_imag:[2,6],train_input_glob:[2,3,6],train_target_glob:[2,3,6],trainable_net:6,transpar:6,trigger:2,tupl:6,two:6,type:6,under:[1,2],unit:6,units_in_front:6,unreleas:4,updat:[3,6],use:[0,1,2,3,6],used:[2,3,6],useful:[1,6],using:[2,3,6],util:[3,6],val_d:3,val_dl:[3,6],val_input_glob:[2,3,6],val_target_glob:[2,3,6],valid:[2,3,6],validation_error:3,valu:[3,6],version:[0,1,2],wai:[0,2,6],want:[1,6],warranti:1,weight:[0,6],weights_path:[0,6],welcom:2,were:6,what:1,when:[0,3,6],where:[0,6],whether:6,which:[2,3,6],who:2,why:1,width:[2,3,6],within:6,without:1,work:[1,2,3],worst:6,worthwil:3,write:6,www:1,x64:2,you:[1,2,3,6],your:[1,2],zero:[3,6],zero_:6},titles:["Changelog","&lt;no title&gt;","Mixed-scale Dense Networks for PyTorch","Examples","Welcome to the documentation of Mixed-scale Dense Networks for PyTorch!","msd_pytorch","msd_pytorch package"],titleterms:{Added:0,Using:2,author:2,bench:6,chang:0,changelog:0,conda:2,content:6,contribut:2,contributor:2,conv:6,conv_relu:6,dens:[2,4],document:4,error:6,exampl:[2,3],fix:0,from:2,get:2,how:2,image_dataset:6,indic:4,instal:2,licens:2,main:6,mix:[2,4],modul:6,msd_block:6,msd_model:6,msd_modul:6,msd_pytorch:[5,6],msd_regression_model:6,msd_segmentation_model:6,network:[2,4],packag:6,pytorch:[2,4],relu_inplac:6,remov:0,requir:2,run:2,scale:[2,4],sourc:2,start:2,stitch:6,submodul:6,tabl:4,tool:2,unreleas:0,welcom:4}})
\ No newline at end of file