From 7dab6db049b4aae03ab7236bbf603c19ddf45b9d Mon Sep 17 00:00:00 2001
From: joaquinvanschoren <joaquin.vanschoren@gmail.com>
Date: Mon, 5 Feb 2024 12:17:43 +0100
Subject: [PATCH] Update documentation

---
 .DS_Store                                     |  Bin 0 -> 6148 bytes
 _sources/labs/Lab 2 - Tutorial.ipynb          |    4 +-
 genindex.html                                 |    1 +
 intro.html                                    |    1 +
 labs/.DS_Store                                |  Bin 0 -> 6148 bytes
 ...Linear Models for Regression Solution.html | 1116 --------------
 ...ar Models for Classification Solution.html | 1079 -------------
 labs/Lab 2 - Tutorial.html                    |   31 +-
 labs/Lab 2a - Kernelization Solution.html     | 1026 -------------
 labs/Lab 2b - Model Selection Solution.html   |  953 ------------
 labs/Lab 3 - Ensembles Solution.html          | 1027 -------------
 labs/Lab 3b - Ensembles Solution.html         | 1146 --------------
 labs/Lab 4 - Pipelines Solution.html          |  978 ------------
 labs/Lab 5 - Bayesian learning Solution.html  |  848 -----------
 labs/Lab 6 - Neural Networks Solution.html    |  900 -----------
 ...onvolutional Neural Networks Solution.html | 1272 ----------------
 ...b - Neural Networks for text Solution.html | 1332 -----------------
 objects.inv                                   |  Bin 1467 -> 1467 bytes
 search.html                                   |    1 +
 searchindex.js                                |    2 +-
 studies/S9 Multi-fidelity optimization.html   |    1 +
 21 files changed, 33 insertions(+), 11685 deletions(-)
 create mode 100644 .DS_Store
 create mode 100644 labs/.DS_Store
 delete mode 100644 labs/Lab 1a - Linear Models for Regression Solution.html
 delete mode 100644 labs/Lab 1b - Linear Models for Classification Solution.html
 delete mode 100644 labs/Lab 2a - Kernelization Solution.html
 delete mode 100644 labs/Lab 2b - Model Selection Solution.html
 delete mode 100644 labs/Lab 3 - Ensembles Solution.html
 delete mode 100644 labs/Lab 3b - Ensembles Solution.html
 delete mode 100644 labs/Lab 4 - Pipelines Solution.html
 delete mode 100644 labs/Lab 5 - Bayesian learning Solution.html
 delete mode 100644 labs/Lab 6 - Neural Networks Solution.html
 delete mode 100644 labs/Lab 7a - Convolutional Neural Networks Solution.html
 delete mode 100644 labs/Lab 7b - Neural Networks for text Solution.html
diff --git a/.DS_Store b/.DS_Store
new file mode 100644
index 0000000000000000000000000000000000000000..616bbdc39ebb8c79d797e4153c95b00a51a126b5
GIT binary patch
literal 6148
zcmeH~F^<AO3`M_}6iC~oq?~3Cus0YXIKf^30%ar$wEY}?zddfqQlkicOZFRkVkP-S
zCI(>p-|IIp0@%`>`0}tYV?JQU858c;`(>VPx7mxdj}CZBAF<faZ9xi10VyB_q<|Dy
zkpg*)Z$DS`OnMY4AO+T;fPWtf-C2{ZGd>**F#?bS%VAu{EI}48kTuylS)o}@50<SK
zV~E$Ioh*4>O}5V74$I-g^3LW{49$8wtT3Tj4Jb$fDX>sr)AP~K|0Dg`{J&^XDg~s#
zn<-$!;pedDOXb=6@AbTX%Brs$os7#F9)1Ft_))y0hjG97f~?8b$qG$B0wIHf6nLou
EfBT>krvLx|

literal 0
HcmV?d00001

diff --git a/_sources/labs/Lab 2 - Tutorial.ipynb b/_sources/labs/Lab 2 - Tutorial.ipynb
index de9f87bae..d21c618f0 100644
--- a/_sources/labs/Lab 2 - Tutorial.ipynb	
+++ b/_sources/labs/Lab 2 - Tutorial.ipynb	
@@ -8,7 +8,7 @@
     }
    },
    "source": [
-    "# Lab 3 Tutorial: Model Selection in scikit-learn"
+    "# Lab 2 Tutorial: Model Selection in scikit-learn"
    ]
   },
   {
@@ -1007,7 +1007,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.9.7"
+   "version": "3.10.10"
   }
  },
  "nbformat": 4,
diff --git a/genindex.html b/genindex.html
index a5787d2ec..a036e0eca 100644
--- a/genindex.html
+++ b/genindex.html
@@ -200,6 +200,7 @@
 
 
 
+<li class="toctree-l1"><a class="reference internal" href="labs/Lab%202%20-%20Tutorial.html">Lab 2 Tutorial: Model Selection in scikit-learn</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
diff --git a/intro.html b/intro.html
index 8f6e4485e..20efe4187 100644
--- a/intro.html
+++ b/intro.html
@@ -202,6 +202,7 @@
 
 
 
+<li class="toctree-l1"><a class="reference internal" href="labs/Lab%202%20-%20Tutorial.html">Lab 2 Tutorial: Model Selection in scikit-learn</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
diff --git a/labs/.DS_Store b/labs/.DS_Store
new file mode 100644
index 0000000000000000000000000000000000000000..5008ddfcf53c02e82d7eee2e57c38e5672ef89f6
GIT binary patch
literal 6148
zcmeH~Jr2S!425mzP>H1@V-^m;4Wg<&0T*E43hX&L&p$$qDprKhvt+--jT7}7np#A3
zem<@ulZcFPQ@L2!n>{z**<q8>++&mCkOWA81W14cNZ<zv;LbK1Poaz?KmsK2CSc!(
z0ynLxE!0092;Krf2c+FF_Fe*7ECH>lEfg7;MkzE(HCqgga^y>{tEnwC%0;vJ&^%eQ
zLs35+`xjp>T0<F0fCPF1$Cyrb|F7^5{eNG?83~ZUUlGt@xh*qZDeu<Z%US-OSsOPv
j)R!Z4KLME7ReXlK;d!wEw5GODWMKRea10D2@KpjYNUI8I

literal 0
HcmV?d00001

diff --git a/labs/Lab 1a - Linear Models for Regression Solution.html b/labs/Lab 1a - Linear Models for Regression Solution.html
deleted file mode 100644
index 4411df971..000000000
--- a/labs/Lab 1a - Linear Models for Regression Solution.html	
+++ /dev/null
@@ -1,1116 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 1: Linear models &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>window.MathJax = {"options": {"processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 1a - Linear Models for Regression Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 1a - Linear Models for Regression Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 1a - Linear Models for Regression Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 1a - Linear Models for Regression Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 1: Linear models</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#part-1-regression">Part 1: Regression</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quick-visualization">Quick visualization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-model-benchmark">Exercise 1: Model benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1">Exercise 1.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-2">Exercise 1.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-3">Exercise 1.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-regularization">Exercise 2: Regularization</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-3">Exercise 2.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-visualizing-coefficients">Exercise 3: Visualizing coefficients</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id7">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-1-linear-models">
-<h1>Lab 1: Linear models<a class="headerlink" href="#lab-1-linear-models" title="Permalink to this heading">#</a></h1>
-<section id="part-1-regression">
-<h2>Part 1: Regression<a class="headerlink" href="#part-1-regression" title="Permalink to this heading">#</a></h2>
-<p>The <a class="reference external" href="https://www.openml.org/d/547">NO2 dataset</a> contains 500 measurement of pollution caused by cars. The goal is to predict the concentration of <span class="math notranslate nohighlight">\(NO_2\)</span> from data about traffic and atmospheric conditions. The predictive variables include the number of cars per hour, temperature, wind, and time of day.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Auto-setup when running on Google Colab</span>
-<span class="k">if</span> <span class="s1">&#39;google.colab&#39;</span> <span class="ow">in</span> <span class="nb">str</span><span class="p">(</span><span class="n">get_ipython</span><span class="p">()):</span>
-    <span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>openml
-
-<span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">from</span> <span class="nn">matplotlib</span> <span class="kn">import</span> <span class="n">cm</span>
-<span class="kn">import</span> <span class="nn">sys</span>
-<span class="kn">import</span> <span class="nn">os</span>
-
-<span class="c1"># Hide convergence warning for now</span>
-<span class="kn">import</span> <span class="nn">warnings</span>
-<span class="kn">from</span> <span class="nn">sklearn.exceptions</span> <span class="kn">import</span> <span class="n">ConvergenceWarning</span>
-<span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="n">ConvergenceWarning</span><span class="p">)</span>
-
-<span class="c1"># Hiding all warnings. Not recommended, just for compilation.</span>
-<span class="k">if</span> <span class="ow">not</span> <span class="n">sys</span><span class="o">.</span><span class="n">warnoptions</span><span class="p">:</span>
-    <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">)</span>
-    <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;PYTHONWARNINGS&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;ignore&quot;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download NO2 data. Takes a while the first time.</span>
-<span class="n">no2</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">547</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">no2</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">no2</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">);</span> 
-<span class="n">attribute_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="quick-visualization">
-<h2>Quick visualization<a class="headerlink" href="#quick-visualization" title="Permalink to this heading">#</a></h2>
-<p>We can use pandas to quickly visualize the data. If you are new to pandas, take some time to understand the code.</p>
-<p>We’ll remove the ‘day’ feature to focus on the non-temporal aspects of this interaction. We are not aiming to predict future levels, and even if we would it would require special treatment (e.g. different train-test splits). There also doesn’t seem to be a long term trend in the data, even though there are clear periodic trends in temperature.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="n">attribute_names</span><span class="p">)</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">y</span><span class="p">),</span><span class="n">columns</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;target&#39;</span><span class="p">]))</span>
-<span class="n">df</span> <span class="o">=</span> <span class="n">df</span><span class="o">.</span><span class="n">sort_values</span><span class="p">([</span><span class="s1">&#39;day&#39;</span><span class="p">,</span><span class="s1">&#39;hour_of_day&#39;</span><span class="p">])</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="s1">&#39;day&#39;</span><span class="p">,</span><span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">df</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">use_index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span><span class="mi">5</span><span class="p">),</span><span class="n">cmap</span><span class="o">=</span><span class="n">cm</span><span class="o">.</span><span class="n">get_cmap</span><span class="p">(</span><span class="s1">&#39;brg&#39;</span><span class="p">));</span>
-<span class="n">X</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="s1">&#39;day&#39;</span><span class="p">,</span><span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/8c48c118634ac5f737e78ecd36a28e0be31c516ed9ea21f14506af16d942d418.png" src="../_images/8c48c118634ac5f737e78ecd36a28e0be31c516ed9ea21f14506af16d942d418.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">df</span><span class="o">.</span><span class="n">head</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_html"><div>
-<style scoped>
-    .dataframe tbody tr th:only-of-type {
-        vertical-align: middle;
-    }
-
-    .dataframe tbody tr th {
-        vertical-align: top;
-    }
-
-    .dataframe thead th {
-        text-align: right;
-    }
-</style>
-<table border="1" class="dataframe">
-  <thead>
-    <tr style="text-align: right;">
-      <th></th>
-      <th>cars_per_hour</th>
-      <th>temperature_at_2m</th>
-      <th>wind_speed</th>
-      <th>temperature_diff_2m_25m</th>
-      <th>wind_direction</th>
-      <th>hour_of_day</th>
-      <th>target</th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <th>42</th>
-      <td>7.64300</td>
-      <td>8.5</td>
-      <td>4.3</td>
-      <td>-0.2</td>
-      <td>322.0</td>
-      <td>13</td>
-      <td>3.22287</td>
-    </tr>
-    <tr>
-      <th>20</th>
-      <td>7.75061</td>
-      <td>8.2</td>
-      <td>4.5</td>
-      <td>0.2</td>
-      <td>307.0</td>
-      <td>14</td>
-      <td>3.15274</td>
-    </tr>
-    <tr>
-      <th>255</th>
-      <td>8.12415</td>
-      <td>5.2</td>
-      <td>2.8</td>
-      <td>0.3</td>
-      <td>209.0</td>
-      <td>8</td>
-      <td>4.19570</td>
-    </tr>
-    <tr>
-      <th>488</th>
-      <td>7.64108</td>
-      <td>6.7</td>
-      <td>2.3</td>
-      <td>-0.4</td>
-      <td>247.0</td>
-      <td>10</td>
-      <td>3.98155</td>
-    </tr>
-    <tr>
-      <th>94</th>
-      <td>8.31630</td>
-      <td>6.3</td>
-      <td>1.2</td>
-      <td>1.3</td>
-      <td>265.0</td>
-      <td>17</td>
-      <td>4.14155</td>
-    </tr>
-  </tbody>
-</table>
-</div></div></div>
-</div>
-<p>If we plot the data, ordered by time of measurement, we can see that the wind direction (measured in angular degrees) is scaled very differently from the other features. Let’s now zoom in to the other measures:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">df</span><span class="o">.</span><span class="n">drop</span><span class="p">(</span><span class="s1">&#39;wind_direction&#39;</span><span class="p">,</span><span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">use_index</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span><span class="mi">5</span><span class="p">),</span><span class="n">cmap</span><span class="o">=</span><span class="n">cm</span><span class="o">.</span><span class="n">get_cmap</span><span class="p">(</span><span class="s1">&#39;brg&#39;</span><span class="p">));</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/0809975f925ab0f01c8b205b50e714a69994daee598e8a8e96677dc46a06ca01.png" src="../_images/0809975f925ab0f01c8b205b50e714a69994daee598e8a8e96677dc46a06ca01.png" />
-</div>
-</div>
-<p>We can see that the target (<span class="math notranslate nohighlight">\(NO_2\)</span> levels) seem to be correlated to the number of cars per hour, which makes sense because cars produce <span class="math notranslate nohighlight">\(NO_2\)</span>. Other influences (air temperature differences and wind) seem to have a more complex and subtle effect. Let’s try to model these using linear regression models.</p>
-</section>
-<section id="exercise-1-model-benchmark">
-<h2>Exercise 1: Model benchmark<a class="headerlink" href="#exercise-1-model-benchmark" title="Permalink to this heading">#</a></h2>
-<p>It is clear that <span class="math notranslate nohighlight">\(NO_2\)</span> concentrations depend on a combination of these features, so we will now try to learn this complex relationship. We first evaluate a range of linear regression problems, i.e. Linear Regression, Ridge, Lasso and ElasticNet, as well as kNN. Since we observed that somf features have very different scales, we’ll also build pipelines of all these measures with an additional scaling step. For now, we’ll stick to the default hyperparameter settings.</p>
-<section id="exercise-1-1">
-<h3>Exercise 1.1<a class="headerlink" href="#exercise-1-1" title="Permalink to this heading">#</a></h3>
-<p>Implement a function below which evaluates each classifier passed into it on the given data, and then returns both the train and test scores of each as a list. You are allowed to import additional functions from whichever module you like, but you should be able to complete the function with <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html"><code class="docutils literal notranslate"><span class="pre">cross_validate</span></code></a> function and standard Python built-ins. Below you the function you will find example output.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">evaluate_learners</span><span class="p">(</span><span class="n">models</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;     </span>
-<span class="sd">    Given a list of models [model1, model2, ..., modelN] return two lists:</span>
-<span class="sd">     - a list with the scores obtained on the training samples for each model,</span>
-<span class="sd">     - a list with the test scores obtained on the test samples for each model.</span>
-<span class="sd">     The order of scores should match the order in which the models were originally provided. E.g.:     </span>
-<span class="sd">     [Model1 train score, ..., ModelN train score], [Model1 test score, ..., ModelN test score]</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">pass</span>
-
-<span class="c1"># # Example output:</span>
-<span class="c1"># train_scores, test_scores = ([[0.92 , 0.924, 0.916, 0.917, 0.921],  # Model 1 train score for each of 5 folds.</span>
-<span class="c1">#                               [0.963, 0.962, 0.953, 0.912, 0.934],  # Model 2 train score for each of 5 folds.</span>
-<span class="c1">#                               ..</span>
-<span class="c1">#                              [[0.801, 0.811, 0.806, 0.826, 0.804],  # Model 1 test score for each of 5 folds.</span>
-<span class="c1">#                               [0.766, 0.756, 0.773, 0.756, 0.741],  # Model 2 test score for each of 5 folds.</span>
-<span class="c1">#                               ..</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="solution">
-<h4>Solution<a class="headerlink" href="#solution" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># MODEL IMPLEMENTATION:</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_validate</span><span class="p">,</span> <span class="n">train_test_split</span>
-<span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">LinearRegression</span><span class="p">,</span> <span class="n">Ridge</span><span class="p">,</span> <span class="n">Lasso</span><span class="p">,</span> <span class="n">ElasticNet</span>
-<span class="kn">from</span> <span class="nn">sklearn.neighbors</span> <span class="kn">import</span> <span class="n">KNeighborsRegressor</span>
-<span class="kn">from</span> <span class="nn">sklearn.pipeline</span> <span class="kn">import</span> <span class="n">make_pipeline</span>
-<span class="kn">from</span> <span class="nn">sklearn.preprocessing</span> <span class="kn">import</span> <span class="n">StandardScaler</span>
-
-<span class="k">def</span> <span class="nf">evaluate_learners</span><span class="p">(</span><span class="n">models</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Evaluate each model in &#39;models&#39; with cross-validation on the provided (X, y) data. </span>
-<span class="sd">    </span>
-<span class="sd">    Given a list of models [model1, model2, ..., modelN] return two lists:</span>
-<span class="sd">     - a list with the scores obtained on the training samples for each model,</span>
-<span class="sd">     - a list with the test scores obtained on the test samples for each model.</span>
-<span class="sd">     The order of scores should match the order in which the models were originally provided. E.g.:     </span>
-<span class="sd">     [Model1 train score, ..., ModelN train score], [Model1 test score, ..., ModelN test score]</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Evaluate with 5-fold cross-validation.</span>
-    <span class="n">xvals</span> <span class="o">=</span> <span class="p">[</span><span class="n">cross_validate</span><span class="p">(</span><span class="n">m</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">return_train_score</span><span class="o">=</span> <span class="kc">True</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span> <span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="n">models</span><span class="p">]</span>
-    <span class="n">test_scores</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;test_score&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">xvals</span><span class="p">]</span>
-    <span class="n">train_scores</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;train_score&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">xvals</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-1-2">
-<h3>Exercise 1.2<a class="headerlink" href="#exercise-1-2" title="Permalink to this heading">#</a></h3>
-<p>Call the function you created with a Linear Regression, Ridge, Lasso and ElasticNet, as well as kNN.
-Store the return values in the variables <code class="docutils literal notranslate"><span class="pre">train_scores</span></code> and <code class="docutils literal notranslate"><span class="pre">test_scores</span></code>. Then, run the code given below to produce a plot visualizing the scores.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Dummy code. Replace with the actual classifiers and scores</span>
-<span class="n">classifiers</span> <span class="o">=</span> <span class="p">[</span><span class="n">LinearRegression</span><span class="p">()]</span>
-<span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span> <span class="o">=</span> <span class="p">[[</span><span class="mf">0.6</span><span class="p">,</span><span class="mf">0.7</span><span class="p">,</span><span class="mf">0.8</span><span class="p">]],</span> <span class="p">[[</span><span class="mf">0.5</span><span class="p">,</span><span class="mf">0.6</span><span class="p">,</span><span class="mf">0.7</span><span class="p">]]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id1">
-<h4>Solution<a class="headerlink" href="#id1" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">models</span> <span class="o">=</span> <span class="p">[</span><span class="n">LinearRegression</span><span class="p">(),</span> <span class="n">Ridge</span><span class="p">(),</span> <span class="n">Lasso</span><span class="p">(),</span> <span class="n">ElasticNet</span><span class="p">(),</span> <span class="n">KNeighborsRegressor</span><span class="p">()]</span>
-<span class="c1">#models = np.array([m for m in models]).flatten()</span>
-
-<span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span> <span class="o">=</span> <span class="n">evaluate_learners</span><span class="p">(</span><span class="n">models</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Plot a bar chart of the train and test scores of all the classifiers, including the variance as error bars</span>
-<span class="c1"># Note: we use some more advanced visualization and formatting tricks here to get a nice plot, but</span>
-<span class="c1"># it doesn&#39;t have to done this way, as long as the results are the same (or similar)</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span><span class="mi">6</span><span class="p">))</span>
-<span class="n">width</span><span class="o">=</span><span class="mf">0.45</span>
-
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">)),</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">test_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">width</span><span class="p">,</span>
-        <span class="n">yerr</span><span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">test_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;green&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;test R^2&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">))</span><span class="o">-</span><span class="n">width</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">train_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">width</span><span class="p">,</span>
-        <span class="n">yerr</span><span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">train_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;red&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;train R^2&#39;</span><span class="p">)</span>
-<span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">te</span><span class="p">,</span> <span class="n">tr</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">)),</span><span class="n">test_scores</span><span class="p">,</span><span class="n">train_scores</span><span class="p">):</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">i</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">{:.3f}</span><span class="s2"> +- </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">te</span><span class="p">),</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">te</span><span class="p">)),</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="s1">&#39;white&#39;</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">te</span><span class="p">)</span><span class="o">&gt;</span><span class="mf">0.1</span> <span class="k">else</span> <span class="s1">&#39;black&#39;</span><span class="p">),</span> <span class="n">va</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">i</span><span class="o">-</span><span class="n">width</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">{:.3f}</span><span class="s2"> +- </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">tr</span><span class="p">),</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">tr</span><span class="p">)),</span> <span class="n">color</span><span class="o">=</span><span class="p">(</span><span class="s1">&#39;white&#39;</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">tr</span><span class="p">)</span><span class="o">&gt;</span><span class="mf">0.1</span> <span class="k">else</span> <span class="s1">&#39;black&#39;</span><span class="p">),</span> <span class="n">va</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-<span class="n">labels</span> <span class="o">=</span> <span class="p">[</span><span class="n">c</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span> <span class="k">if</span> <span class="ow">not</span> <span class="nb">hasattr</span><span class="p">(</span><span class="n">c</span><span class="p">,</span> <span class="s1">&#39;steps&#39;</span><span class="p">)</span> <span class="k">else</span> <span class="n">c</span><span class="o">.</span><span class="n">steps</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="s2">&quot;_&quot;</span> <span class="o">+</span> <span class="n">c</span><span class="o">.</span><span class="n">steps</span><span class="p">[</span><span class="mi">1</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">models</span><span class="p">]</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">yticks</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">))</span><span class="o">-</span><span class="n">width</span><span class="o">/</span><span class="mi">2</span><span class="p">,</span> <span class="n">yticklabels</span><span class="o">=</span><span class="n">labels</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">bbox_to_anchor</span><span class="o">=</span><span class="p">(</span><span class="mf">1.05</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">loc</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/781c74b09bb62245202394cc3f7edab634155e2ff0fab05676f2bcc1d1b5bb8e.png" src="../_images/781c74b09bb62245202394cc3f7edab634155e2ff0fab05676f2bcc1d1b5bb8e.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-1-3">
-<h3>Exercise 1.3<a class="headerlink" href="#exercise-1-3" title="Permalink to this heading">#</a></h3>
-<p>Interpret the plot. Which is the best regressor? Are any of the models overfitting? If so, what can we do to solve this? Is there a lot of variance in the results?</p>
-<section id="id2">
-<h4>Solution<a class="headerlink" href="#id2" title="Permalink to this heading">#</a></h4>
-<p>Linear regression and ridge regression don’t surpass 0.5 <span class="math notranslate nohighlight">\(R^2\)</span>, yet don’t seem to drastically overfit. kNN is drastically overfitting. Lasso and ElasticNet are catastrophically bad in their default settings.</p>
-</section>
-</section>
-</section>
-<section id="exercise-2-regularization">
-<h2>Exercise 2: Regularization<a class="headerlink" href="#exercise-2-regularization" title="Permalink to this heading">#</a></h2>
-<p>We will now tune these algorithm’s main regularization hyperparameter: the regularization hyperparameter (<code class="docutils literal notranslate"><span class="pre">alpha</span></code>) in Lasso and Ridge, and the number of neighbors (<code class="docutils literal notranslate"><span class="pre">n_neighbors</span></code>) in kNN.</p>
-<p>We expect the optimum for the alpha parameters to lie in <span class="math notranslate nohighlight">\([10^{-12},10^{12}]\)</span> and for n_neighbors between 1 and 50. alpha should be varied on a log scale (i.e. [0.01, 0.1, 1, 10, 100]), k should be varied uniformly (i.e. [1,2,3,4]).</p>
-<section id="exercise-2-1">
-<h3>Exercise 2.1<a class="headerlink" href="#exercise-2-1" title="Permalink to this heading">#</a></h3>
-<p>Vary the hyperparameters in the range given above and, for each regressor, create a line plot that plots both the training and test score for every value of the regularization hyperparameter. Hence, you should produce 3 plots, one for each regressor. Use the default 5-fold cross validation for all scores, but only plot the means.</p>
-<p>Hints:</p>
-<ul class="simple">
-<li><p>Think about the time complexity of these models. Trying too many hyperparameter values may take too much time.</p></li>
-<li><p>You can make use of numpy’s <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.logspace.html">logspace</a>, <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.geomspace.html?highlight=geomspace#numpy.geomspace">geomspace</a>, and <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.linspace.html#numpy.linspace">linspace</a> functions.</p></li>
-<li><p>You can use matplotlib’s default <a class="reference external" href="https://matplotlib.org/tutorials/introductory/pyplot.html">plot</a> function to plot the train and test scores.</p></li>
-<li><p>You can manually loop over the hyperparameter ranges, or you can already check out scikit-learn’s <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html">GridSearchCV</a> function to save some programming. We’ll see it again later in the course.</p></li>
-</ul>
-<section id="id3">
-<h4>Solution<a class="headerlink" href="#id3" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Design the hyperparameter search space</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">GridSearchCV</span>
-
-<span class="n">param_a</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;alpha&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">22</span><span class="p">)}</span>
-<span class="n">param_elastic</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;l1_ratio&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">11</span><span class="p">),</span>
-                 <span class="s1">&#39;alpha&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">25</span><span class="p">)}</span>
-<span class="n">param_k</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;kneighborsregressor__n_neighbors&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">geomspace</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">60</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">12</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)[</span><span class="mi">1</span><span class="p">:]}</span>
-
-<span class="n">models</span> <span class="o">=</span> <span class="p">[</span><span class="n">Ridge</span><span class="p">(),</span> <span class="n">Lasso</span><span class="p">(),</span> <span class="n">make_pipeline</span><span class="p">(</span><span class="n">StandardScaler</span><span class="p">(),</span> <span class="n">KNeighborsRegressor</span><span class="p">()),</span> <span class="n">ElasticNet</span><span class="p">()]</span>
-
-<span class="n">grids</span> <span class="o">=</span> <span class="p">[</span><span class="n">param_a</span><span class="p">,</span><span class="n">param_a</span><span class="p">,</span><span class="n">param_k</span><span class="p">,</span><span class="n">param_elastic</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Generic plot for 1D grid search</span>
-<span class="k">def</span> <span class="nf">plot_tuning</span><span class="p">(</span><span class="n">grid_search</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">ax</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    grid_search: the result of the GridSearchCV</span>
-<span class="sd">    param_name: the name of the parameter that is being varied</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">param_grid</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_test_score&#39;</span><span class="p">],</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;Test score&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">param_grid</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_train_score&#39;</span><span class="p">],</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;Train score&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s1">&#39;score (ACC)&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">param_name</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="s1">&#39;lower left&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xscale</span><span class="p">(</span><span class="s1">&#39;log&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-    <span class="n">bp</span><span class="p">,</span> <span class="n">bs</span> <span class="o">=</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">best_params_</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">best_score_</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">bp</span><span class="p">,</span><span class="n">bs</span><span class="o">+</span><span class="mf">0.01</span><span class="p">,</span><span class="s2">&quot;  best:</span><span class="si">{:.2E}</span><span class="s2">, R2:</span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">bp</span><span class="p">,</span><span class="n">bs</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Run the grid search</span>
-<span class="n">grid_searches</span> <span class="o">=</span> <span class="p">[</span><span class="n">GridSearchCV</span><span class="p">(</span><span class="n">m</span><span class="p">,</span><span class="n">grid</span><span class="p">,</span><span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">return_train_score</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">)</span> <span class="k">for</span> <span class="n">m</span><span class="p">,</span><span class="n">grid</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">models</span><span class="p">,</span><span class="n">grids</span><span class="p">)]</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">nrows</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">ncols</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">15</span><span class="p">,</span><span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">grid_search</span><span class="p">,</span> <span class="n">param</span><span class="p">,</span> <span class="n">ax</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">grid_searches</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="mi">3</span><span class="p">],[</span><span class="s1">&#39;alpha&#39;</span><span class="p">,</span><span class="s1">&#39;alpha&#39;</span><span class="p">,</span><span class="s1">&#39;kneighborsregressor__n_neighbors&#39;</span><span class="p">],</span><span class="n">axes</span><span class="p">):</span>
-    <span class="n">plot_tuning</span><span class="p">(</span><span class="n">grid_search</span><span class="p">,</span> <span class="n">param</span><span class="p">,</span> <span class="n">ax</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/e9097d5a7dbf4c2f163940b8a53cd86dd5b8094fc3f6019c237c6d28728f3781.png" src="../_images/e9097d5a7dbf4c2f163940b8a53cd86dd5b8094fc3f6019c237c6d28728f3781.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-2-2">
-<h3>Exercise 2.2<a class="headerlink" href="#exercise-2-2" title="Permalink to this heading">#</a></h3>
-<p>Interpret the plots. When are the methods underfitting? When are they overfitting? How sensitive are they to the regularization hyperparameter?</p>
-<section id="id4">
-<h4>Solution<a class="headerlink" href="#id4" title="Permalink to this heading">#</a></h4>
-<p>Ridge and Lasso behave very similarly, producing the same optimal result for small alpha’s (small amounts of regularization), and then quickly dropping down to default performance (0 <span class="math notranslate nohighlight">\(R^2\)</span>) around alpha=0.1. Any more regularization makes the model completely underfit the data. The only difference is that Ridge has a slightly more gradual descent than Lasso. kNN yields a worse score (0.4175 <span class="math notranslate nohighlight">\(R^2\)</span>) even after tuning. It has a clear optimum around 9 nearest neighbors, after which it gradually starts underfitting.</p>
-</section>
-</section>
-<section id="exercise-2-3">
-<h3>Exercise 2.3<a class="headerlink" href="#exercise-2-3" title="Permalink to this heading">#</a></h3>
-<p>ElasticNet allows to mix L1 and L2 loss, and the <code class="docutils literal notranslate"><span class="pre">l1_ratio</span></code> hyperparameter defines the ratio of L1 loss. Hence, it has two interacting hyperparameters: l1_ratio and alpha. Run a grid search to obtain a matrix of l1_ratio and alpha values and the resulting cross-validation scores. Then, use the function provided below to plot a heatmap of all values and interpret the result. Can you explain how the two hyperparameters interact?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Generic heatmap</span>
-<span class="k">def</span> <span class="nf">heatmap</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">xlabel</span><span class="p">,</span> <span class="n">ylabel</span><span class="p">,</span> <span class="n">xticklabels</span><span class="p">,</span> <span class="n">yticklabels</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-            <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">fmt</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">%0.2f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">printvalues</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Plots a heatmap for the performance of a model for every combination of two hyperparameter values</span>
-<span class="sd">    </span>
-<span class="sd">    values: nxn array with all evaluation results, varying the first hyperparameter first</span>
-<span class="sd">    xlabel: name of the first hyperparameter</span>
-<span class="sd">    ylabel: name of the second hyperparameter</span>
-<span class="sd">    xticklabels: values of the first hyperparameter</span>
-<span class="sd">    yticklabels: values of the second hyperparameter</span>
-<span class="sd">    cmap: colormap</span>
-<span class="sd">    vmin: minimal score</span>
-<span class="sd">    vmax: maximal score</span>
-<span class="sd">    ax: plot axes</span>
-<span class="sd">    fmt: format for printing the scores</span>
-<span class="sd">    printvalues: whether to print the scores</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="n">img</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">pcolor</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">cmap</span><span class="p">,</span> <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-    <span class="n">img</span><span class="o">.</span><span class="n">update_scalarmappable</span><span class="p">()</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">xlabel</span><span class="p">,</span> <span class="n">fontsize</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">,</span> <span class="n">fontsize</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticklabels</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_aspect</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-    
-    <span class="n">ax</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s1">&#39;y&#39;</span><span class="p">,</span> <span class="n">labelsize</span><span class="o">=</span><span class="mi">12</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s1">&#39;x&#39;</span><span class="p">,</span> <span class="n">labelsize</span><span class="o">=</span><span class="mi">12</span><span class="p">,</span> <span class="n">labelrotation</span><span class="o">=</span><span class="mi">90</span><span class="p">)</span>
-
-    <span class="k">if</span><span class="p">(</span><span class="n">printvalues</span><span class="p">):</span>
-        <span class="k">for</span> <span class="n">p</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">img</span><span class="o">.</span><span class="n">get_paths</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_facecolors</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_array</span><span class="p">()):</span>
-            <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">vertices</span><span class="p">[:</span><span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-            <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">color</span><span class="p">[:</span><span class="mi">3</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mf">0.5</span><span class="p">:</span>
-                <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;k&#39;</span>
-            <span class="k">else</span><span class="p">:</span>
-                <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;w&#39;</span>
-            <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">fmt</span> <span class="o">%</span> <span class="n">value</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">img</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id5">
-<h4>Solution<a class="headerlink" href="#id5" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">scores</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">grid_searches</span><span class="p">[</span><span class="mi">3</span><span class="p">]</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">)</span><span class="o">.</span><span class="n">mean_test_score</span><span class="p">)</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="mi">25</span><span class="p">,</span> <span class="mi">11</span><span class="p">)</span><span class="o">.</span><span class="n">T</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s1">&#39;font.size&#39;</span><span class="p">:</span> <span class="mi">12</span><span class="p">})</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">13</span><span class="p">,</span> <span class="mi">13</span><span class="p">))</span>
-<span class="n">heatmap</span><span class="p">(</span><span class="n">scores</span><span class="p">,</span> <span class="n">xlabel</span><span class="o">=</span><span class="s1">&#39;alpha&#39;</span><span class="p">,</span> <span class="n">xticklabels</span><span class="o">=</span><span class="nb">list</span><span class="p">(</span><span class="nb">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">n</span><span class="p">:</span> <span class="s2">&quot;%.E&quot;</span> <span class="o">%</span> <span class="n">n</span><span class="p">,</span> <span class="n">param_elastic</span><span class="p">[</span><span class="s1">&#39;alpha&#39;</span><span class="p">])),</span>
-        <span class="n">ylabel</span><span class="o">=</span><span class="s1">&#39;l1_ratio&#39;</span><span class="p">,</span> <span class="n">yticklabels</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">around</span><span class="p">(</span><span class="n">param_elastic</span><span class="p">[</span><span class="s1">&#39;l1_ratio&#39;</span><span class="p">],</span><span class="mi">4</span><span class="p">),</span> <span class="n">cmap</span><span class="o">=</span><span class="s2">&quot;viridis&quot;</span><span class="p">,</span> <span class="n">fmt</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">%.2f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="n">axes</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/e154775f48abf02a54e1f4c4ae85e99db588736b7150af1cf743b47d0cd9367f.png" src="../_images/e154775f48abf02a54e1f4c4ae85e99db588736b7150af1cf743b47d0cd9367f.png" />
-</div>
-</div>
-<p>For ElasticNet we see the same sudden drop in performance around alpha=0.1. For l1_ratio=0, it is identical to Ridge (L2), showing a more gradual descent. For l1_ration=1, it is identical to Lasso (L1), showing the same sharp performance drop.</p>
-</section>
-</section>
-</section>
-<section id="exercise-3-visualizing-coefficients">
-<h2>Exercise 3: Visualizing coefficients<a class="headerlink" href="#exercise-3-visualizing-coefficients" title="Permalink to this heading">#</a></h2>
-<p>Finally, let’s verify whether the different optimized linear models also find the same coefficients.</p>
-<section id="exercise-3-1">
-<h3>Exercise 3.1<a class="headerlink" href="#exercise-3-1" title="Permalink to this heading">#</a></h3>
-<p>Draw a <a class="reference external" href="https://matplotlib.org/gallery/shapes_and_collections/scatter.html">scatterplot</a> plotting the coefficients of the different models in different colors. Do you see much difference between the different models?</p>
-<p>For all models, choose an alpha parameter that seems to work well in the previous exercise. When in doubt, use alpha=0.001.</p>
-<section id="id6">
-<h4>Solution<a class="headerlink" href="#id6" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">scatter_coefficients</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="mf">0.001</span><span class="p">):</span>
-    <span class="n">models</span> <span class="o">=</span> <span class="p">[</span><span class="n">LinearRegression</span><span class="p">(),</span> <span class="n">Ridge</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">),</span> <span class="n">Lasso</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">),</span> <span class="n">ElasticNet</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)]</span>
-    <span class="n">coeff</span> <span class="o">=</span> <span class="p">[</span><span class="n">m</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">)</span><span class="o">.</span><span class="n">coef_</span> <span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="n">models</span><span class="p">]</span>
-    <span class="n">attribute_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
-
-    <span class="n">col</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;k&#39;</span><span class="p">,</span><span class="s1">&#39;b&#39;</span><span class="p">,</span><span class="s1">&#39;r&#39;</span><span class="p">,</span><span class="s1">&#39;y&#39;</span><span class="p">]</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">()</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xticks</span><span class="p">(</span><span class="n">rotation</span><span class="o">=</span><span class="mi">45</span><span class="p">,</span><span class="n">ha</span><span class="o">=</span><span class="s2">&quot;right&quot;</span><span class="p">)</span>
-    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">4</span><span class="p">):</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">attribute_names</span><span class="p">,</span> <span class="n">coeff</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">s</span><span class="o">=</span><span class="p">(</span><span class="mi">4</span><span class="o">-</span><span class="n">i</span><span class="p">)</span><span class="o">*</span><span class="mi">40</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="n">col</span><span class="p">[</span><span class="n">i</span><span class="p">],</span> <span class="n">label</span><span class="o">=</span><span class="n">models</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">();</span>
-<span class="n">scatter_coefficients</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="mf">0.001</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/3eae0847f567c3e0d9a63422cc8dc1e08403db76ec4296c68ee7251a60951631.png" src="../_images/3eae0847f567c3e0d9a63422cc8dc1e08403db76ec4296c68ee7251a60951631.png" />
-</div>
-</div>
-<p>The different techniques find almost <em>exactly</em> the same coefficients (the markers overlap). cars_per_hour is the most influential, followed by temperature_diff_2m_25m and wind_speed. The others are nearly zero.</p>
-</section>
-</section>
-<section id="exercise-3-2">
-<h3>Exercise 3.2<a class="headerlink" href="#exercise-3-2" title="Permalink to this heading">#</a></h3>
-<p>Redraw the same plot but now using a large amount of regularization (e.g. alpha=1). What do you observe? Does this help you explain the performance difference between Ridge and Lasso in exercise 1.2?</p>
-<section id="id7">
-<h4>Solution<a class="headerlink" href="#id7" title="Permalink to this heading">#</a></h4>
-<p>Increasing alpha makes Lasso completely ignore most features: the coefficients are exactly 0. Hence, it is important to tune alpha carefully.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">scatter_coefficients</span><span class="p">(</span><span class="n">alpha</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/7c1a0a6e2f88bd4820741b80a1c1f6e0205292eb669c680a7e2a8841e0dbfe4e.png" src="../_images/7c1a0a6e2f88bd4820741b80a1c1f6e0205292eb669c680a7e2a8841e0dbfe4e.png" />
-</div>
-</div>
-</section>
-</section>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#part-1-regression">Part 1: Regression</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quick-visualization">Quick visualization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-model-benchmark">Exercise 1: Model benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1">Exercise 1.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-2">Exercise 1.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-3">Exercise 1.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-regularization">Exercise 2: Regularization</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-3">Exercise 2.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-visualizing-coefficients">Exercise 3: Visualizing coefficients</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id7">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 1b - Linear Models for Classification Solution.html b/labs/Lab 1b - Linear Models for Classification Solution.html
deleted file mode 100644
index e57d9abd1..000000000
--- a/labs/Lab 1b - Linear Models for Classification Solution.html	
+++ /dev/null
@@ -1,1079 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 1: Linear models &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>window.MathJax = {"options": {"processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 1b - Linear Models for Classification Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 1b - Linear Models for Classification Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 1b - Linear Models for Classification Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 1b - Linear Models for Classification Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 1: Linear models</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#part-2-classification">Part 2: Classification</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-a-quick-benchmark">Exercise 1: A quick benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1">Exercise 1.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-2">Exercise 1.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-3">Exercise 1.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-regularization">Exercise 2: Regularization</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-interpreting-misclassifications">Exercise 3: Interpreting misclassifications</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-3">Exercise 3.3.</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id7">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-interpreting-model-parameters">Exercise 4: Interpreting model parameters</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-1">Exercise 4.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id8">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-2">Exercise 4.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id9">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-1-linear-models">
-<h1>Lab 1: Linear models<a class="headerlink" href="#lab-1-linear-models" title="Permalink to this heading">#</a></h1>
-<section id="part-2-classification">
-<h2>Part 2: Classification<a class="headerlink" href="#part-2-classification" title="Permalink to this heading">#</a></h2>
-<p>The <a class="reference external" href="https://www.openml.org/d/40996">Fashion-MNIST dataset</a> contains 70,000 images of Zalando fashion products, classified into 10 types of clothing, each represented by 28 by 28 pixel values. We’s see how well we can classify these with linear models. Let’s start with looking at our data:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Auto-setup when running on Google Colab</span>
-<span class="k">if</span> <span class="s1">&#39;google.colab&#39;</span> <span class="ow">in</span> <span class="nb">str</span><span class="p">(</span><span class="n">get_ipython</span><span class="p">()):</span>
-    <span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>openml
-
-<span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">from</span> <span class="nn">matplotlib</span> <span class="kn">import</span> <span class="n">cm</span>
-
-<span class="c1"># Hide convergence warning for now</span>
-<span class="kn">import</span> <span class="nn">warnings</span>
-<span class="kn">from</span> <span class="nn">sklearn.exceptions</span> <span class="kn">import</span> <span class="n">ConvergenceWarning</span>
-<span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="n">ConvergenceWarning</span><span class="p">)</span>
-
-<span class="c1"># Hiding all warnings. Not recommended, just for compilation.</span>
-<span class="k">if</span> <span class="ow">not</span> <span class="n">sys</span><span class="o">.</span><span class="n">warnoptions</span><span class="p">:</span>
-    <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">)</span>
-    <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;PYTHONWARNINGS&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;ignore&quot;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download FMINST data. Takes a while the first time.</span>
-<span class="n">fmnist</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">40996</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">fmnist</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">fmnist</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">);</span> 
-<span class="n">fmnist_classes</span> <span class="o">=</span> <span class="p">{</span><span class="mi">0</span><span class="p">:</span><span class="s2">&quot;T-shirt/top&quot;</span><span class="p">,</span> <span class="mi">1</span><span class="p">:</span> <span class="s2">&quot;Trouser&quot;</span><span class="p">,</span> <span class="mi">2</span><span class="p">:</span> <span class="s2">&quot;Pullover&quot;</span><span class="p">,</span> <span class="mi">3</span><span class="p">:</span> <span class="s2">&quot;Dress&quot;</span><span class="p">,</span> <span class="mi">4</span><span class="p">:</span> <span class="s2">&quot;Coat&quot;</span><span class="p">,</span> <span class="mi">5</span><span class="p">:</span> <span class="s2">&quot;Sandal&quot;</span><span class="p">,</span> 
-                  <span class="mi">6</span><span class="p">:</span> <span class="s2">&quot;Shirt&quot;</span><span class="p">,</span> <span class="mi">7</span><span class="p">:</span> <span class="s2">&quot;Sneaker&quot;</span><span class="p">,</span> <span class="mi">8</span><span class="p">:</span> <span class="s2">&quot;Bag&quot;</span><span class="p">,</span> <span class="mi">9</span><span class="p">:</span> <span class="s2">&quot;Ankle boot&quot;</span><span class="p">}</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Take some random examples, reshape to a 32x32 image and plot</span>
-<span class="kn">from</span> <span class="nn">random</span> <span class="kn">import</span> <span class="n">randint</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span>  <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">5</span><span class="p">):</span>
-    <span class="n">n</span> <span class="o">=</span> <span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">70000</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">X</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="mi">28</span><span class="p">,</span> <span class="mi">28</span><span class="p">),</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">gray_r</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">((</span><span class="n">fmnist_classes</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="n">y</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="n">n</span><span class="p">])]))</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(()),</span> <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(())</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/8bfb28f81299c513ee0ba1ae8d4d8170474fb110d8e57c976b472b22d950aaa1.png" src="../_images/8bfb28f81299c513ee0ba1ae8d4d8170474fb110d8e57c976b472b22d950aaa1.png" />
-</div>
-</div>
-</section>
-<section id="exercise-1-a-quick-benchmark">
-<h2>Exercise 1: A quick benchmark<a class="headerlink" href="#exercise-1-a-quick-benchmark" title="Permalink to this heading">#</a></h2>
-<p>First, we’ll try the default <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html">Logistic Regression</a> and <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html?highlight=linearsvc#sklearn.svm.LinearSVC">Linear SVMs</a>. Click the links to read the documentation. We’ll also compare it to <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html">k-Nearest Neighbors</a> as a point of reference. To see whether our models are overfitting, we also evaluate the training set error. This can be done using <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html"><code class="docutils literal notranslate"><span class="pre">cross_validate</span></code></a> instead of  <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_score.html#sklearn.model_selection.cross_val_score"><code class="docutils literal notranslate"><span class="pre">cross_val_scores</span></code></a>.</p>
-<p>For now we are just interested in a quick approximation, so we don’t use the full dataset for our experiments. Instead, we use 10% of our samples:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span><span class="p">,</span> <span class="n">cross_validate</span>
-<span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">LogisticRegression</span>
-<span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">LinearSVC</span>
-<span class="kn">from</span> <span class="nn">sklearn.neighbors</span> <span class="kn">import</span> <span class="n">KNeighborsClassifier</span>
-
-<span class="c1"># Take a 10% stratified subsample to speed up experimentation</span>
-<span class="n">Xs</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.1</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>With this small sample of our data we can now train and evaluate the three classifiers.</p>
-<section id="exercise-1-1">
-<h3>Exercise 1.1<a class="headerlink" href="#exercise-1-1" title="Permalink to this heading">#</a></h3>
-<p>Implement a function below which evaluates each classifier passed into it on the given data, and then returns both the train and test scores of each as a list. You are allowed to import additional functions from whichever module you like, but you should be able to complete the function with <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html"><code class="docutils literal notranslate"><span class="pre">cross_validate</span></code></a> function and standard Python built-ins. Below the function you will find example output.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">evaluate_learners</span><span class="p">(</span><span class="n">classifiers</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Evaluate each classifier in &#39;classifiers&#39; with cross-validation on the provided (X, y) data. </span>
-<span class="sd">    </span>
-<span class="sd">    Given a list of scikit-learn classifiers [Classifier1, Classifier2, ..., ClassifierN] return two lists:</span>
-<span class="sd">     - a list with the scores obtained on the training samples for each classifier,</span>
-<span class="sd">     - a list with the test scores obtained on the test samples for each classifier.</span>
-<span class="sd">     The order of scores should match the order in which the classifiers were originally provided. E.g.:     </span>
-<span class="sd">     [Classifier1 train score, ..., ClassifierN train score], [Classifier1 test score, ..., ClassifierN test score]</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">pass</span>
-
-<span class="c1"># # Example output:</span>
-<span class="c1"># train_scores, test_scores = ([[0.92 , 0.924, 0.916, 0.917, 0.921],  # Classifier 1 train score for each of 5 folds.</span>
-<span class="c1">#                               [0.963, 0.962, 0.953, 0.912, 0.934],  # Classifier 2 train score for each of 5 folds.</span>
-<span class="c1">#                               [0.867, 0.868, 0.865, 0.866, 0.866]], # Classifier 3 train score for each of 5 folds.</span>
-<span class="c1">#                              [[0.801, 0.811, 0.806, 0.826, 0.804],  # Classifier 1 test score for each of 5 folds.</span>
-<span class="c1">#                               [0.766, 0.756, 0.773, 0.756, 0.741],  # Classifier 2 test score for each of 5 folds.</span>
-<span class="c1">#                               [0.804, 0.814, 0.806, 0.821, 0.806]]) # Classifier 3 test score for each of 5 folds.</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="solution">
-<h4>Solution<a class="headerlink" href="#solution" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># MODEL IMPLEMENTATION:</span>
-<span class="k">def</span> <span class="nf">evaluate_learners</span><span class="p">(</span><span class="n">classifiers</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Evaluate each classifier in &#39;classifiers&#39; with cross-validation on the provided (X, y) data. </span>
-<span class="sd">    </span>
-<span class="sd">    Given a list of classifiers [Classifier1, Classifier2, ..., ClassifierN] return two lists:</span>
-<span class="sd">     - a list with the scores obtained on the training samples for each classifier,</span>
-<span class="sd">     - a list with the test scores obtained on the test samples for each classifier.</span>
-<span class="sd">     The order of scores should match the order in which the classifiers were originally provided. E.g.:     </span>
-<span class="sd">     [Classifier1 train scores, ..., ClassifierN train scores], [Classifier1 test scores, ..., ClassifierN test scores]</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Evaluate with 3-fold cross-validation.</span>
-    <span class="n">xvals</span> <span class="o">=</span> <span class="p">[</span><span class="n">cross_validate</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">return_train_score</span><span class="o">=</span> <span class="kc">True</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span> <span class="k">for</span> <span class="n">clf</span> <span class="ow">in</span> <span class="n">classifiers</span><span class="p">]</span>
-    <span class="n">train_scores</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;train_score&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">xvals</span><span class="p">]</span>
-    <span class="n">test_scores</span> <span class="o">=</span> <span class="p">[</span><span class="n">x</span><span class="p">[</span><span class="s1">&#39;test_score&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">xvals</span><span class="p">]</span>
-    <span class="k">return</span> <span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-1-2">
-<h3>Exercise 1.2<a class="headerlink" href="#exercise-1-2" title="Permalink to this heading">#</a></h3>
-<p>Call the function you created with a Logistic Regression, Linear SVM, and k-Nearest Neighbors Classifier.
-Store the return values in the variables <code class="docutils literal notranslate"><span class="pre">train_scores</span></code> and <code class="docutils literal notranslate"><span class="pre">test_scores</span></code>. Then, run the code given below to produce a plot visualizing the scores.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Dummy code. Replace with the actual classifiers and scores</span>
-<span class="n">classifiers</span> <span class="o">=</span> <span class="p">[</span><span class="n">LogisticRegression</span><span class="p">()]</span>
-<span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span> <span class="o">=</span> <span class="p">[[</span><span class="mf">0.6</span><span class="p">,</span><span class="mf">0.7</span><span class="p">,</span><span class="mf">0.8</span><span class="p">]],</span> <span class="p">[[</span><span class="mf">0.5</span><span class="p">,</span><span class="mf">0.6</span><span class="p">,</span><span class="mf">0.7</span><span class="p">]]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id1">
-<h4>Solution<a class="headerlink" href="#id1" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">classifiers</span> <span class="o">=</span> <span class="p">[</span><span class="n">LogisticRegression</span><span class="p">(),</span> <span class="n">LinearSVC</span><span class="p">(),</span> <span class="n">KNeighborsClassifier</span><span class="p">()]</span>
-<span class="n">train_scores</span><span class="p">,</span> <span class="n">test_scores</span> <span class="o">=</span> <span class="n">evaluate_learners</span><span class="p">(</span><span class="n">classifiers</span><span class="p">,</span> <span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Plot a bar chart of the train and test scores of all the classifiers, including the variance as error bars</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">()</span>
-<span class="n">width</span><span class="o">=</span><span class="mf">0.3</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">)),</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">test_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">width</span><span class="p">,</span>
-        <span class="n">yerr</span><span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">test_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;green&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;test&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">))</span><span class="o">-</span><span class="n">width</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">train_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">width</span><span class="p">,</span>
-        <span class="n">yerr</span><span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">train_scores</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;red&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;train&#39;</span><span class="p">)</span>
-<span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">te</span><span class="p">,</span> <span class="n">tr</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">)),</span><span class="n">test_scores</span><span class="p">,</span><span class="n">train_scores</span><span class="p">):</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">i</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">{:.4f}</span><span class="s2"> +- </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">te</span><span class="p">),</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">te</span><span class="p">)),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;white&#39;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">i</span><span class="o">-</span><span class="n">width</span><span class="p">,</span> <span class="s2">&quot;</span><span class="si">{:.4f}</span><span class="s2"> +- </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">tr</span><span class="p">),</span><span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">tr</span><span class="p">)),</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;white&#39;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">yticks</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">train_scores</span><span class="p">))</span><span class="o">-</span><span class="n">width</span><span class="o">/</span><span class="mi">2</span><span class="p">,</span> <span class="n">yticklabels</span><span class="o">=</span><span class="p">[</span><span class="n">c</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span> <span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="n">classifiers</span><span class="p">])</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Accuracy&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">bbox_to_anchor</span><span class="o">=</span><span class="p">(</span><span class="mf">1.05</span><span class="p">,</span> <span class="mi">1</span><span class="p">),</span> <span class="n">loc</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/504d0e079df9858798d9ebfd8fab47494b5a288f9205ee5bd9e7efef32504a5a.png" src="../_images/504d0e079df9858798d9ebfd8fab47494b5a288f9205ee5bd9e7efef32504a5a.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-1-3">
-<h3>Exercise 1.3<a class="headerlink" href="#exercise-1-3" title="Permalink to this heading">#</a></h3>
-<p>Interpret the plot. Which is the best classifier? Are any of the models overfitting? If so, what can we do to solve this? Is there a lot of variance in the results?</p>
-<section id="id2">
-<h4>Solution<a class="headerlink" href="#id2" title="Permalink to this heading">#</a></h4>
-<p>k-NN and LogisticRegression have the best cross-validated test set performance. The linear SVM performs noticeably worse. Both linear models have a big difference between training set accuracy and test set accuracy. This indicates that both linear models are likely overfitted and need to be regularized. The standard deviation of the results is very small: the error bars are hardly noticeable.</p>
-</section>
-</section>
-</section>
-<section id="exercise-2-regularization">
-<h2>Exercise 2: Regularization<a class="headerlink" href="#exercise-2-regularization" title="Permalink to this heading">#</a></h2>
-<p>We will now tune these algorithm’s main regularization hyperparameter: the misclassification cost in SVMs (C), the regularization parameter in logistic regression (C), and the number of neighbors (n_neighbors) in kNN. We expect the optimum for the C parameters to lie in <span class="math notranslate nohighlight">\([10^{-12},10^{12}]\)</span> and for n_neighbors between 1 and 50. C should be varied on a log scale (i.e. [0.01, 0.1, 1, 10, 100]) and k should be varied uniformly (i.e. [1,2,3,4]).</p>
-<section id="exercise-2-1">
-<h3>Exercise 2.1<a class="headerlink" href="#exercise-2-1" title="Permalink to this heading">#</a></h3>
-<p>Vary the regularization parameters in the range given above and, for each classifier, create a line plot that plots both the training and test score for every value of the regularization hyperparameter. Hence, you should produce 3 plots, one for each classifier. Use the default 5-fold cross validation for all scores, but only plot the means.</p>
-<p>Hints:</p>
-<ul class="simple">
-<li><p>Think about the time complexity of these models. Trying too many hyperparameter values may take too much time.</p></li>
-<li><p>You can make use of numpy’s <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.logspace.html">logspace</a>, <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.geomspace.html?highlight=geomspace#numpy.geomspace">geomspace</a>, and <a class="reference external" href="https://docs.scipy.org/doc/numpy/reference/generated/numpy.linspace.html#numpy.linspace">linspace</a> functions.</p></li>
-<li><p>You can use matplotlib’s default <a class="reference external" href="https://matplotlib.org/tutorials/introductory/pyplot.html">plot</a> function to plot the train and test scores.</p></li>
-<li><p>You can manually loop over the hyperparameter ranges, or you can already check out scikit-learn’s <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html">GridSearchCV</a> function to save some programming. We’ll see it again later in the course.</p></li>
-</ul>
-<section id="id3">
-<h4>Solution<a class="headerlink" href="#id3" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">GridSearchCV</span>
-
-<span class="n">param_c</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;C&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">12</span><span class="p">,</span> <span class="mi">12</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">22</span><span class="p">)}</span>
-<span class="n">param_k</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;n_neighbors&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">geomspace</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">60</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">12</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">int</span><span class="p">)[</span><span class="mi">1</span><span class="p">:]}</span>
-<span class="n">grids</span> <span class="o">=</span> <span class="p">[</span><span class="n">param_c</span><span class="p">,</span> <span class="n">param_c</span><span class="p">,</span> <span class="n">param_k</span><span class="p">]</span>
-<span class="n">grid_searches</span> <span class="o">=</span> <span class="p">[</span><span class="n">GridSearchCV</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">grid</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">return_train_score</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">)</span> <span class="k">for</span> <span class="n">clf</span><span class="p">,</span><span class="n">grid</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">classifiers</span><span class="p">,</span><span class="n">grids</span><span class="p">)]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Generic plot for 1D grid search</span>
-<span class="c1"># grid_search: the result of the GridSearchCV</span>
-<span class="c1"># param_name: the name of the parameter that is being varied</span>
-<span class="k">def</span> <span class="nf">plot_tuning</span><span class="p">(</span><span class="n">grid_search</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">ax</span><span class="p">):</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">param_grid</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_test_score&#39;</span><span class="p">],</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;Test score&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">param_grid</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_train_score&#39;</span><span class="p">],</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;Train score&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s1">&#39;score (ACC)&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">param_name</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xscale</span><span class="p">(</span><span class="s1">&#39;log&#39;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_title</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-    <span class="n">bp</span><span class="p">,</span> <span class="n">bs</span> <span class="o">=</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">best_params_</span><span class="p">[</span><span class="n">param_name</span><span class="p">],</span> <span class="n">grid_search</span><span class="o">.</span><span class="n">best_score_</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">bp</span><span class="p">,</span><span class="n">bs</span><span class="p">,</span><span class="s2">&quot;  C:</span><span class="si">{:.2E}</span><span class="s2">, ACC:</span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">bp</span><span class="p">,</span><span class="n">bs</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">nrows</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">ncols</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">15</span><span class="p">,</span><span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">grid_search</span><span class="p">,</span> <span class="n">param</span><span class="p">,</span> <span class="n">ax</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">grid_searches</span><span class="p">,[</span><span class="s1">&#39;C&#39;</span><span class="p">,</span><span class="s1">&#39;C&#39;</span><span class="p">,</span><span class="s1">&#39;n_neighbors&#39;</span><span class="p">],</span><span class="n">axes</span><span class="p">):</span>
-    <span class="n">plot_tuning</span><span class="p">(</span><span class="n">grid_search</span><span class="p">,</span> <span class="n">param</span><span class="p">,</span> <span class="n">ax</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/55b4c1d30f964582fcd3aa4e022c74e6468d4a77ea2eb7a661b59286050919e0.png" src="../_images/55b4c1d30f964582fcd3aa4e022c74e6468d4a77ea2eb7a661b59286050919e0.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-2-2">
-<h3>Exercise 2.2<a class="headerlink" href="#exercise-2-2" title="Permalink to this heading">#</a></h3>
-<p>Interpret the plots. When are the methods underfitting? When are they overfitting? How sensitive are they to the regularization hyperparameter?</p>
-<section id="id4">
-<h4>Solution<a class="headerlink" href="#id4" title="Permalink to this heading">#</a></h4>
-<p>We find that, when properly regularized, the linear models both outperform kNN, and that linear SVMs seem to do slighty better of these two. Logistic regression underfits for small values of C, reaches an optimum around C=1e-7, and then starts overfitting. The linear SVM behaves the same way, but with an optimum around C=1e-8. The kNN overfits for small numbers of neighbors, reaches an optimum around n_neighbors=4, and then starts underfitting gradually. Note that these results were obtained on a 10% subsample. Results may be different when we optimize our models on the entire datset.</p>
-</section>
-</section>
-</section>
-<section id="exercise-3-interpreting-misclassifications">
-<h2>Exercise 3: Interpreting misclassifications<a class="headerlink" href="#exercise-3-interpreting-misclassifications" title="Permalink to this heading">#</a></h2>
-<p>Chances are that your models are not yet perfect. It is important to understand what kind of errors it still makes. Let’s take a closer look at which instances are misclassified and which classes are often confused.
-Train the logistic regression model with <code class="docutils literal notranslate"><span class="pre">C=1e-7</span></code>. Train the model on a training set, and make predictions for a test set (both sets should be  sampled from our 10% subsample).</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Create a stratified train-test split on a sample</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span><span class="n">ys</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">ys</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="exercise-3-1">
-<h3>Exercise 3.1<a class="headerlink" href="#exercise-3-1" title="Permalink to this heading">#</a></h3>
-<p>Train the classifier as described above, obtain the predictions <code class="docutils literal notranslate"><span class="pre">y_pred</span></code> on the test set, and identify all the misclassified samples <code class="docutils literal notranslate"><span class="pre">misclassified_samples</span></code>. Then, run the visualization code below to study the misclassifications</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Implement the code to obtain the actual predictions on the test set</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">y_test</span><span class="p">)</span> <span class="c1"># dummy values, replace y_test with the actual predictions</span>
-
-<span class="c1"># Implement the code to obtain the indices of the misclassified samples</span>
-<span class="c1"># Example output:</span>
-<span class="c1"># misclassified_samples = [  11,   12,   14,   23,   30,   34,   39,   46,   50,   52,   55]</span>
-<span class="n">misclassified_samples</span> <span class="o">=</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span><span class="mi">1</span><span class="p">,</span><span class="mi">2</span><span class="p">,</span><span class="mi">3</span><span class="p">,</span><span class="mi">4</span><span class="p">]</span> <span class="c1"># dummy values</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id5">
-<h4>Solution<a class="headerlink" href="#id5" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># model implementation:</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">LogisticRegression</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e-7</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-<span class="n">misclassified_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">nonzero</span><span class="p">(</span><span class="n">y_pred</span> <span class="o">!=</span> <span class="nb">list</span><span class="p">(</span><span class="n">y_test</span><span class="p">))[</span><span class="mi">0</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Visualize the (first five) misclassifications, together with the predicted and actual class</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span>  <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">nr</span><span class="p">,</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">misclassified_samples</span><span class="p">[:</span><span class="mi">5</span><span class="p">]):</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">X_test</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="mi">28</span><span class="p">,</span> <span class="mi">28</span><span class="p">),</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">gray_r</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;Predicted: </span><span class="si">%s</span><span class="s2">,</span><span class="se">\n</span><span class="s2"> Actual : </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">fmnist_classes</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="n">y_pred</span><span class="p">[</span><span class="n">i</span><span class="p">])],</span><span class="n">fmnist_classes</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="n">y_test</span><span class="o">.</span><span class="n">values</span><span class="p">[</span><span class="n">i</span><span class="p">])]))</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(()),</span> <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(())</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/6bc401d727123b6bd87d2eae0a74051b5abe968b54ffea3c15b0ca2abd01fefb.png" src="../_images/6bc401d727123b6bd87d2eae0a74051b5abe968b54ffea3c15b0ca2abd01fefb.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-3-2">
-<h3>Exercise 3.2<a class="headerlink" href="#exercise-3-2" title="Permalink to this heading">#</a></h3>
-<p>Interpret the results. Are these misclassifications to be expected?</p>
-<section id="id6">
-<h4>Solution<a class="headerlink" href="#id6" title="Permalink to this heading">#</a></h4>
-<p>Some of these seem quite common mistakes, such as confusing shirts and coats. The images are quite coarse so there may not be enough detail. Others, like misclassifying a dress for a t-shirt, seem more curious.</p>
-</section>
-</section>
-<section id="exercise-3-3">
-<h3>Exercise 3.3.<a class="headerlink" href="#exercise-3-3" title="Permalink to this heading">#</a></h3>
-<p>Run the code below on your results to draw the complete confusion matrix and get more insight on the systematic misclassifications
-of your model. A confusion matrix shows the amount of examples in for each pair of true and predicted classes. Interpret the results.
-Does your model produce certain types of error more often than other types?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">confusion_matrix</span>
-<span class="n">cm</span> <span class="o">=</span> <span class="n">confusion_matrix</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span><span class="n">y_pred</span><span class="p">)</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">()</span>
-<span class="n">im</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">cm</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">10</span><span class="p">)),</span> <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">10</span><span class="p">))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xticklabels</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">fmnist_classes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">rotation</span><span class="o">=</span><span class="mi">45</span><span class="p">,</span> <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;right&quot;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">fmnist_classes</span><span class="o">.</span><span class="n">values</span><span class="p">()))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s1">&#39;True&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Predicted&#39;</span><span class="p">)</span>
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">100</span><span class="p">):</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">i</span><span class="o">/</span><span class="mi">10</span><span class="p">),</span><span class="n">i</span><span class="o">%</span><span class="k">10</span>,cm[i%10,int(i/10)], ha=&quot;center&quot;, va=&quot;center&quot;, color=&quot;w&quot;)
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/8271957e8718704684fe9802943ab20fb59a343bef08445940c61fb3edfcc27f.png" src="../_images/8271957e8718704684fe9802943ab20fb59a343bef08445940c61fb3edfcc27f.png" />
-</div>
-</div>
-<section id="id7">
-<h4>Solution<a class="headerlink" href="#id7" title="Permalink to this heading">#</a></h4>
-<p>We see that some categories are much easier to predict than others. For instance, trousers and bags are almost always predicted correctly, while sneakers are occasionally confused with sandals or boots. Shirts, on the other hand, are misclassified close to half of the time, predominantly confused with t-shirts, pullovers, and coats.</p>
-</section>
-</section>
-</section>
-<section id="exercise-4-interpreting-model-parameters">
-<h2>Exercise 4: Interpreting model parameters<a class="headerlink" href="#exercise-4-interpreting-model-parameters" title="Permalink to this heading">#</a></h2>
-<p>Finally, we’ll take a closer look at the model parameters, i.e. the coefficients of our linear models. Since we are dealing with 28x28 pixel images, we have to learn 784 coefficients. What do these coefficients mean? We’ll start by plotting them as 28x28 pixel images.</p>
-<section id="exercise-4-1">
-<h3>Exercise 4.1<a class="headerlink" href="#exercise-4-1" title="Permalink to this heading">#</a></h3>
-<p>Train a Logistic Regression model and a Linear SVM using their tuned hyperparameters from exercise 2.
-When in doubt, use <code class="docutils literal notranslate"><span class="pre">C=1e-7</span></code> for LogReg and <code class="docutils literal notranslate"><span class="pre">C=1e-8</span></code> for the SVM.
-Pass the trained model to the provided plotting function. Interpret the results in detail.
-Why do you get multiple plots per model? What do the features represent in your data.
-Does it seems like the models pay attention to the right features?
-Do you models seem to ignore certain features? Do you observe differences in quality between the different classes? Do you observe any differences between the models?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Plots the coefficients of the given model as 28x28 heatmaps. </span>
-<span class="c1"># The `name` attribute is optional, it is simply a title for the produced figure</span>
-<span class="k">def</span> <span class="nf">plot_coefficients</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-    <span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span><span class="mi">10</span><span class="p">,</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">20</span><span class="p">,</span><span class="mi">2</span><span class="p">))</span>
-    <span class="n">fig</span><span class="o">.</span><span class="n">suptitle</span><span class="p">(</span><span class="n">name</span> <span class="k">if</span> <span class="n">name</span> <span class="k">else</span> <span class="n">model</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">ax</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">axes</span><span class="p">):</span>
-        <span class="n">m</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">coef_</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="mi">28</span><span class="p">,</span><span class="mi">28</span><span class="p">))</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">fmnist_classes</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(()),</span> <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(())</span>
-    <span class="n">fig</span><span class="o">.</span><span class="n">colorbar</span><span class="p">(</span><span class="n">m</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="n">axes</span><span class="o">.</span><span class="n">ravel</span><span class="p">()</span><span class="o">.</span><span class="n">tolist</span><span class="p">())</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id8">
-<h4>Solution<a class="headerlink" href="#id8" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_coefficients</span><span class="p">(</span><span class="n">LogisticRegression</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e-7</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">))</span>
-<span class="n">plot_coefficients</span><span class="p">(</span><span class="n">LinearSVC</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e-8</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/80a11a2c179e5f8a77522c05f4f422468c7774b7d3b717ac4d9138733282deb4.png" src="../_images/80a11a2c179e5f8a77522c05f4f422468c7774b7d3b717ac4d9138733282deb4.png" />
-<img alt="../_images/5fd4a64c07608758b6297389dbe7fb7e083e227fac06019b39d123a29001f0f3.png" src="../_images/5fd4a64c07608758b6297389dbe7fb7e083e227fac06019b39d123a29001f0f3.png" />
-</div>
-</div>
-<p>Remember that linear models are typically binary classifiers. They will solve multi-class problems in a one-vs-all approach. Hence, for a 10-class problem, they will build 10 models, each one trained to predict whether an instance is from a specific class or not. This leads to 10 sets of 784 trained coefficients. Above, we plot them as 28x28 matrices, such that each coefficient is plotted at the location of their corresponding pixel value.</p>
-<p>Very high values for coefficients (bright pixels in the images) or very low values (dark pixels in the images)
-cause the corresponding pixel values to have a large effect on the final prediction. In other words, the very bright and very dark pixels in the images are the pixels that the model is mainly ‘looking’ at to make a prediction. We can easily recognize the shapes of the fashion items for each class. For instance, for classifying a t-shirt (yes or no), the model will blow up the pixel values near the edges of the shirt, and especially near the shoulders, while it will suppress the background pixel values near the outlines of the shirt. If the sum of all these values is large, it will likely lead to a positive prediction for that class.</p>
-<p>We can also see that some classes are less defined than others in these images, and these are typically the classes which are easily confused for other classes.</p>
-<p>Both models seem to focus on the same coefficients, yielding very similar images, yet smoother for the SVM.  Moreover, the Linear SVM uses much smaller coefficients.</p>
-<p>Finally, out of curiosity, let’s see the result of underfitting and overfitting on the learned coefficients:</p>
-</section>
-</section>
-<section id="exercise-4-2">
-<h3>Exercise 4.2<a class="headerlink" href="#exercise-4-2" title="Permalink to this heading">#</a></h3>
-<p>Repeat the previous exercise, but now only with logistic regression. In addition to a tuned version, also add a model that overfits a lot and one that underfits a lot. Interpret and explain the results.</p>
-<section id="id9">
-<h4>Solution<a class="headerlink" href="#id9" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_coefficients</span><span class="p">(</span><span class="n">LogisticRegression</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e-12</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">),</span><span class="s2">&quot;Underfitting logistic regression&quot;</span><span class="p">)</span>
-<span class="n">plot_coefficients</span><span class="p">(</span><span class="n">LogisticRegression</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e-7</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">),</span><span class="s2">&quot;Good fit logistic regression&quot;</span><span class="p">)</span>
-<span class="n">plot_coefficients</span><span class="p">(</span><span class="n">LogisticRegression</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">1e+10</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">),</span><span class="s2">&quot;Overfitting logistic regression&quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/6efa631380b4d735e8baac1324069c5b6cc85e79c9aefb1cf59ca5bfb79920f4.png" src="../_images/6efa631380b4d735e8baac1324069c5b6cc85e79c9aefb1cf59ca5bfb79920f4.png" />
-<img alt="../_images/5b2d9c856db975415441a705b307a1a95ea90ec9e3a900fc1e6660bdb2afc73b.png" src="../_images/5b2d9c856db975415441a705b307a1a95ea90ec9e3a900fc1e6660bdb2afc73b.png" />
-<img alt="../_images/9be552872fc073adbe897624a3ba5d60378affd323b34ddfcfb44bb3919878a5.png" src="../_images/9be552872fc073adbe897624a3ba5d60378affd323b34ddfcfb44bb3919878a5.png" />
-</div>
-</div>
-<p>In the case that we underfit the logistic regression model, we see that the model has very strong believes of the shapes. This is evidenced by the many extreme weights (very bright or very dark). In the underfit model a t-shirt has, in addition to the short sleeves, a heigh weight for the bottom of the t-shirt. With the better tuned model (in the middle), the importance of the overall shape is still present, but the emphasis is on <em>just</em> the short sleeves.</p>
-<p>If we overfit the model, it pays attention to seemingly random pixels, including pixels that are simply background pixels. The coefficients are much higher (or much more negative), meaning that the model can yield different predictions for only slight variations in the input pixel value.</p>
-<p>We can expect similar behavior from under- or overfitted linear SVMs.</p>
-</section>
-</section>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#part-2-classification">Part 2: Classification</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-a-quick-benchmark">Exercise 1: A quick benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1">Exercise 1.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-2">Exercise 1.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-3">Exercise 1.3</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-regularization">Exercise 2: Regularization</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-interpreting-misclassifications">Exercise 3: Interpreting misclassifications</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-3">Exercise 3.3.</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id7">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-interpreting-model-parameters">Exercise 4: Interpreting model parameters</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-1">Exercise 4.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id8">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-2">Exercise 4.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id9">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 2 - Tutorial.html b/labs/Lab 2 - Tutorial.html
index 00f09b1f2..71aa2bf52 100644
--- a/labs/Lab 2 - Tutorial.html	
+++ b/labs/Lab 2 - Tutorial.html	
@@ -9,7 +9,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
 
-    <title>Lab 3 Tutorial: Model Selection in scikit-learn &#8212; ML Engineering</title>
+    <title>Lab 2 Tutorial: Model Selection in scikit-learn &#8212; ML Engineering</title>
   
   
   
@@ -65,6 +65,8 @@
     <link rel="shortcut icon" href="../_static/favicon.png"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
+    <link rel="next" title="Lab 4 Tutorial: Data engineering pipelines" href="Lab%204%20-%20Tutorial.html" />
+    <link rel="prev" title="Lab 1: Machine Learning with Python" href="Lab%201%20-%20Tutorial.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -187,7 +189,7 @@
 <li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
+<ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
@@ -201,6 +203,7 @@
 
 
 
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">Lab 2 Tutorial: Model Selection in scikit-learn</a></li>
 <li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
 <li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
 <li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
@@ -418,7 +421,7 @@
               
 
 <div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 3 Tutorial: Model Selection in scikit-learn</h1>
+    <h1>Lab 2 Tutorial: Model Selection in scikit-learn</h1>
     <!-- Table of contents -->
     <div id="print-main-content">
         <div id="jb-print-toc">
@@ -463,8 +466,8 @@ <h2> Contents </h2>
 <div id="searchbox"></div>
                 <article class="bd-article" role="main">
                   
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-3-tutorial-model-selection-in-scikit-learn">
-<h1>Lab 3 Tutorial: Model Selection in scikit-learn<a class="headerlink" href="#lab-3-tutorial-model-selection-in-scikit-learn" title="Permalink to this heading">#</a></h1>
+  <section class="tex2jax_ignore mathjax_ignore" id="lab-2-tutorial-model-selection-in-scikit-learn">
+<h1>Lab 2 Tutorial: Model Selection in scikit-learn<a class="headerlink" href="#lab-2-tutorial-model-selection-in-scikit-learn" title="Permalink to this heading">#</a></h1>
 <div class="cell docutils container">
 <div class="cell_input docutils container">
 <div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># General imports</span>
@@ -1166,6 +1169,24 @@ <h3>Random Search<a class="headerlink" href="#random-search" title="Permalink to
                 <footer class="bd-footer-article">
                   <!-- Previous / next buttons -->
 <div class="prev-next-area">
+    <a class="left-prev"
+       href="Lab%201%20-%20Tutorial.html"
+       title="previous page">
+      <i class="fa-solid fa-angle-left"></i>
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">previous</p>
+        <p class="prev-next-title">Lab 1: Machine Learning with Python</p>
+      </div>
+    </a>
+    <a class="right-next"
+       href="Lab%204%20-%20Tutorial.html"
+       title="next page">
+      <div class="prev-next-info">
+        <p class="prev-next-subtitle">next</p>
+        <p class="prev-next-title">Lab 4 Tutorial: Data engineering pipelines</p>
+      </div>
+      <i class="fa-solid fa-angle-right"></i>
+    </a>
 </div>
                 </footer>
               
diff --git a/labs/Lab 2a - Kernelization Solution.html b/labs/Lab 2a - Kernelization Solution.html
deleted file mode 100644
index c6ec8adec..000000000
--- a/labs/Lab 2a - Kernelization Solution.html	
+++ /dev/null
@@ -1,1026 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 2a: Tuning Support Vector Machines &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>window.MathJax = {"options": {"processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 2a - Kernelization Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 2a - Kernelization Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 2a - Kernelization Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 2a - Kernelization Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 2a: Tuning Support Vector Machines</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#getting-the-data">Getting the data</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-linear-svms">Exercise 1: Linear SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1-linear-svms">Exercise 1.1: Linear SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-kernelized-svms">Exercise 2: Kernelized SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-visualizing-the-fit">Exercise 2: Visualizing the fit</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-visualizing-the-rbf-models-and-hyperparameter-space">Exercise 3: Visualizing the RBF models and hyperparameter space</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-2a-tuning-support-vector-machines">
-<h1>Lab 2a: Tuning Support Vector Machines<a class="headerlink" href="#lab-2a-tuning-support-vector-machines" title="Permalink to this heading">#</a></h1>
-<p>Support Vector Machines are powerful methods, but they also require careful tuning. We’ll explore SVM kernels and hyperparameters on an artificial dataset. We’ll especially look at model underfitting and overfitting.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Auto-setup when running on Google Colab</span>
-<span class="k">if</span> <span class="s1">&#39;google.colab&#39;</span> <span class="ow">in</span> <span class="nb">str</span><span class="p">(</span><span class="n">get_ipython</span><span class="p">()):</span>
-    <span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>openml
-
-<span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">from</span> <span class="nn">matplotlib</span> <span class="kn">import</span> <span class="n">cm</span>
-
-<span class="c1"># Hide convergence warning for now</span>
-<span class="kn">import</span> <span class="nn">warnings</span>
-<span class="kn">from</span> <span class="nn">sklearn.exceptions</span> <span class="kn">import</span> <span class="n">ConvergenceWarning</span>
-<span class="n">warnings</span><span class="o">.</span><span class="n">filterwarnings</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">,</span> <span class="n">category</span><span class="o">=</span><span class="n">ConvergenceWarning</span><span class="p">)</span>
-
-<span class="c1"># Hiding all warnings. Not recommended, just for compilation.</span>
-<span class="k">if</span> <span class="ow">not</span> <span class="n">sys</span><span class="o">.</span><span class="n">warnoptions</span><span class="p">:</span>
-    <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;ignore&quot;</span><span class="p">)</span>
-    <span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;PYTHONWARNINGS&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;ignore&quot;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="getting-the-data">
-<h2>Getting the data<a class="headerlink" href="#getting-the-data" title="Permalink to this heading">#</a></h2>
-<p>We fetch the Banana data from OpenML: <a class="reference external" href="https://www.openml.org/d/1460">https://www.openml.org/d/1460</a></p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">bananas</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">1460</span><span class="p">)</span> <span class="c1"># Banana data has OpenML ID 1460</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">bananas</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">bananas</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>Quick look at the data:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">X</span><span class="p">[:,</span><span class="mi">0</span><span class="p">],</span> <span class="n">X</span><span class="p">[:,</span><span class="mi">1</span><span class="p">],</span> <span class="n">c</span><span class="o">=</span><span class="n">y</span><span class="p">,</span><span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">bwr</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s1">&#39;.&#39;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/694b1c75f3c9d3601c2c41259111616112d476009e17c5ddc523ff74ff7f7057.png" src="../_images/694b1c75f3c9d3601c2c41259111616112d476009e17c5ddc523ff74ff7f7057.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Plotting helpers. Based loosely on https://github.com/amueller/mglearn</span>
-<span class="k">def</span> <span class="nf">plot_svm_kernel</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">title</span><span class="p">,</span> <span class="n">support_vectors</span><span class="p">,</span> <span class="n">decision_function</span><span class="p">,</span> <span class="n">dual_coef</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">show</span><span class="o">=</span><span class="kc">True</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Visualizes the SVM model given the various outputs. It plots:</span>
-<span class="sd">    * All the data point, color coded by class: blue or red</span>
-<span class="sd">    * The support vectors, indicated by circling the points with a black border. </span>
-<span class="sd">      If the dual coefficients are known (only for kernel SVMs) if paints support vectors with high coefficients darker</span>
-<span class="sd">    * The decision function as a blue-to-red gradient. It is white where the decision function is near 0.</span>
-<span class="sd">    * The decision boundary as a full line, and the SVM margins (-1 and +1 values) as a dashed line</span>
-<span class="sd">    </span>
-<span class="sd">    Attributes:</span>
-<span class="sd">    X -- The training data</span>
-<span class="sd">    y -- The correct labels</span>
-<span class="sd">    title -- The plot title</span>
-<span class="sd">    support_vectors -- the list of the coordinates of the support vectores</span>
-<span class="sd">    decision_function - The decision function returned by the SVM</span>
-<span class="sd">    dual_coef -- The dual coefficients of all the support vectors (not relevant for LinearSVM)</span>
-<span class="sd">    show -- whether to plot the figure already or not</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># plot the line, the points, and the nearest vectors to the plane</span>
-    <span class="c1">#plt.figure(fignum, figsize=(5, 5))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="n">title</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">X</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">X</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">],</span> <span class="n">c</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">bwr</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s1">&#39;.&#39;</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">dual_coef</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">support_vectors</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">support_vectors</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">],</span> <span class="n">c</span><span class="o">=</span><span class="n">dual_coef</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="p">:],</span>
-                    <span class="n">s</span><span class="o">=</span><span class="mi">70</span><span class="p">,</span> <span class="n">edgecolors</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">bwr</span><span class="p">)</span>
-    <span class="k">else</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">support_vectors</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">],</span> <span class="n">support_vectors</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">],</span> <span class="n">facecolors</span><span class="o">=</span><span class="s1">&#39;none&#39;</span><span class="p">,</span>
-                    <span class="n">s</span><span class="o">=</span><span class="mi">70</span><span class="p">,</span> <span class="n">edgecolors</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s1">&#39;.&#39;</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">bwr</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">axis</span><span class="p">(</span><span class="s1">&#39;tight&#39;</span><span class="p">)</span>
-    <span class="n">x_min</span><span class="p">,</span> <span class="n">x_max</span> <span class="o">=</span> <span class="o">-</span><span class="mf">3.5</span><span class="p">,</span> <span class="mf">3.5</span>
-    <span class="n">y_min</span><span class="p">,</span> <span class="n">y_max</span> <span class="o">=</span> <span class="o">-</span><span class="mf">3.5</span><span class="p">,</span> <span class="mf">3.5</span>
-
-    <span class="n">XX</span><span class="p">,</span> <span class="n">YY</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mgrid</span><span class="p">[</span><span class="n">x_min</span><span class="p">:</span><span class="n">x_max</span><span class="p">:</span><span class="mi">300</span><span class="n">j</span><span class="p">,</span> <span class="n">y_min</span><span class="p">:</span><span class="n">y_max</span><span class="p">:</span><span class="mi">300</span><span class="n">j</span><span class="p">]</span>
-    <span class="n">Z</span> <span class="o">=</span> <span class="n">decision_function</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">c_</span><span class="p">[</span><span class="n">XX</span><span class="o">.</span><span class="n">ravel</span><span class="p">(),</span> <span class="n">YY</span><span class="o">.</span><span class="n">ravel</span><span class="p">()])</span>
-
-    <span class="c1"># Put the result into a color plot</span>
-    <span class="n">Z</span> <span class="o">=</span> <span class="n">Z</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">XX</span><span class="o">.</span><span class="n">shape</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">contour</span><span class="p">(</span><span class="n">XX</span><span class="p">,</span> <span class="n">YY</span><span class="p">,</span> <span class="n">Z</span><span class="p">,</span> <span class="n">colors</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="s1">&#39;k&#39;</span><span class="p">],</span> <span class="n">linestyles</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;--&#39;</span><span class="p">,</span> <span class="s1">&#39;-&#39;</span><span class="p">,</span> <span class="s1">&#39;--&#39;</span><span class="p">],</span>
-                <span class="n">levels</span><span class="o">=</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">])</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">pcolormesh</span><span class="p">(</span><span class="n">XX</span><span class="p">,</span> <span class="n">YY</span><span class="p">,</span> <span class="n">Z</span><span class="p">,</span> <span class="n">vmin</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">bwr</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.1</span><span class="p">)</span>
-
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlim</span><span class="p">(</span><span class="n">x_min</span><span class="p">,</span> <span class="n">x_max</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">(</span><span class="n">y_min</span><span class="p">,</span> <span class="n">y_max</span><span class="p">)</span>
-    
-    <span class="n">plt</span><span class="o">.</span><span class="n">xticks</span><span class="p">(())</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">yticks</span><span class="p">(())</span>
-
-    <span class="k">if</span> <span class="n">show</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-    
-<span class="k">def</span> <span class="nf">heatmap</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">xlabel</span><span class="p">,</span> <span class="n">ylabel</span><span class="p">,</span> <span class="n">xticklabels</span><span class="p">,</span> <span class="n">yticklabels</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-            <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">fmt</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">%0.2f</span><span class="s2">&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Visualizes the results of a grid search with two hyperparameters as a heatmap.</span>
-<span class="sd">    Attributes:</span>
-<span class="sd">    values -- The test scores</span>
-<span class="sd">    xlabel -- The name of hyperparameter 1</span>
-<span class="sd">    ylabel -- The name of hyperparameter 2</span>
-<span class="sd">    xticklabels -- The values of hyperparameter 1</span>
-<span class="sd">    yticklabels -- The values of hyperparameter 2</span>
-<span class="sd">    cmap -- The matplotlib color map</span>
-<span class="sd">    vmin -- the minimum value</span>
-<span class="sd">    vmax -- the maximum value</span>
-<span class="sd">    ax -- The figure axes to plot on</span>
-<span class="sd">    fmt -- formatting of the score values</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="c1"># plot the mean cross-validation scores</span>
-    <span class="n">img</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">pcolor</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">cmap</span><span class="p">,</span> <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-    <span class="n">img</span><span class="o">.</span><span class="n">update_scalarmappable</span><span class="p">()</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">xlabel</span><span class="p">,</span> <span class="n">fontsize</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">,</span> <span class="n">fontsize</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticklabels</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_aspect</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-    
-    <span class="n">ax</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s1">&#39;y&#39;</span><span class="p">,</span> <span class="n">labelsize</span><span class="o">=</span><span class="mi">12</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">tick_params</span><span class="p">(</span><span class="n">axis</span><span class="o">=</span><span class="s1">&#39;x&#39;</span><span class="p">,</span> <span class="n">labelsize</span><span class="o">=</span><span class="mi">12</span><span class="p">,</span> <span class="n">labelrotation</span><span class="o">=</span><span class="mi">90</span><span class="p">)</span>
-
-    <span class="k">for</span> <span class="n">p</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">img</span><span class="o">.</span><span class="n">get_paths</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_facecolors</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_array</span><span class="p">()):</span>
-        <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">vertices</span><span class="p">[:</span><span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">color</span><span class="p">[:</span><span class="mi">3</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mf">0.5</span><span class="p">:</span>
-            <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;k&#39;</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;w&#39;</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">fmt</span> <span class="o">%</span> <span class="n">value</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">img</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-1-linear-svms">
-<h2>Exercise 1: Linear SVMs<a class="headerlink" href="#exercise-1-linear-svms" title="Permalink to this heading">#</a></h2>
-<p>First, we’ll look at linear SVMs and the different outputs they produce. Check the <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.svm.LinearSVC.html#sklearn.svm.LinearSVC">documentation of LinearSVC</a></p>
-<p>The most important inputs are:</p>
-<ul class="simple">
-<li><p>C – The C hyperparameter controls the misclassification cost and therefore the amount of regularization. Lower values correspond to more regularization</p></li>
-<li><p>loss - The loss function, typically ‘hinge’ or ‘squared_hinge’. Squared hinge is the default. Normal hinge is less strict.</p></li>
-<li><p>dual – Whether to solve the primal optimization problem or the dual (default). The primal is recommended if you have many more data points than features (although our datasets is very small, so it won’t matter much).</p></li>
-</ul>
-<p>The most important outputs are:</p>
-<ul class="simple">
-<li><p>decision_function - The function used to classify any point. In this case on linear SVMs, this corresponds to the learned hyperplane, or <span class="math notranslate nohighlight">\(y = \mathbf{wX} + b\)</span>. It can be evaluated at every point, if the result is positive the point is classified as the positive class and vice versa.</p></li>
-<li><p>coef_ - The model coefficients, i.e. the weights <span class="math notranslate nohighlight">\(\mathbf{w}\)</span></p></li>
-<li><p>intercept_ - the bias <span class="math notranslate nohighlight">\(b\)</span></p></li>
-</ul>
-<p>From the decision function we can find which points are support vectors and which are not: the support vectors are all
-the points that fall inside the margin, i.e. have a decision value between -1 and 1, or that are misclassified. Also see the lecture slides.</p>
-<section id="exercise-1-1-linear-svms">
-<h3>Exercise 1.1: Linear SVMs<a class="headerlink" href="#exercise-1-1-linear-svms" title="Permalink to this heading">#</a></h3>
-<p>Train a LinearSVC with C=0.001 and hinge loss. Then, use the plotting function <code class="docutils literal notranslate"><span class="pre">plot_svm_kernel</span></code> to plot the results. For this you need to extract the support vectors from the decision function. There is a hint below should you get stuck.
-Interpret the plot as detailed as you can. Afterwards you can also try some different settings. You can also try using the primal instead of the dual optimization problem (in that case, use squared hinge loss).</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Hint: how to compute the support vectors from the decision function (ignore if you want to solve this yourself)</span>
-<span class="c1"># support_vector_indices = np.where((2 * y - 1) * clf.decision_function(X) &lt;= 1)[0]</span>
-<span class="c1"># support_vectors = X[support_vector_indices]</span>
-
-<span class="c1"># Note that we can also calculate the decision function manually with the formula y = w*X</span>
-<span class="c1"># decision_function = np.dot(X, clf.coef_[0]) + clf.intercept_[0]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="solution">
-<h4>Solution<a class="headerlink" href="#solution" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;figure.dpi&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">200</span> <span class="c1"># Make figures a bit bigger</span>
-
-<span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">LinearSVC</span>
-<span class="n">clf1_1</span> <span class="o">=</span> <span class="n">LinearSVC</span><span class="p">(</span><span class="n">C</span><span class="o">=</span><span class="mf">0.001</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;hinge&#39;</span><span class="p">)</span>
-<span class="n">clf1_1</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-
-<span class="n">support_vector_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">where</span><span class="p">((</span><span class="mi">2</span> <span class="o">*</span> <span class="n">y</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">clf1_1</span><span class="o">.</span><span class="n">decision_function</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">&lt;=</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-<span class="n">support_vectors</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">support_vector_indices</span><span class="p">]</span>
-
-<span class="n">plot_svm_kernel</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="s2">&quot;Linear SVM&quot;</span><span class="p">,</span><span class="n">support_vectors</span><span class="p">,</span><span class="n">clf1_1</span><span class="o">.</span><span class="n">decision_function</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/83c1ed94f8db18fe2a76a7ad8ee05e6d57d615bb2311bfd8c135c9962c89d60e.png" src="../_images/83c1ed94f8db18fe2a76a7ad8ee05e6d57d615bb2311bfd8c135c9962c89d60e.png" />
-</div>
-</div>
-<p>Interpretation: As expected, the data cannot be fitted well with a linear SVM. Almost all points fall within the margin. Almost all points are support vectors, except for a few blue points on the top right. The accuracy is only 57%.</p>
-</section>
-</section>
-</section>
-<section id="exercise-2-kernelized-svms">
-<h2>Exercise 2: Kernelized SVMs<a class="headerlink" href="#exercise-2-kernelized-svms" title="Permalink to this heading">#</a></h2>
-<p>Check the <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html">documentation of SVC</a></p>
-<p>It has a few more inputs. The most important:</p>
-<ul class="simple">
-<li><p>kernel - It must be either ‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, or your custom defined kernel.</p></li>
-<li><p>gamma - The kernel width of the <code class="docutils literal notranslate"><span class="pre">rbf</span></code> (Gaussian) kernel. Smaller values mean wider kernels.
-Only relevant when selecting the rbf kernel.</p></li>
-<li><p>degree - The degree of the polynomial kernel. Only relevant when selecting the poly kernel.</p></li>
-</ul>
-<p>There also also more outputs that make our lifes easier:</p>
-<ul class="simple">
-<li><p>support_vectors_ - The array of support vectors</p></li>
-<li><p>n_support_ - The number of support vectors per class</p></li>
-<li><p>dual_coef_ - The coefficients of the support vectors (the dual coefficients)</p></li>
-</ul>
-<section id="exercise-2-1">
-<h3>Exercise 2.1<a class="headerlink" href="#exercise-2-1" title="Permalink to this heading">#</a></h3>
-<p>Evaluate different kernels, with their default hyperparameter settings.
-Outputs should be the 5-fold cross validated accuracy scores for the linear kernel (lin_scores), polynomial kernel (poly_scores) and RBF kernel (rbf_scores). Print the mean and variance of the scores and give an initial interpretation of the performance of each kernel.</p>
-<section id="id1">
-<h4>Solution<a class="headerlink" href="#id1" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">#Imports</span>
-<span class="kn">from</span> <span class="nn">sklearn</span> <span class="kn">import</span> <span class="n">svm</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span>
-
-<span class="c1"># Linear kernel</span>
-<span class="n">clf</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">lin_scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-
-<span class="c1"># Polynomial kernel</span>
-<span class="n">clf</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;poly&#39;</span><span class="p">)</span>
-<span class="n">poly_scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-
-<span class="c1"># RBF kernel</span>
-<span class="n">clf</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;rbf&#39;</span><span class="p">)</span>
-<span class="n">rbf_scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC Linear Kernel: </span><span class="si">{:.2f}</span><span class="s2"> +- </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">lin_scores</span><span class="o">.</span><span class="n">mean</span><span class="p">(),</span> <span class="n">np</span><span class="o">.</span><span class="n">var</span><span class="p">(</span><span class="n">lin_scores</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC Polynomial Kernel: </span><span class="si">{:.2f}</span><span class="s2"> +- </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">poly_scores</span><span class="o">.</span><span class="n">mean</span><span class="p">(),</span> <span class="n">np</span><span class="o">.</span><span class="n">var</span><span class="p">(</span><span class="n">poly_scores</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC RBF Kernel: </span><span class="si">{:.2f}</span><span class="s2"> +- </span><span class="si">{:.5f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">rbf_scores</span><span class="o">.</span><span class="n">mean</span><span class="p">(),</span> <span class="n">np</span><span class="o">.</span><span class="n">var</span><span class="p">(</span><span class="n">rbf_scores</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>AUC Linear Kernel: 0.55 +- 0.0000
-AUC Polynomial Kernel: 0.64 +- 0.0000
-AUC RBF Kernel: 0.90 +- 0.00005
-</pre></div>
-</div>
-</div>
-</div>
-<p>The linear kernel has a very low score, and is likely underfitting severely.
-The polynomial kernel does a lot better. The RBF kernel works particularly well, even without any tuning.
-The models are very stable, there is hardly any variance in the scores.</p>
-</section>
-</section>
-</section>
-<section id="exercise-2-visualizing-the-fit">
-<h2>Exercise 2: Visualizing the fit<a class="headerlink" href="#exercise-2-visualizing-the-fit" title="Permalink to this heading">#</a></h2>
-<p>To better understand what the different kernels are doing, let’s visualize their predictions.</p>
-<section id="id2">
-<h3>Exercise 2.1<a class="headerlink" href="#id2" title="Permalink to this heading">#</a></h3>
-<p>Call and fit SVM with linear, polynomial and RBF kernels with default parameter values. For RBF kernel, use kernel coefficient value (gamma) of 2.0. Plot the results for each kernel with “plot_svm_kernel” function. The plots show the predictions made for the different kernels. The background color shows the prediction (blue or red). The full line shows the decision boundary, and the dashed line the margin. The encircled points are the support vectors.</p>
-<section id="id3">
-<h4>Solution<a class="headerlink" href="#id3" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;figure.dpi&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">120</span> <span class="c1"># Make figures a bit bigger</span>
-
-<span class="c1">#Linear</span>
-<span class="n">clf1</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">,</span> <span class="n">C</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">tol</span><span class="o">=</span><span class="mf">1e-3</span><span class="p">)</span>  <span class="c1">#default values for parameters</span>
-<span class="n">clf1</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-<span class="n">plot_svm_kernel</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="s2">&quot;Linear kernel&quot;</span><span class="p">,</span> 
-                <span class="n">clf1</span><span class="o">.</span><span class="n">support_vectors_</span><span class="p">,</span> 
-                <span class="n">clf1</span><span class="o">.</span><span class="n">decision_function</span><span class="p">,</span> <span class="n">clf1</span><span class="o">.</span><span class="n">dual_coef_</span><span class="p">)</span>
-
-<span class="c1">#Polynomial</span>
-<span class="n">clf2</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;poly&#39;</span><span class="p">,</span> <span class="n">C</span><span class="o">=</span><span class="mf">1.0</span><span class="p">)</span>
-<span class="n">clf2</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-<span class="n">plot_svm_kernel</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="s2">&quot;Polynomial kernel&quot;</span><span class="p">,</span> 
-                <span class="n">clf2</span><span class="o">.</span><span class="n">support_vectors_</span><span class="p">,</span> 
-                <span class="n">clf2</span><span class="o">.</span><span class="n">decision_function</span><span class="p">,</span> <span class="n">clf2</span><span class="o">.</span><span class="n">dual_coef_</span><span class="p">)</span>
-
-<span class="c1">#RBF</span>
-<span class="n">clf3</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;rbf&#39;</span><span class="p">,</span> <span class="n">gamma</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">C</span><span class="o">=</span><span class="mf">1.0</span><span class="p">)</span>
-<span class="n">clf3</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">)</span>
-<span class="n">plot_svm_kernel</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="s2">&quot;RBF kernel&quot;</span><span class="p">,</span> 
-                <span class="n">clf3</span><span class="o">.</span><span class="n">support_vectors_</span><span class="p">,</span> 
-                <span class="n">clf3</span><span class="o">.</span><span class="n">decision_function</span><span class="p">,</span> <span class="n">clf3</span><span class="o">.</span><span class="n">dual_coef_</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/41d6bbd6e04a3019614e45f24cd874149b2a7007c4d1e00a66636ff25f500a3a.png" src="../_images/41d6bbd6e04a3019614e45f24cd874149b2a7007c4d1e00a66636ff25f500a3a.png" />
-<img alt="../_images/5867ed814d5072a5c6d42be594087988e7512bc8da232f0e9f0949198b4d5266.png" src="../_images/5867ed814d5072a5c6d42be594087988e7512bc8da232f0e9f0949198b4d5266.png" />
-<img alt="../_images/8e5a6f1eb09ba37c60e6c69363f53f73c891efeaa4b2f4b43605cc086140e6e0.png" src="../_images/8e5a6f1eb09ba37c60e6c69363f53f73c891efeaa4b2f4b43605cc086140e6e0.png" />
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-2-2">
-<h3>Exercise 2.2<a class="headerlink" href="#exercise-2-2" title="Permalink to this heading">#</a></h3>
-<p>Interpret the plots for each kernel. Think of ways to improve the results.</p>
-<section id="id4">
-<h4>Solution<a class="headerlink" href="#id4" title="Permalink to this heading">#</a></h4>
-<p><strong>Linear</strong>: It’s clear that this data is not linearly separable. The linear SVM is badly underfitting. There also appear to be some optimization issues, as the decision boundary lies way outside of the image, and there is a group of non-support vectors that should be support vectors. Forcing more optimization (by decreasing tolerance of the stopping criterion <code class="docutils literal notranslate"><span class="pre">tol</span></code>) yields slightly better results, but will also slow down the optimization (try it of you like).</p>
-<p><strong>Polynomial</strong>: A slightly better fit, but clearly polynomials aren’t the best fit either. They divide the space in subspaces that don’t capture the banana shapes at all.</p>
-<p><strong>RBF</strong>: Works very nicely, and the default settings seem to actually hit the sweet spot. We should still try to tune C and gamma.</p>
-</section>
-</section>
-</section>
-<section id="exercise-3-visualizing-the-rbf-models-and-hyperparameter-space">
-<h2>Exercise 3: Visualizing the RBF models and hyperparameter space<a class="headerlink" href="#exercise-3-visualizing-the-rbf-models-and-hyperparameter-space" title="Permalink to this heading">#</a></h2>
-<p>Select the RBF kernel and optimize the two most important hyperparameters (the 𝐶 parameter and the kernel width 𝛾 ).</p>
-<p>Hint: values for C and <span class="math notranslate nohighlight">\(\gamma\)</span> are typically in [<span class="math notranslate nohighlight">\(2^{-15}..2^{15}\)</span>] on a log scale.</p>
-<section id="exercise-3-1">
-<h3>Exercise 3.1<a class="headerlink" href="#exercise-3-1" title="Permalink to this heading">#</a></h3>
-<p>First try 3 very different values for <span class="math notranslate nohighlight">\(C\)</span> and <span class="math notranslate nohighlight">\(\gamma\)</span> (for instance [1e-3,1,1e3]). For each of the 9 combinations, create the same RBF plot as before to understand what the model is doing. Also create a standard train-test split and report the train and test score. Explain the performance results. When are you over/underfitting? Can you see this in the predictions?</p>
-<section id="id5">
-<h4>Solution<a class="headerlink" href="#id5" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span>
-
-<span class="c1"># For convenience we&#39;ll plot the results in a 3x3 grid</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">15</span><span class="p">,</span> <span class="mi">10</span><span class="p">))</span>
-<span class="n">fig_num</span> <span class="o">=</span> <span class="mi">0</span>
-
-<span class="c1"># build a standard stratified train-test split</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-
-<span class="k">for</span> <span class="n">c</span> <span class="ow">in</span> <span class="p">[</span><span class="mf">0.001</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">1000</span><span class="p">]:</span>
-    <span class="k">for</span> <span class="n">gamma</span> <span class="ow">in</span> <span class="p">[</span><span class="mf">0.001</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="mi">1000</span><span class="p">]:</span>
-        <span class="n">fig_num</span> <span class="o">+=</span> <span class="mi">1</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">subplot</span><span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">,</span> <span class="n">fig_num</span><span class="p">)</span> <span class="c1"># plot in a 3x3 grid</span>
-        <span class="n">clf4</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;rbf&#39;</span><span class="p">,</span><span class="n">C</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="n">c</span><span class="p">),</span><span class="n">gamma</span><span class="o">=</span><span class="nb">float</span><span class="p">(</span><span class="n">gamma</span><span class="p">))</span> <span class="c1"># setup and fit the model</span>
-        <span class="n">clf4</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-        <span class="n">plot_svm_kernel</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">,</span><span class="s2">&quot;C=</span><span class="si">{}</span><span class="s2">, g=</span><span class="si">{}</span><span class="s2">, trainACC </span><span class="si">{:.2f}</span><span class="s2">, testACC </span><span class="si">{:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">c</span><span class="p">,</span><span class="n">gamma</span><span class="p">,</span><span class="n">clf4</span><span class="o">.</span><span class="n">score</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">),</span> <span class="n">clf4</span><span class="o">.</span><span class="n">score</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span><span class="n">y_test</span><span class="p">)),</span> 
-                <span class="n">clf4</span><span class="o">.</span><span class="n">support_vectors_</span><span class="p">,</span> <span class="n">clf4</span><span class="o">.</span><span class="n">decision_function</span><span class="p">,</span> <span class="n">clf4</span><span class="o">.</span><span class="n">dual_coef_</span><span class="p">,</span> <span class="n">show</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-        
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/75158ca0b5de067bf9f731e23f6b68105d374dd4f0477b1fc88c0a645b56c3f4.png" src="../_images/75158ca0b5de067bf9f731e23f6b68105d374dd4f0477b1fc88c0a645b56c3f4.png" />
-</div>
-</div>
-<ul class="simple">
-<li><p>For C = 0.001 (top row), the SVM is always underfitting. The boundaries look very different but all are underfitting because they are over-regularized.</p></li>
-<li><p>For gamma = 1000 (narrow Gaussians, right column), almost all datapoints are support vectors, For higher values of C, they are clearly overfitting: the decision boundaries are islands around each point, the model predicts 0 everywhere else.</p></li>
-<li><p>The best results are found for medium C, medium gamma. This also yields the fewest support vectors. The decision boundaries show that it captures the banana shapes well.</p></li>
-<li><p>Large C values (bottom row) tend to cause more overfitting unless gamma is very small. These two types of regularization clearly interact with each other.</p></li>
-<li><p>For gamma=1, you can also see that the margins for C=1000 are much more narrow than those for C=1. Although not visible in the scores, it is clear that the center model (with the larger margins) will generalize better.</p></li>
-</ul>
-</section>
-</section>
-<section id="exercise-3-2">
-<h3>Exercise 3.2<a class="headerlink" href="#exercise-3-2" title="Permalink to this heading">#</a></h3>
-<p>Optimize the hyperparameters using a grid search, trying every possible combination of C and gamma. Show a heatmap of the results and report the optimal hyperparameter values. Use at least 10 values for <span class="math notranslate nohighlight">\(C\)</span> and <span class="math notranslate nohighlight">\(\gamma\)</span> in [<span class="math notranslate nohighlight">\(2^{-15}..2^{15}\)</span>] on a log scale. Report accuracy under 3-fold CV. We recommend to use sklearn’s <a class="reference external" href="https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html">GridSearchCV</a> and the <code class="docutils literal notranslate"><span class="pre">heatmap</span></code> function defined above. Check their documentation.</p>
-<section id="id6">
-<h4>Solution<a class="headerlink" href="#id6" title="Permalink to this heading">#</a></h4>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">GridSearchCV</span>
-
-<span class="c1"># Define and fit a grid search with 3-fold cross validation for SVM - RBF kernel. </span>
-<span class="c1"># Quite a detailed grid search. May take a while.</span>
-<span class="n">svc</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">SVC</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="s1">&#39;rbf&#39;</span><span class="p">)</span>
-<span class="n">resolution</span> <span class="o">=</span> <span class="mi">25</span>
-<span class="n">param_grid</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;C&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">,</span><span class="n">resolution</span><span class="p">,</span><span class="n">base</span><span class="o">=</span><span class="mi">2</span><span class="p">),</span>
-              <span class="s1">&#39;gamma&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">12</span><span class="p">,</span><span class="mi">12</span><span class="p">,</span><span class="n">resolution</span><span class="p">,</span><span class="n">base</span><span class="o">=</span><span class="mi">2</span><span class="p">)}</span>
-<span class="n">grid_search</span> <span class="o">=</span> <span class="n">GridSearchCV</span><span class="p">(</span><span class="n">svc</span><span class="p">,</span> <span class="n">param_grid</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;accuracy&#39;</span><span class="p">);</span>
-<span class="n">grid_search</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">#Plot with heatmap</span>
-<span class="n">results</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">grid_search</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">)</span>
-<span class="n">scores</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">results</span><span class="o">.</span><span class="n">mean_test_score</span><span class="p">)</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">resolution</span><span class="p">,</span> <span class="n">resolution</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s1">&#39;font.size&#39;</span><span class="p">:</span> <span class="mi">18</span><span class="p">})</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">13</span><span class="p">,</span> <span class="mi">13</span><span class="p">))</span>
-<span class="n">heatmap</span><span class="p">(</span><span class="n">scores</span><span class="p">,</span> <span class="n">xlabel</span><span class="o">=</span><span class="s1">&#39;gamma&#39;</span><span class="p">,</span> <span class="n">xticklabels</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">around</span><span class="p">(</span><span class="n">param_grid</span><span class="p">[</span><span class="s1">&#39;gamma&#39;</span><span class="p">],</span><span class="mi">4</span><span class="p">),</span>
-                      <span class="n">ylabel</span><span class="o">=</span><span class="s1">&#39;C&#39;</span><span class="p">,</span> <span class="n">yticklabels</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">around</span><span class="p">(</span><span class="n">param_grid</span><span class="p">[</span><span class="s1">&#39;C&#39;</span><span class="p">],</span><span class="mi">4</span><span class="p">),</span> <span class="n">cmap</span><span class="o">=</span><span class="s2">&quot;viridis&quot;</span><span class="p">,</span> <span class="n">fmt</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">%.2f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="n">axes</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/ba3f777d5bd95ab10d87abb5045a76790e1c4c6cd0fab1babc992ae115a33fb8.png" src="../_images/ba3f777d5bd95ab10d87abb5045a76790e1c4c6cd0fab1babc992ae115a33fb8.png" />
-</div>
-</div>
-<p>We can see that there isn’t really an simple optimal peak in the C-gamma space, but rather a ‘ridge’ of optimal performance. For instance, (gamma=0.25, C=4096) has top performance,
-but so does (gamma=2.0, C=0.25).</p>
-</section>
-</section>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#getting-the-data">Getting the data</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-linear-svms">Exercise 1: Linear SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-1-linear-svms">Exercise 1.1: Linear SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#solution">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-kernelized-svms">Exercise 2: Kernelized SVMs</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-1">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-visualizing-the-fit">Exercise 2: Visualizing the fit</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Exercise 2.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-2">Exercise 2.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id4">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-visualizing-the-rbf-models-and-hyperparameter-space">Exercise 3: Visualizing the RBF models and hyperparameter space</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-1">Exercise 3.1</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id5">Solution</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-2">Exercise 3.2</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#id6">Solution</a></li>
-</ul>
-</li>
-</ul>
-</li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 2b - Model Selection Solution.html b/labs/Lab 2b - Model Selection Solution.html
deleted file mode 100644
index bd7a622b3..000000000
--- a/labs/Lab 2b - Model Selection Solution.html	
+++ /dev/null
@@ -1,953 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 2b: Model selection: dark matter &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>window.MathJax = {"options": {"processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 2b - Model Selection Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 2b - Model Selection Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 2b - Model Selection Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 2b - Model Selection Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 2b: Model selection: dark matter</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-metrics">Exercise 1: Metrics</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-preprocessing">Exercise 2: Preprocessing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-hyperparameter-optimization">Exercise 3: Hyperparameter optimization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-threshold-calibration">Exercise 4: Threshold calibration</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-cost-function">Exercise 5: Cost function</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-2b-model-selection-dark-matter">
-<h1>Lab 2b: Model selection: dark matter<a class="headerlink" href="#lab-2b-model-selection-dark-matter" title="Permalink to this heading">#</a></h1>
-<p>We’ll use the MAGIC telescope dataset (<a class="reference external" href="http://www.openml.org/d/1120">http://www.openml.org/d/1120</a>). The task is to classifying gamma rays, which consist of high-energy particles. When they hit our atmosphere, they produce chain reactions of other particles called ‘showers’. However, similar showers are also produced by other particles (hadrons). We want to be able to detect which ones originate from gamma rays and which ones come from background radiation. To do this, the observed shower patterns are observed and converted into 10 numeric features. You need to detect whether these are gamma rays or background radiation. This is a key aspect of research into dark matter, which is believed to generate such gamma rays. If we can detect where they occur, we can build a map of the origins of gamma radiation, and locate where dark matter may occur in the observed universe. However, we’ll first need to accurately detect these gamma rays first.</p>
-<p>A quick visualization of the features is shown below. Note that this is not a time series, we just plot the instances in the order they occur in the dataset. The first 12500 or so are examples of signal (gamma), the final 6700 or so are background (hadrons).</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">from</span> <span class="nn">preamble</span> <span class="kn">import</span> <span class="o">*</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;figure.dpi&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">100</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download MAGIC Telescope data from OpenML. You can repeat this analysis with any other OpenML classification dataset.</span>
-<span class="n">magic</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">1120</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">magic</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">magic</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span> 
-<span class="n">attribute_names</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span><span class="n">f</span> <span class="ow">in</span> <span class="n">magic</span><span class="o">.</span><span class="n">features</span><span class="o">.</span><span class="n">items</span><span class="p">()][:</span><span class="o">-</span><span class="mi">1</span><span class="p">][</span><span class="mi">1</span><span class="p">:]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Quick visualization of the features (top) and the target (bottom)</span>
-<span class="n">magic_df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">columns</span><span class="o">=</span><span class="n">attribute_names</span><span class="p">)</span>
-<span class="n">magic_df</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">6</span><span class="p">))</span>
-<span class="c1"># Also plot the target: 1 = background, 0 = gamma</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">y</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span><span class="mi">1</span><span class="p">));</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/aea41e3795dfde0202769680c3cabdffa37e3e235090bc91b1b10532ae6fb365.png" src="../_images/aea41e3795dfde0202769680c3cabdffa37e3e235090bc91b1b10532ae6fb365.png" />
-<img alt="../_images/6edb23999cbfb410b472df340710d46407f4309709d9ec9d7843491691b5c6fa.png" src="../_images/6edb23999cbfb410b472df340710d46407f4309709d9ec9d7843491691b5c6fa.png" />
-</div>
-</div>
-<section id="exercise-1-metrics">
-<h2>Exercise 1: Metrics<a class="headerlink" href="#exercise-1-metrics" title="Permalink to this heading">#</a></h2>
-<p>Train and evaluate an SVM with RBF kernel (default hyperparameters) using a standard 25% holdout. Report the accuracy, precision, recall, F1 score, and area under the ROC curve (AUC).</p>
-<p>Answer the following questions:</p>
-<ul class="simple">
-<li><p>How many of the detected gamma rays are actually real gamma rays?</p></li>
-<li><p>How many of all the gamma rays are we detecting?</p></li>
-<li><p>How many false positives and false negatives occur?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">accuracy_score</span><span class="p">,</span> <span class="n">f1_score</span><span class="p">,</span> <span class="n">precision_score</span><span class="p">,</span> <span class="n">recall_score</span><span class="p">,</span> <span class="n">roc_auc_score</span>
-<span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">SVC</span>
-
-<span class="c1"># Default train-test split</span>
-<span class="c1"># This is classification, so we definitely want to use stratification again.</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span>
-    <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-
-<span class="c1"># Train the SVM and retrieve the predictions</span>
-<span class="n">svm</span> <span class="o">=</span> <span class="n">SVC</span><span class="p">()</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Get the scores by comparing the predictions y_pred with the ground truth y_test</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Accuracy: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Precision: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">precision_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Recall: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">recall_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;F1 score: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">f1_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">roc_auc_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Accuracy: 0.824
-Precision: 0.878
-Recall: 0.581
-F1 score: 0.700
-AUC: 0.769
-</pre></div>
-</div>
-</div>
-</div>
-<blockquote>
-<div><p>How many of the detected gamma rays are actually real gamma rays?</p>
-</div></blockquote>
-<p>This is precision. Hence, about 88%.</p>
-<blockquote>
-<div><p>How many of all the gamma rays are we detecting?</p>
-</div></blockquote>
-<p>This is recall. Hence, about 58%. That doesn’t seem useful at all.</p>
-<blockquote>
-<div><p>How many false positives and false negatives occur?</p>
-</div></blockquote>
-<p>This we can retrieve from the confusion matrix. Remember that in sklearn, the classes are ordered numerically, so the first class is 0 (negative), the second is 1 (positive). That means that the false positives are on row 0, column 1.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">confusion_matrix</span>
-<span class="n">cm</span> <span class="o">=</span> <span class="n">confusion_matrix</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;There are </span><span class="si">{}</span><span class="s2"> false positives and </span><span class="si">{}</span><span class="s2"> false negatives&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">cm</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span><span class="mi">1</span><span class="p">],</span><span class="n">cm</span><span class="p">[</span><span class="mi">1</span><span class="p">,</span><span class="mi">0</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>There are 135 false positives and 700 false negatives
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-2-preprocessing">
-<h2>Exercise 2: Preprocessing<a class="headerlink" href="#exercise-2-preprocessing" title="Permalink to this heading">#</a></h2>
-<p>SVMs require scaling to perform well. For now, use the following code to scale the data (we’ll get back to this in the lab about preprocessing and pipelines). Repeat question 2 on the scaled data. Have the results improved?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.preprocessing</span> <span class="kn">import</span> <span class="n">StandardScaler</span>
-<span class="c1"># Important here is to fit the scaler on the training data alone</span>
-<span class="c1"># Then, use it to scale both the training set and test set</span>
-<span class="c1"># This assumes that you named your training set X_train. Adapt if needed.</span>
-<span class="n">scaler</span> <span class="o">=</span> <span class="n">StandardScaler</span><span class="p">()</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">)</span>
-<span class="n">Xs_train</span> <span class="o">=</span> <span class="n">scaler</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">X_train</span><span class="p">)</span>
-<span class="n">Xs_test</span> <span class="o">=</span> <span class="n">scaler</span><span class="o">.</span><span class="n">transform</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Train the SVM and retrieve the predictions</span>
-<span class="n">svm</span> <span class="o">=</span> <span class="n">SVC</span><span class="p">()</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">Xs_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">svm</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">Xs_test</span><span class="p">)</span>
-
-<span class="c1"># Get the scores by comparing the predictions y_pred with the ground truth y_test</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Accuracy: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Precision: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">precision_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Recall: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">recall_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;F1 score: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">f1_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">roc_auc_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Accuracy: 0.872
-Precision: 0.903
-Recall: 0.711
-F1 score: 0.796
-AUC: 0.835
-</pre></div>
-</div>
-</div>
-</div>
-<p>All scores have improved significantly!</p>
-</section>
-<section id="exercise-3-hyperparameter-optimization">
-<h2>Exercise 3: Hyperparameter optimization<a class="headerlink" href="#exercise-3-hyperparameter-optimization" title="Permalink to this heading">#</a></h2>
-<p>Use 50 iterations of random search to tune the <span class="math notranslate nohighlight">\(C\)</span> and <span class="math notranslate nohighlight">\(gamma\)</span> hyperparameters on the scaled training data. Vary both on a log scale (e.g. from 2^-12 to 2^12). Optimize on AUC and use 3 cross-validation (CV) folds for the inner CV to estimate performance. For the outer loop, just use the train-test split you used before (hence, no nested CV). Report the best hyperparameters and the corresponding AUC score. Is it better than the default? Finally, use them to evaluate the model on the held-out test set, for all 5 metrics we used before.</p>
-<p>Extra challenge: plot the samples used by the random search (<span class="math notranslate nohighlight">\(C\)</span> vs <span class="math notranslate nohighlight">\(gamma\)</span>)</p>
-<p>Note: The reason we don’t use a nested CV just yet is because we would need to rebuild the scaled training and test set multiple times. This is tedious, unless we use pipelines, which we’ll cover in a future lab.</p>
-<p>Let’s start with the challenge question and plot the set of points selected by randomsearch.
-We use a loguniform distribution, which returns values uniformly on a log scale, between 1e-12 and 1e12. To sample randomly from this distibution, we use the random value sample function rvs().</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># With scipy 1.4, you can use scipy.stats.loguniform instead</span>
-<span class="kn">from</span> <span class="nn">sklearn.utils.fixes</span> <span class="kn">import</span> <span class="n">loguniform</span>
-
-<span class="n">c_samples</span> <span class="o">=</span> <span class="n">loguniform</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e4</span><span class="p">)</span><span class="o">.</span><span class="n">rvs</span><span class="p">(</span><span class="n">size</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span>
-<span class="n">g_samples</span> <span class="o">=</span> <span class="n">loguniform</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e12</span><span class="p">)</span><span class="o">.</span><span class="n">rvs</span><span class="p">(</span><span class="n">size</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span>
-
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">()</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">c_samples</span><span class="p">,</span><span class="n">g_samples</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;C&quot;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s2">&quot;gamma&quot;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlim</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e4</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_ylim</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e12</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xscale</span><span class="p">(</span><span class="s1">&#39;log&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yscale</span><span class="p">(</span><span class="s1">&#39;log&#39;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/9dd3b6bfa17102d3f4fea8a5af3f9ecd5ff933793eb1491e20f3f185c5d2d8c1.png" src="../_images/9dd3b6bfa17102d3f4fea8a5af3f9ecd5ff933793eb1491e20f3f185c5d2d8c1.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">RandomizedSearchCV</span>
-<span class="c1"># We use the loguniform distribution</span>
-<span class="c1"># You could also use a large fixed grid [1e-12, 1e-11,...]</span>
-<span class="c1"># Large C values slow down training, so we&#39;ll limit it to 1e4</span>
-<span class="n">param_grid</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;C&#39;</span><span class="p">:</span> <span class="n">loguniform</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e4</span><span class="p">),</span> <span class="s1">&#39;gamma&#39;</span><span class="p">:</span> <span class="n">loguniform</span><span class="p">(</span><span class="mf">1e-12</span><span class="p">,</span> <span class="mf">1e12</span><span class="p">)}</span>
-
-<span class="c1"># Set cv to 3 to do 3-fold CV</span>
-<span class="c1"># Set scoring to &#39;roc_auc&#39; to optimize AUC</span>
-<span class="c1"># Set n_iter to 50 to do 50 iterations</span>
-<span class="c1"># njobs = -1 allows parallellization</span>
-<span class="c1"># Optionally, set a verbosity level to see intermediate output </span>
-<span class="n">rs</span> <span class="o">=</span> <span class="n">RandomizedSearchCV</span><span class="p">(</span><span class="n">SVC</span><span class="p">(),</span> <span class="n">param_grid</span><span class="p">,</span> <span class="n">n_iter</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;roc_auc&#39;</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">rs</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">Xs_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Fitting 3 folds for each of 50 candidates, totalling 150 fits
-</pre></div>
-</div>
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[Parallel(n_jobs=-1)]: Using backend LokyBackend with 4 concurrent workers.
-[Parallel(n_jobs=-1)]: Done  33 tasks      | elapsed:   46.0s
-[Parallel(n_jobs=-1)]: Done 150 out of 150 | elapsed:  3.8min finished
-</pre></div>
-</div>
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>RandomizedSearchCV(cv=3, estimator=SVC(), n_iter=50, n_jobs=-1,
-                   param_distributions={&#39;C&#39;: &lt;scipy.stats._distn_infrastructure.rv_frozen object at 0x7fca10e3ebe0&gt;,
-                                        &#39;gamma&#39;: &lt;scipy.stats._distn_infrastructure.rv_frozen object at 0x7fca114786d8&gt;},
-                   scoring=&#39;roc_auc&#39;, verbose=2)
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Best score: </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="p">,</span><span class="n">rs</span><span class="o">.</span><span class="n">best_score_</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Best hyperparameters:&quot;</span><span class="p">,</span> <span class="n">rs</span><span class="o">.</span><span class="n">best_params_</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Best score: {:.4f} 0.9101131972886245
-Best hyperparameters: {&#39;C&#39;: 462.63302228870276, &#39;gamma&#39;: 0.0035856241778658205}
-</pre></div>
-</div>
-</div>
-</div>
-<p>AUC is indeed a lot better than we found before, but note that is the score of the inner CV, not the test set.</p>
-<p>Out of interest: are these optimal values close to the defaults we used before? The SVC implementation uses a good heuristic for the defaults: 1 / (n_features * X.var())</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Default gamma: &quot;</span><span class="p">,</span><span class="n">svm</span><span class="o">.</span><span class="n">_gamma</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Default C: &quot;</span><span class="p">,</span><span class="n">svm</span><span class="o">.</span><span class="n">C</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Default gamma:  0.0999999999483963
-Default C:  1.0
-</pre></div>
-</div>
-</div>
-</div>
-<p>Our tuned hyperparameters end up with quite different values.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Get best estimator, train on the full training set, and evaluate on the test set</span>
-<span class="n">best_svm</span> <span class="o">=</span> <span class="n">rs</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">Xs_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">best_svm</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">Xs_test</span><span class="p">)</span>
-
-<span class="c1"># Get the scores by comparing the predictions y_pred with the ground truth y_test</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Accuracy: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Precision: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">precision_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Recall: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">recall_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;F1 score: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">f1_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">roc_auc_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Accuracy: 0.868
-Precision: 0.903
-Recall: 0.700
-F1 score: 0.789
-AUC: 0.830
-</pre></div>
-</div>
-</div>
-</div>
-<p>The scores on the test set are slightly lower than we observed before. This likely means that we are overfitting the hyperparameters on the single train test split. Do keep in mind that the result on a single held out test set should be treated with care. It would be best to also do an outer CV to get a better estimate.</p>
-</section>
-<section id="exercise-4-threshold-calibration">
-<h2>Exercise 4: Threshold calibration<a class="headerlink" href="#exercise-4-threshold-calibration" title="Permalink to this heading">#</a></h2>
-<p>First, plot the Precision-Recall curve for the SVM using the default parameters on the scaled data. Then, calibrate the threshold to find a solution that yields better recall without sacrificing too much precision.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">precision_recall_curve</span>
-
-<span class="c1"># Train model</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">SVC</span><span class="p">()</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">Xs_train</span><span class="p">,</span><span class="n">y_train</span><span class="p">)</span>
-
-<span class="c1"># SVC is not probabilistic, so we use the decision function to get the ROC curve</span>
-<span class="n">precision</span><span class="p">,</span> <span class="n">recall</span><span class="p">,</span> <span class="n">thresholds</span> <span class="o">=</span> <span class="n">precision_recall_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">model</span><span class="o">.</span><span class="n">decision_function</span><span class="p">(</span><span class="n">Xs_test</span><span class="p">))</span>
-<span class="c1"># Find threshold closest to 0</span>
-<span class="n">close_zero</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">recall</span><span class="p">[</span><span class="n">close_zero</span><span class="p">],</span> <span class="n">precision</span><span class="p">[</span><span class="n">close_zero</span><span class="p">],</span> <span class="s1">&#39;o&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold zero&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-<span class="n">threshold</span> <span class="o">=</span> <span class="o">-</span><span class="mf">0.28</span>
-<span class="n">close_t</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds</span><span class="o">-</span><span class="n">threshold</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">recall</span><span class="p">[</span><span class="n">close_t</span><span class="p">],</span> <span class="n">precision</span><span class="p">[</span><span class="n">close_t</span><span class="p">],</span> <span class="s1">&#39;^&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;better threshold&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-<span class="n">threshold</span> <span class="o">=</span> <span class="o">-</span><span class="mf">1.175</span>
-<span class="n">close_t</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds</span><span class="o">-</span><span class="n">threshold</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">recall</span><span class="p">[</span><span class="n">close_t</span><span class="p">],</span> <span class="n">precision</span><span class="p">[</span><span class="n">close_t</span><span class="p">],</span> <span class="s1">&#39;s&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold -1.175&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">recall</span><span class="p">,</span> <span class="n">precision</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC curve&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;Precision&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Recall&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="s2">&quot;best&quot;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/799246109b97f6bb845f2bf048384e8edd8e78be7e52556398ceb9cc184e8845.png" src="../_images/799246109b97f6bb845f2bf048384e8edd8e78be7e52556398ceb9cc184e8845.png" />
-</div>
-</div>
-<p>The Precision-recall curve is really smooth. Every improvement in recall will equally reduce precision. We can move a little bit to the right. There is a small drop around threshold -0.28. That means we will be predicting more points as positive.</p>
-</section>
-<section id="exercise-5-cost-function">
-<h2>Exercise 5: Cost function<a class="headerlink" href="#exercise-5-cost-function" title="Permalink to this heading">#</a></h2>
-<p>Assume that a false negative is twice as bad (costly) than a false positive. I.e. we would rather waste time checking gamma ray sources that are not real, than missing an interesting gamma ray source. Use ROC analysis to find the optimal threshold under this assumption.</p>
-<p>Finally, let the model make predictions using the optimal threshold and report all 5 scores. Is recall better now? Did we lose a lot of precision?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">roc_curve</span>
-
-<span class="c1"># Reusing code for the lecture notebook</span>
-<span class="c1"># Cost function, give the cost for FN and FP</span>
-<span class="k">def</span> <span class="nf">cost</span><span class="p">(</span><span class="n">fpr</span><span class="p">,</span> <span class="n">tpr</span><span class="p">,</span> <span class="n">cost_FN</span><span class="p">,</span> <span class="n">cost_FP</span><span class="p">,</span> <span class="n">ratio_P</span><span class="p">):</span>
-    <span class="k">return</span> <span class="n">fpr</span> <span class="o">*</span> <span class="n">cost_FP</span> <span class="o">*</span> <span class="n">ratio_P</span> <span class="o">+</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">tpr</span><span class="p">)</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">-</span> <span class="n">ratio_P</span><span class="p">)</span> <span class="o">*</span> <span class="n">cost_FN</span><span class="p">;</span>
-
-<span class="k">def</span> <span class="nf">plot_isometrics</span><span class="p">(</span><span class="n">c_FN</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">c_FP</span><span class="o">=</span><span class="mi">1</span><span class="p">):</span>
-    <span class="c1"># Build the ROC curve for the trained model</span>
-    <span class="n">fpr</span><span class="p">,</span> <span class="n">tpr</span><span class="p">,</span> <span class="n">thresholds</span> <span class="o">=</span> <span class="n">roc_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">model</span><span class="o">.</span><span class="n">decision_function</span><span class="p">(</span><span class="n">Xs_test</span><span class="p">))</span>
-
-    <span class="c1"># Compute costs</span>
-    <span class="n">ratio_P</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">y_test</span><span class="p">[</span><span class="n">y_test</span><span class="o">==</span><span class="mi">1</span><span class="p">])</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">y_test</span><span class="p">)</span>
-    <span class="n">costs</span> <span class="o">=</span> <span class="p">[</span><span class="n">cost</span><span class="p">(</span><span class="n">fpr</span><span class="p">[</span><span class="n">x</span><span class="p">],</span><span class="n">tpr</span><span class="p">[</span><span class="n">x</span><span class="p">],</span><span class="n">c_FN</span><span class="p">,</span><span class="n">c_FP</span><span class="p">,</span> <span class="n">ratio_P</span><span class="p">)</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">thresholds</span><span class="p">))]</span>
-    
-    <span class="c1"># Get optimal cost and threshold</span>
-    <span class="n">min_cost</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">min</span><span class="p">(</span><span class="n">costs</span><span class="p">)</span>
-    <span class="n">min_thres</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">costs</span><span class="p">)</span>
-    <span class="n">min_thres_val</span> <span class="o">=</span> <span class="n">thresholds</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">costs</span><span class="p">)]</span>
-
-    <span class="c1"># plot contours</span>
-    <span class="n">x</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.1</span><span class="p">,</span> <span class="mf">0.1</span><span class="p">)</span>
-    <span class="n">y</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.1</span><span class="p">,</span> <span class="mf">0.1</span><span class="p">)</span>
-    <span class="n">XX</span><span class="p">,</span> <span class="n">YY</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">meshgrid</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-    <span class="n">costs</span> <span class="o">=</span> <span class="p">[</span><span class="n">cost</span><span class="p">(</span><span class="n">f</span><span class="p">,</span> <span class="n">t</span><span class="p">,</span> <span class="n">c_FN</span><span class="p">,</span> <span class="n">c_FP</span><span class="p">,</span> <span class="n">ratio_P</span><span class="p">)</span> <span class="k">for</span> <span class="n">f</span><span class="p">,</span> <span class="n">t</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">XX</span><span class="p">,</span><span class="n">YY</span><span class="p">)]</span>
-
-    <span class="c1"># plot all together</span>
-    <span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">9</span><span class="p">,</span> <span class="mi">3</span><span class="p">))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr</span><span class="p">,</span> <span class="n">tpr</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC Curve&quot;</span><span class="p">)</span>
-    <span class="n">levels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">costs</span><span class="p">)</span><span class="o">.</span><span class="n">min</span><span class="p">(),</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">costs</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">(),</span> <span class="mi">10</span><span class="p">)</span>
-    <span class="n">levels</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sort</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">levels</span><span class="p">,</span> <span class="n">min_cost</span><span class="p">))</span>
-    <span class="n">CS</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">contour</span><span class="p">(</span><span class="n">XX</span><span class="p">,</span> <span class="n">YY</span><span class="p">,</span> <span class="n">costs</span><span class="p">,</span> <span class="n">levels</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">clabel</span><span class="p">(</span><span class="n">CS</span><span class="p">,</span> <span class="n">inline</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">fontsize</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;FPR&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;TPR (recall)&quot;</span><span class="p">)</span>
-    <span class="c1"># find threshold closest to zero:</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr</span><span class="p">[</span><span class="n">min_thres</span><span class="p">],</span> <span class="n">tpr</span><span class="p">[</span><span class="n">min_thres</span><span class="p">],</span> <span class="s1">&#39;o&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span>
-             <span class="n">label</span><span class="o">=</span><span class="s2">&quot;optimal: </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">min_thres_val</span><span class="p">),</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="mi">4</span><span class="p">);</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="s2">&quot;Isometrics, cost_FN: </span><span class="si">{}</span><span class="s2">, cost_FP: </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">c_FN</span><span class="p">,</span> <span class="n">c_FP</span><span class="p">))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-    
-<span class="n">plot_isometrics</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/69f4ce656fa150ede224a3ff8237fc014598d21bb79953a7157728bc0e59c9ea.png" src="../_images/69f4ce656fa150ede224a3ff8237fc014598d21bb79953a7157728bc0e59c9ea.png" />
-</div>
-</div>
-<p>Under this cost function, the ideal threshold is -1.175.
-Now, let’s evaluate what this means for the model’s performance.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">y_pred</span> <span class="o">=</span> <span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">decision_function</span><span class="p">(</span><span class="n">Xs_test</span><span class="p">)</span> <span class="o">&gt;=</span> <span class="o">-</span><span class="mf">1.175</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="nb">int</span><span class="p">)</span>
-
-<span class="c1"># Get the scores by comparing the predictions y_pred with the ground truth y_test</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Accuracy: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">accuracy_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Precision: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">precision_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Recall: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">recall_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;F1 score: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">f1_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;AUC: </span><span class="si">{:.3f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">roc_auc_score</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">y_pred</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Accuracy: 0.748
-Precision: 0.591
-Recall: 0.926
-F1 score: 0.721
-AUC: 0.789
-</pre></div>
-</div>
-</div>
-</div>
-<p>The recall score improved massively (from 71% to 93%), but we also lost a lot of precision (from 90% to 59%). If we plot this threshold in the precision-recall curve (see previous question), we see that it is indeed giving high recall but low precision. Accuracy and AUC also reduced quite a bit. However, if recall is what we really care about, this would still be a good solution.</p>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-metrics">Exercise 1: Metrics</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-preprocessing">Exercise 2: Preprocessing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-hyperparameter-optimization">Exercise 3: Hyperparameter optimization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-threshold-calibration">Exercise 4: Threshold calibration</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-cost-function">Exercise 5: Cost function</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 3 - Ensembles Solution.html b/labs/Lab 3 - Ensembles Solution.html
deleted file mode 100644
index 0f598672a..000000000
--- a/labs/Lab 3 - Ensembles Solution.html	
+++ /dev/null
@@ -1,1027 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 4: Using trees to detect trees &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 3 - Ensembles Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 3 - Ensembles Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 3 - Ensembles Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 3 - Ensembles Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 4: Using trees to detect trees</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-random-forests">Exercise 1: Random Forests</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-other-measures">Exercise 2: Other measures</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-feature-importance">Exercise 3: Feature importance</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-feature-selection">Exercise 4: Feature selection</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-confusion-matrix">Exercise 5: Confusion matrix</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-a-second-level-model">Exercise 6: A second-level model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-7-model-calibration">Exercise 7: Model calibration</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-8-gradient-boosting">Exercise 8: Gradient Boosting</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-4-using-trees-to-detect-trees">
-<h1>Lab 4: Using trees to detect trees<a class="headerlink" href="#lab-4-using-trees-to-detect-trees" title="Permalink to this heading">#</a></h1>
-<p>We will be using tree-based ensemble methods on the <a class="reference external" href="https://www.openml.org/d/180">Covertype dataset</a>.
-It contains about 100,000 observations of 7 types of trees (Spruce, Pine, Cottonwood, Aspen,…) described by 55 features describing elevation, distance to water, soil type, etc.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="c1"># imports</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">openml</span>
-<span class="kn">import</span> <span class="nn">time</span>
-<span class="kn">from</span> <span class="nn">tqdm</span> <span class="kn">import</span> <span class="n">tqdm</span><span class="p">,</span> <span class="n">tqdm_notebook</span>
-<span class="kn">import</span> <span class="nn">seaborn</span> <span class="k">as</span> <span class="nn">sns</span> <span class="c1"># Plotting library, install with &#39;pip install seaborn&#39;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download Covertype data. Takes a while the first time.</span>
-<span class="n">covertype</span> <span class="o">=</span> <span class="n">openml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">180</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">covertype</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">covertype</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span> 
-<span class="n">classes</span> <span class="o">=</span> <span class="n">covertype</span><span class="o">.</span><span class="n">retrieve_class_labels</span><span class="p">()</span>
-<span class="n">features</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span><span class="n">f</span> <span class="ow">in</span> <span class="n">covertype</span><span class="o">.</span><span class="n">features</span><span class="o">.</span><span class="n">items</span><span class="p">()][:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">classes</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[&#39;Spruce_Fir&#39;,
- &#39;Lodgepole_Pine&#39;,
- &#39;Ponderosa_Pine&#39;,
- &#39;Cottonwood_Willow&#39;,
- &#39;Aspen&#39;,
- &#39;Douglas_fir&#39;,
- &#39;Krummholz&#39;]
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">features</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="mi">20</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[&#39;elevation&#39;,
- &#39;aspect&#39;,
- &#39;slope&#39;,
- &#39;horizontal_distance_to_hydrology&#39;,
- &#39;Vertical_Distance_To_Hydrology&#39;,
- &#39;Horizontal_Distance_To_Roadways&#39;,
- &#39;Hillshade_9am&#39;,
- &#39;Hillshade_Noon&#39;,
- &#39;Hillshade_3pm&#39;,
- &#39;Horizontal_Distance_To_Fire_Points&#39;,
- &#39;wilderness_area1&#39;,
- &#39;wilderness_area2&#39;,
- &#39;wilderness_area3&#39;,
- &#39;wilderness_area4&#39;,
- &#39;soil_type_1&#39;,
- &#39;soil_type_2&#39;,
- &#39;soil_type_3&#39;,
- &#39;soil_type_4&#39;,
- &#39;soil_type_5&#39;,
- &#39;soil_type_6&#39;]
-</pre></div>
-</div>
-</div>
-</div>
-<p>To understand the data a bit better, we can use a scatter matrix. From this, it looks like elevation is a relevant feature.
-Douglas Fir and Aspen grow at low elevations, while only Krummholz pines survive at very high elevations.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Using seaborn to build the scatter matrix</span>
-<span class="c1"># only first 3 columns, first 1000 examples</span>
-<span class="n">n_points</span> <span class="o">=</span> <span class="mi">1500</span>
-<span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">X</span><span class="p">[:</span><span class="n">n_points</span><span class="p">,:</span><span class="mi">3</span><span class="p">],</span> <span class="n">columns</span><span class="o">=</span><span class="n">features</span><span class="p">[:</span><span class="mi">3</span><span class="p">])</span>
-<span class="n">df</span><span class="p">[</span><span class="s1">&#39;class&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">classes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">y</span><span class="p">[:</span><span class="n">n_points</span><span class="p">]]</span>
-<span class="n">sns</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">style</span><span class="o">=</span><span class="s2">&quot;ticks&quot;</span><span class="p">)</span>
-<span class="n">sns</span><span class="o">.</span><span class="n">pairplot</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="n">hue</span><span class="o">=</span><span class="s2">&quot;class&quot;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/546c29969c9c12df0a26adf9b9aab6ab950b9dc0a64b99be72f48804bf2fb762.png" src="../_images/546c29969c9c12df0a26adf9b9aab6ab950b9dc0a64b99be72f48804bf2fb762.png" />
-</div>
-</div>
-<section id="exercise-1-random-forests">
-<h2>Exercise 1: Random Forests<a class="headerlink" href="#exercise-1-random-forests" title="Permalink to this heading">#</a></h2>
-<p>Implement a function <code class="docutils literal notranslate"><span class="pre">evaluate_RF</span></code> that measures the performance of a Random Forest Classifier, using trees
-of (max) depth 2,8,32,64, for any number of trees in the ensemble (<code class="docutils literal notranslate"><span class="pre">n_estimators</span></code>).
-For the evaluation you should measure accuracy using 3-fold cross-validation.
-Use <code class="docutils literal notranslate"><span class="pre">random_state=1</span></code> to ensure reproducibility. Finally, plot the results for at least 5 values of <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> ranging from 1 to 30. You can, of course, reuse code from earlier labs and assignments. Interpret the results.
-You can take a 50% subsample to speed the plotting.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="kn">from</span> <span class="nn">IPython</span> <span class="kn">import</span> <span class="n">display</span>
-<span class="k">def</span> <span class="nf">plot_live</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;log&#39;</span><span class="p">,</span> <span class="n">ylim</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">1</span><span class="p">),</span> <span class="n">ylabel</span><span class="o">=</span><span class="s1">&#39;score&#39;</span><span class="p">,</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Renders a plot that updates with every evaluation from evaluator.</span>
-<span class="sd">    Keyword arguments:</span>
-<span class="sd">    X -- the data for training and testing</span>
-<span class="sd">    y -- the correct labels</span>
-<span class="sd">    evaluator -- a function with signature (X, y, param_value) that returns a dictionary of scores.</span>
-<span class="sd">                 Examples: {&quot;train&quot;: 0.9, &quot;test&quot;: 0.95} or {&quot;model_1&quot;: 0.9, &quot;model_2&quot;: 0.7}</span>
-<span class="sd">    param_name -- the parameter that is being varied on the X axis. Can be a hyperparameter, sample size,...</span>
-<span class="sd">    param_range -- list of all possible values on the x-axis</span>
-<span class="sd">    scale -- defines which scale to plot the x-axis on, either &#39;log&#39; (logarithmic) or &#39;linear&#39;</span>
-<span class="sd">    ylim -- tuple with the lowest and highest y-value to plot (e.g. (0, 10))</span>
-<span class="sd">    ylabel -- the y-axis title</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Plot interactively</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ion</span><span class="p">()</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="n">param_name</span><span class="p">)</span>
-    
-    <span class="c1"># Make the scale look nice</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xscale</span><span class="p">(</span><span class="n">scale</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlim</span><span class="p">(</span><span class="n">param_range</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span><span class="n">param_range</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">(</span><span class="n">ylim</span><span class="p">)</span>
-        
-    <span class="c1"># Start from empty plot, then fill it</span>
-    <span class="n">series</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="n">lines</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="n">xvals</span> <span class="o">=</span> <span class="p">[]</span>
-    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">param_range</span><span class="p">:</span>
-        <span class="n">scores</span> <span class="o">=</span> <span class="n">evaluator</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">i</span><span class="p">)</span> 
-        <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">param_range</span><span class="p">[</span><span class="mi">0</span><span class="p">]:</span> <span class="c1"># initialize series</span>
-            <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">scores</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-                <span class="n">lines</span><span class="p">[</span><span class="n">k</span><span class="p">],</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="p">[],</span> <span class="n">marker</span> <span class="o">=</span> <span class="n">marker</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="n">k</span><span class="p">)</span>
-                <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="n">xvals</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">i</span><span class="p">)</span>
-        <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">scores</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span> <span class="c1"># append new data</span>
-            <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">scores</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-            <span class="n">lines</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">set_data</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-        <span class="c1"># refresh plot</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="s1">&#39;best&#39;</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">margins</span><span class="p">(</span><span class="mf">0.1</span><span class="p">)</span>
-        <span class="n">display</span><span class="o">.</span><span class="n">display</span><span class="p">(</span><span class="n">plt</span><span class="o">.</span><span class="n">gcf</span><span class="p">())</span>
-        <span class="n">display</span><span class="o">.</span><span class="n">clear_output</span><span class="p">(</span><span class="n">wait</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.ensemble</span> <span class="kn">import</span> <span class="n">RandomForestClassifier</span><span class="p">,</span> <span class="n">GradientBoostingClassifier</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span><span class="p">,</span> <span class="n">train_test_split</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">balanced_accuracy_score</span>
-<span class="kn">from</span> <span class="nn">xgboost</span> <span class="kn">import</span> <span class="n">XGBClassifier</span>
-
-<span class="k">def</span> <span class="nf">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">n_estimators</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">2</span><span class="p">,</span><span class="mi">8</span><span class="p">,</span><span class="mi">32</span><span class="p">,</span><span class="mi">64</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;accuracy&#39;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Evaluate a Random Forest classifier using 3-fold cross-validation on the provided (X, y) data. </span>
-<span class="sd">    Keyword arguments:</span>
-<span class="sd">    X -- the data for training and testing</span>
-<span class="sd">    y -- the correct labels</span>
-<span class="sd">    n_estimators -- the value for the gamma parameter</span>
-<span class="sd">    </span>
-<span class="sd">    Returns: a dictionary with the train and test score, e.g. {&quot;rf_1&quot;: 0.9, &quot;rf_2&quot;: 0.95}</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">res</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="k">for</span> <span class="n">md</span> <span class="ow">in</span> <span class="n">max_depth</span><span class="p">:</span>
-        <span class="n">rf</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">n_estimators</span><span class="o">=</span><span class="n">n_estimators</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="n">md</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">res</span><span class="p">[</span><span class="s1">&#39;rf_&#39;</span><span class="o">+</span><span class="nb">str</span><span class="p">(</span><span class="n">md</span><span class="p">)]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">cross_val_score</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span><span class="n">scoring</span><span class="o">=</span><span class="n">scoring</span><span class="p">))</span>
-    <span class="k">return</span> <span class="n">res</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">Xs</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">5</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_RF</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/7b112a321628fc9eb220c22164152626a8828ab76dae7050c883703ade203b84.png" src="../_images/7b112a321628fc9eb220c22164152626a8828ab76dae7050c883703ade203b84.png" />
-</div>
-</div>
-<p>Overall, the more trees, the better the score. The depth of the tree has a much larger
-effect though. Trees smaller than 32 do not perform well in the ensemble.
-This is to be expected, since Random Forests is a variance-reduction technique. It will
-only work if the trees are allowed to overfit. If they underfit, building a random forest
-ensemble of them won’t help. However, trees deeper than 32 do not further improve the score, likely because the trees don’t grow much deeper on this dataset.</p>
-</section>
-<section id="exercise-2-other-measures">
-<h2>Exercise 2: Other measures<a class="headerlink" href="#exercise-2-other-measures" title="Permalink to this heading">#</a></h2>
-<p>Repeat the same plot but now use balanced_accuracy as the evaluation measure. See the <a class="reference external" href="https://scikit-learn.org/stable/modules/model_evaluation.html#balanced-accuracy-score">documentation</a>.
-Only use the optimal max_depth from the previous question. Do you see an important difference?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="k">def</span> <span class="nf">evaluate_RF_balanced</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">n_estimators</span><span class="p">):</span>
-    <span class="k">return</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">n_estimators</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_RF_balanced</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/dc75447dafd3a307546b1964401b62e06fd4774ac20e22bf196476bbb91423bd.png" src="../_images/dc75447dafd3a307546b1964401b62e06fd4774ac20e22bf196476bbb91423bd.png" />
-</div>
-</div>
-</section>
-<section id="exercise-3-feature-importance">
-<h2>Exercise 3: Feature importance<a class="headerlink" href="#exercise-3-feature-importance" title="Permalink to this heading">#</a></h2>
-<p>Retrieve the feature importances according to the (tuned) random forest model. Which feature are most important?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="k">def</span> <span class="nf">plot_feature_importances</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">model</span><span class="p">):</span>
-    <span class="n">n_features</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">features</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">5</span><span class="p">,</span><span class="mi">10</span><span class="p">))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">),</span> <span class="n">model</span><span class="o">.</span><span class="n">feature_importances_</span><span class="p">,</span> <span class="n">align</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">yticks</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">),</span> <span class="n">features</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Feature importance&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;Feature&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">n_features</span><span class="p">)</span>
-
-<span class="n">forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">forest</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s1">&#39;font.size&#39;</span><span class="p">:</span><span class="mi">8</span><span class="p">})</span>
-<span class="n">plot_feature_importances</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">forest</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/9bba206ebe8896eb66c9d8d8d51a468488cee0948bc61aaef81cd25d7ef86e1a.png" src="../_images/9bba206ebe8896eb66c9d8d8d51a468488cee0948bc61aaef81cd25d7ef86e1a.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-feature-selection">
-<h2>Exercise 4: Feature selection<a class="headerlink" href="#exercise-4-feature-selection" title="Permalink to this heading">#</a></h2>
-<p>Re-build your tuned random forest, but this time only using the first 10 features.
-Return both the balanced accuracy and training time. Interpret the results.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-<span class="n">score</span> <span class="o">=</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="mi">25</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Normal RF: </span><span class="si">{:.2f}</span><span class="s2"> balanced ACC, </span><span class="si">{:.2f}</span><span class="s2"> seconds&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">score</span><span class="p">[</span><span class="s1">&#39;rf_32&#39;</span><span class="p">],</span> <span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span><span class="o">-</span><span class="n">start</span><span class="p">)))</span>
-<span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-<span class="n">score</span> <span class="o">=</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">[:,</span><span class="mi">0</span><span class="p">:</span><span class="mi">10</span><span class="p">],</span><span class="n">y</span><span class="p">,</span><span class="mi">25</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Feature Selection RF: </span><span class="si">{:.2f}</span><span class="s2"> balanced ACC, </span><span class="si">{:.2f}</span><span class="s2"> seconds&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">score</span><span class="p">[</span><span class="s1">&#39;rf_32&#39;</span><span class="p">],</span> <span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span><span class="o">-</span><span class="n">start</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Normal RF: 0.65 balanced ACC, 15.26 seconds
-Feature Selection RF: 0.62 balanced ACC, 16.49 seconds
-</pre></div>
-</div>
-</div>
-</div>
-<p>The first 10 features are the most significant according to the random forest. If we select only those, we get a very similar (but slightly worse) result. Random forests is already very robust against irrelevant features. Removing irrelevant features
-in this way doesn’t help much. The runtime is also about the same.</p>
-</section>
-<section id="exercise-5-confusion-matrix">
-<h2>Exercise 5: Confusion matrix<a class="headerlink" href="#exercise-5-confusion-matrix" title="Permalink to this heading">#</a></h2>
-<p>Do a standard stratified holdout and generate the confusion matrix of the tuned random forest. Which classes are still often confused?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">tuned_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">confusion_matrix</span>
-<span class="n">confusion_matrix</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">tuned_forest</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>array([[ 8475,  1059,    41,    20,    30,    23,    79],
-       [  661, 12032,    73,    22,    35,    67,    31],
-       [   83,   167,  1510,     8,    10,    55,    11],
-       [   81,   114,    39,    81,     4,    12,     4],
-       [  103,   250,    19,     3,   260,    11,     7],
-       [   89,   173,   113,     5,     2,   600,    10],
-       [  173,   121,    14,     2,    10,     8,   799]])
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-6-a-second-level-model">
-<h2>Exercise 6: A second-level model<a class="headerlink" href="#exercise-6-a-second-level-model" title="Permalink to this heading">#</a></h2>
-<p>Build a binary model specifically to correctly choose between the first and the second class.
-Select only the data points with those classes and train a new random forest. Do a standard stratified split and plot the resulting ROC curve. Can we still improve the model by calibrating the threshold?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">X_bin</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">y</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">,</span> <span class="p">:]</span>
-<span class="n">y_bin</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">y</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="k">def</span> <span class="nf">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">5</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span> <span class="n">y_bin</span><span class="p">,</span> <span class="n">evaluate_RF</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/02d8724a5fb4799c8660a6e0a0ad923ac66cc60302c5e9d0c1645f3268a19f54.png" src="../_images/02d8724a5fb4799c8660a6e0a0ad923ac66cc60302c5e9d0c1645f3268a19f54.png" />
-</div>
-</div>
-<p>The previously tuned hyperparameters are still good.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">roc_curve</span>
-
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">binary_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">thresholds_rf</span> <span class="o">=</span> <span class="n">roc_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">binary_forest</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">])</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC Curve RF&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;FPR&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;TPR (recall)&quot;</span><span class="p">)</span>
-<span class="n">close_default_rf</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds_rf</span> <span class="o">-</span> <span class="mf">0.5</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="n">tpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="s1">&#39;^&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
-         <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold 0.5 RF&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="mi">4</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/4fa40a9d08879de74e9cc12ab9ebf1ddfae8996bff6b39dac00012fde4e9a988.png" src="../_images/4fa40a9d08879de74e9cc12ab9ebf1ddfae8996bff6b39dac00012fde4e9a988.png" />
-</div>
-</div>
-<p>Yes, we want to be in the top left corner. Setting the threshold at 0.6 seems te be better.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="c1"># Too much code replication</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC Curve RF&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;FPR&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;TPR (recall)&quot;</span><span class="p">)</span>
-<span class="n">close_default_rf</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds_rf</span> <span class="o">-</span> <span class="mf">0.6</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="n">tpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="s1">&#39;^&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
-         <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold 0.5 RF&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="mi">4</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/492ca4fe7cb32ae676dd463613fb4ee90120dbaf8915c175f9e85ca683b8a00f.png" src="../_images/492ca4fe7cb32ae676dd463613fb4ee90120dbaf8915c175f9e85ca683b8a00f.png" />
-</div>
-</div>
-</section>
-<section id="exercise-7-model-calibration">
-<h2>Exercise 7: Model calibration<a class="headerlink" href="#exercise-7-model-calibration" title="Permalink to this heading">#</a></h2>
-<p>For the trained binary random forest model, plot a calibration curve (see <a class="reference external" href="https://ml-course.github.io/engineer/slides_html/03%20-%20Model%20Selection.slides.html#/40">course notebook</a>).
-Next, try to correct for this using Platt Scaling (or sigmoid scaling).</p>
-<p>Probability calibration should be done on new data not used for model fitting. The class <a class="reference external" href="https://scikit-learn.org/stable/auto_examples/calibration/plot_calibration_curve.html#sphx-glr-auto-examples-calibration-plot-calibration-curve-py">CalibratedClassifierCV</a> uses a cross-validation generator and estimates for each split the model parameter on the train samples and the calibration of the test samples. The probabilities predicted for the folds are then averaged. Already fitted classifiers can be calibrated by CalibratedClassifierCV via the parameter cv=”prefit”. <a class="reference external" href="https://scikit-learn.org/stable/modules/calibration.html">Read more</a></p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.calibration</span> <span class="kn">import</span> <span class="n">calibration_curve</span>
-<span class="k">def</span> <span class="nf">plot_calibration_curve</span><span class="p">(</span><span class="n">y_true</span><span class="p">,</span> <span class="n">y_prob</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">hist</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-    <span class="n">prob_true</span><span class="p">,</span> <span class="n">prob_pred</span> <span class="o">=</span> <span class="n">calibration_curve</span><span class="p">(</span><span class="n">y_true</span><span class="p">,</span> <span class="n">y_prob</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="n">n_bins</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="k">if</span> <span class="n">hist</span><span class="p">:</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">hist</span><span class="p">(</span><span class="n">y_prob</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">y_prob</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">y_prob</span><span class="p">),</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">.4</span><span class="p">,</span>
-               <span class="n">bins</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">maximum</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">n_bins</span><span class="p">))</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="s1">&#39;:&#39;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">)</span>
-    <span class="n">curve</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">prob_pred</span><span class="p">,</span> <span class="n">prob_true</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s2">&quot;o&quot;</span><span class="p">)</span>
-
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;predicted probability&quot;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s2">&quot;fraction of positive samples&quot;</span><span class="p">)</span>
-
-    <span class="n">ax</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">aspect</span><span class="o">=</span><span class="s1">&#39;equal&#39;</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">curve</span>
-
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">binary_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">scores</span> <span class="o">=</span> <span class="n">forest</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">]</span>
-<span class="n">plot_calibration_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">scores</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">20</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/1392fda1c03380b68b68c944f673558226750f331091d15dd1860c9b3b868477.png" src="../_images/1392fda1c03380b68b68c944f673558226750f331091d15dd1860c9b3b868477.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.calibration</span> <span class="kn">import</span> <span class="n">CalibratedClassifierCV</span>
-<span class="n">rf</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span> <span class="c1">#Unfitted RF</span>
-<span class="n">sigmoid</span> <span class="o">=</span> <span class="n">CalibratedClassifierCV</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">method</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">)</span>
-<span class="n">sigmoid</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">sigmoid</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-<span class="n">prob_pos</span> <span class="o">=</span> <span class="n">sigmoid</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">]</span>
-<span class="n">plot_calibration_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">prob_pos</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">20</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/31506bf0392158183ac71743272cd360d984ef6251e6049412a0e9bb4b944838.png" src="../_images/31506bf0392158183ac71743272cd360d984ef6251e6049412a0e9bb4b944838.png" />
-</div>
-</div>
-</section>
-<section id="exercise-8-gradient-boosting">
-<h2>Exercise 8: Gradient Boosting<a class="headerlink" href="#exercise-8-gradient-boosting" title="Permalink to this heading">#</a></h2>
-<p>Implement a function <code class="docutils literal notranslate"><span class="pre">evaluate_GB</span></code> that measures the performance of <code class="docutils literal notranslate"><span class="pre">GradientBoostingClassifier</span></code> or the <code class="docutils literal notranslate"><span class="pre">XGBoostClassifier</span></code> for
-different learning rates (0.01, 0.1, 1, and 10). As before, use a 3-fold cross-validation. You can use a 5% stratified sample of the whole dataset.
-Finally plot the results for <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> ranging from 1 to 100. Run all the GBClassifiers with <code class="docutils literal notranslate"><span class="pre">random_state=1</span></code> to ensure reproducibility.</p>
-<p>Implement a function that plots the score of <code class="docutils literal notranslate"><span class="pre">evaluate_GB</span></code> for <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> = 10,20,30,…,100 on a linear scale.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="c1"># This could be done more efficiently using warm starting</span>
-
-<span class="kn">from</span> <span class="nn">sklearn.ensemble</span> <span class="kn">import</span> <span class="n">GradientBoostingClassifier</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span><span class="p">,</span> <span class="n">StratifiedKFold</span>
-<span class="kn">from</span> <span class="nn">xgboost</span> <span class="kn">import</span> <span class="n">XGBClassifier</span>
-
-<span class="k">def</span> <span class="nf">evaluate_GB</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">n_estimators</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="p">[</span><span class="mf">0.01</span><span class="p">,</span><span class="mf">0.1</span><span class="p">,</span><span class="mi">1</span><span class="p">,</span><span class="mi">10</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;accuracy&#39;</span><span class="p">):</span>
-    <span class="n">res</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="k">for</span> <span class="n">lr</span> <span class="ow">in</span> <span class="n">learning_rate</span><span class="p">:</span>
-        <span class="n">rf</span> <span class="o">=</span> <span class="n">GradientBoostingClassifier</span><span class="p">(</span><span class="n">n_estimators</span><span class="o">=</span><span class="n">n_estimators</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="n">lr</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">kfold</span> <span class="o">=</span> <span class="n">StratifiedKFold</span><span class="p">(</span><span class="n">n_splits</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">res</span><span class="p">[</span><span class="s1">&#39;gb_&#39;</span><span class="o">+</span><span class="nb">str</span><span class="p">(</span><span class="n">lr</span><span class="p">)]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">cross_val_score</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">cv</span><span class="o">=</span><span class="n">kfold</span><span class="p">,</span><span class="n">scoring</span><span class="o">=</span><span class="n">scoring</span><span class="p">))</span>
-    <span class="k">return</span> <span class="n">res</span>
-
-<span class="k">def</span> <span class="nf">plot_2</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">Xs</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.05</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">150</span><span class="p">,</span> <span class="mi">20</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_2</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_GB</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/94903771467885d601f263c974ce7ea6735393ff6a5c57113769516c089238f5.png" src="../_images/94903771467885d601f263c974ce7ea6735393ff6a5c57113769516c089238f5.png" />
-</div>
-</div>
-<p>We notice that gradient boosting is a lot slower to train that random forests, and it performs less well (at least when using fewer than 150 iterations).
-A smaller learning rate requires more iterations but ultimately works out best. It is possible that the model with learning rate 0.01 will ultimately overtake the one with learning rate 0.1 but it may also take a long time.</p>
-<p>A learning rate that is too large performs poorly. For <code class="docutils literal notranslate"><span class="pre">learning_rate=1</span></code>, the model starts out well, but gradually performs worse. The instance weights are adapted so aggressively that the next model does not actually fix the mistakes of the previous model but ‘overshoots’ and introduces more errors in the ensemble. After a while, it is not capable to make fine enough adjustments and levels off, not improving the model anymore. <a class="reference external" href="https://mlexplained.com/2018/01/29/learning-rate-tuning-in-deep-learning-a-practical-guide/">A more detailed explanation can be read here</a>.</p>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-random-forests">Exercise 1: Random Forests</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-other-measures">Exercise 2: Other measures</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-feature-importance">Exercise 3: Feature importance</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-feature-selection">Exercise 4: Feature selection</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-confusion-matrix">Exercise 5: Confusion matrix</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-a-second-level-model">Exercise 6: A second-level model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-7-model-calibration">Exercise 7: Model calibration</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-8-gradient-boosting">Exercise 8: Gradient Boosting</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 3b - Ensembles Solution.html b/labs/Lab 3b - Ensembles Solution.html
deleted file mode 100644
index c50d4b2c5..000000000
--- a/labs/Lab 3b - Ensembles Solution.html	
+++ /dev/null
@@ -1,1146 +0,0 @@
-
-<!DOCTYPE html>
-
-<html>
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.17.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 4: Using trees to detect trees &#8212; ML Engineering</title>
-    
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=1999514e3f237ded88cf" rel="stylesheet">
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=1999514e3f237ded88cf" rel="stylesheet">
-
-    
-  <link rel="stylesheet"
-    href="../_static/vendor/fontawesome/5.13.0/css/all.min.css">
-  <link rel="preload" as="font" type="font/woff2" crossorigin
-    href="../_static/vendor/fontawesome/5.13.0/webfonts/fa-solid-900.woff2">
-  <link rel="preload" as="font" type="font/woff2" crossorigin
-    href="../_static/vendor/fontawesome/5.13.0/webfonts/fa-brands-400.woff2">
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=5115cc725059bd94278eecd172e13a965bf8f5a9" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.b7bb847fb20b106c3d81b95245e65545.min.css" />
-    
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=1999514e3f237ded88cf">
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=9c920249402e914e316237a7dbc6769907cce411"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown, .tag_hide_input div.cell_input, .tag_hide-input div.cell_input, .tag_hide_output div.cell_output, .tag_hide-output div.cell_output, .tag_hide_cell.cell, .tag_hide-cell.cell';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <meta name="viewport" content="width=device-width, initial-scale=1" />
-    <meta name="docsearch:language" content="None">
-    
-
-    <!-- Google Analytics -->
-    
-  </head>
-  <body data-spy="scroll" data-target="#bd-toc-nav" data-offset="60">
-<!-- Checkboxes to toggle the left sidebar -->
-<input type="checkbox" class="sidebar-toggle" name="__navigation" id="__navigation" aria-label="Toggle navigation sidebar">
-<label class="overlay overlay-navbar" for="__navigation">
-    <div class="visually-hidden">Toggle navigation sidebar</div>
-</label>
-<!-- Checkboxes to toggle the in-page toc -->
-<input type="checkbox" class="sidebar-toggle" name="__page-toc" id="__page-toc" aria-label="Toggle in-page Table of Contents">
-<label class="overlay overlay-pagetoc" for="__page-toc">
-    <div class="visually-hidden">Toggle in-page Table of Contents</div>
-</label>
-<!-- Headers at the top -->
-<div class="announcement header-item noprint"></div>
-<div class="header header-item noprint"></div>
-
-    
-    <div class="container-fluid" id="banner"></div>
-
-    
-
-    <div class="container-xl">
-      <div class="row">
-          
-<!-- Sidebar -->
-<div class="bd-sidebar noprint" id="site-navigation">
-    <div class="bd-sidebar__content">
-        <div class="bd-sidebar__top"><div class="navbar-brand-box">
-    <a class="navbar-brand text-wrap" href="../index.html">
-      
-        <!-- `logo` is deprecated in Sphinx 4.0, so remove this when we stop supporting 3 -->
-        
-      
-      
-      <img src="../_static/banner.jpeg" class="logo" alt="logo">
-      
-      
-      <h1 class="site-logo" id="site-title">ML Engineering</h1>
-      
-    </a>
-</div><form class="bd-search d-flex align-items-center" action="../search.html" method="get">
-  <i class="icon fas fa-search"></i>
-  <input type="search" class="form-control" name="q" id="search-input" placeholder="Search this book..." aria-label="Search this book..." autocomplete="off" >
-</form><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%200%20-%20Prerequisites.html">
-   Prerequisites
-  </a>
- </li>
-</ul>
-<p aria-level="2" class="caption" role="heading">
- <span class="caption-text">
-  Lectures
- </span>
-</p>
-<ul class="nav bd-sidenav">
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/01%20-%20Introduction.html">
-   Lecture 1: Introduction
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">
-   Lecture 2: Linear models
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">
-   Lecture 3: Kernelization
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">
-   Lecture 4: Model Selection
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">
-   Lecture 5. Ensemble Learning
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">
-   Lecture 6. Data preprocessing
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">
-   Lecture 7. Bayesian Learning
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">
-   Lecture 8. Neural Networks
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">
-   Lecture 9: Convolutional Neural Networks
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">
-   Lecture 10. Neural Networks for text
-  </a>
- </li>
-</ul>
-<p aria-level="2" class="caption" role="heading">
- <span class="caption-text">
-  Labs
- </span>
-</p>
-<ul class="nav bd-sidenav">
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">
-   Lab 1a: Linear regression
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">
-   Lab 1b: Linear classification
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%202a%20-%20Kernelization.html">
-   Lab 2a: Kernelization
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">
-   Lab 2b: Model selection
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%203%20-%20Ensembles.html">
-   Lab 3b: Ensembles
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%204%20-%20Pipelines.html">
-   Lab 4:  Data preprocessing
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">
-   Lab 5: Bayesian models
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">
-   Lab 6: Neural networks
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">
-   Lab 7a: Convolutional neural nets
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">
-   Lab 7b: Neural Networks for text
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%208%20-%20AutoML.html">
-   Lab 8: AutoML
-  </a>
- </li>
-</ul>
-<p aria-level="2" class="caption" role="heading">
- <span class="caption-text">
-  Tutorials
- </span>
-</p>
-<ul class="nav bd-sidenav">
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">
-   Python for data analysis
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">
-   Python for scientific computing
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">
-   Machine Learning in Python
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">
-   Recap: Decision Trees
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">
-   Recap: k-Nearest Neighbor
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%201%20-%20Tutorial.html">
-   Lab 1: Machine Learning with Python
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%204%20-%20Tutorial.html">
-   Lab 4 Tutorial: Data engineering pipelines
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%206%20-%20Tutorial.html">
-   Lab 6 Tutorial: Deep Learning with TensorFlow
-  </a>
- </li>
- <li class="toctree-l1">
-  <a class="reference internal" href="Lab%207%20-%20Tutorial.html">
-   Lab 7 Tutorial: Deep Learning for text
-  </a>
- </li>
-</ul>
-
-    </div>
-</nav></div>
-        <div class="bd-sidebar__bottom">
-             <!-- To handle the deprecated key -->
-            
-        </div>
-    </div>
-    <div id="rtd-footer-container"></div>
-</div>
-
-
-          
-
-
-          
-<!-- A tiny helper pixel to detect if we've scrolled -->
-<div class="sbt-scroll-pixel-helper"></div>
-<!-- Main content -->
-<div class="col py-0 content-container">
-    
-    <div class="header-article row sticky-top noprint">
-        
-
-
-
-<div class="col py-1 d-flex header-article-main">
-    <div class="header-article__left">
-        
-        <label for="__navigation"
-  class="headerbtn"
-  data-toggle="tooltip"
-data-placement="right"
-title="Toggle navigation"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-bars"></i>
-  </span>
-
-</label>
-
-        
-    </div>
-    <div class="header-article__right">
-<div class="menu-dropdown menu-dropdown-launch-buttons">
-  <button class="headerbtn menu-dropdown__trigger"
-      aria-label="Launch interactive content">
-      <i class="fas fa-rocket"></i>
-  </button>
-  <div class="menu-dropdown__content">
-    <ul>
-      <li>
-        <a href="https://mybinder.org/v2/gh/ml-course/master/master?urlpath=tree/labs/Lab 3b - Ensembles Solution.ipynb"
-   class="headerbtn"
-   data-toggle="tooltip"
-data-placement="left"
-title="Launch on Binder"
->
-  
-
-<span class="headerbtn__icon-container">
-  
-    <img src="../_static/images/logo_binder.svg">
-  </span>
-<span class="headerbtn__text-container">Binder</span>
-</a>
-
-      </li>
-      
-      <li>
-        <a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 3b - Ensembles Solution.ipynb"
-   class="headerbtn"
-   data-toggle="tooltip"
-data-placement="left"
-title="Launch on Colab"
->
-  
-
-<span class="headerbtn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="headerbtn__text-container">Colab</span>
-</a>
-
-      </li>
-      
-    </ul>
-  </div>
-</div>
-
-<button onclick="toggleFullScreen()"
-  class="headerbtn"
-  data-toggle="tooltip"
-data-placement="bottom"
-title="Fullscreen mode"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-<div class="menu-dropdown menu-dropdown-repository-buttons">
-  <button class="headerbtn menu-dropdown__trigger"
-      aria-label="Source repositories">
-      <i class="fab fa-github"></i>
-  </button>
-  <div class="menu-dropdown__content">
-    <ul>
-      <li>
-        <a href="https://github.com/ml-course/master"
-   class="headerbtn"
-   data-toggle="tooltip"
-data-placement="left"
-title="Source repository"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="headerbtn__text-container">repository</span>
-</a>
-
-      </li>
-      
-      <li>
-        <a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 3b - Ensembles Solution.html&body=Your%20issue%20content%20here."
-   class="headerbtn"
-   data-toggle="tooltip"
-data-placement="left"
-title="Open an issue"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="headerbtn__text-container">open issue</span>
-</a>
-
-      </li>
-      
-    </ul>
-  </div>
-</div>
-
-<div class="menu-dropdown menu-dropdown-download-buttons">
-  <button class="headerbtn menu-dropdown__trigger"
-      aria-label="Download this page">
-      <i class="fas fa-download"></i>
-  </button>
-  <div class="menu-dropdown__content">
-    <ul>
-      <li>
-        <a href="../_sources/labs/Lab 3b - Ensembles Solution.ipynb"
-   class="headerbtn"
-   data-toggle="tooltip"
-data-placement="left"
-title="Download source file"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="headerbtn__text-container">.ipynb</span>
-</a>
-
-      </li>
-      
-      <li>
-        
-<button onclick="printPdf(this)"
-  class="headerbtn"
-  data-toggle="tooltip"
-data-placement="left"
-title="Print to PDF"
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="headerbtn__text-container">.pdf</span>
-</button>
-
-      </li>
-      
-    </ul>
-  </div>
-</div>
-<label for="__page-toc"
-  class="headerbtn headerbtn-page-toc"
-  
->
-  
-
-<span class="headerbtn__icon-container">
-  <i class="fas fa-list"></i>
-  </span>
-
-</label>
-
-    </div>
-</div>
-
-<!-- Table of contents -->
-<div class="col-md-3 bd-toc show noprint">
-    <div class="tocsection onthispage pt-5 pb-3">
-        <i class="fas fa-list"></i> Contents
-    </div>
-    <nav id="bd-toc-nav" aria-label="Page">
-        <ul class="visible nav section-nav flex-column">
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-1-random-forests">
-   Exercise 1: Random Forests
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-2-other-measures">
-   Exercise 2: Other measures
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-3-feature-importance">
-   Exercise 3: Feature importance
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-4-feature-selection">
-   Exercise 4: Feature selection
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-5-confusion-matrix">
-   Exercise 5: Confusion matrix
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-6-a-second-level-model">
-   Exercise 6: A second-level model
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-7-model-calibration">
-   Exercise 7: Model calibration
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-8-gradient-boosting">
-   Exercise 8: Gradient Boosting
-  </a>
- </li>
-</ul>
-
-    </nav>
-</div>
-    </div>
-    <div class="article row">
-        <div class="col pl-md-3 pl-lg-5 content-container">
-            <!-- Table of contents that is only displayed when printing the page -->
-            <div id="jb-print-docs-body" class="onlyprint">
-                <h1>Lab 4: Using trees to detect trees</h1>
-                <!-- Table of contents -->
-                <div id="print-main-content">
-                    <div id="jb-print-toc">
-                        
-                        <div>
-                            <h2> Contents </h2>
-                        </div>
-                        <nav aria-label="Page">
-                            <ul class="visible nav section-nav flex-column">
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-1-random-forests">
-   Exercise 1: Random Forests
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-2-other-measures">
-   Exercise 2: Other measures
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-3-feature-importance">
-   Exercise 3: Feature importance
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-4-feature-selection">
-   Exercise 4: Feature selection
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-5-confusion-matrix">
-   Exercise 5: Confusion matrix
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-6-a-second-level-model">
-   Exercise 6: A second-level model
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-7-model-calibration">
-   Exercise 7: Model calibration
-  </a>
- </li>
- <li class="toc-h2 nav-item toc-entry">
-  <a class="reference internal nav-link" href="#exercise-8-gradient-boosting">
-   Exercise 8: Gradient Boosting
-  </a>
- </li>
-</ul>
-
-                        </nav>
-                    </div>
-                </div>
-            </div>
-            <main id="main-content" role="main">
-                
-              <div>
-                
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-4-using-trees-to-detect-trees">
-<h1>Lab 4: Using trees to detect trees<a class="headerlink" href="#lab-4-using-trees-to-detect-trees" title="Permalink to this headline">#</a></h1>
-<p>We will be using tree-based ensemble methods on the <a class="reference external" href="https://www.openml.org/d/180">Covertype dataset</a>.
-It contains about 100,000 observations of 7 types of trees (Spruce, Pine, Cottonwood, Aspen,…) described by 55 features describing elevation, distance to water, soil type, etc.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="c1"># imports</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">openml</span>
-<span class="kn">import</span> <span class="nn">time</span>
-<span class="kn">from</span> <span class="nn">tqdm</span> <span class="kn">import</span> <span class="n">tqdm</span><span class="p">,</span> <span class="n">tqdm_notebook</span>
-<span class="kn">import</span> <span class="nn">seaborn</span> <span class="k">as</span> <span class="nn">sns</span> <span class="c1"># Plotting library, install with &#39;pip install seaborn&#39;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download Covertype data. Takes a while the first time.</span>
-<span class="n">covertype</span> <span class="o">=</span> <span class="n">openml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">180</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">covertype</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">covertype</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span> 
-<span class="n">classes</span> <span class="o">=</span> <span class="n">covertype</span><span class="o">.</span><span class="n">retrieve_class_labels</span><span class="p">()</span>
-<span class="n">features</span> <span class="o">=</span> <span class="p">[</span><span class="n">f</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span><span class="n">f</span> <span class="ow">in</span> <span class="n">covertype</span><span class="o">.</span><span class="n">features</span><span class="o">.</span><span class="n">items</span><span class="p">()][:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">classes</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[&#39;Spruce_Fir&#39;,
- &#39;Lodgepole_Pine&#39;,
- &#39;Ponderosa_Pine&#39;,
- &#39;Cottonwood_Willow&#39;,
- &#39;Aspen&#39;,
- &#39;Douglas_fir&#39;,
- &#39;Krummholz&#39;]
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">features</span><span class="p">[</span><span class="mi">0</span><span class="p">:</span><span class="mi">20</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[&#39;elevation&#39;,
- &#39;aspect&#39;,
- &#39;slope&#39;,
- &#39;horizontal_distance_to_hydrology&#39;,
- &#39;Vertical_Distance_To_Hydrology&#39;,
- &#39;Horizontal_Distance_To_Roadways&#39;,
- &#39;Hillshade_9am&#39;,
- &#39;Hillshade_Noon&#39;,
- &#39;Hillshade_3pm&#39;,
- &#39;Horizontal_Distance_To_Fire_Points&#39;,
- &#39;wilderness_area1&#39;,
- &#39;wilderness_area2&#39;,
- &#39;wilderness_area3&#39;,
- &#39;wilderness_area4&#39;,
- &#39;soil_type_1&#39;,
- &#39;soil_type_2&#39;,
- &#39;soil_type_3&#39;,
- &#39;soil_type_4&#39;,
- &#39;soil_type_5&#39;,
- &#39;soil_type_6&#39;]
-</pre></div>
-</div>
-</div>
-</div>
-<p>To understand the data a bit better, we can use a scatter matrix. From this, it looks like elevation is a relevant feature.
-Douglas Fir and Aspen grow at low elevations, while only Krummholz pines survive at very high elevations.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Using seaborn to build the scatter matrix</span>
-<span class="c1"># only first 3 columns, first 1000 examples</span>
-<span class="n">n_points</span> <span class="o">=</span> <span class="mi">1500</span>
-<span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">X</span><span class="p">[:</span><span class="n">n_points</span><span class="p">,:</span><span class="mi">3</span><span class="p">],</span> <span class="n">columns</span><span class="o">=</span><span class="n">features</span><span class="p">[:</span><span class="mi">3</span><span class="p">])</span>
-<span class="n">df</span><span class="p">[</span><span class="s1">&#39;class&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">classes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">y</span><span class="p">[:</span><span class="n">n_points</span><span class="p">]]</span>
-<span class="n">sns</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">style</span><span class="o">=</span><span class="s2">&quot;ticks&quot;</span><span class="p">)</span>
-<span class="n">sns</span><span class="o">.</span><span class="n">pairplot</span><span class="p">(</span><span class="n">df</span><span class="p">,</span> <span class="n">hue</span><span class="o">=</span><span class="s2">&quot;class&quot;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_6_0.png" src="../_images/Lab 3b - Ensembles Solution_6_0.png" />
-</div>
-</div>
-<section id="exercise-1-random-forests">
-<h2>Exercise 1: Random Forests<a class="headerlink" href="#exercise-1-random-forests" title="Permalink to this headline">#</a></h2>
-<p>Implement a function <code class="docutils literal notranslate"><span class="pre">evaluate_RF</span></code> that measures the performance of a Random Forest Classifier, using trees
-of (max) depth 2,8,32,64, for any number of trees in the ensemble (<code class="docutils literal notranslate"><span class="pre">n_estimators</span></code>).
-For the evaluation you should measure accuracy using 3-fold cross-validation.
-Use <code class="docutils literal notranslate"><span class="pre">random_state=1</span></code> to ensure reproducibility. Finally, plot the results for at least 5 values of <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> ranging from 1 to 30. You can, of course, reuse code from earlier labs and assignments. Interpret the results.
-You can take a 50% subsample to speed the plotting.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="kn">from</span> <span class="nn">IPython</span> <span class="kn">import</span> <span class="n">display</span>
-<span class="k">def</span> <span class="nf">plot_live</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;log&#39;</span><span class="p">,</span> <span class="n">ylim</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">1</span><span class="p">),</span> <span class="n">ylabel</span><span class="o">=</span><span class="s1">&#39;score&#39;</span><span class="p">,</span> <span class="n">marker</span> <span class="o">=</span> <span class="s1">&#39;.&#39;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Renders a plot that updates with every evaluation from evaluator.</span>
-<span class="sd">    Keyword arguments:</span>
-<span class="sd">    X -- the data for training and testing</span>
-<span class="sd">    y -- the correct labels</span>
-<span class="sd">    evaluator -- a function with signature (X, y, param_value) that returns a dictionary of scores.</span>
-<span class="sd">                 Examples: {&quot;train&quot;: 0.9, &quot;test&quot;: 0.95} or {&quot;model_1&quot;: 0.9, &quot;model_2&quot;: 0.7}</span>
-<span class="sd">    param_name -- the parameter that is being varied on the X axis. Can be a hyperparameter, sample size,...</span>
-<span class="sd">    param_range -- list of all possible values on the x-axis</span>
-<span class="sd">    scale -- defines which scale to plot the x-axis on, either &#39;log&#39; (logarithmic) or &#39;linear&#39;</span>
-<span class="sd">    ylim -- tuple with the lowest and highest y-value to plot (e.g. (0, 10))</span>
-<span class="sd">    ylabel -- the y-axis title</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="c1"># Plot interactively</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ion</span><span class="p">()</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="n">param_name</span><span class="p">)</span>
-    
-    <span class="c1"># Make the scale look nice</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xscale</span><span class="p">(</span><span class="n">scale</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlim</span><span class="p">(</span><span class="n">param_range</span><span class="p">[</span><span class="mi">0</span><span class="p">],</span><span class="n">param_range</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">])</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">(</span><span class="n">ylim</span><span class="p">)</span>
-        
-    <span class="c1"># Start from empty plot, then fill it</span>
-    <span class="n">series</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="n">lines</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="n">xvals</span> <span class="o">=</span> <span class="p">[]</span>
-    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">param_range</span><span class="p">:</span>
-        <span class="n">scores</span> <span class="o">=</span> <span class="n">evaluator</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">i</span><span class="p">)</span> 
-        <span class="k">if</span> <span class="n">i</span> <span class="o">==</span> <span class="n">param_range</span><span class="p">[</span><span class="mi">0</span><span class="p">]:</span> <span class="c1"># initialize series</span>
-            <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">scores</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span>
-                <span class="n">lines</span><span class="p">[</span><span class="n">k</span><span class="p">],</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="p">[],</span> <span class="n">marker</span> <span class="o">=</span> <span class="n">marker</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="n">k</span><span class="p">)</span>
-                <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="n">xvals</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">i</span><span class="p">)</span>
-        <span class="k">for</span> <span class="n">k</span> <span class="ow">in</span> <span class="n">scores</span><span class="o">.</span><span class="n">keys</span><span class="p">():</span> <span class="c1"># append new data</span>
-            <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">scores</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-            <span class="n">lines</span><span class="p">[</span><span class="n">k</span><span class="p">]</span><span class="o">.</span><span class="n">set_data</span><span class="p">(</span><span class="n">xvals</span><span class="p">,</span> <span class="n">series</span><span class="p">[</span><span class="n">k</span><span class="p">])</span>
-        <span class="c1"># refresh plot</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="s1">&#39;best&#39;</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">margins</span><span class="p">(</span><span class="mf">0.1</span><span class="p">)</span>
-        <span class="n">display</span><span class="o">.</span><span class="n">display</span><span class="p">(</span><span class="n">plt</span><span class="o">.</span><span class="n">gcf</span><span class="p">())</span>
-        <span class="n">display</span><span class="o">.</span><span class="n">clear_output</span><span class="p">(</span><span class="n">wait</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.ensemble</span> <span class="kn">import</span> <span class="n">RandomForestClassifier</span><span class="p">,</span> <span class="n">GradientBoostingClassifier</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span><span class="p">,</span> <span class="n">train_test_split</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">balanced_accuracy_score</span>
-<span class="kn">from</span> <span class="nn">xgboost</span> <span class="kn">import</span> <span class="n">XGBClassifier</span>
-
-<span class="k">def</span> <span class="nf">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">n_estimators</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">2</span><span class="p">,</span><span class="mi">8</span><span class="p">,</span><span class="mi">32</span><span class="p">,</span><span class="mi">64</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;accuracy&#39;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Evaluate a Random Forest classifier using 3-fold cross-validation on the provided (X, y) data. </span>
-<span class="sd">    Keyword arguments:</span>
-<span class="sd">    X -- the data for training and testing</span>
-<span class="sd">    y -- the correct labels</span>
-<span class="sd">    n_estimators -- the value for the gamma parameter</span>
-<span class="sd">    </span>
-<span class="sd">    Returns: a dictionary with the train and test score, e.g. {&quot;rf_1&quot;: 0.9, &quot;rf_2&quot;: 0.95}</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">res</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="k">for</span> <span class="n">md</span> <span class="ow">in</span> <span class="n">max_depth</span><span class="p">:</span>
-        <span class="n">rf</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">n_estimators</span><span class="o">=</span><span class="n">n_estimators</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="n">md</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">res</span><span class="p">[</span><span class="s1">&#39;rf_&#39;</span><span class="o">+</span><span class="nb">str</span><span class="p">(</span><span class="n">md</span><span class="p">)]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">cross_val_score</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span><span class="n">scoring</span><span class="o">=</span><span class="n">scoring</span><span class="p">))</span>
-    <span class="k">return</span> <span class="n">res</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">Xs</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.5</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">5</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_RF</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_10_0.png" src="../_images/Lab 3b - Ensembles Solution_10_0.png" />
-</div>
-</div>
-<p>Overall, the more trees, the better the score. The depth of the tree has a much larger
-effect though. Trees smaller than 32 do not perform well in the ensemble.
-This is to be expected, since Random Forests is a variance-reduction technique. It will
-only work if the trees are allowed to overfit. If they underfit, building a random forest
-ensemble of them won’t help. However, trees deeper than 32 do not further improve the score, likely because the trees don’t grow much deeper on this dataset.</p>
-</section>
-<section id="exercise-2-other-measures">
-<h2>Exercise 2: Other measures<a class="headerlink" href="#exercise-2-other-measures" title="Permalink to this headline">#</a></h2>
-<p>Repeat the same plot but now use balanced_accuracy as the evaluation measure. See the <a class="reference external" href="https://scikit-learn.org/stable/modules/model_evaluation.html#balanced-accuracy-score">documentation</a>.
-Only use the optimal max_depth from the previous question. Do you see an important difference?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="k">def</span> <span class="nf">evaluate_RF_balanced</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">n_estimators</span><span class="p">):</span>
-    <span class="k">return</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">n_estimators</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_RF_balanced</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_13_0.png" src="../_images/Lab 3b - Ensembles Solution_13_0.png" />
-</div>
-</div>
-</section>
-<section id="exercise-3-feature-importance">
-<h2>Exercise 3: Feature importance<a class="headerlink" href="#exercise-3-feature-importance" title="Permalink to this headline">#</a></h2>
-<p>Retrieve the feature importances according to the (tuned) random forest model. Which feature are most important?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">## Model solution</span>
-<span class="k">def</span> <span class="nf">plot_feature_importances</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">model</span><span class="p">):</span>
-    <span class="n">n_features</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">features</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">5</span><span class="p">,</span><span class="mi">10</span><span class="p">))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">),</span> <span class="n">model</span><span class="o">.</span><span class="n">feature_importances_</span><span class="p">,</span> <span class="n">align</span><span class="o">=</span><span class="s1">&#39;center&#39;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">yticks</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="n">n_features</span><span class="p">),</span> <span class="n">features</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Feature importance&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;Feature&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="n">n_features</span><span class="p">)</span>
-
-<span class="n">forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">forest</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s1">&#39;font.size&#39;</span><span class="p">:</span><span class="mi">8</span><span class="p">})</span>
-<span class="n">plot_feature_importances</span><span class="p">(</span><span class="n">features</span><span class="p">,</span> <span class="n">forest</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_15_0.png" src="../_images/Lab 3b - Ensembles Solution_15_0.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-feature-selection">
-<h2>Exercise 4: Feature selection<a class="headerlink" href="#exercise-4-feature-selection" title="Permalink to this headline">#</a></h2>
-<p>Re-build your tuned random forest, but this time only using the first 10 features.
-Return both the balanced accuracy and training time. Interpret the results.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-<span class="n">score</span> <span class="o">=</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="mi">25</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Normal RF: </span><span class="si">{:.2f}</span><span class="s2"> balanced ACC, </span><span class="si">{:.2f}</span><span class="s2"> seconds&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">score</span><span class="p">[</span><span class="s1">&#39;rf_32&#39;</span><span class="p">],</span> <span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span><span class="o">-</span><span class="n">start</span><span class="p">)))</span>
-<span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-<span class="n">score</span> <span class="o">=</span> <span class="n">evaluate_RF</span><span class="p">(</span><span class="n">X</span><span class="p">[:,</span><span class="mi">0</span><span class="p">:</span><span class="mi">10</span><span class="p">],</span><span class="n">y</span><span class="p">,</span><span class="mi">25</span><span class="p">,</span><span class="n">max_depth</span><span class="o">=</span><span class="p">[</span><span class="mi">32</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;balanced_accuracy&#39;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Feature Selection RF: </span><span class="si">{:.2f}</span><span class="s2"> balanced ACC, </span><span class="si">{:.2f}</span><span class="s2"> seconds&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">score</span><span class="p">[</span><span class="s1">&#39;rf_32&#39;</span><span class="p">],</span> <span class="p">(</span><span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span><span class="o">-</span><span class="n">start</span><span class="p">)))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Normal RF: 0.65 balanced ACC, 15.26 seconds
-Feature Selection RF: 0.62 balanced ACC, 16.49 seconds
-</pre></div>
-</div>
-</div>
-</div>
-<p>The first 10 features are the most significant according to the random forest. If we select only those, we get a very similar (but slightly worse) result. Random forests is already very robust against irrelevant features. Removing irrelevant features
-in this way doesn’t help much. The runtime is also about the same.</p>
-</section>
-<section id="exercise-5-confusion-matrix">
-<h2>Exercise 5: Confusion matrix<a class="headerlink" href="#exercise-5-confusion-matrix" title="Permalink to this headline">#</a></h2>
-<p>Do a standard stratified holdout and generate the confusion matrix of the tuned random forest. Which classes are still often confused?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">tuned_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">confusion_matrix</span>
-<span class="n">confusion_matrix</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">tuned_forest</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>array([[ 8475,  1059,    41,    20,    30,    23,    79],
-       [  661, 12032,    73,    22,    35,    67,    31],
-       [   83,   167,  1510,     8,    10,    55,    11],
-       [   81,   114,    39,    81,     4,    12,     4],
-       [  103,   250,    19,     3,   260,    11,     7],
-       [   89,   173,   113,     5,     2,   600,    10],
-       [  173,   121,    14,     2,    10,     8,   799]])
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-6-a-second-level-model">
-<h2>Exercise 6: A second-level model<a class="headerlink" href="#exercise-6-a-second-level-model" title="Permalink to this headline">#</a></h2>
-<p>Build a binary model specifically to correctly choose between the first and the second class.
-Select only the data points with those classes and train a new random forest. Do a standard stratified split and plot the resulting ROC curve. Can we still improve the model by calibrating the threshold?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="n">X_bin</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">y</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">,</span> <span class="p">:]</span>
-<span class="n">y_bin</span> <span class="o">=</span> <span class="n">y</span><span class="p">[</span><span class="n">y</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="k">def</span> <span class="nf">plot_1</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">5</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_1</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span> <span class="n">y_bin</span><span class="p">,</span> <span class="n">evaluate_RF</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_24_0.png" src="../_images/Lab 3b - Ensembles Solution_24_0.png" />
-</div>
-</div>
-<p>The previously tuned hyperparameters are still good.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">roc_curve</span>
-
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">binary_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">thresholds_rf</span> <span class="o">=</span> <span class="n">roc_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">binary_forest</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">])</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC Curve RF&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;FPR&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;TPR (recall)&quot;</span><span class="p">)</span>
-<span class="n">close_default_rf</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds_rf</span> <span class="o">-</span> <span class="mf">0.5</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="n">tpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="s1">&#39;^&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
-         <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold 0.5 RF&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="mi">4</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_26_0.png" src="../_images/Lab 3b - Ensembles Solution_26_0.png" />
-</div>
-</div>
-<p>Yes, we want to be in the top left corner. Setting the threshold at 0.6 seems te be better.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="c1"># Too much code replication</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">,</span> <span class="n">tpr_rf</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s2">&quot;ROC Curve RF&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;FPR&quot;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;TPR (recall)&quot;</span><span class="p">)</span>
-<span class="n">close_default_rf</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmin</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">abs</span><span class="p">(</span><span class="n">thresholds_rf</span> <span class="o">-</span> <span class="mf">0.6</span><span class="p">))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">fpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="n">tpr_rf</span><span class="p">[</span><span class="n">close_default_rf</span><span class="p">],</span> <span class="s1">&#39;^&#39;</span><span class="p">,</span> <span class="n">markersize</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span>
-         <span class="n">label</span><span class="o">=</span><span class="s2">&quot;threshold 0.5 RF&quot;</span><span class="p">,</span> <span class="n">fillstyle</span><span class="o">=</span><span class="s2">&quot;none&quot;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">mew</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">(</span><span class="n">loc</span><span class="o">=</span><span class="mi">4</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_28_0.png" src="../_images/Lab 3b - Ensembles Solution_28_0.png" />
-</div>
-</div>
-</section>
-<section id="exercise-7-model-calibration">
-<h2>Exercise 7: Model calibration<a class="headerlink" href="#exercise-7-model-calibration" title="Permalink to this headline">#</a></h2>
-<p>For the trained binary random forest model, plot a calibration curve (see <a class="reference external" href="https://ml-course.github.io/engineer/slides_html/03%20-%20Model%20Selection.slides.html#/40">course notebook</a>).
-Next, try to correct for this using Platt Scaling (or sigmoid scaling).</p>
-<p>Probability calibration should be done on new data not used for model fitting. The class <a class="reference external" href="https://scikit-learn.org/stable/auto_examples/calibration/plot_calibration_curve.html#sphx-glr-auto-examples-calibration-plot-calibration-curve-py">CalibratedClassifierCV</a> uses a cross-validation generator and estimates for each split the model parameter on the train samples and the calibration of the test samples. The probabilities predicted for the folds are then averaged. Already fitted classifiers can be calibrated by CalibratedClassifierCV via the parameter cv=”prefit”. <a class="reference external" href="https://scikit-learn.org/stable/modules/calibration.html">Read more</a></p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.calibration</span> <span class="kn">import</span> <span class="n">calibration_curve</span>
-<span class="k">def</span> <span class="nf">plot_calibration_curve</span><span class="p">(</span><span class="n">y_true</span><span class="p">,</span> <span class="n">y_prob</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">hist</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-    <span class="n">prob_true</span><span class="p">,</span> <span class="n">prob_pred</span> <span class="o">=</span> <span class="n">calibration_curve</span><span class="p">(</span><span class="n">y_true</span><span class="p">,</span> <span class="n">y_prob</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="n">n_bins</span><span class="p">,</span> <span class="n">normalize</span><span class="o">=</span><span class="n">normalize</span><span class="p">)</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="k">if</span> <span class="n">hist</span><span class="p">:</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">hist</span><span class="p">(</span><span class="n">y_prob</span><span class="p">,</span> <span class="n">weights</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">y_prob</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">y_prob</span><span class="p">),</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">.4</span><span class="p">,</span>
-               <span class="n">bins</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">maximum</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">n_bins</span><span class="p">))</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="s1">&#39;:&#39;</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">)</span>
-    <span class="n">curve</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">prob_pred</span><span class="p">,</span> <span class="n">prob_true</span><span class="p">,</span> <span class="n">marker</span><span class="o">=</span><span class="s2">&quot;o&quot;</span><span class="p">)</span>
-
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;predicted probability&quot;</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s2">&quot;fraction of positive samples&quot;</span><span class="p">)</span>
-
-    <span class="n">ax</span><span class="o">.</span><span class="n">set</span><span class="p">(</span><span class="n">aspect</span><span class="o">=</span><span class="s1">&#39;equal&#39;</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">curve</span>
-
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X_bin</span><span class="p">,</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y_bin</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-<span class="n">binary_forest</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">scores</span> <span class="o">=</span> <span class="n">forest</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">]</span>
-<span class="n">plot_calibration_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">scores</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">20</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_30_0.png" src="../_images/Lab 3b - Ensembles Solution_30_0.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.calibration</span> <span class="kn">import</span> <span class="n">CalibratedClassifierCV</span>
-<span class="n">rf</span> <span class="o">=</span> <span class="n">RandomForestClassifier</span><span class="p">(</span><span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">n_estimators</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">max_depth</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span> <span class="c1">#Unfitted RF</span>
-<span class="n">sigmoid</span> <span class="o">=</span> <span class="n">CalibratedClassifierCV</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span> <span class="n">method</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">)</span>
-<span class="n">sigmoid</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_pred</span> <span class="o">=</span> <span class="n">sigmoid</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-<span class="n">prob_pos</span> <span class="o">=</span> <span class="n">sigmoid</span><span class="o">.</span><span class="n">predict_proba</span><span class="p">(</span><span class="n">X_test</span><span class="p">)[:,</span> <span class="mi">1</span><span class="p">]</span>
-<span class="n">plot_calibration_curve</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">prob_pos</span><span class="p">,</span> <span class="n">n_bins</span><span class="o">=</span><span class="mi">20</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_31_0.png" src="../_images/Lab 3b - Ensembles Solution_31_0.png" />
-</div>
-</div>
-</section>
-<section id="exercise-8-gradient-boosting">
-<h2>Exercise 8: Gradient Boosting<a class="headerlink" href="#exercise-8-gradient-boosting" title="Permalink to this headline">#</a></h2>
-<p>Implement a function <code class="docutils literal notranslate"><span class="pre">evaluate_GB</span></code> that measures the performance of <code class="docutils literal notranslate"><span class="pre">GradientBoostingClassifier</span></code> or the <code class="docutils literal notranslate"><span class="pre">XGBoostClassifier</span></code> for
-different learning rates (0.01, 0.1, 1, and 10). As before, use a 3-fold cross-validation. You can use a 5% stratified sample of the whole dataset.
-Finally plot the results for <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> ranging from 1 to 100. Run all the GBClassifiers with <code class="docutils literal notranslate"><span class="pre">random_state=1</span></code> to ensure reproducibility.</p>
-<p>Implement a function that plots the score of <code class="docutils literal notranslate"><span class="pre">evaluate_GB</span></code> for <code class="docutils literal notranslate"><span class="pre">n_estimators</span></code> = 10,20,30,…,100 on a linear scale.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Model Solution</span>
-<span class="c1"># This could be done more efficiently using warm starting</span>
-
-<span class="kn">from</span> <span class="nn">sklearn.ensemble</span> <span class="kn">import</span> <span class="n">GradientBoostingClassifier</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span><span class="p">,</span> <span class="n">StratifiedKFold</span>
-<span class="kn">from</span> <span class="nn">xgboost</span> <span class="kn">import</span> <span class="n">XGBClassifier</span>
-
-<span class="k">def</span> <span class="nf">evaluate_GB</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">n_estimators</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="p">[</span><span class="mf">0.01</span><span class="p">,</span><span class="mf">0.1</span><span class="p">,</span><span class="mi">1</span><span class="p">,</span><span class="mi">10</span><span class="p">],</span> <span class="n">scoring</span><span class="o">=</span><span class="s1">&#39;accuracy&#39;</span><span class="p">):</span>
-    <span class="n">res</span> <span class="o">=</span> <span class="p">{}</span>
-    <span class="k">for</span> <span class="n">lr</span> <span class="ow">in</span> <span class="n">learning_rate</span><span class="p">:</span>
-        <span class="n">rf</span> <span class="o">=</span> <span class="n">GradientBoostingClassifier</span><span class="p">(</span><span class="n">n_estimators</span><span class="o">=</span><span class="n">n_estimators</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="n">lr</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-        <span class="n">kfold</span> <span class="o">=</span> <span class="n">StratifiedKFold</span><span class="p">(</span><span class="n">n_splits</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-        <span class="n">res</span><span class="p">[</span><span class="s1">&#39;gb_&#39;</span><span class="o">+</span><span class="nb">str</span><span class="p">(</span><span class="n">lr</span><span class="p">)]</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">cross_val_score</span><span class="p">(</span><span class="n">rf</span><span class="p">,</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span><span class="n">cv</span><span class="o">=</span><span class="n">kfold</span><span class="p">,</span><span class="n">scoring</span><span class="o">=</span><span class="n">scoring</span><span class="p">))</span>
-    <span class="k">return</span> <span class="n">res</span>
-
-<span class="k">def</span> <span class="nf">plot_2</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">):</span>
-    <span class="n">Xs</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.05</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
-    <span class="n">param_name</span> <span class="o">=</span> <span class="s1">&#39;n_estimators&#39;</span>
-    <span class="n">param_range</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">150</span><span class="p">,</span> <span class="mi">20</span><span class="p">)</span>
-    <span class="n">plot_live</span><span class="p">(</span><span class="n">Xs</span><span class="p">,</span> <span class="n">ys</span><span class="p">,</span> <span class="n">evaluator</span><span class="p">,</span> <span class="n">param_name</span><span class="p">,</span> <span class="n">param_range</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="s1">&#39;linear&#39;</span><span class="p">)</span>
-<span class="n">plot_2</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">evaluate_GB</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/Lab 3b - Ensembles Solution_34_0.png" src="../_images/Lab 3b - Ensembles Solution_34_0.png" />
-</div>
-</div>
-<p>We notice that gradient boosting is a lot slower to train that random forests, and it performs less well (at least when using fewer than 150 iterations).
-A smaller learning rate requires more iterations but ultimately works out best. It is possible that the model with learning rate 0.01 will ultimately overtake the one with learning rate 0.1 but it may also take a long time.</p>
-<p>A learning rate that is too large performs poorly. For <code class="docutils literal notranslate"><span class="pre">learning_rate=1</span></code>, the model starts out well, but gradually performs worse. The instance weights are adapted so aggressively that the next model does not actually fix the mistakes of the previous model but ‘overshoots’ and introduces more errors in the ensemble. After a while, it is not capable to make fine enough adjustments and levels off, not improving the model anymore. <a class="reference external" href="https://mlexplained.com/2018/01/29/learning-rate-tuning-in-deep-learning-a-practical-guide/">A more detailed explanation can be read here</a>.</p>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            kernelName: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-              </div>
-              
-            </main>
-            <footer class="footer-article noprint">
-                
-    <!-- Previous / next buttons -->
-<div class='prev-next-area'>
-</div>
-            </footer>
-        </div>
-    </div>
-    <div class="footer-content row">
-        <footer class="col footer"><p>
-  
-    By Joaquin Vanschoren<br/>
-  
-      &copy; Copyright 2023. CC0 Licensed - Use as you like.<br/>
-</p>
-        </footer>
-    </div>
-    
-</div>
-
-
-      </div>
-    </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/pydata-sphinx-theme.js?digest=1999514e3f237ded88cf"></script>
-
-
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 4 - Pipelines Solution.html b/labs/Lab 4 - Pipelines Solution.html
deleted file mode 100644
index 571aa1faf..000000000
--- a/labs/Lab 4 - Pipelines Solution.html	
+++ /dev/null
@@ -1,978 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 4: Data preprocessing and pipelines &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>window.MathJax = {"options": {"processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 4 - Pipelines Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 4 - Pipelines Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 4 - Pipelines Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 4 - Pipelines Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 4: Data preprocessing and pipelines</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exploratory-analysis-and-visualization">Exploratory analysis and visualization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-build-a-pipeline">Exercise 1: Build a pipeline</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-test-the-pipeline">Exercise 2: Test the pipeline</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-a-first-benchmark">Exercise 3: A first benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#discussion">Discussion</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-tuning-linear-models">Exercise 4: Tuning linear models</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Discussion</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-tuning-svms">Exercise 5: Tuning SVMs</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5b-tuning-svms-2">Exercise 5b: Tuning SVMs (2)</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-feature-importance">Exercise 6: Feature importance</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-4-data-preprocessing-and-pipelines">
-<h1>Lab 4: Data preprocessing and pipelines<a class="headerlink" href="#lab-4-data-preprocessing-and-pipelines" title="Permalink to this heading">#</a></h1>
-<p>We explore the performance of several linear regression models on a real-world dataset, i.e. <a class="reference external" href="https://www.openml.org/d/41021">MoneyBall</a>. See the description on OpenML for more information. In short, this dataset captures performance data from baseball players. The regression task is to accurately predict the number of ‘runs’ each player can score, and understanding which are the most important factors.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download MoneyBall data from OpenML</span>
-<span class="n">moneyball</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">41021</span><span class="p">)</span>
-<span class="c1"># Get the pandas dataframe (default)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">attribute_names</span> <span class="o">=</span> <span class="n">moneyball</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">moneyball</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<section id="exploratory-analysis-and-visualization">
-<h2>Exploratory analysis and visualization<a class="headerlink" href="#exploratory-analysis-and-visualization" title="Permalink to this heading">#</a></h2>
-<p>First, we visually explore the data by visualizing the value distribution and the interaction between every other feature in a scatter matrix. We use the target feature as the color variable to see which features are correlated with the target.</p>
-<p>For the plotting to work, however, we need to remove the categorical features (the first 2) and fill in the missing values. Let’s find out which columns have missing values. This matches what we already saw on the OpenML page (<a class="reference external" href="https://www.openml.org/d/41021">https://www.openml.org/d/41021</a>).</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">isnull</span><span class="p">(</span><span class="n">X</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Team            False
-League          False
-Year            False
-RA              False
-W               False
-OBP             False
-SLG             False
-BA              False
-Playoffs        False
-RankSeason       True
-RankPlayoffs     True
-G               False
-OOBP             True
-OSLG             True
-dtype: bool
-</pre></div>
-</div>
-</div>
-</div>
-<p>For this first quick visualization, we will simply impute the missing values using the median. Removing all instances with missing values is not really an option since some features have consistent missing values: we would have to remove a lot of data.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Impute missing values with sklearn and rebuild the dataframe</span>
-<span class="kn">from</span> <span class="nn">sklearn.impute</span> <span class="kn">import</span> <span class="n">SimpleImputer</span>
-<span class="n">imputer</span> <span class="o">=</span> <span class="n">SimpleImputer</span><span class="p">(</span><span class="n">strategy</span><span class="o">=</span><span class="s2">&quot;median&quot;</span><span class="p">)</span>
-<span class="n">X_clean_array</span> <span class="o">=</span> <span class="n">imputer</span><span class="o">.</span><span class="n">fit_transform</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">attribute_names</span><span class="p">[</span><span class="mi">2</span><span class="p">:]])</span> <span class="c1"># skip the first 2 features</span>
-<span class="c1"># The imputer will return a numpy array. To plot it we make it a pandas dataframe again.</span>
-<span class="n">X_clean</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">X_clean_array</span><span class="p">,</span> <span class="n">columns</span> <span class="o">=</span> <span class="n">attribute_names</span><span class="p">[</span><span class="mi">2</span><span class="p">:])</span> <span class="c1">#</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>Next, we build the scatter matrix. We include the target column to see which features strongly correlate with the target, and also use the target value as the color to see which combinations of features correlate with the target.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">pandas.plotting</span> <span class="kn">import</span> <span class="n">scatter_matrix</span>
-
-<span class="c1"># Scatter matrix of dataframe including the target feature</span>
-<span class="n">copyframe</span> <span class="o">=</span> <span class="n">X_clean</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span> 
-<span class="n">copyframe</span><span class="p">[</span><span class="s1">&#39;y&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">Series</span><span class="p">(</span><span class="n">y</span><span class="p">,</span> <span class="n">index</span><span class="o">=</span><span class="n">copyframe</span><span class="o">.</span><span class="n">index</span><span class="p">)</span>
-<span class="n">scatter_matrix</span><span class="p">(</span><span class="n">copyframe</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">25</span><span class="p">,</span><span class="mi">25</span><span class="p">),</span> 
-               <span class="n">marker</span><span class="o">=</span><span class="s1">&#39;o&#39;</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">.8</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="s1">&#39;viridis&#39;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/4d4de1353ded20f6ae577478ff3f15706819ad0e78bde5de7bc9398e3d47efad.png" src="../_images/4d4de1353ded20f6ae577478ff3f15706819ad0e78bde5de7bc9398e3d47efad.png" />
-</div>
-</div>
-<p>Several things immediately stand out:</p>
-<ul class="simple">
-<li><p>OBP, SLG and BA strongly correlate with the target (near-diagonals in the final column), but also combinations of either of these and W or R seem useful.</p></li>
-<li><p>RA, W, OBP, SLG and BA seem normally distributed, most others do not.</p></li>
-<li><p>OOBP and OSLG have a very peaked distribution.</p></li>
-<li><p>‘Playoffs’ seems to be categorical and should probably be encoded as such.</p></li>
-</ul>
-</section>
-<section id="exercise-1-build-a-pipeline">
-<h2>Exercise 1: Build a pipeline<a class="headerlink" href="#exercise-1-build-a-pipeline" title="Permalink to this heading">#</a></h2>
-<p>Implement a function <code class="docutils literal notranslate"><span class="pre">build_pipeline</span></code> that does the following:</p>
-<ul class="simple">
-<li><p>Impute missing values by replacing NaN’s with the feature median for numerical features.</p></li>
-<li><p>Encode the categorical features using OneHotEncoding.</p></li>
-<li><p>If the attribute <code class="docutils literal notranslate"><span class="pre">scaling=True</span></code>, also scale the data using standard scaling.</p></li>
-<li><p>Attach the given regression model to the end of the pipeline</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">build_pipeline</span><span class="p">(</span><span class="n">regressor</span><span class="p">,</span> <span class="n">numerical</span><span class="p">,</span> <span class="n">categorical</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot; Build a robust pipeline with the given regression model</span>
-<span class="sd">    Keyword arguments:</span>
-<span class="sd">    regressor -- the regression model</span>
-<span class="sd">    categorical -- the list of categorical features</span>
-<span class="sd">    scaling -- whether or not to scale the data</span>
-<span class="sd">    </span>
-<span class="sd">    Returns: a pipeline</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">pass</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">### Model solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.preprocessing</span> <span class="kn">import</span> <span class="n">StandardScaler</span><span class="p">,</span> <span class="n">MinMaxScaler</span><span class="p">,</span> <span class="n">OneHotEncoder</span>
-<span class="kn">from</span> <span class="nn">sklearn.pipeline</span> <span class="kn">import</span> <span class="n">make_pipeline</span><span class="p">,</span> <span class="n">Pipeline</span>
-<span class="kn">from</span> <span class="nn">sklearn.compose</span> <span class="kn">import</span> <span class="n">make_column_transformer</span>
-
-<span class="k">def</span> <span class="nf">build_pipeline</span><span class="p">(</span><span class="n">regressor</span><span class="p">,</span> <span class="n">categorical</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-    <span class="n">cat_pipe</span> <span class="o">=</span> <span class="n">make_pipeline</span><span class="p">(</span><span class="n">OneHotEncoder</span><span class="p">(</span><span class="n">sparse</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">handle_unknown</span><span class="o">=</span><span class="s1">&#39;ignore&#39;</span><span class="p">))</span>
-    <span class="n">num_pipe</span> <span class="o">=</span> <span class="n">make_pipeline</span><span class="p">(</span><span class="n">SimpleImputer</span><span class="p">(</span><span class="n">strategy</span><span class="o">=</span><span class="s1">&#39;mean&#39;</span><span class="p">))</span>
-    <span class="k">if</span> <span class="n">scaling</span><span class="p">:</span>
-        <span class="n">num_pipe</span><span class="o">.</span><span class="n">steps</span><span class="o">.</span><span class="n">insert</span><span class="p">(</span><span class="mi">1</span><span class="p">,[</span><span class="s2">&quot;scaler&quot;</span><span class="p">,</span> <span class="n">StandardScaler</span><span class="p">()])</span> 
-    <span class="n">transform</span> <span class="o">=</span> <span class="n">make_column_transformer</span><span class="p">((</span><span class="n">cat_pipe</span><span class="p">,</span> <span class="n">categorical</span><span class="p">),</span> <span class="n">remainder</span><span class="o">=</span><span class="n">num_pipe</span><span class="p">)</span>
-    <span class="c1"># Give a name to the regressor so that we can tune it more easily</span>
-    <span class="k">return</span> <span class="n">Pipeline</span><span class="p">(</span><span class="n">steps</span><span class="o">=</span><span class="p">[(</span><span class="s1">&#39;preprocess&#39;</span><span class="p">,</span> <span class="n">transform</span><span class="p">),</span> <span class="p">(</span><span class="s1">&#39;reg&#39;</span><span class="p">,</span> <span class="n">regressor</span><span class="p">)])</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-2-test-the-pipeline">
-<h2>Exercise 2: Test the pipeline<a class="headerlink" href="#exercise-2-test-the-pipeline" title="Permalink to this heading">#</a></h2>
-<p>Test the pipeline by evaluating linear regression (without scaling) on the dataset, using 5-fold cross-validation and <span class="math notranslate nohighlight">\(R^2\)</span>. Make sure to run it on the original dataset (‘X’), not the manually cleaned version (‘X_clean’).</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">### Model solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">cross_val_score</span>
-<span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">LinearRegression</span>
-<span class="n">categorical</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;Team&quot;</span><span class="p">,</span><span class="s2">&quot;League&quot;</span><span class="p">]</span>
-<span class="n">regressor</span> <span class="o">=</span> <span class="n">LinearRegression</span><span class="p">()</span>
-<span class="n">pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">LinearRegression</span><span class="p">(),</span><span class="n">categorical</span><span class="p">)</span>
-<span class="n">scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">pipe</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Cross-validated R^2 score for </span><span class="si">{}</span><span class="s2">: </span><span class="si">{:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">regressor</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">,</span> <span class="n">scores</span><span class="o">.</span><span class="n">mean</span><span class="p">()))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Cross-validated R^2 score for LinearRegression: 0.92
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-3-a-first-benchmark">
-<h2>Exercise 3: A first benchmark<a class="headerlink" href="#exercise-3-a-first-benchmark" title="Permalink to this heading">#</a></h2>
-<p>Evaluate the following algorithms in their default settings, both with and without scaling, and interpret the results:</p>
-<ul class="simple">
-<li><p>Linear regression</p></li>
-<li><p>Ridge</p></li>
-<li><p>Lasso</p></li>
-<li><p>SVM (RBF)</p></li>
-<li><p>RandomForests</p></li>
-<li><p>GradientBoosting</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">### Model solution</span>
-<span class="kn">from</span> <span class="nn">sklearn.linear_model</span> <span class="kn">import</span> <span class="n">LinearRegression</span><span class="p">,</span> <span class="n">Ridge</span><span class="p">,</span> <span class="n">Lasso</span>
-<span class="kn">from</span> <span class="nn">sklearn.ensemble</span> <span class="kn">import</span> <span class="n">RandomForestRegressor</span><span class="p">,</span> <span class="n">GradientBoostingRegressor</span>
-<span class="kn">from</span> <span class="nn">sklearn.svm</span> <span class="kn">import</span> <span class="n">SVR</span>
-<span class="kn">from</span> <span class="nn">tqdm</span> <span class="kn">import</span> <span class="n">tqdm_notebook</span> <span class="k">as</span> <span class="n">tqdm</span>
-
-<span class="n">models</span> <span class="o">=</span> <span class="p">[</span><span class="n">LinearRegression</span><span class="p">(),</span> <span class="n">Ridge</span><span class="p">(),</span> <span class="n">Lasso</span><span class="p">(),</span> <span class="n">RandomForestRegressor</span><span class="p">(),</span> <span class="n">GradientBoostingRegressor</span><span class="p">(),</span> <span class="n">SVR</span><span class="p">()]</span>
-<span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="n">tqdm</span><span class="p">(</span><span class="n">models</span><span class="p">):</span>
-    <span class="n">pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">m</span><span class="p">,</span><span class="n">categorical</span><span class="p">)</span>
-    <span class="n">scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">pipe</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;R^2 score for </span><span class="si">{}</span><span class="s2">: </span><span class="si">{:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">m</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">,</span> <span class="n">scores</span><span class="o">.</span><span class="n">mean</span><span class="p">()))</span>
-    <span class="n">pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">m</span><span class="p">,</span><span class="n">categorical</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">pipe</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;R^2 score for </span><span class="si">{}</span><span class="s2"> (scaled): </span><span class="si">{:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">m</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">,</span> <span class="n">scores</span><span class="o">.</span><span class="n">mean</span><span class="p">()))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<script type="application/vnd.jupyter.widget-view+json">{"model_id": "1f1605b020664fa387b35ee2fb9bcbe3", "version_major": 2, "version_minor": 0}</script><div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>R^2 score for LinearRegression: 0.92
-R^2 score for LinearRegression (scaled): -22898115995987259424768.00
-R^2 score for Ridge: 0.83
-R^2 score for Ridge (scaled): 0.92
-R^2 score for Lasso: 0.81
-R^2 score for Lasso (scaled): 0.92
-R^2 score for RandomForestRegressor: 0.89
-R^2 score for RandomForestRegressor (scaled): 0.89
-R^2 score for GradientBoostingRegressor: 0.91
-R^2 score for GradientBoostingRegressor (scaled): 0.91
-R^2 score for SVR: -0.46
-R^2 score for SVR (scaled): 0.27
-</pre></div>
-</div>
-</div>
-</div>
-<section id="discussion">
-<h3>Discussion<a class="headerlink" href="#discussion" title="Permalink to this heading">#</a></h3>
-<p>Without scaling: LinearRegression without scaling works better than Ridge and Lasso. The latter two are perhaps overfitting and need to be tuned. RandomForest and GradientBoosting do well (almost as good as LinearRegression), but can still be improven. The SVM performs very badly (worse than simply predicting the mean).</p>
-<p>Scaling helps performance significantly, except for LinearRegression which now seems to massively overfit. Since scaling also changes the scale of the coefficients, the default hyperparameter settings may just fit better after scaling for Ridge and Lasso, but not for the unregularized LinearRegression. Indeed, if one feature had a very different scale, the corresponding coefficient has to compensate for this, leading to possibly large coefficients and more likely overfitting. Thus, scaling may sometimes act as a regularizer. The SVM improves a lot after scaling but there is still a lot more room for tuning. The tree-based models are, as expected, not affected by scaling.</p>
-<p>Note: the extremely bad result for scaled linear regression is caused by a single bad train-test split. If we try different splits we get:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">LinearRegression</span><span class="p">(),</span><span class="n">categorical</span><span class="p">,</span><span class="n">scaling</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">scores</span> <span class="o">=</span> <span class="n">cross_val_score</span><span class="p">(</span><span class="n">pipe</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">8</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;R^2 score for </span><span class="si">{}</span><span class="s2">: </span><span class="si">{:.2f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">LinearRegression</span><span class="p">()</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">,</span> <span class="n">scores</span><span class="o">.</span><span class="n">mean</span><span class="p">()))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>R^2 score for LinearRegression: 0.92
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-</section>
-<section id="exercise-4-tuning-linear-models">
-<h2>Exercise 4: Tuning linear models<a class="headerlink" href="#exercise-4-tuning-linear-models" title="Permalink to this heading">#</a></h2>
-<p>Next, visualize the effect of the alpha regularizer for Ridge and Lasso. Vary alpha from 1e-4 to 1e6 and plot the <span class="math notranslate nohighlight">\(R^2\)</span> score as a line plot (one line for each algorithm). Always use scaling. Interpret the results.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">GridSearchCV</span> 
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-
-<span class="n">grid_alpha</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;reg__alpha&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">4</span><span class="p">,</span> <span class="mi">6</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">50</span><span class="p">)}</span>
-
-<span class="c1"># Build a pipeline and runs a grid search</span>
-<span class="k">def</span> <span class="nf">evaluateGrid</span><span class="p">(</span><span class="n">regressor</span><span class="p">,</span> <span class="n">grid</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-    <span class="n">pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">regressor</span><span class="p">,</span> <span class="n">categorical</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="n">scaling</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">GridSearchCV</span><span class="p">(</span><span class="n">pipe</span><span class="p">,</span> <span class="n">grid</span><span class="p">,</span> <span class="n">n_jobs</span><span class="o">=-</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">)</span>
-
-<span class="n">ridge_res</span> <span class="o">=</span> <span class="n">evaluateGrid</span><span class="p">(</span><span class="n">Ridge</span><span class="p">(),</span> <span class="n">grid_alpha</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
-<span class="n">_</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s1">&#39;reg__alpha&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">ridge_res</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;params&#39;</span><span class="p">]],</span> 
-           <span class="n">ridge_res</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_test_score&#39;</span><span class="p">],</span> <span class="s1">&#39;b&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Ridge&#39;</span><span class="p">)</span>
-<span class="n">lasso_res</span> <span class="o">=</span> <span class="n">evaluateGrid</span><span class="p">(</span><span class="n">Lasso</span><span class="p">(),</span> <span class="n">grid_alpha</span><span class="p">,</span> <span class="kc">True</span><span class="p">)</span>
-<span class="n">_</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s1">&#39;reg__alpha&#39;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">lasso_res</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;params&#39;</span><span class="p">]],</span> 
-           <span class="n">lasso_res</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_test_score&#39;</span><span class="p">],</span> <span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Lasso&#39;</span><span class="p">)</span>
-<span class="n">_</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">xscale</span><span class="p">(</span><span class="s1">&#39;log&#39;</span><span class="p">)</span>
-<span class="n">_</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">ylim</span><span class="p">([</span><span class="mf">0.8</span><span class="p">,</span> <span class="mf">0.94</span><span class="p">])</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Best result </span><span class="si">{:.3f}</span><span class="s2"> with </span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">lasso_res</span><span class="o">.</span><span class="n">best_score_</span><span class="p">,</span> <span class="n">lasso_res</span><span class="o">.</span><span class="n">best_params_</span><span class="p">));</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/430e78898fdffa9df3c7765ea1e0b5d0fe7992d198c454e7df0fa62a298e6b3c.png" src="../_images/430e78898fdffa9df3c7765ea1e0b5d0fe7992d198c454e7df0fa62a298e6b3c.png" />
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Best result 0.927 with {&#39;reg__alpha&#39;: 0.11513953993264481}
-</pre></div>
-</div>
-</div>
-</div>
-<section id="id1">
-<h3>Discussion<a class="headerlink" href="#id1" title="Permalink to this heading">#</a></h3>
-<p>Lasso (red line) finds a slightly better model than Ridge, with an optional alpha of around 0.1 (you may need to zoon in to see it). For values larger than 10, Lasso starts underfitting heavily (it penalizes large coefficients too much), and <span class="math notranslate nohighlight">\(R^2\)</span> drops to 0 (and lower). Ridge is slighlty less sensitive to alpha and only starts overfitting heavily for alpha values of 1000 or larger.</p>
-</section>
-</section>
-<section id="exercise-5-tuning-svms">
-<h2>Exercise 5: Tuning SVMs<a class="headerlink" href="#exercise-5-tuning-svms" title="Permalink to this heading">#</a></h2>
-<p>Next, tune the SVM’s C and gamma. You can stay within the 1e-6 to 1e6 range. Plot the <span class="math notranslate nohighlight">\(R^2\)</span> score as a heatmap.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">heatmap</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">xlabel</span><span class="p">,</span> <span class="n">ylabel</span><span class="p">,</span> <span class="n">xticklabels</span><span class="p">,</span> <span class="n">yticklabels</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-            <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">ax</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">fmt</span><span class="o">=</span><span class="s2">&quot;</span><span class="si">%0.2f</span><span class="s2">&quot;</span><span class="p">):</span>
-    <span class="k">if</span> <span class="n">ax</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-        <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">gca</span><span class="p">()</span>
-    <span class="c1"># plot the mean cross-validation scores</span>
-    <span class="n">img</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">pcolor</span><span class="p">(</span><span class="n">values</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="n">cmap</span><span class="p">,</span> <span class="n">vmin</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">vmax</span><span class="o">=</span><span class="kc">None</span><span class="p">)</span>
-    <span class="n">img</span><span class="o">.</span><span class="n">update_scalarmappable</span><span class="p">()</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="n">xlabel</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="n">ylabel</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">))</span> <span class="o">+</span> <span class="mf">.5</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_xticklabels</span><span class="p">(</span><span class="n">xticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="n">yticklabels</span><span class="p">)</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">set_aspect</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-
-    <span class="k">for</span> <span class="n">p</span><span class="p">,</span> <span class="n">color</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">img</span><span class="o">.</span><span class="n">get_paths</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_facecolors</span><span class="p">(),</span> <span class="n">img</span><span class="o">.</span><span class="n">get_array</span><span class="p">()):</span>
-        <span class="n">x</span><span class="p">,</span> <span class="n">y</span> <span class="o">=</span> <span class="n">p</span><span class="o">.</span><span class="n">vertices</span><span class="p">[:</span><span class="o">-</span><span class="mi">2</span><span class="p">,</span> <span class="p">:]</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
-        <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">color</span><span class="p">[:</span><span class="mi">3</span><span class="p">])</span> <span class="o">&gt;</span> <span class="mf">0.5</span><span class="p">:</span>
-            <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;k&#39;</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">c</span> <span class="o">=</span> <span class="s1">&#39;w&#39;</span>
-        <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">fmt</span> <span class="o">%</span> <span class="n">value</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="n">c</span><span class="p">,</span> <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">,</span> <span class="n">va</span><span class="o">=</span><span class="s2">&quot;center&quot;</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">img</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">svm_heat</span><span class="p">(</span><span class="n">scaling</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
-    <span class="c1"># Run a 2D grid search and build a heatmap with the results</span>
-    <span class="n">grid_svm</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;reg__C&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">5</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">6</span><span class="p">),</span>
-                <span class="s1">&#39;reg__gamma&#39;</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">logspace</span><span class="p">(</span><span class="o">-</span><span class="mi">6</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="n">num</span><span class="o">=</span><span class="mi">6</span><span class="p">)}</span>
-    <span class="n">svm_res</span> <span class="o">=</span> <span class="n">evaluateGrid</span><span class="p">(</span><span class="n">SVR</span><span class="p">(),</span> <span class="n">grid_svm</span><span class="p">,</span> <span class="n">scaling</span><span class="o">=</span><span class="n">scaling</span><span class="p">)</span>
-
-    <span class="c1"># Reshape and transpose (we want alpha on the x-axes to compare with the previous plot)</span>
-    <span class="n">scores</span> <span class="o">=</span> <span class="n">svm_res</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">[</span><span class="s1">&#39;mean_test_score&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="n">grid_svm</span><span class="p">[</span><span class="s1">&#39;reg__C&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">size</span><span class="p">,</span>
-                                                            <span class="n">grid_svm</span><span class="p">[</span><span class="s1">&#39;reg__gamma&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">size</span><span class="p">)</span><span class="o">.</span><span class="n">T</span>
-    <span class="n">heatmap</span><span class="p">(</span><span class="n">scores</span><span class="p">,</span> <span class="n">xlabel</span><span class="o">=</span><span class="s1">&#39;C&#39;</span><span class="p">,</span> <span class="n">xticklabels</span><span class="o">=</span><span class="n">grid_svm</span><span class="p">[</span><span class="s1">&#39;reg__C&#39;</span><span class="p">],</span>
-            <span class="n">ylabel</span><span class="o">=</span><span class="s1">&#39;gamma&#39;</span><span class="p">,</span> <span class="n">yticklabels</span><span class="o">=</span><span class="n">grid_svm</span><span class="p">[</span><span class="s1">&#39;reg__gamma&#39;</span><span class="p">],</span> <span class="n">cmap</span><span class="o">=</span><span class="s2">&quot;viridis&quot;</span><span class="p">);</span>
-
-<span class="n">svm_heat</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/c6589b45bb71c23eec2fe71c20271bbf1b701858dc499842d10e54982115e5d0.png" src="../_images/c6589b45bb71c23eec2fe71c20271bbf1b701858dc499842d10e54982115e5d0.png" />
-</div>
-</div>
-</section>
-<section id="exercise-5b-tuning-svms-2">
-<h2>Exercise 5b: Tuning SVMs (2)<a class="headerlink" href="#exercise-5b-tuning-svms-2" title="Permalink to this heading">#</a></h2>
-<p>Redraw the heatmap, but now use scaling. What do you observe?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">svm_heat</span><span class="p">(</span><span class="n">scaling</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/4e74809ca2d209105609e81e9e8f4638ba55758b4c37ad94376fee3bbf306c95.png" src="../_images/4e74809ca2d209105609e81e9e8f4638ba55758b4c37ad94376fee3bbf306c95.png" />
-</div>
-</div>
-<p>The tuned SVM yields scores that are identical to the best scores found (0.92 <span class="math notranslate nohighlight">\(R^2\)</span>), but only if we do scaling.
-Without scaling, we get nowhere near that performance, no matter how much we tune.</p>
-</section>
-<section id="exercise-6-feature-importance">
-<h2>Exercise 6: Feature importance<a class="headerlink" href="#exercise-6-feature-importance" title="Permalink to this heading">#</a></h2>
-<p>Retrieve the coefficients from the optimized Lasso, Ridge, and the feature importances from the default RandomForest and GradientBoosting models.
-Compare the results. Do the different models agree on which features are important? You will need to map the encoded feature names to the correct coefficients and feature importances.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># The OneHotEncoder has messed up our attribute names, so we must map features to names again</span>
-<span class="c1"># feature_indices_ returns a mapping for the one-hot-encoded features</span>
-<span class="n">fi</span> <span class="o">=</span> <span class="n">lasso_res</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="n">named_steps</span><span class="p">[</span><span class="s1">&#39;preprocess&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">named_transformers_</span><span class="p">[</span><span class="s1">&#39;pipeline&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">named_steps</span><span class="p">[</span><span class="s1">&#39;onehotencoder&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">get_feature_names</span><span class="p">(</span><span class="n">input_features</span><span class="o">=</span><span class="n">categorical</span><span class="p">)</span>
-<span class="n">new_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">fi</span><span class="p">)</span>
-<span class="n">new_names</span><span class="o">.</span><span class="n">extend</span><span class="p">(</span><span class="n">attribute_names</span><span class="p">[</span><span class="mi">2</span><span class="p">:])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># We additionally train a RandomForest and Gradient Booster to see if they return the same feature importances</span>
-<span class="n">rf_pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">RandomForestRegressor</span><span class="p">(),</span><span class="n">categorical</span><span class="p">)</span>
-<span class="n">rf_pipe</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">);</span>
-<span class="n">gb_pipe</span> <span class="o">=</span> <span class="n">build_pipeline</span><span class="p">(</span><span class="n">GradientBoostingRegressor</span><span class="p">(),</span><span class="n">categorical</span><span class="p">)</span>
-<span class="n">gb_pipe</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">df</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">({</span><span class="s1">&#39;names&#39;</span><span class="p">:</span> <span class="n">new_names</span><span class="p">,</span> 
-                   <span class="s1">&#39;lasso&#39;</span><span class="p">:</span> <span class="n">lasso_res</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="n">get_params</span><span class="p">()[</span><span class="s1">&#39;reg&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">coef_</span><span class="p">,</span>
-                   <span class="s1">&#39;ridge&#39;</span><span class="p">:</span> <span class="n">ridge_res</span><span class="o">.</span><span class="n">best_estimator_</span><span class="o">.</span><span class="n">get_params</span><span class="p">()[</span><span class="s1">&#39;reg&#39;</span><span class="p">]</span><span class="o">.</span><span class="n">coef_</span><span class="p">,</span>
-                   <span class="s1">&#39;random_forest&#39;</span><span class="p">:</span> <span class="n">rf_pipe</span><span class="o">.</span><span class="n">named_steps</span><span class="o">.</span><span class="n">reg</span><span class="o">.</span><span class="n">feature_importances_</span><span class="p">,</span>
-                   <span class="s1">&#39;gradient_boosting&#39;</span><span class="p">:</span> <span class="n">gb_pipe</span><span class="o">.</span><span class="n">named_steps</span><span class="o">.</span><span class="n">reg</span><span class="o">.</span><span class="n">feature_importances_</span><span class="p">})</span>
-<span class="n">ind</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">df</span><span class="p">))</span>
-<span class="n">width</span> <span class="o">=</span> <span class="mf">0.2</span>
-
-<span class="c1"># Coefficients</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">6</span><span class="p">,</span> <span class="mi">10</span><span class="p">))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">ind</span><span class="p">,</span> <span class="n">df</span><span class="o">.</span><span class="n">lasso</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;red&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Lasso&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">ind</span> <span class="o">+</span> <span class="n">width</span><span class="p">,</span> <span class="n">df</span><span class="o">.</span><span class="n">ridge</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;green&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Ridge&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="n">new_names</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">new_names</span><span class="p">)))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Coefficients&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">6</span><span class="p">,</span> <span class="mi">10</span><span class="p">))</span>
-<span class="c1"># RandomForest feature importances</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">ind</span> <span class="o">+</span> <span class="n">width</span><span class="o">*</span><span class="mi">2</span><span class="p">,</span> <span class="n">df</span><span class="o">.</span><span class="n">random_forest</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;orange&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;RandomForest&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">barh</span><span class="p">(</span><span class="n">ind</span> <span class="o">+</span> <span class="n">width</span><span class="o">*</span><span class="mi">3</span><span class="p">,</span> <span class="n">df</span><span class="o">.</span><span class="n">gradient_boosting</span><span class="p">,</span> <span class="n">width</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;blue&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;GradientBoosting&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="n">new_names</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">new_names</span><span class="p">)))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Feature importance (RF/GB)&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlim</span><span class="p">(</span><span class="o">-</span><span class="mf">0.285</span><span class="p">,</span> <span class="mf">0.8</span><span class="p">)</span> <span class="c1">#</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/b76d87e106c2b645df2ca06f25b9177a44efa32c5578063d3b7b9125ffbe12ab.png" src="../_images/b76d87e106c2b645df2ca06f25b9177a44efa32c5578063d3b7b9125ffbe12ab.png" />
-<img alt="../_images/194160ff63fd822f9d77ca2a377ca018d0729d832facef60ca0f4fdafada1708.png" src="../_images/194160ff63fd822f9d77ca2a377ca018d0729d832facef60ca0f4fdafada1708.png" />
-</div>
-</div>
-<p>Ridge and lasso roughly agree on the importance of features. Especially SLG, OBP, W, and RA are deemed important, and to a lesser degree Year. Also, interestingly, it seems to matter whether the player plays in the American League (League_AL) or not, and playing in some teams (BOSton, BALtimore, NYMets, OAKland) is also a good indicator.</p>
-<p>One very obvious phenomenon is that Ridge considers all the one-hot-encoded features to be quite important. Since ridge uses the L2 norm, it will prefer many small coefficients, whereas Lasso (L1 norm) prefers to have many coefficients equal to 0. This is exactly what we are seeing here. From the plots above, we’ve seen that Ridge performs worse than Lasso, and the rather large coefficients for one-hot-encoded features hint at overfitting.</p>
-<p>RandomForest and GradientBoosting deem especially SLG and OBP important. All the one-hot-encoded features have an importance of about 0.</p>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exploratory-analysis-and-visualization">Exploratory analysis and visualization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-build-a-pipeline">Exercise 1: Build a pipeline</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-test-the-pipeline">Exercise 2: Test the pipeline</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-a-first-benchmark">Exercise 3: A first benchmark</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#discussion">Discussion</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-tuning-linear-models">Exercise 4: Tuning linear models</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Discussion</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-tuning-svms">Exercise 5: Tuning SVMs</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5b-tuning-svms-2">Exercise 5b: Tuning SVMs (2)</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-feature-importance">Exercise 6: Feature importance</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 5 - Bayesian learning Solution.html b/labs/Lab 5 - Bayesian learning Solution.html
deleted file mode 100644
index dc5ed3e77..000000000
--- a/labs/Lab 5 - Bayesian learning Solution.html	
+++ /dev/null
@@ -1,848 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 6: Bayesian models (Solution) &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 5 - Bayesian learning Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 5 - Bayesian learning Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 5 - Bayesian learning Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 5 - Bayesian learning Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 6: Bayesian models (Solution)</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#">Lab 6: Bayesian models (Solution)</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-visualizing-predictions">Exercise 1: visualizing predictions</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-reducing-the-uncertainty">Exercise 2: reducing the uncertainty</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-kernels">Exercise 3: Kernels</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-mauna-loa-data">Exercise 4: Mauna Loa data</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-1">Exercise 4.1</a></li>
-</ul>
-
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section id="lab-6-bayesian-models-solution">
-<h1>Lab 6: Bayesian models (Solution)<a class="headerlink" href="#lab-6-bayesian-models-solution" title="Permalink to this heading">#</a></h1>
-<p>We will first learn a GP regressor for an artificial, non-linear function to illustrate some basic aspects of GPs. To this end, we consider a sinusoidal function from which we sample a dataset.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># General imports</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">from</span> <span class="nn">preamble</span> <span class="kn">import</span> <span class="o">*</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;figure.dpi&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">100</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>The function to predict and the dataset we create from it:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">f</span><span class="p">(</span><span class="n">x</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;The function to predict.&quot;&quot;&quot;</span>
-    <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">sin</span><span class="p">((</span><span class="n">x</span> <span class="o">-</span> <span class="mf">2.5</span><span class="p">)</span> <span class="o">**</span> <span class="mi">3</span><span class="p">)</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">8</span><span class="p">,</span><span class="mi">4</span><span class="p">))</span>
-<span class="n">t</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">5</span><span class="p">,</span><span class="mi">1000</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">t</span><span class="p">,</span> <span class="n">f</span><span class="p">(</span><span class="n">t</span><span class="p">),</span> <span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;original f(x)&#39;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[&lt;matplotlib.lines.Line2D at 0x7fe415cadeb0&gt;]
-</pre></div>
-</div>
-<img alt="../_images/3f4b4b671332779dce8b9ef16c08b380620ba300832ece0cabc8e9822049f370.png" src="../_images/3f4b4b671332779dce8b9ef16c08b380620ba300832ece0cabc8e9822049f370.png" />
-</div>
-</div>
-<p>The dataset we create based on the function:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Dataset sampled from a sine function</span>
-<span class="n">rng</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">RandomState</span><span class="p">(</span><span class="mi">4</span><span class="p">)</span>
-<span class="n">X_</span> <span class="o">=</span> <span class="n">rng</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">1000</span><span class="p">)[:,</span> <span class="n">np</span><span class="o">.</span><span class="n">newaxis</span><span class="p">]</span>
-<span class="n">y_</span> <span class="o">=</span> <span class="n">f</span><span class="p">(</span><span class="n">X_</span><span class="p">)</span><span class="o">.</span><span class="n">ravel</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">plot_gp</span><span class="p">(</span><span class="n">g</span><span class="p">,</span> <span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">X_full</span><span class="p">,</span> <span class="n">y_full</span><span class="p">,</span> <span class="n">y_pred_mean</span><span class="p">,</span> <span class="n">y_pred_std</span><span class="p">,</span> <span class="n">use_title</span><span class="o">=</span><span class="s2">&quot;yes&quot;</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Visualizes the GP predictions, training points and original function</span>
-<span class="sd">    </span>
-<span class="sd">    Attributes:</span>
-<span class="sd">    X_train -- The training data</span>
-<span class="sd">    y_train -- The correct labels</span>
-<span class="sd">    X_full -- The data to calculate predictions</span>
-<span class="sd">    y_full -- The correct labels of the prediction data</span>
-<span class="sd">    y_pred_mean -- the predicted means</span>
-<span class="sd">    y_pred_std -- the predicted st. devs.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">x_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">linspace</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span> <span class="mi">1000</span><span class="p">)[:,</span><span class="n">np</span><span class="o">.</span><span class="n">newaxis</span><span class="p">]</span>
-    
-    <span class="n">idx</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">X_full</span><span class="p">[:,</span><span class="mi">0</span><span class="p">])</span>
-    
-    <span class="c1"># Original function</span>
-    <span class="n">a</span> <span class="o">=</span> <span class="n">X_full</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
-    <span class="n">b</span> <span class="o">=</span> <span class="n">y_full</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
-    
-    <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">8</span><span class="p">,</span><span class="mi">4</span><span class="p">))</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">a</span><span class="p">,</span> 
-             <span class="n">b</span><span class="p">,</span> <span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">label</span> <span class="o">=</span> <span class="s1">&#39;original f(x)&#39;</span><span class="p">)</span>
-    
-    <span class="c1"># Training points</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">scatter</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">c</span><span class="o">=</span><span class="s1">&#39;r&#39;</span><span class="p">,</span> <span class="n">s</span><span class="o">=</span><span class="mi">50</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">edgecolors</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
-    
-    <span class="c1"># Prediction </span>
-    <span class="n">d</span> <span class="o">=</span> <span class="n">y_pred_mean</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
-    <span class="n">e</span> <span class="o">=</span> <span class="n">y_pred_std</span><span class="p">[</span><span class="n">idx</span><span class="p">]</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">a</span><span class="p">,</span> <span class="n">d</span><span class="p">,</span> <span class="s1">&#39;k&#39;</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">zorder</span><span class="o">=</span><span class="mi">9</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">fill_between</span><span class="p">(</span><span class="n">a</span><span class="p">[:,</span><span class="mi">0</span><span class="p">],</span> <span class="n">d</span> <span class="o">-</span> <span class="mf">1.96</span><span class="o">*</span><span class="n">e</span><span class="p">,</span> <span class="n">d</span> <span class="o">+</span> <span class="mf">1.96</span><span class="o">*</span><span class="n">e</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.2</span><span class="p">,</span> <span class="n">color</span><span class="o">=</span><span class="s1">&#39;k&#39;</span><span class="p">)</span>
-    
-    <span class="k">if</span> <span class="n">use_title</span> <span class="o">==</span> <span class="s2">&quot;yes&quot;</span><span class="p">:</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="s2">&quot;Posterior (kernel: </span><span class="si">%s</span><span class="s2">)</span><span class="se">\n</span><span class="s2"> Log-Likelihood: </span><span class="si">%.3f</span><span class="s2">&quot;</span>
-              <span class="o">%</span> <span class="p">(</span><span class="n">g</span><span class="o">.</span><span class="n">kernel_</span><span class="p">,</span> <span class="n">g</span><span class="o">.</span><span class="n">log_marginal_likelihood</span><span class="p">(</span><span class="n">g</span><span class="o">.</span><span class="n">kernel_</span><span class="o">.</span><span class="n">theta</span><span class="p">)),</span>
-              <span class="n">fontsize</span><span class="o">=</span><span class="mi">12</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">tight_layout</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-1-visualizing-predictions">
-<h1>Exercise 1: visualizing predictions<a class="headerlink" href="#exercise-1-visualizing-predictions" title="Permalink to this heading">#</a></h1>
-<p>Train a GP regressor with a RBF kernel with default hyperparameters on a 1% sample of the sine data. Note that by learning a GP the hyperparameters of the chosen kernel are tuned automatically. To visualize what the GP has learned, use the model to predict values for the entire dataset. Plot the original function, the predictions and the training data points. You can use the function <code class="docutils literal notranslate"><span class="pre">plot_gp()</span></code> to assist with plotting.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.gaussian_process</span> <span class="kn">import</span> <span class="n">GaussianProcessRegressor</span>
-<span class="kn">from</span> <span class="nn">sklearn.gaussian_process.kernels</span> <span class="kn">import</span> <span class="p">(</span><span class="n">RBF</span><span class="p">,</span> <span class="n">Matern</span><span class="p">,</span> <span class="n">RationalQuadratic</span><span class="p">,</span>
-                                              <span class="n">ExpSineSquared</span><span class="p">,</span> <span class="n">DotProduct</span><span class="p">,</span>
-                                              <span class="n">ConstantKernel</span><span class="p">)</span>
-
-<span class="n">X_train</span> <span class="o">=</span> <span class="n">X_</span><span class="p">[:</span><span class="mi">10</span><span class="p">]</span>
-<span class="n">y_train</span> <span class="o">=</span> <span class="n">y_</span><span class="p">[:</span><span class="mi">10</span><span class="p">]</span>
-
-<span class="n">kernel</span> <span class="o">=</span> <span class="mf">1.0</span> <span class="o">*</span> <span class="n">RBF</span><span class="p">()</span>
-<span class="n">gp</span> <span class="o">=</span> <span class="n">GaussianProcessRegressor</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="n">kernel</span><span class="p">,</span> <span class="n">n_restarts_optimizer</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-
-<span class="n">gp</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-
-<span class="n">y_pred_mean</span><span class="p">,</span> <span class="n">y_pred_std</span> <span class="o">=</span> <span class="n">gp</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_</span><span class="p">,</span> <span class="n">return_std</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-
-<span class="n">plot_gp</span><span class="p">(</span><span class="n">gp</span><span class="p">,</span> <span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">X_</span><span class="p">,</span> <span class="n">y_</span><span class="p">,</span> <span class="n">y_pred_mean</span><span class="p">,</span> <span class="n">y_pred_std</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/4d18942bdb367e78fedf8970c2ad535d6fe635e004ee38f732aeff6059ba2832.png" src="../_images/4d18942bdb367e78fedf8970c2ad535d6fe635e004ee38f732aeff6059ba2832.png" />
-</div>
-</div>
-</section>
-<section id="exercise-2-reducing-the-uncertainty">
-<h1>Exercise 2: reducing the uncertainty<a class="headerlink" href="#exercise-2-reducing-the-uncertainty" title="Permalink to this heading">#</a></h1>
-<p>Fit a model using 5% and 10% of the data. Now try setting <code class="docutils literal notranslate"><span class="pre">n_restarts_optimizer</span></code> in the <code class="docutils literal notranslate"><span class="pre">GaussianProcessRegressor</span></code> constructor. Plot the results. What differences do you see?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">X2</span> <span class="o">=</span> <span class="n">X_</span><span class="p">[:</span><span class="mi">50</span><span class="p">]</span>
-<span class="n">y2</span> <span class="o">=</span> <span class="n">y_</span><span class="p">[:</span><span class="mi">50</span><span class="p">]</span>
-
-<span class="n">gp2</span> <span class="o">=</span> <span class="n">GaussianProcessRegressor</span><span class="p">(</span><span class="n">kernel</span> <span class="o">=</span> <span class="n">kernel</span><span class="p">,</span> <span class="n">n_restarts_optimizer</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-<span class="n">gp2</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X2</span><span class="p">,</span> <span class="n">y2</span><span class="p">)</span>
-<span class="n">y2_pred_mean</span><span class="p">,</span> <span class="n">y2_pred_std</span> <span class="o">=</span> <span class="n">gp2</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_</span><span class="p">,</span> <span class="n">return_std</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">plot_gp</span><span class="p">(</span><span class="n">gp2</span><span class="p">,</span> <span class="n">X2</span><span class="p">,</span> <span class="n">y2</span><span class="p">,</span> <span class="n">X_</span><span class="p">,</span> <span class="n">y_</span><span class="p">,</span> <span class="n">y2_pred_mean</span><span class="p">,</span> <span class="n">y2_pred_std</span><span class="p">)</span>
-
-<span class="n">X3</span> <span class="o">=</span> <span class="n">X_</span><span class="p">[:</span><span class="mi">100</span><span class="p">]</span>
-<span class="n">y3</span> <span class="o">=</span> <span class="n">y_</span><span class="p">[:</span><span class="mi">100</span><span class="p">]</span>
-
-<span class="n">gp3</span> <span class="o">=</span> <span class="n">GaussianProcessRegressor</span><span class="p">(</span><span class="n">kernel</span> <span class="o">=</span> <span class="n">kernel</span><span class="p">,</span> <span class="n">n_restarts_optimizer</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-
-<span class="n">gp3</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X3</span><span class="p">,</span> <span class="n">y3</span><span class="p">)</span>
-<span class="n">y3_pred_mean</span><span class="p">,</span> <span class="n">y3_pred_std</span> <span class="o">=</span> <span class="n">gp3</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_</span><span class="p">,</span> <span class="n">return_std</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">plot_gp</span><span class="p">(</span><span class="n">gp3</span><span class="p">,</span> <span class="n">X3</span><span class="p">,</span> <span class="n">y3</span><span class="p">,</span> <span class="n">X_</span><span class="p">,</span> <span class="n">y_</span><span class="p">,</span> <span class="n">y3_pred_mean</span><span class="p">,</span> <span class="n">y3_pred_std</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/fa8033d996976607ca6866adbc5265c7def939f5ceb557d8af6b8132bb9b1ba7.png" src="../_images/fa8033d996976607ca6866adbc5265c7def939f5ceb557d8af6b8132bb9b1ba7.png" />
-<img alt="../_images/29180bdeaa18a47726476a1b1cf22374405f98ab21b6c20267a996aeeabf4e66.png" src="../_images/29180bdeaa18a47726476a1b1cf22374405f98ab21b6c20267a996aeeabf4e66.png" />
-</div>
-</div>
-</section>
-<section id="exercise-3-kernels">
-<h1>Exercise 3: Kernels<a class="headerlink" href="#exercise-3-kernels" title="Permalink to this heading">#</a></h1>
-<p>Like SVMs, kernels play a major role in GPs. Using a 5% sample of the data, train one GP  with each of the following kernels:</p>
-<ul class="simple">
-<li><p>RBF</p></li>
-<li><p>RationalQuadratic</p></li>
-<li><p>ExpSineSquared</p></li>
-<li><p>DotProduct</p></li>
-<li><p>Matern</p></li>
-</ul>
-<p>What differences do you see in the log-likelihood? Which model fit best the training data?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">kernels</span> <span class="o">=</span> <span class="p">[</span><span class="mf">1.0</span> <span class="o">*</span> <span class="n">RBF</span><span class="p">(),</span>
-           <span class="mf">1.0</span> <span class="o">*</span> <span class="n">RationalQuadratic</span><span class="p">(),</span>
-           <span class="mf">1.0</span> <span class="o">*</span> <span class="n">ExpSineSquared</span><span class="p">(),</span>
-           <span class="n">DotProduct</span><span class="p">(),</span>
-           <span class="mf">1.0</span> <span class="o">*</span> <span class="n">Matern</span><span class="p">()]</span>
-
-<span class="k">for</span> <span class="n">kernel</span> <span class="ow">in</span> <span class="n">kernels</span><span class="p">:</span>
-    <span class="n">gp</span><span class="o">=</span> <span class="n">GaussianProcessRegressor</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="n">kernel</span><span class="p">,</span><span class="n">n_restarts_optimizer</span><span class="o">=</span><span class="mi">10</span><span class="p">)</span>
-    <span class="n">gp</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X2</span><span class="p">,</span> <span class="n">y2</span><span class="p">)</span>
-    <span class="n">y_pred_mean</span><span class="p">,</span> <span class="n">y_pred_std</span> <span class="o">=</span> <span class="n">gp</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_</span><span class="p">,</span> <span class="n">return_std</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-    <span class="n">plot_gp</span><span class="p">(</span><span class="n">gp</span><span class="p">,</span> <span class="n">X2</span><span class="p">,</span> <span class="n">y2</span><span class="p">,</span> <span class="n">X_</span><span class="p">,</span> <span class="n">y_</span><span class="p">,</span> <span class="n">y_pred_mean</span><span class="p">,</span> <span class="n">y_pred_std</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/b8d4a6bfe6e7c09f3415dc0dd949d11ebd2c67e28a77f27e7cbaa928ccbe4171.png" src="../_images/b8d4a6bfe6e7c09f3415dc0dd949d11ebd2c67e28a77f27e7cbaa928ccbe4171.png" />
-<img alt="../_images/3af4a0e837a173629dbf24414a9507210fa9e48c8059eb91fefad1e4b1541915.png" src="../_images/3af4a0e837a173629dbf24414a9507210fa9e48c8059eb91fefad1e4b1541915.png" />
-<img alt="../_images/083402cf4ad8ac77878d0e6d7315f403a75285ae7dd0be5046b864b127eaf80a.png" src="../_images/083402cf4ad8ac77878d0e6d7315f403a75285ae7dd0be5046b864b127eaf80a.png" />
-<img alt="../_images/ad991b0bc0319c8179b0fbcab20ded3140d785ea79bc62e0a7ece822c0b73295.png" src="../_images/ad991b0bc0319c8179b0fbcab20ded3140d785ea79bc62e0a7ece822c0b73295.png" />
-<img alt="../_images/527f99965a8e6cec2b6a7e90b90b794f2386f8a0e3020b3dc89876049f51fca5.png" src="../_images/527f99965a8e6cec2b6a7e90b90b794f2386f8a0e3020b3dc89876049f51fca5.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-mauna-loa-data">
-<h1>Exercise 4: Mauna Loa data<a class="headerlink" href="#exercise-4-mauna-loa-data" title="Permalink to this heading">#</a></h1>
-<p>We now look at the problem of predicting the monthly average CO2 concentrations collected at the Mauna Loa Observatory in Hawaii, between 1958 and 2001. This is a time-series data.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.datasets</span> <span class="kn">import</span> <span class="n">fetch_openml</span>
-
-<span class="c1"># originally from sci-kit learn</span>
-<span class="k">def</span> <span class="nf">load_mauna_loa_atmospheric_co2</span><span class="p">():</span>
-    <span class="n">ml_data</span> <span class="o">=</span> <span class="n">fetch_openml</span><span class="p">(</span><span class="n">data_id</span><span class="o">=</span><span class="mi">41187</span><span class="p">,</span> <span class="n">as_frame</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span>
-    <span class="n">months</span> <span class="o">=</span> <span class="p">[]</span>
-    <span class="n">ppmv_sums</span> <span class="o">=</span> <span class="p">[]</span>
-    <span class="n">counts</span> <span class="o">=</span> <span class="p">[]</span>
-
-    <span class="n">y</span> <span class="o">=</span> <span class="n">ml_data</span><span class="o">.</span><span class="n">data</span><span class="p">[:,</span> <span class="mi">0</span><span class="p">]</span>
-    <span class="n">m</span> <span class="o">=</span> <span class="n">ml_data</span><span class="o">.</span><span class="n">data</span><span class="p">[:,</span> <span class="mi">1</span><span class="p">]</span>
-    <span class="n">month_float</span> <span class="o">=</span> <span class="n">y</span> <span class="o">+</span> <span class="p">(</span><span class="n">m</span> <span class="o">-</span> <span class="mi">1</span><span class="p">)</span> <span class="o">/</span> <span class="mi">12</span>
-    <span class="n">ppmvs</span> <span class="o">=</span> <span class="n">ml_data</span><span class="o">.</span><span class="n">target</span>
-
-    <span class="k">for</span> <span class="n">month</span><span class="p">,</span> <span class="n">ppmv</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">month_float</span><span class="p">,</span> <span class="n">ppmvs</span><span class="p">):</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="n">months</span> <span class="ow">or</span> <span class="n">month</span> <span class="o">!=</span> <span class="n">months</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]:</span>
-            <span class="n">months</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">month</span><span class="p">)</span>
-            <span class="n">ppmv_sums</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">ppmv</span><span class="p">)</span>
-            <span class="n">counts</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="c1"># aggregate monthly sum to produce average</span>
-            <span class="n">ppmv_sums</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">+=</span> <span class="n">ppmv</span>
-            <span class="n">counts</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">+=</span> <span class="mi">1</span>
-
-    <span class="n">months</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">months</span><span class="p">)</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">,</span> <span class="mi">1</span><span class="p">)</span>
-    <span class="n">avg_ppmvs</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">ppmv_sums</span><span class="p">)</span> <span class="o">/</span> <span class="n">counts</span>
-    <span class="k">return</span> <span class="n">months</span><span class="p">,</span> <span class="n">avg_ppmvs</span>
-
-
-<span class="n">X_mauna</span><span class="p">,</span> <span class="n">y_mauna</span> <span class="o">=</span> <span class="n">load_mauna_loa_atmospheric_co2</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>Quick visualization:</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">#Quick visualization</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">X_mauna</span><span class="p">,</span><span class="n">y_mauna</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;date&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;co2&#39;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Text(0, 0.5, &#39;co2&#39;)
-</pre></div>
-</div>
-<img alt="../_images/bd4fa4c1478f0e99774409bd841c7be0de3db3ee535ddc0ddb2c970b33df7fc1.png" src="../_images/bd4fa4c1478f0e99774409bd841c7be0de3db3ee535ddc0ddb2c970b33df7fc1.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-1">
-<h1>Exercise 4.1<a class="headerlink" href="#exercise-4-1" title="Permalink to this heading">#</a></h1>
-<p>Signals like this usually consist of a combination of different “sub-signals”, e.g. a long-term component, a seasonal component, a noise component, and so on. When defining a GP kernel, you can combine multiple kernels, such as:</p>
-<ul class="simple">
-<li><p>A RBF kernel can be used to explain long-term, smooth patterns.</p></li>
-<li><p>The seasonal component can be modeled by an <code class="docutils literal notranslate"><span class="pre">ExpSineSquared</span></code> component.</p></li>
-<li><p>Small and medium-term irregularities can be modeled by a <code class="docutils literal notranslate"><span class="pre">RationalQuadratic</span></code> component.</p></li>
-<li><p><code class="docutils literal notranslate"><span class="pre">WhiteNoise</span></code> kernel to model white noise.</p></li>
-</ul>
-<p>Train a GP using the first 75% data points as training data using the kernel below. Experiment with removing one or more kernels and check the results visually (you can use <code class="docutils literal notranslate"><span class="pre">plot_gp</span></code>). What do you observe?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.gaussian_process.kernels</span> <span class="kn">import</span> <span class="n">WhiteKernel</span>
-
-<span class="n">k1</span> <span class="o">=</span> <span class="mf">50.0</span><span class="o">**</span><span class="mi">2</span> <span class="o">*</span> <span class="n">RBF</span><span class="p">(</span><span class="n">length_scale</span><span class="o">=</span><span class="mf">50.0</span><span class="p">)</span>  <span class="c1"># long term smooth rising trend</span>
-<span class="n">k2</span> <span class="o">=</span> <span class="mf">2.0</span><span class="o">**</span><span class="mi">2</span> <span class="o">*</span> <span class="n">RBF</span><span class="p">(</span><span class="n">length_scale</span><span class="o">=</span><span class="mf">100.0</span><span class="p">)</span> \
-    <span class="o">*</span> <span class="n">ExpSineSquared</span><span class="p">(</span><span class="n">length_scale</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">periodicity</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span>
-                     <span class="n">periodicity_bounds</span><span class="o">=</span><span class="s2">&quot;fixed&quot;</span><span class="p">)</span>  <span class="c1"># seasonal component</span>
-<span class="c1"># medium term irregularities</span>
-<span class="n">k3</span> <span class="o">=</span> <span class="mf">0.5</span><span class="o">**</span><span class="mi">2</span> <span class="o">*</span> <span class="n">RationalQuadratic</span><span class="p">(</span><span class="n">length_scale</span><span class="o">=</span><span class="mf">1.0</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">1.0</span><span class="p">)</span>
-<span class="n">k4</span> <span class="o">=</span> <span class="mf">0.1</span><span class="o">**</span><span class="mi">2</span> <span class="o">*</span> <span class="n">RBF</span><span class="p">(</span><span class="n">length_scale</span><span class="o">=</span><span class="mf">0.1</span><span class="p">)</span> \
-    <span class="o">+</span> <span class="n">WhiteKernel</span><span class="p">(</span><span class="n">noise_level</span><span class="o">=</span><span class="mf">0.1</span><span class="o">**</span><span class="mi">2</span><span class="p">,</span>
-                  <span class="n">noise_level_bounds</span><span class="o">=</span><span class="p">(</span><span class="mf">1e-5</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">inf</span><span class="p">))</span>  <span class="c1"># noise terms</span>
-
-<span class="n">kernel</span> <span class="o">=</span> <span class="n">k1</span> <span class="o">+</span> <span class="n">k2</span> <span class="o">+</span>  <span class="n">k3</span> <span class="o">+</span> <span class="n">k4</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">end</span> <span class="o">=</span> <span class="nb">round</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_mauna</span><span class="p">)</span> <span class="o">*</span> <span class="mf">0.75</span><span class="p">)</span>
-
-<span class="n">gp</span> <span class="o">=</span> <span class="n">GaussianProcessRegressor</span><span class="p">(</span><span class="n">kernel</span><span class="o">=</span><span class="n">kernel</span><span class="p">,</span> <span class="n">normalize_y</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">gp</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_mauna</span><span class="p">[:</span><span class="n">end</span><span class="p">],</span> <span class="n">y_mauna</span><span class="p">[:</span><span class="n">end</span><span class="p">])</span>
-
-<span class="c1"># Make the prediction on the meshed x-axis (ask for MSE as well)</span>
-<span class="n">y_mean</span><span class="p">,</span> <span class="n">y_sigma</span> <span class="o">=</span> <span class="n">gp</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_mauna</span><span class="p">,</span> <span class="n">return_std</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-
-<span class="n">plot_gp</span><span class="p">(</span><span class="n">gp</span><span class="p">,</span> <span class="n">X_mauna</span><span class="p">[:</span><span class="n">end</span><span class="p">],</span> <span class="n">y_mauna</span><span class="p">[:</span><span class="n">end</span><span class="p">],</span> <span class="n">X_mauna</span><span class="p">,</span> <span class="n">y_mauna</span><span class="p">,</span> <span class="n">y_mean</span><span class="p">,</span> <span class="n">y_sigma</span><span class="p">,</span> <span class="s2">&quot;no&quot;</span><span class="p">)</span>
-
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Learned kernel: </span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">,</span><span class="n">gp</span><span class="o">.</span><span class="n">kernel</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Learned kernel: 
- 50**2 * RBF(length_scale=50) + 2**2 * RBF(length_scale=100) * ExpSineSquared(length_scale=1, periodicity=1) + 0.5**2 * RationalQuadratic(alpha=1, length_scale=1) + 0.1**2 * RBF(length_scale=0.1) + WhiteKernel(noise_level=0.01)
-</pre></div>
-</div>
-<img alt="../_images/3739925082971225c5fa90b3ec2a22872caeed73879447ac60140116d44d6c84.png" src="../_images/3739925082971225c5fa90b3ec2a22872caeed73879447ac60140116d44d6c84.png" />
-</div>
-</div>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#">Lab 6: Bayesian models (Solution)</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-visualizing-predictions">Exercise 1: visualizing predictions</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-reducing-the-uncertainty">Exercise 2: reducing the uncertainty</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-kernels">Exercise 3: Kernels</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-mauna-loa-data">Exercise 4: Mauna Loa data</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-1">Exercise 4.1</a></li>
-</ul>
-
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 6 - Neural Networks Solution.html b/labs/Lab 6 - Neural Networks Solution.html
deleted file mode 100644
index a638a393d..000000000
--- a/labs/Lab 6 - Neural Networks Solution.html	
+++ /dev/null
@@ -1,900 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 7: Neural networks &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 6 - Neural Networks Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 6 - Neural Networks Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 6 - Neural Networks Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 6 - Neural Networks Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 7: Neural networks</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#load-the-data-and-create-train-test-splits">Load the data and create train-test splits</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-preprocessing">Exercise 1: Preprocessing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-create-a-deep-neural-net-model">Exercise 2: Create a deep neural net model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-create-a-training-function">Exercise 3: Create a training function</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-evaluate-the-model">Exercise 4: Evaluate the model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-optimize-the-model">Exercise 5: Optimize the model</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-7-neural-networks">
-<h1>Lab 7: Neural networks<a class="headerlink" href="#lab-7-neural-networks" title="Permalink to this heading">#</a></h1>
-<p>In this lab we will build dense neural networks on the MNIST dataset.</p>
-<p>Make sure you read the tutorial for this lab first.</p>
-<section id="load-the-data-and-create-train-test-splits">
-<h2>Load the data and create train-test splits<a class="headerlink" href="#load-the-data-and-create-train-test-splits" title="Permalink to this heading">#</a></h2>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Global imports and settings</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">tensorflow.keras</span> <span class="k">as</span> <span class="nn">keras</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Using Keras&quot;</span><span class="p">,</span><span class="n">keras</span><span class="o">.</span><span class="n">__version__</span><span class="p">)</span>
-<span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s1">&#39;TF_CPP_MIN_LOG_LEVEL&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;2&quot;</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Using Keras 2.7.0
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download MNIST data. Takes a while the first time.</span>
-<span class="n">mnist</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">554</span><span class="p">)</span>
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">mnist</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">mnist</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span>
-<span class="n">X</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">reshape</span><span class="p">(</span><span class="mi">70000</span><span class="p">,</span> <span class="mi">28</span><span class="p">,</span> <span class="mi">28</span><span class="p">)</span>
-
-<span class="c1"># Take some random examples</span>
-<span class="kn">from</span> <span class="nn">random</span> <span class="kn">import</span> <span class="n">randint</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span>  <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">5</span><span class="p">):</span>
-    <span class="n">n</span> <span class="o">=</span> <span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">70000</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">X</span><span class="p">[</span><span class="n">n</span><span class="p">],</span> <span class="n">cmap</span><span class="o">=</span><span class="n">plt</span><span class="o">.</span><span class="n">cm</span><span class="o">.</span><span class="n">gray_r</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">([])</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">([])</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;</span><span class="si">{}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">]))</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/cc82a7a9ddac27ce50cb7b6aed03a41513ef51f85ef02e2aabb317cf1acb7ecf.png" src="../_images/cc82a7a9ddac27ce50cb7b6aed03a41513ef51f85ef02e2aabb317cf1acb7ecf.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># For MNIST, there exists a predefined stratified train-test split of 60000-10000. We therefore don&#39;t shuffle or stratify here.</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mi">60000</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-1-preprocessing">
-<h2>Exercise 1: Preprocessing<a class="headerlink" href="#exercise-1-preprocessing" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Normalize the data: map each feature value from its current representation (an integer between 0 and 255) to a floating-point value between 0 and 1.0.</p></li>
-<li><p>Store the floating-point values in <code class="docutils literal notranslate"><span class="pre">x_train_normalized</span></code> and <code class="docutils literal notranslate"><span class="pre">x_test_normalized</span></code>.</p></li>
-<li><p>Map the class label to a on-hot-encoded value. Store in <code class="docutils literal notranslate"><span class="pre">y_train_encoded</span></code> and <code class="docutils literal notranslate"><span class="pre">y_test_encoded</span></code>.</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution</span>
-<span class="n">x_train_normalized</span> <span class="o">=</span> <span class="n">X_train</span> <span class="o">/</span> <span class="mf">255.0</span>
-<span class="n">x_test_normalized</span> <span class="o">=</span> <span class="n">X_test</span> <span class="o">/</span> <span class="mf">255.0</span>
-
-<span class="kn">from</span> <span class="nn">tensorflow.keras.utils</span> <span class="kn">import</span> <span class="n">to_categorical</span>
-<span class="n">y_train_encoded</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_test_encoded</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">y_test</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-2-create-a-deep-neural-net-model">
-<h2>Exercise 2: Create a deep neural net model<a class="headerlink" href="#exercise-2-create-a-deep-neural-net-model" title="Permalink to this heading">#</a></h2>
-<p>Implement a <code class="docutils literal notranslate"><span class="pre">create_model</span></code> function which defines the topography of the deep neural net, specifying the following:</p>
-<ul class="simple">
-<li><p>The number of layers in the deep neural net: Use 2 dense layers for now.</p></li>
-<li><p>The number of nodes in each layer: these are parameters of your function.</p></li>
-<li><p>Any regularization layers. Add at least one dropout layer.</p></li>
-<li><p>The optimizer and learning rate. Make the learning rate a parameter of your function as well.</p></li>
-</ul>
-<p>Consider:</p>
-<ul class="simple">
-<li><p>What should be the shape of the input layer?</p></li>
-<li><p>Which activation function you will need for the last layer, since this is a 10-class classification problem?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">### Create and compile a &#39;deep&#39; neural net</span>
-<span class="k">def</span> <span class="nf">create_model</span><span class="p">(</span><span class="n">layer_1_units</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">layer_2_units</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="mf">0.001</span><span class="p">,</span> <span class="n">dropout_rate</span><span class="o">=</span><span class="mf">0.3</span><span class="p">):</span>
-    <span class="k">pass</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution</span>
-<span class="k">def</span> <span class="nf">create_model</span><span class="p">(</span><span class="n">layer_1_units</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">layer_2_units</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="mf">0.001</span><span class="p">,</span> <span class="n">dropout_rate</span><span class="o">=</span><span class="mf">0.3</span><span class="p">):</span>
-
-    <span class="n">model</span> <span class="o">=</span> <span class="n">keras</span><span class="o">.</span><span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-
-    <span class="c1"># The features are stored in a two-dimensional 28X28 array. </span>
-    <span class="c1"># Flatten that two-dimensional array into a a one-dimensional </span>
-    <span class="c1"># 784-element array.</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">(</span><span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">28</span><span class="p">,</span> <span class="mi">28</span><span class="p">)))</span>
-
-    <span class="c1"># Define the first hidden layer.   </span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="n">units</span><span class="o">=</span><span class="mi">32</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-
-    <span class="c1"># Define a dropout regularization layer. </span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="n">rate</span><span class="o">=</span><span class="n">dropout_rate</span><span class="p">))</span>
-
-    <span class="c1"># Define the output layer. The units parameter is set to 10 because</span>
-    <span class="c1"># the model must choose among 10 possible output values (representing</span>
-    <span class="c1"># the digits from 0 to 9, inclusive).</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="n">units</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>     
-
-    <span class="c1"># Construct the layers into a model that TensorFlow can execute.  </span>
-    <span class="c1"># Notice that the loss function for multi-class classification</span>
-    <span class="c1"># is different than the loss function for binary classification.</span>
-    <span class="c1"># Using Adam here. RMSProp would also be fine</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">keras</span><span class="o">.</span><span class="n">optimizers</span><span class="o">.</span><span class="n">Adam</span><span class="p">(</span><span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">),</span>
-                  <span class="n">loss</span><span class="o">=</span><span class="s2">&quot;categorical_crossentropy&quot;</span><span class="p">,</span> <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-
-    <span class="k">return</span> <span class="n">model</span>       
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-3-create-a-training-function">
-<h2>Exercise 3: Create a training function<a class="headerlink" href="#exercise-3-create-a-training-function" title="Permalink to this heading">#</a></h2>
-<p>Implement a <code class="docutils literal notranslate"><span class="pre">train_model</span></code> function which trains and evaluates a given model.
-It should do a train-validation split and report the train and validation loss and accuracy, and return the training history.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="k">def</span> <span class="nf">train_model</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">validation_split</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    model: the model to train</span>
-<span class="sd">    X, y: the training data and labels</span>
-<span class="sd">    validation_split: the percentage of data set aside for the validation set</span>
-<span class="sd">    epochs: the number of epochs to train for</span>
-<span class="sd">    batch_size: the batch size for minibatch SGD</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="k">pass</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution</span>
-<span class="k">def</span> <span class="nf">train_model</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">validation_split</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="kc">None</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    model: the model to train</span>
-<span class="sd">    X, y: the training data and labels</span>
-<span class="sd">    validation_split: the percentage of data set aside for the validation set</span>
-<span class="sd">    epochs: the number of epochs to train for</span>
-<span class="sd">    batch_size: the batch size for minibatch SGD</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">X_train</span><span class="p">,</span> <span class="n">x_val</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_val</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">test_size</span><span class="o">=</span><span class="n">validation_split</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-    
-    <span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y_train</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                        <span class="n">epochs</span><span class="o">=</span><span class="n">epochs</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-    <span class="k">return</span> <span class="n">history</span> 
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-4-evaluate-the-model">
-<h2>Exercise 4: Evaluate the model<a class="headerlink" href="#exercise-4-evaluate-the-model" title="Permalink to this heading">#</a></h2>
-<p>Train the model with a learning rate of 0.003, 50 epochs, batch size 4000, and a validation set that is 20% of the total training data.
-Use default settings otherwise. Plot the learning curve of the loss, validation loss, accuracy, and validation accuracy. Finally, report the performance on the test set.</p>
-<p>Feel free to use the plotting function below, or implement the callback from the tutorial to see results in real time.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Helper plotting function</span>
-<span class="c1">#</span>
-<span class="c1"># history: the history object returned by the fit function</span>
-<span class="c1"># list_of_metrics: the metrics to plot</span>
-<span class="k">def</span> <span class="nf">plot_curve</span><span class="p">(</span><span class="n">history</span><span class="p">,</span> <span class="n">list_of_metrics</span><span class="p">):</span>
-    
-    <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">()</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s2">&quot;Epoch&quot;</span><span class="p">)</span>
-    <span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s2">&quot;Value&quot;</span><span class="p">)</span>
-
-    <span class="n">epochs</span> <span class="o">=</span> <span class="n">history</span><span class="o">.</span><span class="n">epoch</span>
-    <span class="n">hist</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span>
-
-    <span class="k">for</span> <span class="n">m</span> <span class="ow">in</span> <span class="n">list_of_metrics</span><span class="p">:</span>
-        <span class="n">x</span> <span class="o">=</span> <span class="n">hist</span><span class="p">[</span><span class="n">m</span><span class="p">]</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">[</span><span class="mi">1</span><span class="p">:],</span> <span class="n">x</span><span class="p">[</span><span class="mi">1</span><span class="p">:],</span> <span class="n">label</span><span class="o">=</span><span class="n">m</span><span class="p">,</span> <span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">)</span>
-
-    <span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution</span>
-<span class="c1"># Settings</span>
-<span class="n">learning_rate</span> <span class="o">=</span> <span class="mf">0.003</span>
-<span class="n">epochs</span> <span class="o">=</span> <span class="mi">50</span>
-<span class="n">batch_size</span> <span class="o">=</span> <span class="mi">4000</span>
-<span class="n">validation_split</span> <span class="o">=</span> <span class="mf">0.2</span>
-
-<span class="c1"># Create the model the model&#39;s topography.</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">create_model</span><span class="p">(</span><span class="n">learning_rate</span><span class="p">)</span>
-
-<span class="c1"># Train the model on the normalized training set.</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">train_model</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">x_train_normalized</span><span class="p">,</span> <span class="n">y_train_encoded</span><span class="p">,</span> 
-                      <span class="n">validation_split</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">)</span>
-
-<span class="c1"># Plot a graph of the metric vs. epochs.</span>
-<span class="n">list_of_metrics</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">,</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">,</span><span class="s1">&#39;loss&#39;</span><span class="p">,</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-<span class="n">plot_curve</span><span class="p">(</span><span class="n">history</span><span class="p">,</span> <span class="n">list_of_metrics</span><span class="p">)</span>
-
-<span class="c1"># Evaluate against the test set.</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Evaluation on the test set [loss, accuracy]:&quot;</span><span class="p">)</span>
-<span class="n">model</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="n">x_test_normalized</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y_test_encoded</span><span class="p">,</span> 
-               <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Metal device set to: Apple M1 Pro
-</pre></div>
-</div>
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>/Users/jvanscho/miniforge3/lib/python3.9/site-packages/keras/optimizer_v2/adam.py:105: UserWarning: The `lr` argument is deprecated, use `learning_rate` instead.
-  super(Adam, self).__init__(name, **kwargs)
-</pre></div>
-</div>
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span> Evaluation on the test set [loss, accuracy]:
-</pre></div>
-</div>
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>[0.21780921518802643, 0.9358000159263611]
-</pre></div>
-</div>
-<img alt="../_images/f9506f9e6f3971cc5e8159d8ab4130a2d93e96d587cf9444fba0f95cac684e75.png" src="../_images/f9506f9e6f3971cc5e8159d8ab4130a2d93e96d587cf9444fba0f95cac684e75.png" />
-</div>
-</div>
-</section>
-<section id="exercise-5-optimize-the-model">
-<h2>Exercise 5: Optimize the model<a class="headerlink" href="#exercise-5-optimize-the-model" title="Permalink to this heading">#</a></h2>
-<p>Try to optimize the model, either manually or with a tuning method. At least optimize the following:</p>
-<ul class="simple">
-<li><p>the number of hidden layers</p></li>
-<li><p>the number of nodes in each layer</p></li>
-<li><p>the amount of dropout layers and the dropout rate</p></li>
-</ul>
-<p>Try to reach at least 96% accuracy against the test set.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution</span>
-<span class="c1"># For an example with random search, see the tutorial</span>
-<span class="c1"># Here, we search manually, following the following hunches:</span>
-<span class="c1">#   * Adding more nodes to the first hidden layer will improve accuracy. The input size is 784, so we should not make it too small</span>
-<span class="c1">#   * Adding a second hidden layer generally improves accuracy.</span>
-<span class="c1">#   * For larger models (more nodes), we need to regularize more (more dropout)</span>
-
-<span class="n">batch_size</span> <span class="o">=</span> <span class="mi">4000</span> <span class="c1"># Pretty high, but making this smaller doesn&#39;t seem to help much.</span>
-<span class="n">epochs</span> <span class="o">=</span> <span class="mi">70</span>
-
-<span class="c1"># Create the model the model&#39;s topography.</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">create_model</span><span class="p">(</span><span class="n">layer_1_units</span><span class="o">=</span><span class="mi">800</span><span class="p">,</span> <span class="n">layer_2_units</span><span class="o">=</span><span class="mi">800</span><span class="p">,</span> <span class="n">learning_rate</span><span class="o">=</span><span class="mf">0.003</span><span class="p">,</span> <span class="n">dropout_rate</span><span class="o">=</span> <span class="mf">0.15</span><span class="p">)</span>
-
-<span class="c1"># Train the model on the normalized training set.</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">train_model</span><span class="p">(</span><span class="n">model</span><span class="p">,</span> <span class="n">x_train_normalized</span><span class="p">,</span> <span class="n">y_train_encoded</span><span class="p">,</span> 
-                      <span class="n">validation_split</span><span class="p">,</span> <span class="n">epochs</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">)</span>
-
-<span class="c1"># Plot a graph of the metric vs. epochs.</span>
-<span class="n">list_of_metrics</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">,</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">,</span><span class="s1">&#39;loss&#39;</span><span class="p">,</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-<span class="n">plot_curve</span><span class="p">(</span><span class="n">history</span><span class="p">,</span> <span class="n">list_of_metrics</span><span class="p">)</span>
-
-<span class="c1"># Evaluate against the test set.</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2"> Evaluation on the test set (accuracy):&quot;</span><span class="p">)</span>
-<span class="n">model</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="n">x_test_normalized</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y_test_encoded</span><span class="p">,</span> 
-               <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>/Users/jvanscho/miniforge3/lib/python3.9/site-packages/keras/optimizer_v2/adam.py:105: UserWarning: The `lr` argument is deprecated, use `learning_rate` instead.
-  super(Adam, self).__init__(name, **kwargs)
-</pre></div>
-</div>
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span> Evaluation on the test set (accuracy):
-</pre></div>
-</div>
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>0.9571000337600708
-</pre></div>
-</div>
-<img alt="../_images/af5246af88ef9e3c99bf3cdd47fe89790b5e954e646f881a8d56f949d130d4d8.png" src="../_images/af5246af88ef9e3c99bf3cdd47fe89790b5e954e646f881a8d56f949d130d4d8.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Solution with tuning. Takes a long time, and the best found solution isn&#39;t better.</span>
-<span class="c1"># The maximum number of nodes was set to 265. Setting it higher may yield better result.</span>
-
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">optimizers</span>
-<span class="kn">import</span> <span class="nn">keras_tuner</span> <span class="k">as</span> <span class="nn">kt</span>
-
-
-<span class="k">def</span> <span class="nf">build_model</span><span class="p">(</span><span class="n">hp</span><span class="p">):</span>
-    <span class="n">model</span> <span class="o">=</span> <span class="n">keras</span><span class="o">.</span><span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-
-    <span class="c1"># Tune the number of units in the dense layers</span>
-    <span class="n">hp_units</span> <span class="o">=</span> <span class="n">hp</span><span class="o">.</span><span class="n">Int</span><span class="p">(</span><span class="s1">&#39;units&#39;</span><span class="p">,</span> <span class="n">min_value</span> <span class="o">=</span> <span class="mi">32</span><span class="p">,</span> <span class="n">max_value</span> <span class="o">=</span> <span class="mi">265</span><span class="p">,</span> <span class="n">step</span> <span class="o">=</span> <span class="mi">32</span><span class="p">)</span>
-    <span class="n">hp_units2</span> <span class="o">=</span> <span class="n">hp</span><span class="o">.</span><span class="n">Int</span><span class="p">(</span><span class="s1">&#39;units2&#39;</span><span class="p">,</span> <span class="n">min_value</span> <span class="o">=</span> <span class="mi">32</span><span class="p">,</span> <span class="n">max_value</span> <span class="o">=</span> <span class="mi">265</span><span class="p">,</span> <span class="n">step</span> <span class="o">=</span> <span class="mi">32</span><span class="p">)</span>
-    <span class="n">hp_dropout</span> <span class="o">=</span> <span class="n">hp</span><span class="o">.</span><span class="n">Float</span><span class="p">(</span><span class="s1">&#39;dropout&#39;</span><span class="p">,</span> <span class="n">min_value</span> <span class="o">=</span> <span class="mf">0.1</span><span class="p">,</span> <span class="n">max_value</span> <span class="o">=</span> <span class="mf">0.5</span><span class="p">,</span> <span class="n">step</span> <span class="o">=</span> <span class="mf">0.1</span><span class="p">)</span>
-
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">(</span><span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">28</span><span class="p">,</span> <span class="mi">28</span><span class="p">)))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="n">units</span> <span class="o">=</span> <span class="n">hp_units</span><span class="p">,</span> <span class="n">activation</span> <span class="o">=</span> <span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="n">rate</span><span class="o">=</span> <span class="n">hp_dropout</span><span class="p">))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="n">units</span> <span class="o">=</span> <span class="n">hp_units2</span><span class="p">,</span> <span class="n">activation</span> <span class="o">=</span> <span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">keras</span><span class="o">.</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">))</span>
-
-    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span> <span class="o">=</span> <span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                  <span class="n">loss</span> <span class="o">=</span> <span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-                  <span class="n">metrics</span> <span class="o">=</span> <span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-    <span class="k">return</span> <span class="n">model</span>
-
-<span class="n">tuner</span> <span class="o">=</span> <span class="n">kt</span><span class="o">.</span><span class="n">RandomSearch</span><span class="p">(</span><span class="n">build_model</span><span class="p">,</span> <span class="n">max_trials</span><span class="o">=</span><span class="mi">5</span><span class="p">,</span> <span class="n">objective</span> <span class="o">=</span> <span class="s1">&#39;val_accuracy&#39;</span><span class="p">,</span> <span class="n">project_name</span><span class="o">=</span><span class="s1">&#39;mnist_tuning&#39;</span><span class="p">)</span>
-
-<span class="n">X_train</span><span class="p">,</span> <span class="n">x_val</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_val</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">x_train_normalized</span><span class="p">,</span> <span class="n">y_train_encoded</span><span class="p">,</span> <span class="n">test_size</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span> <span class="n">shuffle</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y_train_encoded</span><span class="p">,</span> <span class="n">random_state</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-<span class="n">tuner</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">x</span><span class="o">=</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y</span><span class="o">=</span><span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span> <span class="o">=</span> <span class="mi">50</span><span class="p">,</span> <span class="n">validation_data</span> <span class="o">=</span> <span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">),</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-
-<span class="c1"># Get the optimal hyperparameters</span>
-<span class="n">best_hps</span> <span class="o">=</span> <span class="n">tuner</span><span class="o">.</span><span class="n">get_best_hyperparameters</span><span class="p">(</span><span class="n">num_trials</span> <span class="o">=</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#load-the-data-and-create-train-test-splits">Load the data and create train-test splits</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-preprocessing">Exercise 1: Preprocessing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-create-a-deep-neural-net-model">Exercise 2: Create a deep neural net model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-create-a-training-function">Exercise 3: Create a training function</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-evaluate-the-model">Exercise 4: Evaluate the model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-optimize-the-model">Exercise 5: Optimize the model</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 7a - Convolutional Neural Networks Solution.html b/labs/Lab 7a - Convolutional Neural Networks Solution.html
deleted file mode 100644
index 5ed5b5dd9..000000000
--- a/labs/Lab 7a - Convolutional Neural Networks Solution.html	
+++ /dev/null
@@ -1,1272 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 8: Object recognition with convolutional neural networks &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 7a - Convolutional Neural Networks Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 7a - Convolutional Neural Networks Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 7a - Convolutional Neural Networks Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 7a - Convolutional Neural Networks Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 8: Object recognition with convolutional neural networks</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-a-simple-model">Exercise 1: A simple model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-vgg-like-model">Exercise 2: VGG-like model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-regularization">Exercise 3: Regularization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-data-augmentation">Exercise 4: Data Augmentation</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-interpreting-misclassifications">Exercise 5: Interpreting misclassifications</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-interpreting-the-model">Exercise 6: Interpreting the model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#optional-take-it-a-step-further">Optional: Take it a step further</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-8-object-recognition-with-convolutional-neural-networks">
-<h1>Lab 8: Object recognition with convolutional neural networks<a class="headerlink" href="#lab-8-object-recognition-with-convolutional-neural-networks" title="Permalink to this heading">#</a></h1>
-<p>In this lab we consider the <a class="reference external" href="https://www.openml.org/d/40926">CIFAR dataset</a>, but model it using convolutional neural networks instead of linear models.
-There is no separate tutorial, but you can find lots of examples in the lecture notebook on convolutional neural networks.</p>
-<p>Tip: You can run these exercises faster on a GPU (but they will also run fine on a CPU). If you do not have a GPU locally, you can upload this notebook to Google Colab. You can enable GPU support at “runtime” -&gt; “change runtime type”.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">tensorflow</span> <span class="k">as</span> <span class="nn">tf</span>
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="n">tf</span><span class="o">.</span><span class="n">config</span><span class="o">.</span><span class="n">experimental</span><span class="o">.</span><span class="n">list_physical_devices</span><span class="p">(</span><span class="s1">&#39;GPU&#39;</span><span class="p">)</span> <span class="c1"># Check whether GPUs are available</span>
-<span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s1">&#39;TF_CPP_MIN_LOG_LEVEL&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;2&quot;</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Download CIFAR data. Takes a while the first time.</span>
-<span class="c1"># This version returns 3x32x32 resolution images. </span>
-<span class="c1"># If you feel like it, repeat the exercises with the 96x96x3 resolution version by using ID 41103 </span>
-<span class="n">cifar</span> <span class="o">=</span> <span class="n">oml</span><span class="o">.</span><span class="n">datasets</span><span class="o">.</span><span class="n">get_dataset</span><span class="p">(</span><span class="mi">40926</span><span class="p">)</span> 
-<span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">_</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">cifar</span><span class="o">.</span><span class="n">get_data</span><span class="p">(</span><span class="n">target</span><span class="o">=</span><span class="n">cifar</span><span class="o">.</span><span class="n">default_target_attribute</span><span class="p">,</span> <span class="n">dataset_format</span><span class="o">=</span><span class="s1">&#39;array&#39;</span><span class="p">);</span> 
-<span class="n">cifar_classes</span> <span class="o">=</span> <span class="p">{</span><span class="mi">0</span><span class="p">:</span> <span class="s2">&quot;airplane&quot;</span><span class="p">,</span> <span class="mi">1</span><span class="p">:</span> <span class="s2">&quot;automobile&quot;</span><span class="p">,</span> <span class="mi">2</span><span class="p">:</span> <span class="s2">&quot;bird&quot;</span><span class="p">,</span> <span class="mi">3</span><span class="p">:</span> <span class="s2">&quot;cat&quot;</span><span class="p">,</span> <span class="mi">4</span><span class="p">:</span> <span class="s2">&quot;deer&quot;</span><span class="p">,</span>
-                 <span class="mi">5</span><span class="p">:</span> <span class="s2">&quot;dog&quot;</span><span class="p">,</span> <span class="mi">6</span><span class="p">:</span> <span class="s2">&quot;frog&quot;</span><span class="p">,</span> <span class="mi">7</span><span class="p">:</span> <span class="s2">&quot;horse&quot;</span><span class="p">,</span> <span class="mi">8</span><span class="p">:</span> <span class="s2">&quot;ship&quot;</span><span class="p">,</span> <span class="mi">9</span><span class="p">:</span> <span class="s2">&quot;truck&quot;</span><span class="p">}</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># The data is in a weird 3x32x32 format, we need to reshape and transpose</span>
-<span class="n">Xr</span> <span class="o">=</span> <span class="n">X</span><span class="o">.</span><span class="n">reshape</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span><span class="mi">3</span><span class="p">,</span><span class="mi">32</span><span class="p">,</span><span class="mi">32</span><span class="p">))</span><span class="o">.</span><span class="n">transpose</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="mi">2</span><span class="p">,</span><span class="mi">3</span><span class="p">,</span><span class="mi">1</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Take some random examples, reshape to a 32x32 image and plot</span>
-<span class="kn">from</span> <span class="nn">random</span> <span class="kn">import</span> <span class="n">randint</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span>  <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">5</span><span class="p">):</span>
-    <span class="n">n</span> <span class="o">=</span> <span class="n">randint</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span><span class="nb">len</span><span class="p">(</span><span class="n">Xr</span><span class="p">))</span>
-    <span class="c1"># The data is stored in a 3x32x32 format, so we need to transpose it</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">Xr</span><span class="p">[</span><span class="n">n</span><span class="p">]</span><span class="o">/</span><span class="mi">255</span><span class="p">)</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">((</span><span class="n">cifar_classes</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="n">y</span><span class="p">[</span><span class="n">n</span><span class="p">])]))</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(()),</span> <span class="n">axes</span><span class="p">[</span><span class="n">i</span><span class="p">]</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(())</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/5cd0fac758103966139dcee0c86a484fee4faef93740678145a345e0f143ffd6.png" src="../_images/5cd0fac758103966139dcee0c86a484fee4faef93740678145a345e0f143ffd6.png" />
-</div>
-</div>
-<section id="exercise-1-a-simple-model">
-<h2>Exercise 1: A simple model<a class="headerlink" href="#exercise-1-a-simple-model" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Split the data into 80% training and 20% validation sets</p></li>
-<li><p>Normalize the data to [0,1]</p></li>
-<li><p>Build a ConvNet with 3 convolutional layers interspersed with MaxPooling layers, and one dense layer.</p>
-<ul>
-<li><p>Use at least 32 filters in the first layer and ReLU activation.</p></li>
-<li><p>Otherwise, make rational design choices or experiment a bit to see what works.</p></li>
-</ul>
-</li>
-<li><p>You should at least get 60% accuracy.</p></li>
-<li><p>For training, you can try batch sizes of 64, and 20-50 epochs, but feel free to explore this as well</p></li>
-<li><p>Plot and interpret the learning curves</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">train_test_split</span>
-<span class="n">X_train</span><span class="p">,</span> <span class="n">X_test</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">y_test</span> <span class="o">=</span> <span class="n">train_test_split</span><span class="p">(</span><span class="n">Xr</span><span class="p">,</span><span class="n">y</span><span class="p">,</span> <span class="n">stratify</span><span class="o">=</span><span class="n">y</span><span class="p">,</span> <span class="n">train_size</span><span class="o">=</span><span class="mf">0.8</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras.utils</span> <span class="kn">import</span> <span class="n">to_categorical</span>
-<span class="n">X_train</span> <span class="o">=</span> <span class="n">X_train</span> <span class="o">/</span> <span class="mf">255.</span>
-<span class="n">X_test</span> <span class="o">=</span> <span class="n">X_test</span> <span class="o">/</span> <span class="mf">255.</span>
-<span class="n">y_train</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">y_train</span><span class="p">)</span>
-<span class="n">y_test</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">y_test</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">layers</span>
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">models</span>
-
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Metal device set to: Apple M1 Pro
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.6492500305175781
-</pre></div>
-</div>
-<img alt="../_images/6ec37b1351ae0c260a0ccef804a3eb0452935a8ea395cb3b4c60373087fceafd.png" src="../_images/6ec37b1351ae0c260a0ccef804a3eb0452935a8ea395cb3b4c60373087fceafd.png" />
-</div>
-</div>
-<p>Already decent performance but the model starts overfitting heavily after epoch 15.</p>
-</section>
-<section id="exercise-2-vgg-like-model">
-<h2>Exercise 2: VGG-like model<a class="headerlink" href="#exercise-2-vgg-like-model" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Mimic the VGG model by building 3 ‘blocks’ of 2 convolutional layers each</p></li>
-<li><p>Do MaxPooling after each block</p></li>
-<li><p>The first layer should have at least 32 filters</p></li>
-<li><p>Use zero-padding to be able to build a deeper model</p></li>
-<li><p>Use a dense layer with at least 128 hidden nodes.</p></li>
-<li><p>Plot and interpret the learning curves</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.6827500462532043
-</pre></div>
-</div>
-<img alt="../_images/dd2fbf7d0ca958ff5941d89f3d6656aae6878371962b8a1d524c46205104c92d.png" src="../_images/dd2fbf7d0ca958ff5941d89f3d6656aae6878371962b8a1d524c46205104c92d.png" />
-</div>
-</div>
-<p>Better result, but still overfitting heavily</p>
-</section>
-<section id="exercise-3-regularization">
-<h2>Exercise 3: Regularization<a class="headerlink" href="#exercise-3-regularization" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Explore different ways to regularize your VGG-like model</p>
-<ul>
-<li><p>Try adding some dropout after every MaxPooling and Dense layer.</p>
-<ul>
-<li><p>What are good Dropout rates?</p></li>
-</ul>
-</li>
-<li><p>Try batch nornmalization together with Dropout</p></li>
-</ul>
-</li>
-<li><p>Plot and interpret the learning curves</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.7305000424385071
-</pre></div>
-</div>
-<img alt="../_images/631f2b8e63972f0c8ed640f9ba510cd3f58c649f316abeb3f288603c946339d3.png" src="../_images/631f2b8e63972f0c8ed640f9ba510cd3f58c649f316abeb3f288603c946339d3.png" />
-</div>
-</div>
-<p>Accuracy is quite a bit better and overfitting seems lessened</p>
-<p>Another common approach is to gradually increase the amount of dropout. This forces layers deep in the model to regularize more than layers closer to the input.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.3</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.4</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.7412500381469727
-</pre></div>
-</div>
-<img alt="../_images/126c43a647c246c4904891c216c21612a9f9b2ff730b1172886cac992fbbd848.png" src="../_images/126c43a647c246c4904891c216c21612a9f9b2ff730b1172886cac992fbbd848.png" />
-</div>
-</div>
-<p>Slightly better accuracy and very little overfitting remains.</p>
-<p>Next, we try adding Batch Normalization.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.3</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.4</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.7827500104904175
-</pre></div>
-</div>
-<img alt="../_images/73110a91c076f14386e897031949c7bb8e0ab336716f4e392beca56456ac6a10.png" src="../_images/73110a91c076f14386e897031949c7bb8e0ab336716f4e392beca56456ac6a10.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-data-augmentation">
-<h2>Exercise 4: Data Augmentation<a class="headerlink" href="#exercise-4-data-augmentation" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Perform image augmentation. You can use the ImageDataGenerator for this.</p></li>
-<li><p>What is the effect? What is the effect with and without Dropout?</p></li>
-<li><p>Plot and interpret the learning curves</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras.preprocessing.image</span> <span class="kn">import</span> <span class="n">ImageDataGenerator</span>
-
-<span class="n">train_datagen</span> <span class="o">=</span> <span class="n">ImageDataGenerator</span><span class="p">(</span>
-    <span class="n">width_shift_range</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span>
-    <span class="n">height_shift_range</span><span class="o">=</span><span class="mf">0.1</span><span class="p">,</span>
-    <span class="n">horizontal_flip</span><span class="o">=</span><span class="kc">True</span><span class="p">,)</span>
-<span class="n">it_train</span> <span class="o">=</span> <span class="n">train_datagen</span><span class="o">.</span><span class="n">flow</span><span class="p">(</span><span class="n">X_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">64</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">layers</span>
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">models</span>
-
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="mi">32</span><span class="p">,</span> <span class="mi">3</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">32</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.2</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.3</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Conv2D</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">3</span><span class="p">),</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">padding</span><span class="o">=</span><span class="s1">&#39;same&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">MaxPooling2D</span><span class="p">((</span><span class="mi">2</span><span class="p">,</span> <span class="mi">2</span><span class="p">)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.4</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">128</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">BatchNormalization</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-
-<span class="n">steps</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">X_train</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">/</span> <span class="mi">64</span><span class="p">)</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">it_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">25</span><span class="p">,</span> <span class="n">steps_per_epoch</span><span class="o">=</span><span class="n">steps</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">X_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">,</span><span class="n">style</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;b:&#39;</span><span class="p">,</span><span class="s1">&#39;r:&#39;</span><span class="p">,</span><span class="s1">&#39;b-&#39;</span><span class="p">,</span><span class="s1">&#39;r-&#39;</span><span class="p">]);</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Max val_acc&quot;</span><span class="p">,</span><span class="n">np</span><span class="o">.</span><span class="n">max</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_accuracy&#39;</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Max val_acc 0.8022500276565552
-</pre></div>
-</div>
-<img alt="../_images/4d0e96f82305c43bf0dd9c159249077ff7afbbbcd9bbd9906feb2d469934c7c9.png" src="../_images/4d0e96f82305c43bf0dd9c159249077ff7afbbbcd9bbd9906feb2d469934c7c9.png" />
-</div>
-</div>
-<p>We get 2-3% improvement. We get the best results with very subtle data augmentation (small shifts and flips). The images are quite low resolution and rotation or sheer will destroy too much information.</p>
-</section>
-<section id="exercise-5-interpreting-misclassifications">
-<h2>Exercise 5: Interpreting misclassifications<a class="headerlink" href="#exercise-5-interpreting-misclassifications" title="Permalink to this heading">#</a></h2>
-<p>Chances are that even your best models are not yet perfect. It is important to understand what kind of errors it still makes.</p>
-<ul class="simple">
-<li><p>Run the test images through the network and detect all misclassified ones</p></li>
-<li><p>Interpret the results. Are these misclassifications to be expected?</p></li>
-<li><p>Compute the confusion matrix. Which classes are often confused?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">y_pred</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X_test</span><span class="p">)</span>
-<span class="n">misclassified_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">nonzero</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span> <span class="o">!=</span> <span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_pred</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))[</span><span class="mi">0</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>Since we have numeric outputs (a value per class), we need to take the class with the maximum value as the predicted class.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Visualize the (first five) misclassifications, together with the predicted and actual class</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">axes</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">5</span><span class="p">,</span>  <span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="mi">10</span><span class="p">,</span> <span class="mi">5</span><span class="p">))</span>
-<span class="k">for</span> <span class="n">nr</span><span class="p">,</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">misclassified_samples</span><span class="p">[:</span><span class="mi">5</span><span class="p">]):</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">X_test</span><span class="p">[</span><span class="n">i</span><span class="p">])</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s2">&quot;Predicted: </span><span class="si">%s</span><span class="s2">,</span><span class="se">\n</span><span class="s2"> Actual : </span><span class="si">%s</span><span class="s2">&quot;</span> <span class="o">%</span> <span class="p">(</span><span class="n">cifar_classes</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_pred</span><span class="p">[</span><span class="n">i</span><span class="p">])],</span><span class="n">cifar_classes</span><span class="p">[</span><span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_test</span><span class="p">[</span><span class="n">i</span><span class="p">])]))</span>
-    <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(()),</span> <span class="n">axes</span><span class="p">[</span><span class="n">nr</span><span class="p">]</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(())</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">();</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/8a25833aacb4d8ba2ec988125222c275c6ee44e79314bec95b3d8372df61c2fe.png" src="../_images/8a25833aacb4d8ba2ec988125222c275c6ee44e79314bec95b3d8372df61c2fe.png" />
-</div>
-</div>
-<p>Some of these are indeed hard to categorize, although we can probably still improve the model quite a bit.</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">sklearn.metrics</span> <span class="kn">import</span> <span class="n">confusion_matrix</span>
-<span class="n">cm</span> <span class="o">=</span> <span class="n">confusion_matrix</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_test</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">),</span><span class="n">np</span><span class="o">.</span><span class="n">argmax</span><span class="p">(</span><span class="n">y_pred</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">1</span><span class="p">))</span>
-<span class="n">fig</span><span class="p">,</span> <span class="n">ax</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">()</span>
-<span class="n">im</span> <span class="o">=</span> <span class="n">ax</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">cm</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">10</span><span class="p">)),</span> <span class="n">ax</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="mi">10</span><span class="p">))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xticklabels</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">cifar_classes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">rotation</span><span class="o">=</span><span class="mi">45</span><span class="p">,</span> <span class="n">ha</span><span class="o">=</span><span class="s2">&quot;right&quot;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_yticklabels</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">cifar_classes</span><span class="o">.</span><span class="n">values</span><span class="p">()))</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_ylabel</span><span class="p">(</span><span class="s1">&#39;True&#39;</span><span class="p">)</span>
-<span class="n">ax</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Predicted&#39;</span><span class="p">)</span>
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">100</span><span class="p">):</span>
-    <span class="n">ax</span><span class="o">.</span><span class="n">text</span><span class="p">(</span><span class="nb">int</span><span class="p">(</span><span class="n">i</span><span class="o">/</span><span class="mi">10</span><span class="p">),</span><span class="n">i</span><span class="o">%</span><span class="k">10</span>,cm[i%10,int(i/10)], ha=&quot;center&quot;, va=&quot;center&quot;, color=&quot;w&quot;)
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/99e10c626f885233b6831a5ea20688e43723b19c6f5bb2f455287cdcaeb91e96.png" src="../_images/99e10c626f885233b6831a5ea20688e43723b19c6f5bb2f455287cdcaeb91e96.png" />
-</div>
-</div>
-<p>Most misclassifications seem to involve cats, birds, and horses. The most common misclassification is between cats and dogs.</p>
-</section>
-<section id="exercise-6-interpreting-the-model">
-<h2>Exercise 6: Interpreting the model<a class="headerlink" href="#exercise-6-interpreting-the-model" title="Permalink to this heading">#</a></h2>
-<p>Retrain your best model on all the data. Next, retrieve and visualize the activations (feature maps) for every filter for every layer, or at least for a few filters for every layer. Tip: see the course notebooks for examples on how to do this.</p>
-<p>Interpret the results. Is your model indeed learning something useful?</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span><span class="o">.</span><span class="n">summary</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Model: &quot;sequential_5&quot;
-_________________________________________________________________
- Layer (type)                Output Shape              Param #   
-=================================================================
- conv2d_27 (Conv2D)          (None, 32, 32, 32)        896       
-                                                                 
- batch_normalization_7 (Batc  (None, 32, 32, 32)       128       
- hNormalization)                                                 
-                                                                 
- conv2d_28 (Conv2D)          (None, 32, 32, 32)        9248      
-                                                                 
- batch_normalization_8 (Batc  (None, 32, 32, 32)       128       
- hNormalization)                                                 
-                                                                 
- max_pooling2d_14 (MaxPoolin  (None, 16, 16, 32)       0         
- g2D)                                                            
-                                                                 
- dropout_12 (Dropout)        (None, 16, 16, 32)        0         
-                                                                 
- conv2d_29 (Conv2D)          (None, 16, 16, 64)        18496     
-                                                                 
- batch_normalization_9 (Batc  (None, 16, 16, 64)       256       
- hNormalization)                                                 
-                                                                 
- conv2d_30 (Conv2D)          (None, 16, 16, 64)        36928     
-                                                                 
- batch_normalization_10 (Bat  (None, 16, 16, 64)       256       
- chNormalization)                                                
-                                                                 
- max_pooling2d_15 (MaxPoolin  (None, 8, 8, 64)         0         
- g2D)                                                            
-                                                                 
- dropout_13 (Dropout)        (None, 8, 8, 64)          0         
-                                                                 
- conv2d_31 (Conv2D)          (None, 8, 8, 128)         73856     
-                                                                 
- batch_normalization_11 (Bat  (None, 8, 8, 128)        512       
- chNormalization)                                                
-                                                                 
- conv2d_32 (Conv2D)          (None, 8, 8, 128)         147584    
-                                                                 
- batch_normalization_12 (Bat  (None, 8, 8, 128)        512       
- chNormalization)                                                
-                                                                 
- max_pooling2d_16 (MaxPoolin  (None, 4, 4, 128)        0         
- g2D)                                                            
-                                                                 
- dropout_14 (Dropout)        (None, 4, 4, 128)         0         
-                                                                 
- flatten_5 (Flatten)         (None, 2048)              0         
-                                                                 
- dense_10 (Dense)            (None, 128)               262272    
-                                                                 
- batch_normalization_13 (Bat  (None, 128)              512       
- chNormalization)                                                
-                                                                 
- dropout_15 (Dropout)        (None, 128)               0         
-                                                                 
- dense_11 (Dense)            (None, 10)                1290      
-                                                                 
-=================================================================
-Total params: 552,874
-Trainable params: 551,722
-Non-trainable params: 1,152
-_________________________________________________________________
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">models</span>
-
-<span class="n">img_tensor</span> <span class="o">=</span> <span class="n">X_test</span><span class="p">[</span><span class="mi">4</span><span class="p">]</span>
-<span class="n">img_tensor</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">expand_dims</span><span class="p">(</span><span class="n">img_tensor</span><span class="p">,</span> <span class="n">axis</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span> 
-
-<span class="c1"># Extracts the outputs of the top 8 layers:</span>
-<span class="n">layer_outputs</span> <span class="o">=</span> <span class="p">[</span><span class="n">layer</span><span class="o">.</span><span class="n">output</span> <span class="k">for</span> <span class="n">layer</span> <span class="ow">in</span> <span class="n">model</span><span class="o">.</span><span class="n">layers</span><span class="p">[:</span><span class="mi">15</span><span class="p">]]</span>
-<span class="c1"># Creates a model that will return these outputs, given the model input:</span>
-<span class="n">activation_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Model</span><span class="p">(</span><span class="n">inputs</span><span class="o">=</span><span class="n">model</span><span class="o">.</span><span class="n">input</span><span class="p">,</span> <span class="n">outputs</span><span class="o">=</span><span class="n">layer_outputs</span><span class="p">)</span>
-
-<span class="c1"># This will return a list of 5 Numpy arrays:</span>
-<span class="c1"># one array per layer activation</span>
-<span class="n">activations</span> <span class="o">=</span> <span class="n">activation_model</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">img_tensor</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plt</span><span class="o">.</span><span class="n">rcParams</span><span class="p">[</span><span class="s1">&#39;figure.dpi&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="mi">120</span>
-<span class="n">first_layer_activation</span> <span class="o">=</span> <span class="n">activations</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-
-<span class="n">f</span><span class="p">,</span> <span class="p">(</span><span class="n">ax1</span><span class="p">,</span> <span class="n">ax2</span><span class="p">)</span> <span class="o">=</span> <span class="n">plt</span><span class="o">.</span><span class="n">subplots</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">2</span><span class="p">,</span> <span class="n">sharey</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">ax1</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">img_tensor</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-<span class="n">ax2</span><span class="o">.</span><span class="n">matshow</span><span class="p">(</span><span class="n">first_layer_activation</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span> <span class="p">:,</span> <span class="p">:,</span> <span class="mi">2</span><span class="p">],</span> <span class="n">cmap</span><span class="o">=</span><span class="s1">&#39;viridis&#39;</span><span class="p">)</span>
-<span class="n">ax1</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">([])</span>
-<span class="n">ax1</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">([])</span>
-<span class="n">ax2</span><span class="o">.</span><span class="n">set_xticks</span><span class="p">([])</span>
-<span class="n">ax2</span><span class="o">.</span><span class="n">set_yticks</span><span class="p">([])</span>
-<span class="n">ax1</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Input image&#39;</span><span class="p">)</span>
-<span class="n">ax2</span><span class="o">.</span><span class="n">set_xlabel</span><span class="p">(</span><span class="s1">&#39;Activation of filter 2&#39;</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/d8334313d2ea420b16b72d0ccdcb3e63beb1bcbacc1bfbe9d0c7f88b0206b198.png" src="../_images/d8334313d2ea420b16b72d0ccdcb3e63beb1bcbacc1bfbe9d0c7f88b0206b198.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">images_per_row</span> <span class="o">=</span> <span class="mi">16</span>
-
-<span class="n">layer_names</span> <span class="o">=</span> <span class="p">[]</span>
-<span class="k">for</span> <span class="n">layer</span> <span class="ow">in</span> <span class="n">model</span><span class="o">.</span><span class="n">layers</span><span class="p">[:</span><span class="mi">15</span><span class="p">]:</span>
-    <span class="n">layer_names</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">layer</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
-
-<span class="k">def</span> <span class="nf">plot_activations</span><span class="p">(</span><span class="n">layer_index</span><span class="p">,</span> <span class="n">activations</span><span class="p">):</span>
-    <span class="n">start</span> <span class="o">=</span> <span class="n">layer_index</span>
-    <span class="n">end</span> <span class="o">=</span> <span class="n">layer_index</span><span class="o">+</span><span class="mi">1</span>
-    <span class="c1"># Now let&#39;s display our feature maps</span>
-    <span class="k">for</span> <span class="n">layer_name</span><span class="p">,</span> <span class="n">layer_activation</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">layer_names</span><span class="p">[</span><span class="n">start</span><span class="p">:</span><span class="n">end</span><span class="p">],</span> <span class="n">activations</span><span class="p">[</span><span class="n">start</span><span class="p">:</span><span class="n">end</span><span class="p">]):</span>
-        <span class="c1"># This is the number of features in the feature map</span>
-        <span class="n">n_features</span> <span class="o">=</span> <span class="n">layer_activation</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-
-        <span class="c1"># The feature map has shape (1, size, size, n_features)</span>
-        <span class="n">size</span> <span class="o">=</span> <span class="n">layer_activation</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span>
-
-        <span class="c1"># We will tile the activation channels in this matrix</span>
-        <span class="n">n_cols</span> <span class="o">=</span> <span class="n">n_features</span> <span class="o">//</span> <span class="n">images_per_row</span>
-        <span class="n">display_grid</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="n">size</span> <span class="o">*</span> <span class="n">n_cols</span><span class="p">,</span> <span class="n">images_per_row</span> <span class="o">*</span> <span class="n">size</span><span class="p">))</span>
-
-        <span class="c1"># We&#39;ll tile each filter into this big horizontal grid</span>
-        <span class="k">for</span> <span class="n">col</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_cols</span><span class="p">):</span>
-            <span class="k">for</span> <span class="n">row</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">images_per_row</span><span class="p">):</span>
-                <span class="n">channel_image</span> <span class="o">=</span> <span class="n">layer_activation</span><span class="p">[</span><span class="mi">0</span><span class="p">,</span>
-                                                 <span class="p">:,</span> <span class="p">:,</span>
-                                                 <span class="n">col</span> <span class="o">*</span> <span class="n">images_per_row</span> <span class="o">+</span> <span class="n">row</span><span class="p">]</span>
-                <span class="c1"># Post-process the feature to make it visually palatable</span>
-                <span class="n">channel_image</span> <span class="o">-=</span> <span class="n">channel_image</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
-                <span class="n">channel_image</span> <span class="o">/=</span> <span class="n">channel_image</span><span class="o">.</span><span class="n">std</span><span class="p">()</span>
-                <span class="n">channel_image</span> <span class="o">*=</span> <span class="mi">64</span>
-                <span class="n">channel_image</span> <span class="o">+=</span> <span class="mi">128</span>
-                <span class="n">channel_image</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">clip</span><span class="p">(</span><span class="n">channel_image</span><span class="p">,</span> <span class="mi">0</span><span class="p">,</span> <span class="mi">255</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;uint8&#39;</span><span class="p">)</span>
-                <span class="n">display_grid</span><span class="p">[</span><span class="n">col</span> <span class="o">*</span> <span class="n">size</span> <span class="p">:</span> <span class="p">(</span><span class="n">col</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">size</span><span class="p">,</span>
-                             <span class="n">row</span> <span class="o">*</span> <span class="n">size</span> <span class="p">:</span> <span class="p">(</span><span class="n">row</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">size</span><span class="p">]</span> <span class="o">=</span> <span class="n">channel_image</span>
-
-        <span class="c1"># Display the grid</span>
-        <span class="n">scale</span> <span class="o">=</span> <span class="mf">1.</span> <span class="o">/</span> <span class="n">size</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">figure</span><span class="p">(</span><span class="n">figsize</span><span class="o">=</span><span class="p">(</span><span class="n">scale</span> <span class="o">*</span> <span class="n">display_grid</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span>
-                            <span class="n">scale</span> <span class="o">*</span> <span class="n">display_grid</span><span class="o">.</span><span class="n">shape</span><span class="p">[</span><span class="mi">0</span><span class="p">]))</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">title</span><span class="p">(</span><span class="s2">&quot;Activation of layer </span><span class="si">{}</span><span class="s2"> (</span><span class="si">{}</span><span class="s2">)&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">layer_index</span><span class="o">+</span><span class="mi">1</span><span class="p">,</span><span class="n">layer_name</span><span class="p">))</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">grid</span><span class="p">(</span><span class="kc">False</span><span class="p">)</span>
-        <span class="n">plt</span><span class="o">.</span><span class="n">imshow</span><span class="p">(</span><span class="n">display_grid</span><span class="p">,</span> <span class="n">aspect</span><span class="o">=</span><span class="s1">&#39;auto&#39;</span><span class="p">,</span> <span class="n">cmap</span><span class="o">=</span><span class="s1">&#39;viridis&#39;</span><span class="p">)</span>
-
-    <span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_activations</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">activations</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>/var/folders/0t/5d8ttqzd773fy0wq3h5db0xr0000gn/T/ipykernel_34025/2702396986.py:30: RuntimeWarning: invalid value encountered in true_divide
-  channel_image /= channel_image.std()
-</pre></div>
-</div>
-<img alt="../_images/6d2e74dfbd8c7e93d5ed4f6b27739aae995e92e4daa717584cc09998e85ea81f.png" src="../_images/6d2e74dfbd8c7e93d5ed4f6b27739aae995e92e4daa717584cc09998e85ea81f.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_activations</span><span class="p">(</span><span class="mi">2</span><span class="p">,</span> <span class="n">activations</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/a272da1091f9844fabe7354e5f331cfdd3fb162b05dc592914384a683e3d24f2.png" src="../_images/a272da1091f9844fabe7354e5f331cfdd3fb162b05dc592914384a683e3d24f2.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_activations</span><span class="p">(</span><span class="mi">6</span><span class="p">,</span> <span class="n">activations</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/e9d1042a17161cf6ce477252343017f080f1f1bf0d35db4a0994cbec019ee34c.png" src="../_images/e9d1042a17161cf6ce477252343017f080f1f1bf0d35db4a0994cbec019ee34c.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_activations</span><span class="p">(</span><span class="mi">8</span><span class="p">,</span> <span class="n">activations</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/b50f7ff96c4de5defdb554c3b88e6a5f3181f5fe04027a8d5bb378c044bb795c.png" src="../_images/b50f7ff96c4de5defdb554c3b88e6a5f3181f5fe04027a8d5bb378c044bb795c.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plot_activations</span><span class="p">(</span><span class="mi">12</span><span class="p">,</span> <span class="n">activations</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>/var/folders/0t/5d8ttqzd773fy0wq3h5db0xr0000gn/T/ipykernel_34025/2702396986.py:30: RuntimeWarning: invalid value encountered in true_divide
-  channel_image /= channel_image.std()
-</pre></div>
-</div>
-<img alt="../_images/3f9ba637c5a5feea99676318929e0dd5666970e19352ee90d62fbc0fad83972b.png" src="../_images/3f9ba637c5a5feea99676318929e0dd5666970e19352ee90d62fbc0fad83972b.png" />
-</div>
-</div>
-</section>
-<section id="optional-take-it-a-step-further">
-<h2>Optional: Take it a step further<a class="headerlink" href="#optional-take-it-a-step-further" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Repeat the exercises, but now use a <a class="reference external" href="https://www.openml.org/d/40926">higher-resolution version of the CIFAR dataset</a> (with OpenML ID 41103), or another <a class="reference external" href="https://www.openml.org/d/41983">version with 100 classes</a> (with OpenML ID 41983). Good luck!</p></li>
-</ul>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-a-simple-model">Exercise 1: A simple model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-vgg-like-model">Exercise 2: VGG-like model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-regularization">Exercise 3: Regularization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-data-augmentation">Exercise 4: Data Augmentation</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-5-interpreting-misclassifications">Exercise 5: Interpreting misclassifications</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-6-interpreting-the-model">Exercise 6: Interpreting the model</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#optional-take-it-a-step-further">Optional: Take it a step further</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/labs/Lab 7b - Neural Networks for text Solution.html b/labs/Lab 7b - Neural Networks for text Solution.html
deleted file mode 100644
index 5f915a057..000000000
--- a/labs/Lab 7b - Neural Networks for text Solution.html	
+++ /dev/null
@@ -1,1332 +0,0 @@
-
-
-<!DOCTYPE html>
-
-
-<html lang="en" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="generator" content="Docutils 0.18.1: http://docutils.sourceforge.net/" />
-
-    <title>Lab 9: Neural Networks for text &#8212; ML Engineering</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.1.2/css/all.min.css?digest=12da95d707ffb74b382d" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.1.2/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css" />
-    <link rel="stylesheet" href="../_static/styles/sphinx-book-theme.css?digest=14f4ca6b54d191a8c7657f6c759bf11a5fb86285" type="text/css" />
-    <link rel="stylesheet" type="text/css" href="../_static/togglebutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/mystnb.4510f1fc1dee50b3e5859aac5469c37c29e427902b24a333a5f9fcb2f0b3ac41.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/sphinx-thebe.css" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.4045f2051d55cab465a707391d5b2007.min.css" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d" />
-
-    <script data-url_root="../" id="documentation_options" src="../_static/documentation_options.js"></script>
-    <script src="../_static/jquery.js"></script>
-    <script src="../_static/underscore.js"></script>
-    <script src="../_static/_sphinx_javascript_frameworks_compat.js"></script>
-    <script src="../_static/doctools.js"></script>
-    <script src="../_static/clipboard.min.js"></script>
-    <script src="../_static/copybutton.js"></script>
-    <script src="../_static/scripts/sphinx-book-theme.js?digest=5a5c038af52cf7bc1a1ec88eea08e6366ee68824"></script>
-    <script>let toggleHintShow = 'Click to show';</script>
-    <script>let toggleHintHide = 'Click to hide';</script>
-    <script>let toggleOpenOnPrint = 'true';</script>
-    <script src="../_static/togglebutton.js"></script>
-    <script>var togglebuttonSelector = '.toggle, .admonition.dropdown';</script>
-    <script src="../_static/design-tabs.js"></script>
-    <script>const THEBE_JS_URL = "https://unpkg.com/thebe@0.8.2/lib/index.js"
-const thebe_selector = ".thebe,.cell"
-const thebe_selector_input = "pre"
-const thebe_selector_output = ".output, .cell_output"
-</script>
-    <script async="async" src="../_static/sphinx-thebe.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'labs/Lab 7b - Neural Networks for text Solution';</script>
-    <link rel="shortcut icon" href="../_static/favicon.png"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search this book..."
-         aria-label="Search this book..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <nav class="bd-header navbar navbar-expand-lg bd-navbar">
-    </nav>
-  
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-    
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item">
-  
-
-<a class="navbar-brand logo" href="../intro.html">
-  
-  
-  
-  
-    
-    
-      
-    
-    
-    <img src="../_static/banner.jpeg" class="logo__image only-light" alt="Logo image"/>
-    <script>document.write(`<img src="../_static/banner.jpeg" class="logo__image only-dark" alt="Logo image"/>`);</script>
-  
-  
-</a></div>
-        <div class="sidebar-primary-item"><nav class="bd-links" id="bd-docs-nav" aria-label="Main">
-    <div class="bd-toc-item navbar-nav active">
-        
-        <ul class="nav bd-sidenav bd-sidenav__home-link">
-            <li class="toctree-l1">
-                <a class="reference internal" href="../intro.html">
-                    Welcome
-                </a>
-            </li>
-        </ul>
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%200%20-%20Prerequisites.html">Prerequisites</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Lectures</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/01%20-%20Introduction.html">Lecture 1: Introduction</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/02%20-%20Linear%20Models.html">Lecture 2: Linear models</a></li>
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/03%20-%20Kernelization.html">Lecture 3: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/04%20-%20Model%20Selection.html">Lecture 4: Model Selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/05%20-%20Ensemble%20Learning.html">Lecture 5. Ensemble Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/06%20-%20Data%20Preprocessing.html">Lecture 6. Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/07%20-%20Bayesian%20Learning.html">Lecture 7. Bayesian Learning</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/08%20-%20Neural%20Networks.html">Lecture 8. Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/09%20-%20Convolutional%20Neural%20Networks.html">Lecture 9: Convolutional Neural Networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/10%20-%20Neural%20Networks%20for%20text.html">Lecture 10. Neural Networks for text</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Labs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="Lab%201a%20-%20Linear%20Models%20for%20Regression.html">Lab 1a: Linear regression</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201b%20-%20Linear%20Models%20for%20Classification.html">Lab 1b: Linear classification</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202a%20-%20Kernelization.html">Lab 2a: Kernelization</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%202b%20-%20Model%20Selection.html">Lab 2b: Model selection</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%203%20-%20Ensembles.html">Lab 3: Ensembles</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Pipelines.html">Lab 4:  Data preprocessing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%205%20-%20Bayesian%20learning.html">Lab 5: Bayesian models</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Neural%20Networks.html">Lab 6: Neural networks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207a%20-%20Convolutional%20Neural%20Networks.html">Lab 7a: Convolutional neural nets</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207b%20-%20Neural%20Networks%20for%20text.html">Lab 7b: Neural Networks for text</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%208%20-%20AutoML.html">Lab 8: AutoML</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Tutorials</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%201%20-%20Python.html">Python for data analysis</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%202%20-%20Python%20for%20Data%20Analysis.html">Python for scientific computing</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%203%20-%20Machine%20Learning%20in%20Python.html">Machine Learning in Python</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%204%20-%20Decision%20Trees.html">Recap: Decision Trees</a></li>
-
-
-<li class="toctree-l1"><a class="reference internal" href="../notebooks/Tutorial%205%20-%20Nearest%20Neighbors.html">Recap: k-Nearest Neighbor</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%201%20-%20Tutorial.html">Lab 1: Machine Learning with Python</a></li>
-
-
-
-<li class="toctree-l1"><a class="reference internal" href="Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
-<li class="toctree-l1"><a class="reference internal" href="Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-
-<div class="sbt-scroll-pixel-helper"></div>
-
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item"><label class="sidebar-toggle primary-toggle btn btn-sm" for="__primary" title="Toggle primary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-  <span class="fa-solid fa-bars"></span>
-</label></div>
-      
-    </div>
-  
-  
-    <div class="header-article-items__end">
-      
-        <div class="header-article-item">
-
-<div class="article-header-buttons">
-
-
-
-
-
-<div class="dropdown dropdown-launch-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Launch interactive content">
-    <i class="fas fa-rocket"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://colab.research.google.com/github/ml-course/master/blob/master/labs/Lab 7b - Neural Networks for text Solution.ipynb" target="_blank"
-   class="btn btn-sm dropdown-item"
-   title="Launch onColab"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  
-    <img src="../_static/images/logo_colab.png">
-  </span>
-<span class="btn__text-container">Colab</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-source-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Source repositories">
-    <i class="fab fa-github"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master" target="_blank"
-   class="btn btn-sm btn-source-repository-button dropdown-item"
-   title="Source repository"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fab fa-github"></i>
-  </span>
-<span class="btn__text-container">Repository</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li><a href="https://github.com/ml-course/master/issues/new?title=Issue%20on%20page%20%2Flabs/Lab 7b - Neural Networks for text Solution.html&body=Your%20issue%20content%20here." target="_blank"
-   class="btn btn-sm btn-source-issues-button dropdown-item"
-   title="Open an issue"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-lightbulb"></i>
-  </span>
-<span class="btn__text-container">Open issue</span>
-</a>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-
-
-<div class="dropdown dropdown-download-buttons">
-  <button class="btn dropdown-toggle" type="button" data-bs-toggle="dropdown" aria-expanded="false" aria-label="Download this page">
-    <i class="fas fa-download"></i>
-  </button>
-  <ul class="dropdown-menu">
-      
-      
-      
-      <li><a href="../_sources/labs/Lab 7b - Neural Networks for text Solution.ipynb" target="_blank"
-   class="btn btn-sm btn-download-source-button dropdown-item"
-   title="Download source file"
-   data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file"></i>
-  </span>
-<span class="btn__text-container">.ipynb</span>
-</a>
-</li>
-      
-      
-      
-      
-      <li>
-<button onclick="window.print()"
-  class="btn btn-sm btn-download-pdf-button dropdown-item"
-  title="Print to PDF"
-  data-bs-placement="left" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-file-pdf"></i>
-  </span>
-<span class="btn__text-container">.pdf</span>
-</button>
-</li>
-      
-  </ul>
-</div>
-
-
-
-
-<button onclick="toggleFullScreen()"
-  class="btn btn-sm btn-fullscreen-button"
-  title="Fullscreen mode"
-  data-bs-placement="bottom" data-bs-toggle="tooltip"
->
-  
-
-<span class="btn__icon-container">
-  <i class="fas fa-expand"></i>
-  </span>
-
-</button>
-
-
-<script>
-document.write(`
-  <button class="theme-switch-button btn btn-sm btn-outline-primary navbar-btn rounded-circle" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch" data-mode="light"><i class="fa-solid fa-sun"></i></span>
-    <span class="theme-switch" data-mode="dark"><i class="fa-solid fa-moon"></i></span>
-    <span class="theme-switch" data-mode="auto"><i class="fa-solid fa-circle-half-stroke"></i></span>
-  </button>
-`);
-</script>
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass"></i>
-  </button>
-`);
-</script>
-<label class="sidebar-toggle secondary-toggle btn btn-sm" for="__secondary"title="Toggle secondary sidebar" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="fa-solid fa-list"></span>
-</label>
-</div></div>
-      
-    </div>
-  
-</div>
-</div>
-              
-              
-
-<div id="jb-print-docs-body" class="onlyprint">
-    <h1>Lab 9: Neural Networks for text</h1>
-    <!-- Table of contents -->
-    <div id="print-main-content">
-        <div id="jb-print-toc">
-            
-            <div>
-                <h2> Contents </h2>
-            </div>
-            <nav aria-label="Page">
-                <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-sentiment-analysis">Exercise 1: Sentiment Analysis</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-topic-classification">Exercise 2: Topic classification</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-regularization">Exercise 3: Regularization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-word-embeddings">Exercise 4: Word embeddings</a></li>
-</ul>
-            </nav>
-        </div>
-    </div>
-</div>
-
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article" role="main">
-                  
-  <section class="tex2jax_ignore mathjax_ignore" id="lab-9-neural-networks-for-text">
-<h1>Lab 9: Neural Networks for text<a class="headerlink" href="#lab-9-neural-networks-for-text" title="Permalink to this heading">#</a></h1>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Global imports and settings</span>
-<span class="o">%</span><span class="k">matplotlib</span> inline
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-<span class="kn">import</span> <span class="nn">pandas</span> <span class="k">as</span> <span class="nn">pd</span>
-<span class="kn">import</span> <span class="nn">openml</span> <span class="k">as</span> <span class="nn">oml</span>
-<span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">import</span> <span class="nn">matplotlib.pyplot</span> <span class="k">as</span> <span class="nn">plt</span>
-<span class="kn">import</span> <span class="nn">tensorflow.keras</span> <span class="k">as</span> <span class="nn">keras</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Using Keras&quot;</span><span class="p">,</span><span class="n">keras</span><span class="o">.</span><span class="n">__version__</span><span class="p">)</span>
-<span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s1">&#39;TF_CPP_MIN_LOG_LEVEL&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;2&quot;</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Using Keras 2.2.4-tf
-</pre></div>
-</div>
-<div class="output text_html"><style>html, body{overflow-y: visible !important} .CodeMirror{min-width:105% !important;} .rise-enabled .CodeMirror, .rise-enabled .output_subarea{font-size:140%; line-height:1.2; overflow: visible;} .output_subarea pre{width:110%}</style></div></div>
-</div>
-<p>Before you start, read the Tutorial for this lab (‘Deep Learning with Python’)</p>
-<section id="exercise-1-sentiment-analysis">
-<h2>Exercise 1: Sentiment Analysis<a class="headerlink" href="#exercise-1-sentiment-analysis" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Take the IMDB dataset from keras.datasets with 10000 words and the default train-test-split</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras.datasets</span> <span class="kn">import</span> <span class="n">imdb</span>
-<span class="c1"># Download IMDB data with 10000 most frequent words</span>
-<span class="n">word_index</span> <span class="o">=</span> <span class="n">imdb</span><span class="o">.</span><span class="n">get_word_index</span><span class="p">()</span>
-<span class="p">(</span><span class="n">train_data</span><span class="p">,</span> <span class="n">train_labels</span><span class="p">),</span> <span class="p">(</span><span class="n">test_data</span><span class="p">,</span> <span class="n">test_labels</span><span class="p">)</span> <span class="o">=</span> <span class="n">imdb</span><span class="o">.</span><span class="n">load_data</span><span class="p">(</span><span class="n">num_words</span><span class="o">=</span><span class="mi">10000</span><span class="p">)</span>
-<span class="n">reverse_word_index</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">([(</span><span class="n">value</span><span class="p">,</span> <span class="n">key</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">key</span><span class="p">,</span> <span class="n">value</span><span class="p">)</span> <span class="ow">in</span> <span class="n">word_index</span><span class="o">.</span><span class="n">items</span><span class="p">()])</span>
-
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span><span class="mi">5</span><span class="p">,</span><span class="mi">10</span><span class="p">]:</span>
-    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Review </span><span class="si">{}</span><span class="s2">:&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">i</span><span class="p">),</span><span class="s1">&#39; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">reverse_word_index</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">i</span> <span class="o">-</span> <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;?&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">train_data</span><span class="p">[</span><span class="n">i</span><span class="p">]][</span><span class="mi">0</span><span class="p">:</span><span class="mi">20</span><span class="p">]))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Review 0: ? this film was just brilliant casting location scenery story direction everyone&#39;s really suited the part they played and you
-Review 5: ? begins better than it ends funny that the russian submarine crew ? all other actors it&#39;s like those scenes
-Review 10: ? french horror cinema has seen something of a revival over the last couple of years with great films such
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Vectorize the reviews using one-hot-encoding (see tutorial for helper code)</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Custom implementation of one-hot-encoding</span>
-<span class="k">def</span> <span class="nf">vectorize_sequences</span><span class="p">(</span><span class="n">sequences</span><span class="p">,</span> <span class="n">dimension</span><span class="o">=</span><span class="mi">10000</span><span class="p">):</span>
-    <span class="n">results</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">sequences</span><span class="p">),</span> <span class="n">dimension</span><span class="p">))</span>
-    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">sequence</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">sequences</span><span class="p">):</span>
-        <span class="n">results</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="n">sequence</span><span class="p">]</span> <span class="o">=</span> <span class="mf">1.</span>  <span class="c1"># set specific indices of results[i] to 1s</span>
-    <span class="k">return</span> <span class="n">results</span>
-<span class="n">x_train</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">train_data</span><span class="p">)</span>
-<span class="n">x_test</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">test_data</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Encoded review: &quot;</span><span class="p">,</span> <span class="n">train_data</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">:</span><span class="mi">10</span><span class="p">])</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;One-hot-encoded review: &quot;</span><span class="p">,</span> <span class="n">x_train</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">:</span><span class="mi">10</span><span class="p">])</span>
-
-<span class="c1"># Convert 0/1 labels to float</span>
-<span class="n">y_train</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">train_labels</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;float32&#39;</span><span class="p">)</span>
-<span class="n">y_test</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">test_labels</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;float32&#39;</span><span class="p">)</span>
-
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Label: &quot;</span><span class="p">,</span> <span class="n">y_train</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Encoded review:  [1, 14, 22, 16, 43, 530, 973, 1622, 1385, 65]
-One-hot-encoded review:  [0. 1. 1. 0. 1. 1. 1. 1. 1. 1.]
-Label:  1.0
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Build a network of 2 <em>Dense</em> layers with 16 nodes each and the <em>ReLU</em> activation function.</p></li>
-<li><p>Use cross-entropy as the loss function, Adagrad as the optimizer, and accuracy as the evaluation matric.</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">models</span>
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">layers</span> 
-
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;RMSprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Plot the learning curves, using the first 10000 samples as the validation set and the rest as the training set.</p></li>
-<li><p>Use 20 epochs and a batch size of 512</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">x_val</span><span class="p">,</span> <span class="n">partial_x_train</span> <span class="o">=</span> <span class="n">x_train</span><span class="p">[:</span><span class="mi">10000</span><span class="p">],</span> <span class="n">x_train</span><span class="p">[</span><span class="mi">10000</span><span class="p">:]</span>
-<span class="n">y_val</span><span class="p">,</span> <span class="n">partial_y_train</span> <span class="o">=</span> <span class="n">y_train</span><span class="p">[:</span><span class="mi">10000</span><span class="p">],</span> <span class="n">y_train</span><span class="p">[</span><span class="mi">10000</span><span class="p">:]</span> 
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span> <span class="n">partial_y_train</span><span class="p">,</span>
-                    <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Plotting</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/eacb5482b291355731a0a072f8964a59752038c222796cb8c157c365ff357cdd.png" src="../_images/eacb5482b291355731a0a072f8964a59752038c222796cb8c157c365ff357cdd.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">models</span>
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">layers</span> 
-
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;RMSprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Retrain the model, this time using early stopping to stop training at the optimal time</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Based on the figure, we should stop after 4 epochs</span>
-<span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span> <span class="n">epochs</span><span class="o">=</span><span class="mi">4</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
-<span class="n">result</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Loss: </span><span class="si">{:.4f}</span><span class="s2">, Accuracy:  </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="o">*</span><span class="n">result</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>25000/25000 [==============================] - 2s 100us/sample - loss: 0.2879 - accuracy: 0.8862
-Loss: 0.2879, Accuracy:  0.8862
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Try to manually improve the score and explain what you observe. E.g. you could:</p>
-<ul>
-<li><p>Try 3 hidden layers</p></li>
-<li><p>Change to a higher learning rate (e.g. 0.4)</p></li>
-<li><p>Try another optimizer (e.g. Adagrad)</p></li>
-<li><p>Use more or fewer hidden units (e.g. 64)</p></li>
-<li><p><code class="docutils literal notranslate"><span class="pre">tanh</span></code> activation instead of <code class="docutils literal notranslate"><span class="pre">ReLU</span></code></p></li>
-</ul>
-</li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Three hidden layers</span>
-<span class="c1"># Not really worth it, very similar results</span>
-<span class="c1"># Overfits even faster</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span> <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span> <span class="n">partial_y_train</span><span class="p">,</span>
-                    <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/9f04808c1c84c4798068fb46d511848e08677b1fe27a4eb8430b594547887d7a.png" src="../_images/9f04808c1c84c4798068fb46d511848e08677b1fe27a4eb8430b594547887d7a.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Set the learning rate to 0.1 and plot the learning curves again.</span>
-<span class="c1"># learning rate 0.4 gives very high losses which don&#39;t plot nicely</span>
-<span class="c1"># For high learning rates there is no  convergence, the loss actually increases</span>
-<span class="kn">from</span> <span class="nn">tensorflow.keras</span> <span class="kn">import</span> <span class="n">optimizers</span>
-
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">optimizers</span><span class="o">.</span><span class="n">RMSprop</span><span class="p">(</span><span class="n">lr</span><span class="o">=</span><span class="mf">0.1</span><span class="p">),</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span> <span class="n">partial_y_train</span><span class="p">,</span>
-                    <span class="n">epochs</span><span class="o">=</span><span class="mi">10</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/6e2f5d86d6d65f6256d4efbe17e0ffb24a9bb356bce1673034f906a7f0d54bd3.png" src="../_images/6e2f5d86d6d65f6256d4efbe17e0ffb24a9bb356bce1673034f906a7f0d54bd3.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Adagrad optimizer</span>
-<span class="c1"># Seems more well-behaved but slower. The validation loss is still decreasing after 20 epochs.</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;adagrad&#39;</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span> <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span> <span class="n">partial_y_train</span><span class="p">,</span>
-                    <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-<span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/0ec2e37f44b238c63ec8c200a71325d21b0e407131ee10e2e2bc7b9e017bab01.png" src="../_images/0ec2e37f44b238c63ec8c200a71325d21b0e407131ee10e2e2bc7b9e017bab01.png" />
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Score is not better than RMSprop with early stopping, but could still improve with more epochs</span>
-<span class="n">result</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Loss: </span><span class="si">{:.4f}</span><span class="s2">, Accuracy:  </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="o">*</span><span class="n">result</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>25000/25000 [==============================] - 3s 114us/sample - loss: 0.3511 - accuracy: 0.8770
-Loss: 0.3511, Accuracy:  0.8770
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Further tune the results by doing a grid search for the most interesting hyperparameters</p>
-<ul>
-<li><p>Tune the learning rate between 0.001 and 1</p></li>
-<li><p>Tune the number of epochs between 1 and 20</p></li>
-<li><p>Use only 3-4 values for each</p></li>
-</ul>
-</li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras.wrappers.scikit_learn</span> <span class="kn">import</span> <span class="n">KerasClassifier</span><span class="p">,</span> <span class="n">KerasRegressor</span>
-<span class="kn">from</span> <span class="nn">sklearn.model_selection</span> <span class="kn">import</span> <span class="n">GridSearchCV</span>
-
-<span class="k">def</span> <span class="nf">make_model</span><span class="p">(</span><span class="n">learning_rate</span><span class="o">=</span><span class="mf">0.01</span><span class="p">):</span>
-    <span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-    <span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-    <span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="n">optimizers</span><span class="o">.</span><span class="n">Adagrad</span><span class="p">(</span><span class="n">lr</span><span class="o">=</span><span class="n">learning_rate</span><span class="p">),</span>
-                  <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                  <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-    <span class="k">return</span> <span class="n">model</span>
-
-<span class="n">clf</span> <span class="o">=</span> <span class="n">KerasClassifier</span><span class="p">(</span><span class="n">make_model</span><span class="p">)</span>
-<span class="n">param_grid</span> <span class="o">=</span> <span class="p">{</span><span class="s1">&#39;epochs&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mi">1</span><span class="p">,</span> <span class="mi">10</span><span class="p">,</span> <span class="mi">20</span><span class="p">],</span>  <span class="c1"># epochs is a fit parameter</span>
-              <span class="s1">&#39;learning_rate&#39;</span><span class="p">:</span> <span class="p">[</span><span class="mf">0.001</span><span class="p">,</span> <span class="mf">0.01</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="c1"># this is a make_model parameter</span>
-              <span class="s1">&#39;verbose&#39;</span> <span class="p">:</span> <span class="p">[</span><span class="mi">0</span><span class="p">]}</span>
-<span class="n">grid</span> <span class="o">=</span> <span class="n">GridSearchCV</span><span class="p">(</span><span class="n">clf</span><span class="p">,</span> <span class="n">param_grid</span><span class="o">=</span><span class="n">param_grid</span><span class="p">,</span> <span class="n">cv</span><span class="o">=</span><span class="mi">3</span><span class="p">,</span> <span class="n">return_train_score</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-<span class="n">grid</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_plain highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>GridSearchCV(cv=3, error_score=nan,
-             estimator=&lt;tensorflow.python.keras.wrappers.scikit_learn.KerasClassifier object at 0x134b7e0f0&gt;,
-             iid=&#39;deprecated&#39;, n_jobs=None,
-             param_grid={&#39;epochs&#39;: [1, 10, 20],
-                         &#39;learning_rate&#39;: [0.001, 0.01, 1], &#39;verbose&#39;: [0]},
-             pre_dispatch=&#39;2*n_jobs&#39;, refit=True, return_train_score=True,
-             scoring=None, verbose=0)
-</pre></div>
-</div>
-</div>
-</div>
-<p>Grid search results</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">res</span> <span class="o">=</span> <span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">grid</span><span class="o">.</span><span class="n">cv_results_</span><span class="p">)</span>
-<span class="n">res</span><span class="o">.</span><span class="n">pivot_table</span><span class="p">(</span><span class="n">index</span><span class="o">=</span><span class="p">[</span><span class="s2">&quot;param_epochs&quot;</span><span class="p">,</span> <span class="s2">&quot;param_learning_rate&quot;</span><span class="p">],</span>
-                <span class="n">values</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;mean_train_score&#39;</span><span class="p">,</span> <span class="s2">&quot;mean_test_score&quot;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output text_html"><div>
-<style scoped>
-    .dataframe tbody tr th:only-of-type {
-        vertical-align: middle;
-    }
-
-    .dataframe tbody tr th {
-        vertical-align: top;
-    }
-
-    .dataframe thead th {
-        text-align: right;
-    }
-</style>
-<table border="1" class="dataframe">
-  <thead>
-    <tr style="text-align: right;">
-      <th></th>
-      <th></th>
-      <th>mean_test_score</th>
-      <th>mean_train_score</th>
-    </tr>
-    <tr>
-      <th>param_epochs</th>
-      <th>param_learning_rate</th>
-      <th></th>
-      <th></th>
-    </tr>
-  </thead>
-  <tbody>
-    <tr>
-      <th rowspan="3" valign="top">1</th>
-      <th>1.00e-03</th>
-      <td>0.64</td>
-      <td>0.65</td>
-    </tr>
-    <tr>
-      <th>1.00e-02</th>
-      <td>0.86</td>
-      <td>0.88</td>
-    </tr>
-    <tr>
-      <th>1.00e+00</th>
-      <td>0.50</td>
-      <td>0.50</td>
-    </tr>
-    <tr>
-      <th rowspan="3" valign="top">10</th>
-      <th>1.00e-03</th>
-      <td>0.86</td>
-      <td>0.88</td>
-    </tr>
-    <tr>
-      <th>1.00e-02</th>
-      <td>0.88</td>
-      <td>0.98</td>
-    </tr>
-    <tr>
-      <th>1.00e+00</th>
-      <td>0.50</td>
-      <td>0.50</td>
-    </tr>
-    <tr>
-      <th rowspan="3" valign="top">20</th>
-      <th>1.00e-03</th>
-      <td>0.87</td>
-      <td>0.90</td>
-    </tr>
-    <tr>
-      <th>1.00e-02</th>
-      <td>0.87</td>
-      <td>1.00</td>
-    </tr>
-    <tr>
-      <th>1.00e+00</th>
-      <td>0.50</td>
-      <td>0.50</td>
-    </tr>
-  </tbody>
-</table>
-</div></div></div>
-</div>
-</section>
-<section id="exercise-2-topic-classification">
-<h2>Exercise 2: Topic classification<a class="headerlink" href="#exercise-2-topic-classification" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Take the Reuters dataset from keras.datasets with 10000 words and the default train-test-split</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">keras.datasets</span> <span class="kn">import</span> <span class="n">reuters</span>
-
-<span class="p">(</span><span class="n">train_data</span><span class="p">,</span> <span class="n">train_labels</span><span class="p">),</span> <span class="p">(</span><span class="n">test_data</span><span class="p">,</span> <span class="n">test_labels</span><span class="p">)</span> <span class="o">=</span> <span class="n">reuters</span><span class="o">.</span><span class="n">load_data</span><span class="p">(</span><span class="n">num_words</span><span class="o">=</span><span class="mi">10000</span><span class="p">)</span>
-<span class="n">word_index</span> <span class="o">=</span> <span class="n">reuters</span><span class="o">.</span><span class="n">get_word_index</span><span class="p">()</span>
-<span class="n">reverse_word_index</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">([(</span><span class="n">value</span><span class="p">,</span> <span class="n">key</span><span class="p">)</span> <span class="k">for</span> <span class="p">(</span><span class="n">key</span><span class="p">,</span> <span class="n">value</span><span class="p">)</span> <span class="ow">in</span> <span class="n">word_index</span><span class="o">.</span><span class="n">items</span><span class="p">()])</span>
-
-<span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="p">[</span><span class="mi">0</span><span class="p">,</span><span class="mi">5</span><span class="p">,</span><span class="mi">10</span><span class="p">]:</span>
-    <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;News wire </span><span class="si">{}</span><span class="s2">:&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="n">i</span><span class="p">),</span>
-          <span class="s1">&#39; &#39;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">reverse_word_index</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">i</span> <span class="o">-</span> <span class="mi">3</span><span class="p">,</span> <span class="s1">&#39;?&#39;</span><span class="p">)</span> <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="n">train_data</span><span class="p">[</span><span class="n">i</span><span class="p">]]))</span>
-    <span class="c1"># Note that our indices were offset by 3</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stderr highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Using TensorFlow backend.
-</pre></div>
-</div>
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>News wire 0: ? ? ? said as a result of its december acquisition of space co it expects earnings per share in 1987 of 1 15 to 1 30 dlrs per share up from 70 cts in 1986 the company said pretax net should rise to nine to 10 mln dlrs from six mln dlrs in 1986 and rental operation revenues to 19 to 22 mln dlrs from 12 5 mln dlrs it said cash flow per share this year should be 2 50 to three dlrs reuter 3
-News wire 5: ? the u s agriculture department estimated canada&#39;s 1986 87 wheat crop at 31 85 mln tonnes vs 31 85 mln tonnes last month it estimated 1985 86 output at 24 25 mln tonnes vs 24 25 mln last month canadian 1986 87 coarse grain production is projected at 27 62 mln tonnes vs 27 62 mln tonnes last month production in 1985 86 is estimated at 24 95 mln tonnes vs 24 95 mln last month canadian wheat exports in 1986 87 are forecast at 19 00 mln tonnes vs 18 00 mln tonnes last month exports in 1985 86 are estimated at 17 71 mln tonnes vs 17 72 mln last month reuter 3
-News wire 10: ? period ended december 31 shr profit 11 cts vs loss 24 cts net profit 224 271 vs loss 511 349 revs 7 258 688 vs 7 200 349 reuter 3
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>We have to vectorize the data and the labels using one-hot-encoding</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">keras.utils.np_utils</span> <span class="kn">import</span> <span class="n">to_categorical</span>
-<span class="n">x_train</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">train_data</span><span class="p">)</span>
-<span class="n">x_test</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">test_data</span><span class="p">)</span>
-<span class="n">one_hot_train_labels</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">train_labels</span><span class="p">)</span>
-<span class="n">one_hot_test_labels</span> <span class="o">=</span> <span class="n">to_categorical</span><span class="p">(</span><span class="n">test_labels</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Build a network with 2 dense layers of 64 nodes each</p></li>
-<li><p>Make sensible choices about the activation functions, loss, …</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">46</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<ul class="simple">
-<li><p>Take a validation set from the first 1000 points of the training set</p></li>
-<li><p>Fit the model with 20 epochs and a batch size of 512</p></li>
-<li><p>Plot the learning curves</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">x_val</span><span class="p">,</span> <span class="n">partial_x_train</span> <span class="o">=</span> <span class="n">x_train</span><span class="p">[:</span><span class="mi">1000</span><span class="p">],</span> <span class="n">x_train</span><span class="p">[</span><span class="mi">1000</span><span class="p">:]</span>
-<span class="n">y_val</span><span class="p">,</span> <span class="n">partial_y_train</span> <span class="o">=</span> <span class="n">one_hot_train_labels</span><span class="p">[:</span><span class="mi">1000</span><span class="p">],</span> <span class="n">one_hot_train_labels</span><span class="p">[</span><span class="mi">1000</span><span class="p">:]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">history</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span>
-                    <span class="n">partial_y_train</span><span class="p">,</span>
-                    <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                    <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span>
-                    <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">pd</span><span class="o">.</span><span class="n">DataFrame</span><span class="p">(</span><span class="n">history</span><span class="o">.</span><span class="n">history</span><span class="p">)</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">lw</span><span class="o">=</span><span class="mi">2</span><span class="p">);</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/93c1fdf060ed07e4e21f3b8801d481ab0aefded1fa39900c9b64065e3ab9669a.png" src="../_images/93c1fdf060ed07e4e21f3b8801d481ab0aefded1fa39900c9b64065e3ab9669a.png" />
-</div>
-</div>
-<ul class="simple">
-<li><p>Create an information bottleneck: rebuild the model, but now use only 4 hidden units in the second layer. Evaluate the model. Does it still perform well?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">64</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">46</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;softmax&#39;</span><span class="p">))</span>
-
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-              <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;categorical_crossentropy&#39;</span><span class="p">,</span>
-              <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="n">model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">partial_x_train</span><span class="p">,</span>
-          <span class="n">partial_y_train</span><span class="p">,</span>
-          <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
-          <span class="n">batch_size</span><span class="o">=</span><span class="mi">128</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-          <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_val</span><span class="p">,</span> <span class="n">y_val</span><span class="p">))</span>
-<span class="n">result</span> <span class="o">=</span> <span class="n">model</span><span class="o">.</span><span class="n">evaluate</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">one_hot_test_labels</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Loss: </span><span class="si">{:.4f}</span><span class="s2">, Accuracy: </span><span class="si">{:.4f}</span><span class="s2">&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="o">*</span><span class="n">result</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>2246/2246 [==============================] - 0s 88us/sample - loss: 2.0950 - accuracy: 0.6901
-Loss: 2.0950, Accuracy: 0.6901
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-<section id="exercise-3-regularization">
-<h2>Exercise 3: Regularization<a class="headerlink" href="#exercise-3-regularization" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Go back to the IMDB dataset</p></li>
-<li><p>Retrain with only 4 units per layer</p></li>
-<li><p>Plot the results. What do you observe?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">keras.datasets</span> <span class="kn">import</span> <span class="n">imdb</span>
-<span class="kn">import</span> <span class="nn">numpy</span> <span class="k">as</span> <span class="nn">np</span>
-
-<span class="p">(</span><span class="n">train_data</span><span class="p">,</span> <span class="n">train_labels</span><span class="p">),</span> <span class="p">(</span><span class="n">test_data</span><span class="p">,</span> <span class="n">test_labels</span><span class="p">)</span> <span class="o">=</span> <span class="n">imdb</span><span class="o">.</span><span class="n">load_data</span><span class="p">(</span><span class="n">num_words</span><span class="o">=</span><span class="mi">10000</span><span class="p">)</span>
-
-<span class="k">def</span> <span class="nf">vectorize_sequences</span><span class="p">(</span><span class="n">sequences</span><span class="p">,</span> <span class="n">dimension</span><span class="o">=</span><span class="mi">10000</span><span class="p">):</span>
-    <span class="c1"># Create an all-zero matrix of shape (len(sequences), dimension)</span>
-    <span class="n">results</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">sequences</span><span class="p">),</span> <span class="n">dimension</span><span class="p">))</span>
-    <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">sequence</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">sequences</span><span class="p">):</span>
-        <span class="n">results</span><span class="p">[</span><span class="n">i</span><span class="p">,</span> <span class="n">sequence</span><span class="p">]</span> <span class="o">=</span> <span class="mf">1.</span>  <span class="c1"># set specific indices of results[i] to 1s</span>
-    <span class="k">return</span> <span class="n">results</span>
-
-<span class="c1"># Our vectorized training data</span>
-<span class="n">x_train</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">train_data</span><span class="p">)</span>
-<span class="c1"># Our vectorized test data</span>
-<span class="n">x_test</span> <span class="o">=</span> <span class="n">vectorize_sequences</span><span class="p">(</span><span class="n">test_data</span><span class="p">)</span>
-<span class="c1"># Our vectorized labels</span>
-<span class="n">y_train</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">train_labels</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;float32&#39;</span><span class="p">)</span>
-<span class="n">y_test</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">asarray</span><span class="p">(</span><span class="n">test_labels</span><span class="p">)</span><span class="o">.</span><span class="n">astype</span><span class="p">(</span><span class="s1">&#39;float32&#39;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">original_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">original_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">original_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">original_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">original_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                       <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                       <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;acc&#39;</span><span class="p">])</span>
-
-<span class="n">smaller_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">smaller_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">smaller_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">4</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">smaller_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">smaller_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                      <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                      <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;acc&#39;</span><span class="p">])</span>
-<span class="n">original_hist</span> <span class="o">=</span> <span class="n">original_model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span>
-                                   <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
-                                   <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                                   <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-<span class="n">smaller_model_hist</span> <span class="o">=</span> <span class="n">smaller_model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span>
-                                       <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
-                                       <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                                       <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>The smaller model starts overfitting later than the original one, and it overfits more <em>slowly</em></p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">epochs</span> <span class="o">=</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="mi">21</span><span class="p">)</span>
-<span class="n">original_val_loss</span> <span class="o">=</span> <span class="n">original_hist</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-<span class="n">smaller_model_val_loss</span> <span class="o">=</span> <span class="n">smaller_model_hist</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">original_val_loss</span><span class="p">,</span> <span class="s1">&#39;b+&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Original model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">smaller_model_val_loss</span><span class="p">,</span> <span class="s1">&#39;bo&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Smaller model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Epochs&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;Validation loss&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/858ac9119a5a762e37460c21698ca91fc439ce4844d5a19d95a553ccd78d6529.png" src="../_images/858ac9119a5a762e37460c21698ca91fc439ce4844d5a19d95a553ccd78d6529.png" />
-</div>
-</div>
-<ul class="simple">
-<li><p>Use 16 hidden nodes in the layers again, but now add weight regularization. Use L2 loss with alpha=0.001. What do you observe?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">keras</span> <span class="kn">import</span> <span class="n">regularizers</span>
-
-<span class="n">l2_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">l2_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizers</span><span class="o">.</span><span class="n">l2</span><span class="p">(</span><span class="mf">0.001</span><span class="p">),</span>
-                          <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">l2_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">kernel_regularizer</span><span class="o">=</span><span class="n">regularizers</span><span class="o">.</span><span class="n">l2</span><span class="p">(</span><span class="mf">0.001</span><span class="p">),</span>
-                          <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">l2_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">l2_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                 <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                 <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;acc&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">l2_model_hist</span> <span class="o">=</span> <span class="n">l2_model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span>
-                             <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
-                             <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                             <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>L2 regularized model is much more resistant to overfitting, even though both have the same number of parameters</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">l2_model_val_loss</span> <span class="o">=</span> <span class="n">l2_model_hist</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">original_val_loss</span><span class="p">,</span> <span class="s1">&#39;b+&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Original model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">l2_model_val_loss</span><span class="p">,</span> <span class="s1">&#39;bo&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;L2-regularized model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Epochs&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;Validation loss&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/dd6a64ce8847a27a63d34bd648a3257d0e1699d8f3bfdae78d30677ed8b89245.png" src="../_images/dd6a64ce8847a27a63d34bd648a3257d0e1699d8f3bfdae78d30677ed8b89245.png" />
-</div>
-</div>
-<ul class="simple">
-<li><p>Add a drop out layer after every dense layer. Use a dropout rate of 0.5. What do you observe?</p></li>
-</ul>
-<div class="highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">dpt_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                  <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                  <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;acc&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">dpt_model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">,</span> <span class="n">input_shape</span><span class="o">=</span><span class="p">(</span><span class="mi">10000</span><span class="p">,)))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">16</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;relu&#39;</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dropout</span><span class="p">(</span><span class="mf">0.5</span><span class="p">))</span>
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">layers</span><span class="o">.</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-
-<span class="n">dpt_model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span>
-                  <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span>
-                  <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;acc&#39;</span><span class="p">])</span>
-</pre></div>
-</div>
-</div>
-</div>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">dpt_model_hist</span> <span class="o">=</span> <span class="n">dpt_model</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">x_train</span><span class="p">,</span> <span class="n">y_train</span><span class="p">,</span>
-                               <span class="n">epochs</span><span class="o">=</span><span class="mi">20</span><span class="p">,</span>
-                               <span class="n">batch_size</span><span class="o">=</span><span class="mi">512</span><span class="p">,</span> <span class="n">verbose</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
-                               <span class="n">validation_data</span><span class="o">=</span><span class="p">(</span><span class="n">x_test</span><span class="p">,</span> <span class="n">y_test</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-</div>
-<p>Dropout finds a better model, and overfits more slowly as well</p>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">dpt_model_val_loss</span> <span class="o">=</span> <span class="n">dpt_model_hist</span><span class="o">.</span><span class="n">history</span><span class="p">[</span><span class="s1">&#39;val_loss&#39;</span><span class="p">]</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">original_val_loss</span><span class="p">,</span> <span class="s1">&#39;b+&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Original model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">plot</span><span class="p">(</span><span class="n">epochs</span><span class="p">,</span> <span class="n">dpt_model_val_loss</span><span class="p">,</span> <span class="s1">&#39;bo&#39;</span><span class="p">,</span> <span class="n">label</span><span class="o">=</span><span class="s1">&#39;Dropout-regularized model&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">xlabel</span><span class="p">(</span><span class="s1">&#39;Epochs&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">ylabel</span><span class="p">(</span><span class="s1">&#39;Validation loss&#39;</span><span class="p">)</span>
-<span class="n">plt</span><span class="o">.</span><span class="n">legend</span><span class="p">()</span>
-
-<span class="n">plt</span><span class="o">.</span><span class="n">show</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<img alt="../_images/ce76eabf926094000e9b95de03eab8745f00402b07968867e9ef7fdf18711aa6.png" src="../_images/ce76eabf926094000e9b95de03eab8745f00402b07968867e9ef7fdf18711aa6.png" />
-</div>
-</div>
-</section>
-<section id="exercise-4-word-embeddings">
-<h2>Exercise 4: Word embeddings<a class="headerlink" href="#exercise-4-word-embeddings" title="Permalink to this heading">#</a></h2>
-<ul class="simple">
-<li><p>Instead of one-hot-encoding, use a word embedding of length 300</p></li>
-<li><p>Only add an output layer after the embedding.</p></li>
-<li><p>Evaluate as before. Does it perform better?</p></li>
-</ul>
-<div class="cell docutils container">
-<div class="cell_input docutils container">
-<div class="highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">tensorflow.keras.layers</span> <span class="kn">import</span> <span class="n">Embedding</span><span class="p">,</span> <span class="n">Flatten</span><span class="p">,</span> <span class="n">Dense</span>
-
-<span class="n">max_length</span> <span class="o">=</span> <span class="mi">20</span> <span class="c1"># pad documents to a maximum number of words</span>
-<span class="n">vocab_size</span> <span class="o">=</span> <span class="mi">10000</span> <span class="c1"># vocabulary size</span>
-<span class="n">embedding_length</span> <span class="o">=</span> <span class="mi">300</span> <span class="c1"># vocabulary size</span>
-<span class="c1"># define the model</span>
-<span class="n">model</span> <span class="o">=</span> <span class="n">models</span><span class="o">.</span><span class="n">Sequential</span><span class="p">()</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">Embedding</span><span class="p">(</span><span class="n">vocab_size</span><span class="p">,</span> <span class="n">embedding_length</span><span class="p">,</span> <span class="n">input_length</span><span class="o">=</span><span class="n">max_length</span><span class="p">))</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">Flatten</span><span class="p">())</span>
-<span class="n">model</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">Dense</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">activation</span><span class="o">=</span><span class="s1">&#39;sigmoid&#39;</span><span class="p">))</span>
-<span class="c1"># compile the mode</span>
-<span class="n">model</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="n">optimizer</span><span class="o">=</span><span class="s1">&#39;rmsprop&#39;</span><span class="p">,</span> <span class="n">loss</span><span class="o">=</span><span class="s1">&#39;binary_crossentropy&#39;</span><span class="p">,</span> <span class="n">metrics</span><span class="o">=</span><span class="p">[</span><span class="s1">&#39;accuracy&#39;</span><span class="p">])</span>
-<span class="c1"># summarize the model</span>
-<span class="nb">print</span><span class="p">(</span><span class="n">model</span><span class="o">.</span><span class="n">summary</span><span class="p">())</span>
-</pre></div>
-</div>
-</div>
-<div class="cell_output docutils container">
-<div class="output stream highlight-myst-ansi notranslate"><div class="highlight"><pre><span></span>Model: &quot;sequential_39&quot;
-_________________________________________________________________
-Layer (type)                 Output Shape              Param #   
-=================================================================
-embedding (Embedding)        (None, 20, 300)           3000000   
-_________________________________________________________________
-flatten (Flatten)            (None, 6000)              0         
-_________________________________________________________________
-dense_119 (Dense)            (None, 1)                 6001      
-=================================================================
-Total params: 3,006,001
-Trainable params: 3,006,001
-Non-trainable params: 0
-_________________________________________________________________
-None
-</pre></div>
-</div>
-</div>
-</div>
-</section>
-</section>
-
-    <script type="text/x-thebe-config">
-    {
-        requestKernel: true,
-        binderOptions: {
-            repo: "binder-examples/jupyter-stacks-datascience",
-            ref: "master",
-        },
-        codeMirrorConfig: {
-            theme: "abcdef",
-            mode: "python"
-        },
-        kernelOptions: {
-            name: "python3",
-            path: "./labs"
-        },
-        predefinedOutput: true
-    }
-    </script>
-    <script>kernelName = 'python3'</script>
-
-                </article>
-              
-
-              
-              
-                <footer class="bd-footer-article">
-                  <!-- Previous / next buttons -->
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-  <div class="sidebar-secondary-item">
-  <div class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> Contents
-  </div>
-  <nav class="bd-toc-nav page-toc">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-1-sentiment-analysis">Exercise 1: Sentiment Analysis</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-2-topic-classification">Exercise 2: Topic classification</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-3-regularization">Exercise 3: Regularization</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#exercise-4-word-embeddings">Exercise 4: Word embeddings</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            <div class="bd-footer-content__inner">
-<div class="bd-footer-content__inner container">
-  
-  <div class="footer-item">
-    
-<p class="component-author">
-By Joaquin Vanschoren
-</p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  <p class="copyright">
-    
-      © Copyright 2023. CC0 Licensed - Use as you like. Appropriate credit is very welcome.
-      <br/>
-    
-  </p>
-
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-  <div class="footer-item">
-    
-  </div>
-  
-</div></div>
-          </footer>
-        
-
-      </main>
-    </div>
-  </div>
-  
-  <!-- Scripts loaded after <body> so the DOM is not blocked -->
-  <script src="../_static/scripts/bootstrap.js?digest=12da95d707ffb74b382d"></script>
-<script src="../_static/scripts/pydata-sphinx-theme.js?digest=12da95d707ffb74b382d"></script>
-
-  <footer class="bd-footer">
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/objects.inv b/objects.inv
index 8e1f9d6b1361e5151e548dcb1051ca6424924940..092ddb6e38887d0e98aeb508ef548d8373d3146a 100644
GIT binary patch
delta 1054
zcmV+(1mXL;3%d)jjR6A8Ym<)wC4U2Th<NlW&`{BCdeouff~(Epvjzl8sheNvUV5zs
zNZqlLoYK7Wge<H^ZRfcciAQ_Vr8;`FfT^)g(xp3g&d!rA6NGND#HbLY5Ij@6ksV_C
zfmL62uKF@qbuB{J0py8L2eEL@c(E0TUE>c@Qp`~9PHemC%Bnhh7&?S^V1Jc(zLP!)
zUTh6w-$^B4Uf+p)<Knd|d}}LZto6Xyd!cpWxR`wx3k`&D-5J7l7(zmdMk0GAtmNYN
zoWFU!&9L64Q*YC$r;?B)?=lcl=ktcMpFFSBPS=tAOh7m8yhh;u2yfsF$6Bloco6JO
z+On+9^)7ePt_801ra}k4q<=}LhIeHPo?JmNAMQJJw^r5|dHQW)aU<BXE#<oS7`qn+
z1R1Bwi7niWOOkT_T3$?5@%*OB_P#nxY@wO;BQ&+%Knkk_QH3;o8EVYWs#UwlyuC8T
zI`g^;+0z;jEc%K;XxCE<tjwZW4g&bHzaE5^1LeSqEzc@mD7Ok~f`312?SiXDZBWsS
zQ=XMvP0l$(QI(N&KHh~%zeCmKCIv99n}@`*>q%QF38*$<ejk|Z<~+Z*Pj)jo=L|)+
z{dqpL9LV!la64)8g>si)$%!HEiz(4MbD8w31+LAepG=J*<SUucC5!2#J3D&rx<sig
zWg7B!C!Ar>>Kk)=aepvSrLb4K4?`3_N?Nu_&ApVe*Sqz~+7F7)Bk?)__FOocGpC@p
zB}}S@8o{NhfOU%YXYHHHZ)dj^=#4)a8khDgMQ~hTNLeFj-9l}yshoIAGOBMv&w`NQ
zV7cVzV5-?rKqLQ1GF&7L&Nk(h-m(}jNfJKk;h1tUEWWCDt$#-9k;O*(uj3~7sAw&g
zMWZh6d?^fy@j#Wf3mFyb67;iU3^dOS=E=O@;R6|!vf5KpUOdghi>Yn{^RQ@!j(bdW
z8HFzjr+Q{rj!!{3?xhd>n4%{MD<^+a^7d&*R7&x%0Z)4Q15akY20ZeV%MR^XTu_Xu
zQEK3S@#J&Z9e)LeOBX>mM=WqAiTY_E;|E5Y8^we4rZX^=)g4eTLk%_3HGNjo3vc5c
zS)gl*%kd8k+ni+tGTpxYKIsu^z99y_1M2*K*+cC0)pbrMi>In6xRB@vWPHeQHkq`$
zu+-NKn};kAMh5EhmGz@vz`L?S*A>n8%GPvp?cypCIDf;sCA3lwrziU^1ul4w<AAUI
zuK2rv;?gn2b-b&rsZsd@SEVM{nU08*zX1^LRq2QR^kUn%_0_clI;lO)q`ofm+|>A1
z7q($%eTskc@g(Ytqp>x+`8(8*y7%`IJyf}*;};45DnAe}Bt5nC<{qJzJHo(&5M^sq
Y53Me!BoBWXOS4ggKCGkv0q}?`m(>~%^Z)<=

delta 1054
zcmV+(1mXL;3%d)jjR68IYLkxvC4as893mdQ3N%!-n;vzjxZrAY_^bheQtIYcx|d#S
z0aACYB&Rg*JRu9KQQHMEOg!3?F4fVa1x$@~k}ln`b9SC|nILqFB}RoHh2WXmjqDK9
z53KsKbJdr@s%sI#4j@m2I*5gH#*3{$>>7WNl46E(cVgRBS60>8!_XnT1AnW;^PTib
z@M3Ea`%WqW^ZHKY8yBx#;agiNW330q-V3c0$HnZsSZE-G>&_6a!w?cuG!oe}VI>#8
z=lsp<ZHDzWoqC&2J(Ywcd6$8ZI-fV3{p5M2cDjz_X9Bu$=QRTNM|cBgIM!lyz=L3K
z(w1d)u6MbUb}ew7Hx)YYC4WsiHM}cZ@Z<`D`EcK%yS1{$$kT5ViyOh7Z7J8q$Jo6v
zAjmjXPHf?3T#}UY*YaYjisv^~w)fRpVhhczAEBxB22xlhh$^Jv%TQx}R;}7a=Ixa!
z)|uB;$ez}KV9{3$Lc5+?U}YA~auC3m{q-QU94H4?Y<X7kLb+8?6My_!YZqKKYJ-Yq
zobs&XYI4pQimHsH^YJcB`W>n+Hz|N=-8>|gT~FFdNkFv;^ZUSLH|P1ieX^U$IcF%k
z?a%X}<v^adg4;=xFO<9dN=^)MUrdSCnaiYKEpTl%{bXtkAz#UiE?G<`-PzG|*Ck42
zDbtX*JK+q2R^OQ0i+_WGDuun;eHfzfQPQ$aYVM_!z22=?)_zcY9*Nfhu;;?joH+%(
zEn!kM)Cew31*}uFKWpDqemlFZKyUoX(73c`DT3nyL&_RK>lSKrP36Q}l2LsVdKQEX
z2g@Z#2UE?40vh>8lHnq0aJDJ0^p?eNNs{nM566^?VewVHYkxITk1RIQe;qfuM@4I~
zEE;uj=SyKwj0dW;UC5|dm!O{=W1x9vFi+<F4j;&<l+~V+^5SV0UQBfxn1@9(blhX2
z%P4$NIMp+|a(oKPaW8$~#}qwDSULHVlDAJgqEd>74S3SaA9ynJHQ<q_Ty|*B;(}sK
zjZy>uizlDM?tdsST)GIlIbwk`Nz_jR89y-E+$bKTH=Tj0tnPq%8EUAJuIaOyUU(bt
z$O2tcT#kQW*yb!Fkm>gA_eqaX^9?cZ9Z=`@%N}B{udZ`CSv*xm!G%OWAmc-Zv&p30
zg{8h`*gRx`Ffve|udE;a0^XGsx~^!xSGJ~;YZq6Ez<(LmEuociI6c{SDR9Aa90z>u
zcg5cY6qk-EuH#*0O^wPQxGFWl&U8ei{0)F`uS!4krx)ACt*@>f&`IrSCiQih=cdND
zy08s9>r?!jk0()I9F48n&EKJh)V;r#=%LCb9luZjQ2Bv)A?c~5H}?p&+z|#IgeY5^
YdT4b)B@g+_SelI@^kE(S4+8cpm~~tV{r~^~

diff --git a/search.html b/search.html
index 7bd0f00f7..24a90977c 100644
--- a/search.html
+++ b/search.html
@@ -202,6 +202,7 @@
 
 
 
+<li class="toctree-l1"><a class="reference internal" href="labs/Lab%202%20-%20Tutorial.html">Lab 2 Tutorial: Model Selection in scikit-learn</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
 <li class="toctree-l1"><a class="reference internal" href="labs/Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>
diff --git a/searchindex.js b/searchindex.js
index 3b6fc3678..8097de48e 100644
--- a/searchindex.js
+++ b/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["README", "intro", "labs/Lab 0 - Prerequisites", "labs/Lab 1 - Tutorial", "labs/Lab 1a - Linear Models for Regression", "labs/Lab 1b - Linear Models for Classification", "labs/Lab 2 - Tutorial", "labs/Lab 2a - Kernelization", "labs/Lab 2b - Model Selection", "labs/Lab 3 - Ensembles", "labs/Lab 4 - Pipelines", "labs/Lab 4 - Tutorial", "labs/Lab 5 - Bayesian learning", "labs/Lab 6 - Neural Networks", "labs/Lab 6 - Tutorial", "labs/Lab 7 - Tutorial", "labs/Lab 7a - Convolutional Neural Networks", "labs/Lab 7b - Neural Networks for text", "labs/Lab 8 - AutoML", "notebooks/01 - Introduction", "notebooks/02 - Linear Models", "notebooks/03 - Kernelization", "notebooks/04 - Model Selection", "notebooks/05 - Ensemble Learning", "notebooks/06 - Data Preprocessing", "notebooks/07 - Bayesian Learning", "notebooks/08 - Neural Networks", "notebooks/09 - Convolutional Neural Networks", "notebooks/10 - Neural Networks for text", "notebooks/Tutorial 1 - Python", "notebooks/Tutorial 2 - Python for Data Analysis", "notebooks/Tutorial 3 - Machine Learning in Python", "notebooks/Tutorial 4 - Decision Trees", "notebooks/Tutorial 5 - Nearest Neighbors", "production", "studies/S1 Regression with linear models", "studies/S10 Streetview with linear models", "studies/S11 Bayesian Robots", "studies/S2 Nepalese Character Recognition", "studies/S3 Bias-Variance and Ensembles", "studies/S4 Tuning Support Vector Machines", "studies/S5 Building Kernels", "studies/S6 Bayesian Updates", "studies/S8 Linear models for predicting pollution", "studies/S9 Multi-fidelity optimization"], "filenames": ["README.md", "intro.md", "labs/Lab 0 - Prerequisites.ipynb", "labs/Lab 1 - Tutorial.ipynb", "labs/Lab 1a - Linear Models for Regression.ipynb", "labs/Lab 1b - Linear Models for Classification.ipynb", "labs/Lab 2 - Tutorial.ipynb", "labs/Lab 2a - Kernelization.ipynb", "labs/Lab 2b - Model Selection.ipynb", "labs/Lab 3 - Ensembles.ipynb", "labs/Lab 4 - Pipelines.ipynb", "labs/Lab 4 - Tutorial.ipynb", "labs/Lab 5 - Bayesian learning.ipynb", "labs/Lab 6 - Neural Networks.ipynb", "labs/Lab 6 - Tutorial.ipynb", "labs/Lab 7 - Tutorial.ipynb", "labs/Lab 7a - Convolutional Neural Networks.ipynb", "labs/Lab 7b - Neural Networks for text.ipynb", "labs/Lab 8 - AutoML.ipynb", "notebooks/01 - Introduction.ipynb", "notebooks/02 - Linear Models.ipynb", "notebooks/03 - Kernelization.ipynb", "notebooks/04 - Model Selection.ipynb", "notebooks/05 - Ensemble Learning.ipynb", "notebooks/06 - Data Preprocessing.ipynb", "notebooks/07 - Bayesian Learning.ipynb", "notebooks/08 - Neural Networks.ipynb", "notebooks/09 - Convolutional Neural Networks.ipynb", "notebooks/10 - Neural Networks for text.ipynb", "notebooks/Tutorial 1 - Python.ipynb", "notebooks/Tutorial 2 - Python for Data Analysis.ipynb", "notebooks/Tutorial 3 - Machine Learning in Python.ipynb", "notebooks/Tutorial 4 - Decision Trees.ipynb", "notebooks/Tutorial 5 - Nearest Neighbors.ipynb", "production.md", "studies/S1 Regression with linear models.ipynb", "studies/S10 Streetview with linear models.ipynb", "studies/S11 Bayesian Robots.ipynb", "studies/S2 Nepalese Character Recognition.ipynb", "studies/S3 Bias-Variance and Ensembles.ipynb", "studies/S4 Tuning Support Vector Machines.ipynb", "studies/S5 Building Kernels.ipynb", "studies/S6 Bayesian Updates.ipynb", "studies/S8 Linear models for predicting pollution.ipynb", "studies/S9 Multi-fidelity optimization.ipynb"], "titles": ["An Open Machine Learning Course", "Welcome", "Prerequisites", "Lab 1: Machine Learning with Python", "Lab 1a: Linear regression", "Lab 1b: Linear classification", "Lab 3 Tutorial: Model Selection in scikit-learn", "Lab 2a: Kernelization", "Lab 2b: Model selection", "Lab 3: Ensembles", "Lab 4:  Data preprocessing", "Lab 4 Tutorial: Data engineering pipelines", "Lab 5: Bayesian models", "Lab 6: Neural networks", "Lab 6 Tutorial: Deep Learning with TensorFlow", "Lab 7 Tutorial: Deep Learning for text", "Lab 7a: Convolutional neural nets", "Lab 7b: Neural Networks for text", "Lab 8: AutoML", "Lecture 1: Introduction", "Lecture 2: Linear models", "Lecture 3: Kernelization", "Lecture 4: Model Selection", "Lecture 5. Ensemble Learning", "Lecture 6. Data preprocessing", "Lecture 7. Bayesian Learning", "Lecture 8. Neural Networks", "Lecture 9: Convolutional Neural Networks", "Lecture 10. Neural Networks for text", "Python for data analysis", "Python for scientific computing", "Machine Learning in Python", "Recap: Decision Trees", "Recap: k-Nearest Neighbor", "Production", "Regression with linear models", "Streetview with linear models", "Bayesian Robots!", "Nepalese character recognition", "Bias-Variance and Ensembles", "Tuning Support Vector Machines", "Kernels and Extrapolation", "Gaussian Processes, step by step", "Linear regression models for predicting pollution", "Multi-fidelity optimization for self-tuning robots"], "terms": {"jupyt": [0, 1, 2, 3, 30, 34], "notebook": [0, 1, 3, 9, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 32, 33, 34], "teach": [0, 23], "base": [0, 3, 7, 9, 12, 18, 19, 20, 21, 22, 25, 26, 27, 28, 30, 31, 32, 37, 38, 40, 42, 44], "scikit": [0, 4, 5, 11, 14, 15, 18, 22, 23, 26, 30, 37], "kera": [0, 13, 14, 17, 26, 28], "openml": [0, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 24, 31, 35, 36, 37, 38, 39, 40, 42, 44], "us": [0, 1, 3, 4, 5, 7, 8, 10, 12, 13, 14, 15, 16, 17, 19, 20, 21, 23, 24, 25, 26, 28, 29, 30, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "experi": [0, 5, 12, 16, 18, 19], "more": [0, 1, 2, 3, 4, 5, 7, 9, 10, 12, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 40, 42, 43, 44], "extens": [0, 2, 22, 30, 34], "mani": [0, 3, 4, 5, 6, 7, 8, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 33, 35, 36], "dataset": [0, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "onlin": [0, 1, 2, 3, 29, 31], "book": [0, 3, 31], "power": [0, 7, 19, 20, 21, 23, 29], "we": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "code": [0, 2, 3, 4, 5, 7, 8, 9, 17, 18, 19, 23, 29, 30, 31, 34, 37, 44], "exampl": [0, 3, 4, 5, 6, 8, 9, 11, 13, 16, 18, 20, 22, 28, 33, 34, 36, 38, 39, 41], "from": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 29, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44], "follow": [0, 2, 3, 8, 10, 11, 12, 13, 15, 18, 20, 24, 25, 26, 27, 29, 31, 32, 34, 37, 43, 44], "excel": [0, 28, 30], "urg": 0, "you": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 37, 39, 40, 41, 44], "read": [0, 2, 5, 9, 13, 17, 23, 25, 27, 32, 37, 38, 41, 44], "them": [0, 1, 5, 6, 8, 15, 18, 19, 22, 23, 24, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 41, 43, 44], "complet": [0, 2, 4, 5, 15, 19, 20, 22, 24, 29, 30, 32, 37, 39, 42, 43, 44], "coverag": [0, 2], "python": [0, 1, 4, 5, 15, 17, 23, 24, 27, 32], "introduct": [0, 1, 29], "andrea": [0, 23, 24], "mueller": [0, 23, 24, 25], "sarah": 0, "guido": 0, "focuss": 0, "entir": [0, 12, 14, 19, 20, 22, 26, 28, 31, 36, 37, 38], "written": [0, 29, 30], "one": [0, 2, 4, 5, 6, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 37, 38, 39, 44], "its": [0, 6, 13, 15, 17, 19, 23, 24, 25, 27, 28, 30, 31, 33, 41, 43, 44], "core": [0, 6, 14, 15, 20, 23, 26, 31], "develop": [0, 2, 3, 18, 19, 31, 39], "thi": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "offer": [0, 3, 6, 22, 23, 30, 31], "clear": [0, 4, 14, 24, 26, 28, 35, 36, 37, 40, 41, 43], "guidanc": [0, 22], "how": [0, 1, 3, 4, 5, 6, 7, 8, 14, 15, 16, 18, 19, 20, 22, 23, 24, 26, 27, 28, 29, 31, 32, 34, 37, 39, 41, 42, 44], "do": [0, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 25, 26, 27, 29, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44], "deep": [0, 1, 17, 19, 21, 22, 23, 25, 27, 28, 30, 32], "fran\u00e7oi": [0, 15], "chollet": [0, 15], "author": [0, 30], "librari": [0, 2, 3, 14, 28, 29, 31], "explan": [0, 27], "sebastian": 0, "raschka": 0, "One": [0, 3, 15, 23, 26, 27, 28, 31, 32, 33, 34, 35, 38], "classic": 0, "textbook": 0, "data": [0, 1, 2, 4, 5, 6, 8, 9, 14, 17, 20, 21, 22, 23, 26, 28, 32, 33, 35, 38, 39, 41, 42, 43], "analysi": [0, 1, 8, 19, 30], "mckinnei": [0, 30], "A": [0, 1, 2, 3, 8, 11, 12, 14, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 36, 37, 39, 40, 44], "introductori": [0, 2, 29], "broader": 0, "text": [0, 1, 4, 5, 7, 10, 12, 19, 20, 21, 22, 23, 24, 25, 26, 32, 33, 34, 36, 37, 40, 43, 44], "scienc": [0, 2, 19, 29], "For": [0, 2, 3, 4, 5, 7, 8, 9, 10, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 37, 39, 40, 41, 43, 44], "deeper": [0, 14, 16, 26, 27, 39], "understand": [0, 1, 4, 5, 7, 9, 10, 16, 19, 33, 35, 39, 41, 42], "techniqu": [0, 1, 3, 11, 14, 19, 20, 25, 26, 31, 36, 39, 44], "can": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "recommend": [0, 2, 6, 7, 19, 20, 22, 29, 32], "mathemat": [0, 1, 19, 30], "marc": 0, "deisenroth": [0, 1], "aldo": 0, "faisal": 0, "cheng": 0, "soon": [0, 44], "ong": 0, "provid": [0, 2, 4, 5, 6, 19, 22, 23, 27, 28, 29, 30, 31, 44], "basic": [0, 1, 12, 19, 23, 24, 31, 37], "linear": [0, 1, 3, 6, 9, 11, 12, 14, 16, 19, 22, 23, 24, 25, 26, 28, 30, 31, 32, 37, 38, 40, 41], "algebra": [0, 21, 25, 30], "geometri": [0, 37], "probabl": [0, 2, 6, 9, 10, 19, 23, 24, 26, 30, 32, 36, 37, 38], "continu": [0, 14, 18, 19, 20, 25, 32, 37], "optim": [0, 4, 6, 7, 9, 10, 11, 15, 17, 18, 23, 27, 28, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 43], "thei": [0, 1, 2, 4, 5, 6, 7, 8, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 36, 37, 39, 40, 41, 43], "ar": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "sever": [0, 2, 10, 14, 18, 24, 27, 28, 30, 31, 32, 35, 36, 38, 40, 41], "algorithm": [0, 1, 4, 5, 10, 11, 20, 24, 25, 27, 30, 33, 36, 37, 38, 39, 43, 44], "The": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], "pdf": [0, 1, 20, 21, 25, 30, 34, 37], "avail": [0, 2, 3, 6, 14, 19, 23, 24, 31, 32], "free": [0, 13, 16], "element": [0, 20, 21, 27, 29, 30, 34], "statist": [0, 14, 20, 25, 30, 31], "mine": 0, "infer": 0, "predict": [0, 4, 5, 7, 8, 9, 10, 11, 18, 19, 21, 23, 24, 27, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42], "2nd": [0, 23, 25, 27], "edit": [0, 2, 24], "trevor": 0, "hasti": 0, "robert": [0, 28], "tibshirani": 0, "jerom": 0, "friedman": 0, "kei": [0, 3, 6, 8, 15, 17, 24, 25, 26, 28, 29, 30, 31, 37], "refer": [0, 3, 5, 11, 22, 24, 30, 31, 36, 39], "field": [0, 28, 31], "great": [0, 17, 22, 23, 28, 30, 31, 36], "model": [0, 1, 17, 18, 21, 23, 33, 38, 39, 42, 44], "regular": [0, 7, 10, 11, 13, 19, 21, 22, 23, 24, 25, 27, 32, 33, 35, 37, 38, 41, 42, 44], "kernel": [0, 1, 6, 8, 11, 14, 15, 19, 20, 24, 26, 27, 28, 36, 37, 42, 44], "method": [0, 3, 4, 5, 7, 9, 11, 13, 18, 19, 22, 23, 24, 26, 30, 31, 35, 39, 44], "evalu": [0, 4, 5, 7, 8, 9, 10, 15, 17, 18, 20, 24, 25, 27, 32, 35, 36, 37, 38, 39, 40, 41, 43, 44], "ensembl": [0, 1, 19, 22, 35, 37, 38, 43], "neural": [0, 1, 3, 14, 15, 18, 20, 23, 24, 31, 36], "net": [0, 1, 3, 14, 15, 17, 19, 24, 28, 31, 36], "unsupervis": [0, 3, 28, 31], "ian": 0, "goodfellow": 0, "yoshua": 0, "bengio": 0, "aaron": 0, "courvil": 0, "current": [0, 13, 18, 22, 23, 27, 28, 36, 37], "chapter": [0, 2], "download": [0, 1, 2, 4, 5, 8, 9, 10, 13, 14, 15, 16, 17, 18, 26, 27, 28, 35, 36, 37, 38, 39, 42, 43, 44], "websit": [0, 31], "applic": [0, 3, 19, 22, 27, 31], "r": [0, 1, 2, 3, 4, 10, 11, 12, 14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 42, 43], "gareth": 0, "jame": 0, "daniela": 0, "witten": 0, "version": [0, 2, 3, 5, 10, 11, 14, 16, 18, 19, 20, 23, 24, 26, 27, 28, 31, 34], "abov": [0, 2, 4, 5, 7, 26, 27, 32, 35, 36, 37, 41, 44], "also": [0, 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "note": [0, 3, 6, 7, 8, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 33, 38, 39], "won": [0, 2, 7, 14, 29], "t": [0, 2, 4, 5, 6, 7, 8, 11, 12, 13, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 41, 42, 43], "main": [0, 4, 5, 23, 24, 29, 30, 33, 36, 42, 43, 44], "still": [0, 5, 9, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 36, 37, 38, 39, 40, 41, 44], "veri": [0, 3, 4, 7, 9, 10, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "gaussian": [0, 3, 7, 20, 31, 40], "process": [0, 3, 11, 18, 19, 20, 22, 24, 26, 27, 30, 31], "carl": 0, "edward": 0, "rasmussen": 0, "christoph": 0, "k": [0, 3, 4, 5, 7, 10, 11, 12, 14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 31, 32, 36, 37, 38, 40, 41, 43, 44], "i": [0, 4, 5, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 41, 43, 44], "william": 0, "bayesian": [0, 1, 14, 19, 23, 31], "see": [0, 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 26, 27, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], "david": 0, "mackai": 0, "s": [0, 3, 4, 5, 7, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "addit": [0, 4, 5, 18, 22, 23, 26, 27, 36, 37, 39, 43, 44], "insight": [0, 5, 22], "neil": [0, 25], "lawrenc": [0, 25], "all": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 43, 44], "first": [0, 2, 3, 4, 5, 6, 7, 8, 9, 12, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "principl": 0, "made": [0, 7, 15, 19, 22, 26, 28, 32, 35, 37, 40], "love": [0, 15, 28], "joaquin": [0, 3, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31], "vanschoren": [0, 3, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31], "releas": [0, 1], "under": [0, 2, 6, 7, 8, 18, 19, 24, 25, 39, 40], "cc0": 0, "licens": 0, "like": [0, 1, 2, 4, 5, 6, 9, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 37, 39, 40, 43, 44], "partli": 0, "licenc": 0, "mit": 0, "permiss": 0, "machin": [1, 2, 7, 11, 24, 25, 37, 41], "learn": [1, 4, 5, 7, 9, 11, 12, 13, 16, 17, 18, 21, 30, 37, 39, 42, 43, 44], "cours": [1, 3, 4, 5, 9, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 33, 38, 41], "creat": [1, 2, 3, 4, 5, 6, 7, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 40], "allow": [1, 2, 3, 4, 5, 6, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 34, 36, 37], "interact": [1, 4, 10, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 37, 43], "concept": [1, 19, 22, 23, 27, 32, 37], "better": [1, 3, 6, 7, 8, 9, 11, 14, 15, 17, 18, 22, 23, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "At": [1, 13, 23, 24, 26, 38, 39, 42], "same": [1, 3, 4, 6, 7, 9, 11, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 40, 41, 42, 43, 44], "time": [1, 3, 4, 5, 6, 8, 9, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 36, 38, 39, 41, 42, 43, 44], "ll": [1, 2, 3, 4, 5, 7, 8, 11, 14, 15, 19, 20, 24, 26, 27, 28, 29, 30, 31, 32, 34, 36, 38, 39, 40, 41, 42, 43], "control": [1, 7, 14, 15, 20, 23, 25, 28, 31, 36, 38, 39, 43, 44], "practic": [1, 2, 6, 22, 28, 29, 31, 36], "view": [1, 22, 36], "slide": [1, 7, 27, 37], "video": [1, 23, 26, 34], "host": 1, "youtub": 1, "content": [1, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34], "upon": [1, 29], "open": [1, 2, 27, 28, 32, 34], "launch": [1, 2, 34], "googl": [1, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 32, 33, 36], "colab": [1, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "binder": [1, 2], "run": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 34, 35, 36, 38, 40, 43, 44], "local": [1, 2, 16, 19, 20, 21, 24, 26, 27, 28, 31, 41], "1": [1, 6, 11, 14, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44], "html": [1, 3, 20, 21, 22, 23, 24, 32, 34, 37], "2": [1, 2, 3, 6, 11, 14, 15, 19, 21, 22, 23, 24, 25, 27, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "3": [1, 2, 3, 11, 14, 19, 20, 22, 23, 24, 25, 29, 30, 31, 32, 33, 35, 36, 38, 40, 41, 43, 44], "4": [1, 2, 3, 4, 6, 14, 15, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "select": [1, 2, 3, 7, 11, 23, 25, 32, 36, 38, 44], "5": [1, 3, 4, 5, 6, 7, 11, 14, 15, 17, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "6": [1, 2, 3, 4, 5, 6, 8, 11, 15, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 38, 42, 43], "preprocess": [1, 18, 19, 20, 21, 22, 23, 27, 31, 35, 36, 43], "7": [1, 2, 3, 4, 5, 6, 11, 14, 16, 17, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 36, 37, 38, 41], "8": [1, 3, 4, 5, 6, 10, 12, 14, 15, 16, 19, 20, 21, 22, 23, 24, 25, 27, 28, 29, 30, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42], "network": [1, 3, 16, 18, 20, 23, 31], "9": [1, 3, 5, 6, 7, 11, 12, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 36, 37, 38, 40, 41, 42, 43], "convolut": [1, 26, 36, 37], "10": [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "order": [1, 4, 5, 8, 11, 14, 18, 19, 20, 21, 22, 23, 24, 25, 28, 31, 37, 39, 43], "slightli": [1, 20, 23, 28, 35, 36, 39, 40, 41, 43], "differ": [1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 14, 16, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 31, 32, 33, 35, 36, 38, 39, 41, 43], "significantli": [1, 35, 36], "updat": [1, 2, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 37, 39, 40, 43], "stai": [10, 32], "tune": [4, 5, 7, 8, 9, 11, 12, 13, 17, 18, 19, 20, 23, 33, 36, 37, 42, 43], "retriev": [1, 3, 6, 9, 10, 11, 16, 24, 25, 27, 29, 30, 31], "clone": [1, 2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "github": [1, 3, 7, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34, 40], "repo": [1, 34], "To": [1, 2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 18, 19, 20, 22, 26, 27, 28, 29, 31, 32, 33, 34, 35, 36, 38, 42], "prerequisit": 1, "If": [1, 2, 4, 5, 7, 8, 10, 11, 14, 15, 16, 18, 20, 21, 22, 23, 24, 25, 26, 27, 31, 37, 43, 44], "notic": [1, 36, 37, 44], "ani": [1, 2, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 38, 39, 40, 43], "issu": [1, 2, 20, 24, 25, 36, 37, 40], "suggest": [1, 22, 36, 37], "request": [1, 11], "pleas": [1, 3, 15, 18, 28], "go": [1, 15, 17, 18, 19, 26, 27, 28, 35, 41], "tracker": 1, "directli": [1, 11, 18, 20, 21, 22, 24, 25], "click": [1, 2, 5], "icon": [1, 34], "top": [1, 5, 8, 14, 20, 21, 22, 24, 25, 26, 27, 28, 32, 37, 39, 40, 44], "page": [1, 2, 3, 10, 34, 35], "pull": [1, 2], "solv": [1, 4, 5, 7, 15, 16, 19, 24, 25, 31], "question": [1, 8, 9, 18, 25, 37], "review": [1, 15, 17, 25, 28], "relev": [1, 6, 7, 9, 23, 27], "befor": [1, 6, 7, 8, 9, 14, 17, 22, 24, 25, 26, 27, 28, 31, 34, 35, 37, 40], "start": [1, 2, 5, 14, 15, 17, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 32, 34, 35, 36, 38, 39, 41, 42, 43, 44], "solut": [1, 8, 18, 21, 25, 28, 31, 39, 41, 44], "appear": [1, 21, 24, 28, 36, 40, 43], "toward": [1, 22, 24, 36], "end": [1, 10, 11, 12, 14, 15, 17, 20, 21, 22, 24, 25, 26, 27, 28, 29, 37, 39, 42], "each": [1, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 39, 40, 41, 43, 44], "session": [1, 18], "regress": [1, 3, 5, 10, 11, 24, 26, 28, 31, 36, 38, 41], "classif": [1, 3, 8, 13, 14, 18, 24, 25, 26, 27, 31, 36, 38, 39], "1a": 1, "1b": 1, "date": [1, 12, 30, 32], "feb": 1, "12": [1, 4, 5, 6, 7, 8, 12, 15, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 37, 39, 40, 43, 44], "00": [1, 15, 17, 18, 36], "2a": 1, "2b": 1, "15": [3, 7, 14, 15, 17, 19, 20, 22, 23, 24, 26, 27, 28, 30, 31, 33, 36, 37, 38, 40, 43, 44], "mar": [1, 24], "engin": [1, 22], "22": [14, 15, 17, 18, 22, 24, 26, 28, 30, 43], "imag": [1, 5, 14, 16, 19, 20, 22, 25, 26, 28, 36, 37, 38, 40, 44], "7a": 1, "7b": 1, "29": [15, 36], "automl": [24, 31], "mai": [2, 3, 4, 5, 8, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 38, 40, 41, 44], "chang": [3, 6, 11, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 26, 27, 29, 30, 31, 35, 37, 39, 44], "apr": [], "gener": [1, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 23, 24, 26, 28, 29, 30, 31, 35, 36, 37, 38, 39, 41, 42, 43, 44], "scientif": [1, 29], "program": [1, 4, 5, 20], "well": [1, 2, 3, 4, 5, 8, 11, 13, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 31, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "novic": 1, "cover": [1, 8, 14, 19, 24, 29, 34], "knowledg": [1, 19], "gap": [1, 14, 26, 27], "while": [1, 2, 4, 5, 9, 13, 14, 16, 19, 20, 22, 26, 27, 29, 33, 36, 37, 38, 39, 40, 41, 43], "advanc": [1, 3, 20, 22, 31], "student": [1, 34, 42], "skip": [1, 10, 21, 27, 28, 38, 41], "recap": 1, "decis": [1, 6, 7, 19, 20, 21, 26, 33, 39, 40], "tree": [1, 3, 18, 19, 24, 31, 33, 38, 39], "nearest": [1, 3, 5, 7, 19, 20, 21, 22, 24, 27, 31, 36, 37, 38, 40, 43], "neighbor": [1, 3, 4, 5, 19, 20, 23, 24, 27, 31, 36, 38, 43], "These": [1, 3, 6, 20, 21, 22, 25, 26, 27, 31, 34, 39], "help": [1, 4, 11, 14, 19, 20, 22, 24, 27, 30, 35, 36, 37, 39], "further": [1, 23, 28, 36, 38], "deepen": 1, "skill": [1, 2, 29], "align": [1, 20, 23, 24, 25, 30, 32], "j": [1, 3, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 39], "johansson": [1, 3, 31], "m": [1, 5, 12, 13, 18, 22, 23, 24, 25, 26, 28, 30, 31, 37, 43], "p": [1, 4, 7, 10, 19, 20, 21, 22, 23, 24, 26, 27, 30, 32, 33, 34, 38, 40, 41, 42, 43], "et": [1, 18, 22, 25], "al": [1, 18, 22, 25], "fast": [1, 3, 20, 23, 25, 26, 28, 30, 31, 33, 37, 38, 44], "ai": [1, 20, 26], "crash": 1, "guid": [2, 29, 30], "set": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44], "up": [2, 5, 6, 11, 14, 15, 17, 18, 20, 21, 22, 23, 24, 26, 27, 28, 32, 35, 36, 37, 39, 41], "need": [2, 3, 6, 7, 8, 10, 11, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "have": [2, 4, 5, 6, 7, 8, 10, 11, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 43, 44], "done": [2, 5, 9, 14, 19, 20, 21, 22, 23, 24, 25, 28, 29, 30, 32, 36, 44], "so": [2, 3, 4, 5, 6, 7, 8, 11, 12, 14, 15, 16, 18, 20, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 38, 39, 40, 43, 44], "alreadi": [2, 3, 4, 5, 7, 9, 10, 14, 15, 18, 23, 24, 27, 28, 31, 35, 37, 39], "easiest": 2, "wai": [2, 3, 7, 11, 14, 16, 19, 22, 24, 25, 26, 28, 30, 31, 32, 36, 37, 40, 42], "miniconda": 2, "which": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 22, 23, 24, 25, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43], "commonli": [2, 22, 25], "sure": [2, 10, 13, 18, 22, 24, 27, 28, 37, 42], "right": [2, 5, 11, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 41, 42, 43, 44], "alwai": [2, 3, 6, 10, 14, 15, 19, 20, 21, 22, 24, 26, 28, 31, 36, 39, 40, 41], "64": [2, 9, 14, 15, 16, 17, 23, 24, 26, 27, 28, 29, 30, 38, 39], "bit": [2, 9, 16, 19, 36, 37, 39, 40, 41], "your": [2, 5, 7, 8, 9, 11, 13, 14, 15, 16, 18, 19, 20, 22, 23, 24, 25, 26, 27, 29, 31, 36, 37, 38, 41, 43, 44], "support": [2, 3, 6, 7, 11, 14, 15, 16, 18, 21, 22, 23, 26, 27, 31, 32, 34, 37, 39, 41, 42], "later": [2, 4, 5, 14, 15, 16, 19, 20, 22, 23, 26, 27, 28, 30, 31, 35, 36, 44], "new": [1, 2, 3, 4, 9, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 36, 37, 44], "handbook": 2, "take": [2, 4, 5, 9, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 31, 32, 36, 37, 38, 40, 41, 43, 44], "definit": [2, 21, 29, 41], "whirlwind": [2, 29], "tour": [2, 29], "step": [2, 4, 14, 15, 18, 20, 23, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 43, 44], "approach": [2, 18, 20, 22, 24, 25, 27, 28, 29, 32, 37, 43], "try": [2, 3, 4, 5, 7, 9, 12, 13, 16, 17, 22, 24, 26, 28, 29, 30, 36, 37, 38, 41, 42, 43], "datacamp": [2, 3, 29, 31], "intro": [2, 3, 29, 34], "some": [2, 4, 5, 7, 10, 11, 12, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 34, 35, 36, 37, 38, 39, 40, 41, 44], "hackerrank": [2, 29], "challeng": [2, 8, 29, 41], "window": [2, 22, 27, 28, 31, 32], "user": [2, 3, 18, 19, 22, 31], "anaconda": [2, 32], "prompt": 2, "command": [2, 27, 29], "lab": [2, 23, 31, 32], "mac": 2, "termin": 2, "make": [2, 4, 5, 6, 7, 8, 10, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 26, 27, 28, 30, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "line": [2, 4, 5, 7, 10, 12, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 33, 35, 39, 40], "tool": [2, 14, 19, 20, 22, 23, 30, 32, 33, 35, 38, 41], "xcode": 2, "full": [2, 5, 7, 11, 19, 22, 27, 28, 32, 39, 40], "correct": [2, 3, 7, 9, 10, 12, 19, 20, 22, 23, 24, 25, 26, 27, 31, 32, 36, 38, 44], "graphviz": [2, 23, 32], "accord": [2, 6, 9, 19, 20, 21, 22, 23, 25, 26, 27, 28, 32, 37, 38], "those": [2, 9, 17, 18, 27, 28, 29, 40], "who": [2, 29], "laptop": 2, "effect": [2, 4, 10, 14, 16, 24, 32, 33, 35, 36, 37, 39, 40, 43], "gpu": [2, 14, 15, 16, 20, 23, 26, 27], "howev": [2, 8, 10, 14, 18, 21, 22, 30, 35, 36, 37, 41, 44], "latest": [2, 19, 23], "maco": [2, 18], "doesn": [2, 4, 6, 19, 20, 22, 23, 26, 27, 28, 39, 41, 43], "work": [2, 3, 4, 6, 10, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 40, 41], "reliabl": [2, 23], "downgrad": 2, "older": 2, "procedur": [2, 18, 21, 23, 24, 29, 31, 44], "ha": [1, 2, 4, 5, 6, 7, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 40, 43, 44], "been": [1, 2, 14, 15, 18, 20, 26, 27, 37, 44], "known": [2, 7, 20, 24, 25, 28, 44], "miniconda3": [2, 3], "chip": 2, "cd": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "directori": [2, 27, 34], "c": [2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 40, 41, 42, 43, 44], "dep": 2, "forg": [2, 23, 34], "cvxpy": 2, "pip": [2, 3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34, 36], "metal": [2, 14, 15, 20, 26, 27], "0": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "resolv": [2, 24], "poor": 2, "e": [2, 4, 5, 7, 8, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "g": [2, 4, 5, 8, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 42], "fancyimput": 2, "custom": [2, 7, 15, 19, 27, 28, 30], "possibl": [2, 6, 7, 14, 18, 19, 20, 21, 22, 23, 24, 25, 27, 29, 31, 33, 35, 37, 44], "highli": [2, 3, 24, 31, 37], "avoid": [2, 14, 19, 20, 22, 23, 24, 26, 27, 29, 36], "interfer": 2, "other": [2, 3, 4, 5, 6, 8, 10, 11, 14, 17, 19, 24, 25, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 41, 43, 44], "project": [2, 14, 17, 19, 20, 21, 22, 25, 28, 31, 37], "class": [2, 3, 5, 7, 9, 13, 14, 16, 18, 19, 20, 21, 23, 24, 25, 26, 28, 31, 32, 33, 36, 38, 39, 40], "strictli": [2, 20], "fresh": 2, "sinc": [1, 2, 4, 5, 10, 13, 14, 15, 20, 21, 22, 25, 27, 28, 34, 35, 36, 37, 38, 39, 43, 44], "automat": [2, 6, 11, 12, 19, 20, 31], "call": [2, 3, 4, 5, 7, 8, 11, 14, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29, 30, 31, 36, 39, 44], "mlcours": 2, "whatev": [2, 30], "n": [2, 3, 5, 6, 11, 12, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 42, 43, 44], "activ": [2, 13, 15, 16, 17, 18, 20, 25, 28], "deactic": 2, "deactiv": 2, "venv": 2, "prefer": [2, 14, 18, 20, 22, 24, 26, 35], "sourc": [2, 8, 30, 32], "bin": [2, 3, 22, 23, 28, 30, 43], "script": [2, 34, 38], "type": [2, 3, 5, 9, 14, 15, 16, 18, 20, 22, 24, 26, 27, 28, 30, 31, 32, 36, 37, 41], "haven": 2, "instruct": [2, 34], "ubuntu": [2, 32], "even": [2, 4, 16, 18, 21, 23, 24, 26, 27, 28, 31, 36, 37, 38, 40, 41, 43], "setup": [2, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 32, 33, 37], "easili": [2, 6, 20, 23, 24, 25, 28, 30, 31, 32, 33, 36, 41, 42], "git": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "repositori": 2, "gui": [2, 30], "http": [2, 7, 8, 10, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 39, 40, 41, 42], "com": [2, 7, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 40], "ml": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "master": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34], "detail": [2, 3, 5, 7, 14, 26, 40], "minut": [2, 18, 36, 38], "tutori": [2, 3, 13, 16, 17, 26, 30, 31], "ag": [2, 11, 24, 29, 30, 31], "submit": 2, "assign": [2, 9, 11, 20, 24, 29, 30, 31, 44], "zip": [2, 3, 4, 5, 7, 10, 12, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 36, 40, 43], "file": [2, 3, 18, 28, 30, 31, 32, 34], "Or": [2, 6, 11, 15, 20, 22, 23, 24, 28, 31], "individu": [2, 11, 18, 20, 23, 24, 27, 28, 39], "save": [2, 4, 5, 23, 24, 27, 37, 38, 43], "link": [2, 5, 24], "As": [2, 9, 15, 21, 23, 26, 27, 32, 34, 37, 42], "next": [2, 9, 10, 14, 16, 18, 19, 20, 22, 24, 25, 26, 27, 28, 31, 35, 37, 38, 39, 40, 42, 43, 44], "index": [2, 10, 15, 20, 22, 23, 27, 28, 29, 32, 34, 35, 36, 37, 39], "folder": [2, 14, 15], "where": [2, 7, 8, 11, 16, 20, 21, 22, 25, 26, 27, 28, 32, 37], "adjust": [2, 37, 41, 43], "path": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 37], "txt": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "upgrad": 2, "u": [2, 3, 14, 17, 20, 21, 24, 25, 42], "option": [2, 3, 5, 10, 22, 23, 24, 25, 28, 29, 30, 31, 32, 35, 37], "should": [2, 3, 4, 5, 6, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 38, 39, 40, 41, 43, 44], "our": [2, 3, 5, 7, 8, 11, 14, 15, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 31, 35, 36, 37, 38, 41, 44], "interleav": 2, "document": [2, 3, 5, 7, 9, 15, 18, 23, 24, 28, 31, 34, 37], "markdown": [2, 18], "execut": [2, 31, 32], "browser": 2, "That": [2, 25], "mean": [2, 3, 4, 5, 6, 7, 10, 11, 12, 14, 15, 18, 19, 20, 22, 23, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 43, 44], "re": [2, 9, 14, 22, 23, 24, 25, 27, 40, 44], "quick": [2, 7, 8, 10, 12, 29, 30, 39], "depth": [2, 9, 19, 23, 26, 32, 39], "check": [2, 4, 5, 7, 8, 12, 18, 19, 23, 26, 30, 35, 36, 37], "cell": [2, 3, 18, 26, 28, 34], "shut": 2, "down": [2, 11, 20, 25, 26, 27, 36, 39, 43], "ctrl": 2, "without": [2, 8, 10, 11, 14, 15, 16, 20, 21, 22, 24, 25, 26, 28, 30, 35, 37, 40, 41, 43, 44], "It": [2, 3, 4, 5, 7, 9, 11, 13, 14, 16, 18, 19, 20, 21, 23, 24, 27, 30, 31, 35, 36, 37, 38, 39, 40, 41, 43, 44], "limit": [2, 20, 22, 28, 29, 31, 32, 36], "resourc": [2, 20, 22, 26, 37], "case": [2, 7, 14, 20, 22, 24, 25, 26, 29, 36, 37, 39, 42], "encount": [2, 24], "don": [2, 5, 6, 8, 11, 13, 14, 15, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 34, 36, 40, 41, 43], "overview": [2, 14, 21, 35], "button": 2, "upload": [2, 16], "yourself": [2, 7, 22], "pieter": 3, "gijsber": 3, "bilg": 3, "celik": 3, "prabhant": 3, "singh": 3, "inlin": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "np": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "pd": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 24, 27, 30, 31, 32, 35, 36, 37, 38, 39, 40, 42, 43], "exercis": 3, "heavi": [3, 31], "now": [3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 24, 25, 26, 27, 28, 30, 31, 35, 36, 37, 39, 41, 42, 43], "readabl": [3, 31], "less": [3, 6, 7, 14, 19, 20, 22, 23, 24, 26, 27, 28, 31, 35, 36, 39], "complex": [3, 4, 5, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 33, 37, 43], "prototyp": [3, 19, 22, 31], "easi": [3, 6, 15, 19, 22, 23, 24, 27, 28, 31, 32, 33, 44], "offload": [3, 31], "number": [3, 4, 5, 6, 7, 9, 10, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 43], "crunch": [3, 31], "underli": [3, 31], "fortran": [3, 30, 31], "instal": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 33, 34, 36], "rich": [3, 31], "effici": [3, 19, 22, 24, 25, 26, 27, 28, 30, 31, 37], "structur": [3, 14, 19, 25, 30, 31, 38], "numer": [3, 8, 10, 11, 15, 19, 20, 22, 23, 24, 26, 28, 30, 31, 37, 39], "recip": [3, 31], "high": [3, 7, 8, 9, 11, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 37, 38, 39, 41, 42], "qualiti": [3, 5, 30, 31], "graph": [3, 21, 25, 28, 31, 37], "tensorflow": [3, 13, 15, 16, 17, 18, 20, 26, 27, 28, 31], "good": [3, 11, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 36, 37, 38, 39, 41], "jake": [3, 31], "vanderpla": [3, 31], "most": [3, 7, 9, 10, 14, 15, 17, 19, 20, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 43], "promin": [3, 31], "contain": [3, 4, 5, 6, 9, 11, 14, 15, 18, 19, 22, 24, 25, 28, 30, 31, 36, 37, 38, 43, 44], "state": [3, 19, 21, 23, 25, 28, 30, 31], "art": [3, 31], "implement": [3, 4, 5, 6, 9, 10, 13, 14, 15, 16, 22, 23, 24, 25, 26, 28, 31, 41, 44], "wide": [3, 21, 23, 27, 30, 31, 40], "rang": [3, 4, 5, 9, 10, 11, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "measur": [3, 4, 6, 19, 21, 22, 23, 24, 25, 26, 31, 32, 37, 38, 39, 42, 43], "comprehens": [3, 29, 31], "about": [3, 4, 5, 8, 9, 14, 16, 17, 18, 19, 22, 23, 24, 25, 27, 28, 31, 36, 37, 38, 39, 41, 42, 43], "wealth": [3, 31], "snippet": [3, 31], "supervis": [3, 28, 31], "ridg": [3, 4, 10, 11, 19, 22, 24, 25, 31, 35, 40, 43, 44], "lasso": [3, 4, 10, 24, 31, 35, 43], "elast": [3, 31], "vector": [3, 7, 11, 15, 17, 19, 21, 22, 25, 26, 27, 30, 31, 37, 41], "random": [3, 5, 8, 11, 12, 13, 14, 16, 18, 19, 20, 22, 25, 26, 27, 28, 30, 32, 36, 38, 39, 41, 42, 43, 44], "forest": [3, 6, 24, 25, 31, 37, 38, 39, 43], "featur": [3, 4, 5, 7, 8, 11, 13, 15, 16, 20, 22, 25, 26, 28, 33, 35, 36, 38, 39], "cluster": [3, 24, 31], "kmean": [3, 19, 31], "matrix": [3, 4, 5, 6, 10, 16, 20, 21, 22, 25, 26, 27, 28, 30, 31, 35, 36], "decomposit": [3, 11, 19, 25, 30, 31, 36, 39], "pca": [3, 11, 19, 20, 24, 28, 31, 36], "manifold": [3, 19, 31], "embed": [3, 19, 20, 21, 24, 25, 26, 31], "densiti": [3, 20, 31], "estim": [3, 6, 8, 9, 11, 15, 17, 18, 19, 23, 24, 25, 31, 32, 35, 36, 38, 39, 42], "outlier": [3, 19, 20, 22, 24, 31, 38], "detect": [3, 8, 16, 19, 24, 27, 31, 37, 39], "cross": [3, 4, 5, 7, 8, 9, 10, 11, 14, 15, 17, 18, 19, 23, 24, 25, 26, 28, 35, 36, 37, 38, 40, 43, 44], "valid": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 35, 36, 37, 38, 40, 41, 43], "grid": [3, 4, 5, 7, 17, 20, 21, 22, 23, 24, 26, 27, 35, 36, 37, 38, 40, 41, 42, 43, 44], "search": [3, 4, 5, 7, 8, 14, 17, 18, 19, 22, 23, 24, 25, 32, 35, 36, 37, 38, 40, 41, 43, 44], "lot": [3, 4, 5, 8, 10, 14, 15, 16, 19, 21, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 39, 40, 41], "metric": [3, 5, 13, 15, 17, 18, 19, 21, 24, 27, 28, 31, 36, 37, 39, 40, 41], "multipl": [3, 5, 6, 8, 11, 12, 19, 20, 22, 27, 28, 29, 30, 31], "few": [3, 6, 7, 15, 16, 18, 19, 21, 22, 24, 25, 26, 27, 28, 29, 31, 33, 34, 36, 37, 38, 41], "toi": [3, 20, 22, 23, 26, 31], "includ": [3, 4, 5, 10, 11, 14, 15, 20, 21, 22, 24, 27, 28, 31, 35, 38, 41, 43], "sklearn": [3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "1000": [3, 9, 12, 15, 17, 21, 23, 24, 25, 27, 30, 31, 33, 36, 37, 40, 41, 42], "via": [3, 9, 14, 25, 27, 31], "fetch_openml": [3, 11, 12, 20, 22, 24, 31], "csv": [3, 22, 30, 31, 32], "load_iri": [3, 6, 11, 22, 31], "iris_data": [3, 31], "dating_data": [3, 31], "speeddat": [3, 31], "jvanscho": [3, 18, 31], "lib": [3, 18, 31], "python3": [3, 18, 31], "site": [3, 18, 31], "packag": [3, 18, 23, 24, 29, 30, 31, 32], "_openml": 3, "py": [3, 14, 15, 18, 31], "932": 3, "futurewarn": [3, 18], "default": [3, 4, 5, 6, 7, 8, 10, 12, 13, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 40, 41, 42, 43], "valu": [3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 17, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "parser": [3, 18], "liac": 3, "arff": 3, "auto": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32, 33, 43], "silenc": [3, 14], "warn": [3, 4, 5, 6, 18, 37, 43], "therefor": [3, 7, 13, 14, 37], "an": [3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "importerror": 3, "rais": 3, "dens": [3, 13, 14, 15, 16, 17, 26, 27, 28, 30], "return": [3, 4, 5, 6, 7, 9, 10, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "section": [3, 22], "api": [3, 14, 15, 18, 26], "doc": [3, 28, 30], "bunch": [3, 31], "object": [3, 6, 13, 14, 15, 19, 20, 22, 25, 27, 28, 29, 30, 31], "similar": [3, 6, 8, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 37, 38, 39], "dict": [3, 11, 14, 15, 17, 21, 22, 24, 28, 29, 30, 31, 37], "print": [3, 4, 6, 7, 11, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44], "iris_dataset": [3, 31], "format": [3, 4, 5, 6, 7, 11, 13, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 42, 43, 44], "descr": [3, 31], "193": [3, 31], "dict_kei": [3, 31], "target": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 26, 27, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "frame": [3, 11, 26, 31, 37], "target_nam": [3, 31, 38], "feature_nam": [3, 23, 28, 31, 32], "filenam": [3, 18, 31, 37], "data_modul": [3, 31], "_iris_dataset": [3, 31], "iri": [3, 6, 11, 19, 22, 24, 31], "plant": [3, 31], "characterist": [3, 31], "instanc": [3, 5, 7, 8, 10, 14, 15, 20, 23, 26, 29, 31, 32, 35, 36, 39, 40, 44], "150": [3, 6, 20, 21, 22, 24, 27, 28, 31, 40], "50": [3, 4, 5, 8, 9, 12, 13, 14, 15, 16, 17, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 33, 35, 36, 38, 39, 40, 42, 43, 44], "three": [3, 5, 6, 15, 17, 18, 30, 31, 37], "attribut": [3, 5, 7, 10, 11, 12, 16, 31, 32, 35], "pre": [3, 15, 19, 23, 24, 25, 31, 32, 34, 41], "list": [3, 4, 5, 6, 7, 10, 11, 14, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 39, 41, 42, 43, 44], "string": [3, 11, 14, 22, 30, 31], "ndarrai": [3, 22, 31, 37], "shape": [3, 6, 7, 11, 13, 14, 15, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 37, 40, 41], "row": [3, 15, 20, 21, 22, 23, 24, 25, 27, 28, 30, 31, 36, 37], "setosa": [3, 19, 31], "versicolor": [3, 19, 31], "virginica": [3, 19, 31], "sepal": [3, 31], "length": [3, 17, 18, 19, 25, 27, 28, 29, 31, 34, 41], "cm": [3, 4, 5, 6, 7, 8, 13, 14, 19, 20, 21, 22, 24, 25, 26, 31, 36, 38, 40, 43], "width": [3, 4, 5, 7, 19, 20, 21, 23, 24, 25, 26, 27, 31, 32, 35, 36, 40, 41, 43], "petal": [3, 31], "scikitlearn": [3, 31], "interfac": [3, 18, 24, 30, 31], "supervisedestim": [3, 31], "def": [3, 4, 5, 7, 10, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "__init__": [3, 22, 25, 29, 31, 37], "self": [3, 14, 18, 19, 22, 25, 26, 29, 31, 37], "hyperparam": [3, 31, 37, 44], "x": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "y": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "given": [3, 4, 5, 6, 7, 10, 13, 14, 19, 20, 22, 23, 24, 25, 27, 28, 29, 30, 31, 36, 37, 38, 41], "unseen": [3, 22, 24, 25, 28, 31], "y_pred": [3, 5, 6, 19, 20, 22, 23, 25, 31, 32, 36, 37, 39, 42], "score": [3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 17, 18, 19, 20, 21, 23, 24, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "compar": [3, 5, 10, 15, 18, 19, 21, 22, 23, 24, 27, 31, 35, 41], "true": [3, 5, 6, 7, 10, 11, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "label": [3, 4, 5, 6, 7, 12, 13, 15, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "classifi": [3, 4, 5, 6, 7, 8, 9, 11, 18, 19, 20, 21, 22, 23, 24, 25, 27, 31, 32, 36, 37, 39], "train_test_split": [3, 5, 6, 11, 13, 14, 18, 20, 22, 23, 24, 26, 31, 32, 33, 36, 37, 38, 39, 40, 43], "split": [3, 4, 5, 7, 8, 9, 11, 15, 16, 17, 18, 19, 23, 24, 28, 30, 31, 32, 33, 39, 41, 44], "randomli": [3, 14, 19, 20, 22, 23, 24, 26, 27, 31, 44], "75": [3, 12, 20, 22, 24, 27, 30, 31], "25": [3, 8, 10, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 38, 39, 40, 41, 43], "model_select": [3, 5, 6, 11, 13, 14, 15, 18, 19, 20, 22, 23, 24, 26, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "x_train": [3, 5, 6, 8, 11, 12, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 37, 38, 39, 42], "x_test": [3, 5, 6, 8, 11, 13, 14, 15, 18, 20, 22, 23, 24, 25, 26, 28, 31, 32, 33, 36, 38, 39, 42], "y_train": [3, 5, 6, 11, 12, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 37, 38, 39, 42], "y_test": [3, 5, 6, 11, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 38, 39, 42], "random_st": [3, 5, 6, 9, 11, 13, 14, 18, 19, 20, 21, 22, 23, 24, 26, 31, 32, 33, 36, 38, 39, 44], "112": [3, 14, 15, 31], "38": [3, 15, 25, 28, 30, 31, 41], "choos": [3, 4, 9, 19, 20, 23, 24, 25, 27, 30, 31], "when": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 36, 37, 39, 40, 41, 44], "deal": [3, 5, 18, 26, 27, 36, 44], "larg": [3, 4, 14, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 33, 35, 36, 37, 38, 39, 40, 42, 44], "stratifi": [3, 5, 6, 9, 13, 14, 18, 23, 24, 26, 31, 32, 36, 38], "defin": [3, 4, 6, 7, 11, 12, 13, 14, 15, 19, 20, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 36, 37, 39, 41], "ensur": [3, 9, 14, 24, 26, 27, 28, 31], "distribut": [3, 6, 10, 19, 22, 24, 27, 30, 31, 32, 35, 38, 42], "kept": [3, 23, 41], "xs_train": [3, 8, 22], "xs_test": [3, 8, 22], "ys_train": [3, 22], "ys_test": [3, 22], "train_siz": [3, 5, 6, 13, 14, 18, 22, 26, 36, 38], "test_siz": [3, 6, 11, 22, 23, 24, 32, 39], "05": [3, 4, 5, 20, 21, 22, 25, 26, 27, 32, 35, 36, 37, 38, 43], "plot": [3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "scatter_matrix": [3, 10, 35], "datafram": [3, 4, 8, 9, 10, 13, 15, 18, 21, 24, 27, 35, 36, 37, 38, 39, 40, 43], "name": [3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 43], "iris_df": 3, "column": [3, 4, 8, 9, 10, 11, 18, 19, 20, 21, 22, 23, 24, 25, 27, 30, 35, 39, 43], "scatter": [3, 7, 9, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 33, 35, 37, 40, 41, 43, 44], "color": [3, 4, 5, 7, 10, 12, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 43, 44], "sm": 3, "figsiz": [3, 4, 5, 7, 8, 10, 12, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43], "marker": [3, 5, 7, 10, 19, 21, 22, 24, 26, 30, 33, 35, 37, 38, 40, 43], "o": [3, 10, 19, 20, 21, 22, 23, 24, 25, 26, 30, 33, 35, 38], "hist_kwd": 3, "20": [1, 3, 4, 5, 6, 9, 10, 13, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 38, 39, 41, 42, 43, 44], "60": [3, 16, 18, 19, 20, 22, 23, 25, 27, 28, 30, 31, 38, 41, 43], "alpha": [3, 4, 7, 10, 11, 12, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 33, 35, 37, 38, 40, 41, 42, 43, 44], "knn": [3, 4, 5, 19, 28, 31, 36, 38, 43], "let": [3, 4, 5, 7, 8, 10, 11, 15, 19, 22, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 41, 43, 44], "kneighborsclassifi": [3, 5, 19, 23, 24, 31, 33, 36, 38], "n_neighbor": [3, 4, 5, 19, 23, 24, 31, 33, 36, 38, 43], "In": [3, 5, 7, 10, 11, 13, 14, 15, 16, 18, 19, 21, 22, 25, 26, 27, 28, 29, 30, 31, 36, 37, 39, 44], "environ": [3, 19, 26, 27, 28], "rerun": [3, 34], "show": [3, 4, 5, 6, 7, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 34, 35, 36, 37, 38, 39, 40, 43, 44], "represent": [3, 13, 20, 23, 26, 27, 32, 33], "trust": [3, 22], "On": [3, 6, 18, 19, 22, 28, 39], "unabl": 3, "render": [3, 15, 28, 34], "load": [3, 11, 27, 28, 30], "nbviewer": 3, "org": [3, 7, 8, 10, 11, 14, 15, 22, 26, 30, 31, 35, 39, 40, 42], "kneighborsclassifierkneighborsclassifi": 3, "ask": [3, 18, 25, 31, 35, 42], "x_new": [3, 21, 31, 36], "arrai": [3, 4, 6, 7, 8, 9, 10, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 40, 41, 42, 43], "feed": [3, 14, 24, 26, 27, 28, 31], "yield": [3, 8, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 33, 36, 38, 40, 41, 43], "function": [3, 4, 5, 6, 7, 9, 10, 12, 14, 15, 17, 18, 19, 21, 24, 27, 28, 31, 32, 33, 35, 36, 39, 41, 42, 44], "comput": [3, 6, 7, 16, 19, 20, 21, 23, 24, 26, 27, 28, 31, 32, 37, 39], "percentag": [3, 6, 13, 22, 31], "2f": [3, 4, 6, 7, 10, 11, 20, 21, 22, 23, 24, 26, 27, 29, 31, 32, 33, 35, 39, 40, 42, 43, 44], "97": [3, 6, 11, 20, 27, 31, 40], "instead": [3, 5, 6, 7, 14, 15, 16, 17, 18, 20, 23, 25, 26, 27, 28, 29, 31, 32, 36, 38, 41, 42, 44], "singl": [3, 11, 14, 15, 18, 19, 20, 22, 24, 26, 27, 28, 30, 31, 32, 36, 44], "cross_valid": [3, 4, 5, 6, 15, 20, 24, 36, 43], "everi": [3, 4, 5, 6, 7, 10, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 43, 44], "fold": [3, 4, 5, 6, 7, 8, 9, 10, 14, 18, 24, 31, 36, 37, 38, 40, 43], "By": [3, 22, 23, 30, 36], "doe": [3, 4, 5, 6, 10, 14, 17, 18, 20, 21, 22, 23, 24, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 44], "henc": [3, 4, 5, 8, 11, 15, 20, 21, 22, 23, 25, 26, 27, 28, 31, 32, 35, 36, 37, 39], "joblib": 3, "requir": [3, 4, 6, 7, 8, 14, 19, 20, 22, 23, 24, 25, 26, 28, 29, 30, 32, 37, 41, 43, 44], "satisfi": 3, "xval": [3, 36, 43], "return_train_scor": [3, 15, 20, 22, 36, 43], "n_job": [3, 6, 11, 14, 18, 23, 24, 36, 37, 38, 39, 40, 41, 43, 44], "fit_tim": 3, "0004108": 3, "00043321": 3, "00047421": 3, "00054502": 3, "00044918": 3, "score_tim": 3, "00080895": 3, "00081778": 3, "00089979": 3, "00099206": 3, "00093198": 3, "test_scor": [3, 4, 5, 15, 18, 20, 24, 32, 36, 38, 39, 43], "96666667": [3, 6, 31], "93333333": [3, 6, 31], "train_scor": [3, 4, 5, 20, 32, 36, 38, 39, 43], "give": [3, 7, 15, 18, 22, 23, 24, 25, 27, 28, 29, 35, 37, 38, 41], "perform": [3, 4, 7, 8, 9, 10, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 38, 39, 40, 41, 43, 44], "96": [3, 6, 12, 13, 20, 25, 26, 31], "paramet": [3, 4, 6, 7, 8, 9, 13, 14, 19, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 36, 37, 38, 40, 41, 42, 43], "usual": [3, 12, 14, 18, 19, 20, 22, 25, 26, 27, 28], "coef_": [3, 5, 7, 20, 21, 24, 28, 35, 36, 43], "linear_model": [3, 4, 5, 6, 11, 19, 20, 21, 22, 23, 24, 25, 28, 32, 35, 36, 37, 38, 43], "linearregress": [3, 4, 19, 20, 24, 32, 35, 43], "lr": [3, 6, 15, 19, 20, 22, 26, 27, 28], "15330146": 3, "02540761": 3, "26698013": 3, "57386186": 3, "match": [3, 4, 5, 10, 14, 22, 26, 27, 28, 30, 35], "primarili": 3, "d": [3, 7, 8, 10, 11, 12, 19, 21, 24, 25, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 40, 41, 42], "2669801292888399": 3, "5738618608875331": 3, "15330145645467938": 3, "025407610745503684": 3, "analys": 3, "no2": [4, 18, 43], "500": [4, 22, 23, 24, 30, 38, 39, 42, 43], "pollut": 4, "caus": [4, 14, 19, 20, 21, 23, 24, 26, 36, 39, 40, 43], "car": [4, 19, 43], "goal": [4, 22, 24, 36, 38, 43], "concentr": [4, 12, 43], "no_2": [4, 43], "traffic": [4, 43], "atmospher": [4, 8, 39, 43], "condit": [4, 26, 27, 29, 31, 43], "variabl": [4, 5, 10, 19, 20, 22, 23, 25, 26, 29, 30, 32, 35, 43], "per": [4, 5, 6, 7, 14, 15, 17, 19, 20, 22, 23, 24, 25, 26, 27, 30, 32, 37, 38, 39, 40, 43], "hour": [4, 18, 24, 31, 38, 43], "temperatur": [4, 19, 43], "wind": [4, 43], "dai": [4, 18, 21, 31, 43], "str": [4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 32, 33, 36, 38, 41, 42], "get_ipython": [4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "import": [4, 5, 6, 7, 8, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 29, 30, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "matplotlib": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "numpi": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 26, 27, 36, 37, 40, 43], "panda": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 22, 24, 31, 35, 36, 37], "pyplot": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 22, 25, 30, 31, 36, 37, 40], "plt": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "oml": [4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "hide": [4, 5, 24, 34], "converg": [4, 5, 14, 19, 20, 22, 23, 25, 26, 41], "except": [4, 5, 19, 24, 26, 29, 35, 37], "convergencewarn": [4, 5, 6, 24], "catch_warn": 4, "filterwarn": [4, 37, 43], "ignor": [4, 5, 6, 7, 11, 18, 20, 23, 24, 25, 27, 31, 35, 37, 38, 43], "categori": [4, 5, 6, 11, 18, 19, 24, 30, 31, 37, 43], "get_dataset": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "547": [4, 18, 43], "_": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 32, 33, 35, 36, 37, 38, 39, 42, 43], "get_data": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "default_target_attribut": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "attribute_nam": [4, 8, 10, 35, 39, 43, 44], "quickli": [4, 23, 27, 36, 37, 41, 43], "remov": [4, 10, 12, 14, 19, 20, 24, 27, 28, 30, 33, 34, 35, 43, 44], "focu": [4, 24, 26, 30, 37, 43], "non": [4, 6, 12, 14, 15, 19, 20, 21, 23, 24, 25, 26, 27, 28, 31, 33, 36, 40, 41, 43], "tempor": [4, 43], "aspect": [4, 8, 9, 12, 22, 24, 27, 43], "aim": [4, 19, 20, 23, 24, 43], "futur": [4, 6, 8, 19, 22, 25, 28, 31, 41, 42, 43], "level": [4, 6, 7, 18, 20, 21, 22, 23, 25, 26, 27, 28, 38, 39, 40, 43, 44], "would": [4, 8, 10, 16, 18, 19, 24, 25, 26, 28, 32, 35, 36, 37, 38], "special": [4, 19, 22, 24, 26, 43], "treatment": [4, 22, 43], "train": [4, 5, 6, 7, 8, 9, 11, 12, 16, 17, 18, 19, 20, 21, 23, 24, 25, 32, 33, 36, 37, 38, 39, 41, 42, 43, 44], "test": [4, 5, 6, 7, 8, 9, 11, 15, 16, 17, 18, 19, 20, 21, 23, 26, 27, 30, 32, 33, 36, 37, 38, 39, 42, 43], "There": [4, 6, 7, 14, 16, 18, 19, 20, 21, 22, 24, 26, 27, 30, 31, 34, 36, 40, 42, 43], "seem": [4, 5, 10, 15, 19, 27, 28, 34, 35, 36, 37, 38, 39, 40, 43, 44], "long": [4, 12, 20, 25, 26, 27, 28, 29, 36, 37, 38, 41, 43], "term": [4, 12, 20, 21, 22, 24, 28, 37, 41, 43], "trend": [4, 12, 41, 42, 43], "though": [4, 18, 26, 27, 31, 37, 38, 41, 43, 44], "period": [4, 12, 17, 30, 41, 43], "df": [4, 9, 18, 20, 24, 30, 35, 43], "join": [4, 11, 15, 17, 27, 28, 30, 32, 37, 43], "sort_valu": [4, 18, 30, 37, 43], "hour_of_dai": [4, 43], "drop": [4, 11, 17, 18, 23, 24, 26, 27, 31, 35, 37, 43], "axi": [4, 5, 7, 11, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 36, 37, 40, 42, 43, 44], "use_index": [4, 43], "fals": [4, 8, 10, 12, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 34, 35, 36, 37, 38, 43], "cmap": [4, 5, 7, 10, 11, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 35, 36, 37, 38, 40, 41, 43, 44], "get_cmap": [4, 20, 24, 25, 26, 43], "brg": [4, 22, 24, 43], "head": [4, 21, 24, 27, 28, 30], "cars_per_hour": [4, 43], "temperature_at_2m": 4, "wind_spe": [4, 43], "temperature_diff_2m_25m": [4, 43], "wind_direct": [4, 43], "42": [4, 6, 15, 20, 22, 23, 24, 26, 29, 30, 32, 36], "64300": 4, "322": [4, 27], "13": [1, 4, 14, 15, 20, 24, 25, 26, 27, 28, 30, 40, 43], "22287": 4, "75061": 4, "307": [4, 28], "14": [4, 5, 14, 15, 20, 21, 22, 24, 27, 29, 30, 37], "15274": 4, "255": [4, 13, 14, 16, 20, 26, 27, 36], "12415": 4, "209": 4, "19570": 4, "488": 4, "64108": 4, "247": 4, "98155": 4, "94": [4, 6], "31630": 4, "265": [4, 14, 26], "17": [4, 15, 17, 20, 23, 26, 27, 29], "14155": 4, "direct": [4, 17, 20, 21, 22, 25, 26, 27, 28, 31, 37, 43], "angular": [4, 43], "degre": [4, 7, 11, 19, 20, 21, 24, 25, 27, 31, 35, 37, 41, 43], "scale": [4, 5, 6, 7, 8, 9, 10, 11, 14, 19, 20, 21, 23, 25, 26, 27, 30, 32, 33, 35, 36, 37, 39, 40, 41, 43], "zoom": [4, 16, 27, 36, 43], "correl": [4, 10, 19, 20, 22, 23, 24, 35, 43], "sens": [4, 14, 16, 22, 24, 36, 38, 43], "becaus": [4, 8, 15, 18, 20, 22, 23, 24, 25, 28, 30, 35, 36, 39, 41, 43, 44], "produc": [4, 5, 7, 8, 11, 12, 18, 19, 20, 23, 26, 27, 28, 30, 39, 43, 44], "influenc": [4, 20, 21, 22, 24, 25, 27, 28, 37, 40, 41, 43], "air": [4, 43], "subtl": [4, 43], "depend": [4, 6, 14, 19, 20, 21, 22, 24, 25, 26, 31, 32, 37], "combin": [4, 7, 10, 11, 12, 19, 20, 21, 22, 23, 26, 27, 28, 30, 31, 32, 35, 37, 40, 43, 44], "relationship": [4, 19, 24, 26, 27, 28, 32, 43], "problem": [4, 7, 12, 13, 14, 15, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 36, 41, 42, 43], "elasticnet": [4, 35, 43], "observ": [4, 5, 8, 9, 10, 12, 17, 22, 25, 27, 37, 41, 42, 43], "build": [4, 6, 8, 9, 13, 16, 17, 18, 21, 22, 23, 24, 25, 27, 28, 32, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44], "pipelin": [4, 8, 15, 18, 19, 22, 25, 35, 36, 43], "stick": [4, 38, 43], "hyperparamet": [4, 5, 11, 12, 15, 17, 19, 20, 21, 23, 24, 25, 32, 36, 39, 41, 42, 43, 44], "below": [4, 5, 6, 7, 8, 12, 13, 14, 18, 22, 27, 31, 33, 37, 39, 40, 41, 42, 44], "pass": [4, 5, 10, 13, 14, 20, 22, 27, 28, 29, 30, 41], "both": [4, 5, 6, 8, 9, 10, 11, 18, 19, 20, 21, 24, 25, 26, 28, 30, 31, 33, 35, 37, 38, 39, 43, 44], "whichev": [4, 5], "modul": [4, 5, 27, 36], "abl": [4, 5, 8, 14, 16, 43], "standard": [4, 5, 6, 7, 8, 9, 10, 14, 15, 20, 25, 26, 36, 37], "built": [4, 5, 6, 11, 14, 15, 20, 24, 26, 29, 30, 31, 32], "ins": [4, 5, 20], "find": [4, 5, 7, 8, 10, 11, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 37, 38, 39, 41, 43, 44], "output": [4, 5, 6, 7, 14, 15, 17, 18, 19, 20, 21, 22, 24, 25, 27, 28, 29, 30, 31, 33, 34, 37, 44], "evaluate_learn": [4, 5], "model1": [4, 23, 37], "model2": [4, 23, 37], "modeln": 4, "two": [4, 5, 7, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 34, 35, 37, 38, 39, 40, 43, 44], "obtain": [4, 5, 11, 15, 22, 23, 25, 35, 42], "sampl": [4, 5, 6, 8, 9, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 31, 32, 36, 38, 39, 41, 42, 44], "were": [4, 5, 15, 17, 24, 27, 36, 37], "origin": [4, 5, 8, 10, 11, 12, 15, 18, 19, 20, 21, 24, 26, 27, 28, 36, 38, 39, 44], "92": [4, 5, 6, 22, 38], "924": [4, 5], "916": [4, 5, 40], "917": [4, 5], "921": [4, 5], "963": [4, 5], "962": [4, 5], "953": [4, 5], "912": [4, 5], "934": [4, 5], "801": [4, 5, 28], "811": [4, 5], "806": [4, 5], "826": [4, 5], "804": [4, 5], "766": [4, 5], "756": [4, 5], "773": [4, 5], "741": [4, 5, 28], "store": [4, 5, 13, 14, 16, 18, 19, 22, 23, 24, 27, 28, 29, 32, 33, 36, 37, 38, 39], "Then": [4, 5, 7, 8, 18, 21, 22, 31, 36, 38, 43], "dummi": [4, 5, 22], "replac": [4, 5, 10, 15, 19, 21, 22, 24, 25, 26, 27, 29, 30, 31, 35, 36, 37, 40], "actual": [4, 5, 8, 14, 19, 22, 24, 26, 28, 32, 39, 40, 43], "bar": [4, 5, 10, 24, 28, 29, 30, 36, 37, 43], "chart": [4, 5, 10, 30], "varianc": [4, 5, 6, 7, 14, 19, 24, 25, 26, 31, 32, 33, 36], "error": [4, 5, 15, 16, 18, 19, 20, 24, 27, 31, 32, 33, 36, 37, 39, 41, 43], "fig": [4, 5, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 35, 36, 37, 38, 40, 42, 43], "ax": [4, 5, 7, 10, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 32, 33, 35, 36, 37, 38, 40, 43, 44], "subplot": [4, 5, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 35, 36, 37, 38, 40, 43], "45": [4, 5, 20, 22, 24, 30, 38, 43], "barh": [4, 5, 23, 24, 32, 35, 36, 43], "arang": [4, 5, 7, 10, 14, 22, 23, 24, 25, 26, 28, 30, 31, 32, 35, 36, 37, 40, 43, 44], "len": [4, 5, 6, 7, 10, 11, 14, 15, 16, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 39, 40, 42, 43, 44], "yerr": [4, 5, 36, 43], "std": [4, 5, 19, 24, 27, 30, 36, 37, 43], "green": [4, 5, 20, 23, 24, 25, 26, 27, 28, 32, 35, 36, 37, 39, 41, 43, 44], "red": [4, 5, 7, 20, 21, 22, 23, 25, 26, 28, 30, 32, 35, 36, 37, 39, 40, 41, 43, 44], "te": [4, 5, 36, 43], "tr": [4, 5, 22, 36, 43], "3f": [4, 6, 11, 12, 18, 20, 22, 24, 35, 38, 39, 40, 43], "white": [4, 5, 7, 12, 25, 36, 43, 44], "els": [4, 5, 7, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 36, 37, 40, 43], "black": [4, 7, 15, 22, 24, 25, 27, 28, 32, 36, 37, 43], "va": [4, 5, 7, 10, 22, 26, 36, 40, 43, 44], "center": [4, 5, 6, 7, 10, 20, 21, 22, 23, 24, 26, 27, 32, 33, 36, 40, 41, 43, 44], "__class__": [4, 5, 19, 22, 23, 24, 32, 33, 35, 36, 38, 39, 43], "__name__": [4, 5, 19, 22, 23, 24, 32, 33, 35, 36, 37, 38, 39, 43], "hasattr": [4, 22, 23, 43], "ytick": [4, 5, 7, 11, 22, 23, 24, 25, 27, 32, 36, 40, 43], "yticklabel": [4, 5, 7, 10, 22, 35, 36, 38, 40, 41, 43, 44], "legend": [4, 5, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44], "bbox_to_anchor": [4, 5, 20, 21, 23, 26, 32, 36, 43], "loc": [4, 5, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 33, 35, 36, 37, 39, 41, 42, 43, 44], "interpret": [4, 7, 9, 10, 15, 18, 21, 22, 23, 24, 32, 44], "best": [4, 5, 6, 8, 11, 12, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "regressor": [4, 10, 12, 18, 19, 35, 37], "overfit": [4, 5, 7, 14, 15, 16, 21, 24, 26, 27, 28, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "what": [4, 5, 7, 10, 12, 13, 14, 15, 16, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 35, 36, 41, 44], "Is": [4, 5, 8, 16, 44], "result": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "expect": [4, 5, 15, 16, 17, 19, 20, 21, 22, 25, 31, 36, 37, 43], "optimum": [4, 5, 20, 36, 43, 44], "lie": [4, 5, 25, 43], "between": [4, 5, 6, 7, 9, 10, 12, 13, 14, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 37, 39, 43], "vari": [4, 5, 8, 10, 18, 37, 39, 43], "log": [4, 5, 7, 8, 12, 14, 18, 19, 20, 22, 23, 24, 25, 26, 28, 32, 33, 35, 36, 37, 39, 40, 41, 43], "01": [4, 5, 6, 9, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 37, 38, 41, 42, 43], "100": [4, 5, 6, 9, 11, 12, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "uniformli": [4, 5, 24], "onli": [4, 5, 6, 7, 9, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 33, 35, 36, 37, 38, 39, 42, 43, 44], "hint": [4, 5, 7, 20, 35, 37, 40], "think": [4, 5, 7, 16, 18, 25, 41], "too": [4, 5, 8, 11, 14, 19, 20, 22, 23, 26, 27, 30, 31, 35, 36, 38, 41, 44], "much": [4, 5, 7, 8, 14, 15, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 32, 35, 36, 37, 38, 39, 40, 42], "logspac": [4, 5, 20, 26, 35, 36, 37, 38, 40, 43, 44], "geomspac": [4, 5, 43], "linspac": [4, 5, 12, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 33, 35, 36, 37, 41, 43], "manual": [4, 5, 6, 7, 10, 11, 13, 17, 19, 20, 22, 24, 25, 27, 28, 31, 37, 40, 41], "loop": [4, 5, 6, 8, 22, 25, 27, 30, 31, 37, 38, 44], "over": [4, 5, 7, 11, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 40, 41, 43], "out": [4, 5, 6, 8, 10, 14, 15, 17, 18, 19, 20, 24, 25, 26, 28, 31, 32, 35, 36, 37, 38, 39, 44], "gridsearchcv": [4, 5, 6, 7, 11, 22, 24, 26, 31, 35, 36, 38, 40, 41, 43, 44], "again": [4, 5, 6, 10, 11, 14, 15, 17, 18, 20, 21, 22, 27, 28, 31, 33, 35, 37], "underfit": [4, 5, 7, 20, 21, 23, 26, 32, 35, 36, 39, 40, 41, 43], "sensit": [4, 5, 20, 24, 25, 27, 35], "mix": [4, 28, 32, 36], "l1": [4, 14, 15, 21, 24, 26, 27, 35, 36], "l2": [4, 11, 14, 15, 17, 21, 22, 24, 26, 27, 28, 35], "loss": [4, 7, 13, 15, 17, 19, 21, 22, 24, 25, 27, 28, 32, 33, 35, 39], "l1_ratio": [4, 35, 37, 43], "ratio": [4, 20, 22, 24, 26, 32, 35], "heatmap": [4, 5, 7, 10, 11, 22, 27, 35, 38, 40, 41, 43, 44], "explain": [4, 5, 7, 12, 17, 20, 22, 24, 37, 40, 41, 44], "xlabel": [4, 7, 10, 11, 12, 13, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "ylabel": [4, 7, 10, 11, 12, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "xticklabel": [4, 7, 10, 22, 35, 38, 40, 41, 43, 44], "none": [4, 5, 7, 10, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 34, 36, 37, 40, 41, 43, 44], "vmin": [4, 7, 10, 11, 22, 24, 27, 40, 43, 44], "vmax": [4, 7, 10, 22, 27, 40, 43, 44], "fmt": [4, 7, 10, 20, 22, 25, 40, 43, 44], "printvalu": [4, 43], "nxn": [4, 43], "second": [4, 17, 18, 23, 26, 27, 36, 37, 43], "colormap": [4, 22, 43], "minim": [4, 19, 20, 22, 23, 24, 25, 26, 28, 30, 32, 38, 43], "maxim": [4, 19, 20, 22, 23, 25, 26, 27, 43], "whether": [4, 5, 7, 8, 10, 14, 19, 22, 24, 26, 36, 38, 39, 41, 43], "gca": [4, 7, 10, 20, 22, 23, 24, 26, 28, 32, 36, 38, 40, 43, 44], "img": [4, 7, 10, 21, 22, 27, 28, 36, 40, 43, 44], "pcolor": [4, 7, 10, 22, 40, 43, 44], "update_scalarmapp": [4, 7, 10, 22, 40, 43, 44], "set_xlabel": [4, 5, 7, 10, 13, 14, 16, 19, 20, 21, 22, 24, 25, 26, 27, 33, 35, 36, 37, 38, 40, 43, 44], "fontsiz": [4, 7, 12, 20, 21, 22, 24, 25, 26, 27, 37, 40, 43, 44], "set_ylabel": [4, 5, 7, 10, 19, 20, 21, 22, 24, 25, 26, 27, 33, 36, 37, 38, 40, 43, 44], "set_xtick": [4, 5, 7, 10, 13, 14, 16, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 36, 40, 43, 44], "set_ytick": [4, 5, 7, 10, 13, 14, 16, 20, 21, 22, 23, 24, 25, 26, 27, 32, 35, 36, 40, 43, 44], "set_xticklabel": [4, 5, 7, 10, 20, 22, 24, 28, 36, 40, 43, 44], "set_yticklabel": [4, 5, 7, 10, 22, 24, 35, 36, 40, 43, 44], "set_aspect": [4, 7, 10, 20, 22, 25, 26, 33, 40, 43, 44], "tick_param": [4, 7, 19, 20, 21, 22, 24, 25, 26, 36, 37, 38, 40, 43, 44], "labels": [4, 7, 20, 21, 22, 25, 26, 27, 37, 40, 43, 44], "labelrot": [4, 7, 40, 43, 44], "90": [4, 6, 7, 15, 20, 22, 27, 35, 36, 38, 40, 41, 43, 44], "get_path": [4, 7, 10, 22, 40, 43], "get_facecolor": [4, 7, 10, 22, 40, 43], "get_arrai": [4, 7, 10, 22, 40, 43], "vertic": [4, 7, 10, 22, 25, 30, 39, 40, 43], "w": [4, 5, 7, 10, 14, 15, 20, 21, 22, 24, 26, 28, 31, 35, 40, 43, 44], "size": [4, 7, 13, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 40, 41, 43, 44], "final": [4, 5, 8, 9, 10, 11, 13, 15, 19, 22, 24, 25, 27, 31, 35, 37, 39, 40, 43, 44], "verifi": [4, 36, 43], "draw": [4, 5, 14, 25, 26, 36, 37], "scatterplot": 4, "previou": [4, 5, 9, 14, 15, 18, 19, 20, 23, 25, 26, 27, 28, 35, 44], "doubt": [4, 5], "001": [4, 6, 7, 11, 13, 14, 15, 17, 20, 21, 24, 25, 26, 31, 35, 40, 43], "redraw": [4, 10], "amount": [4, 5, 7, 13, 19, 22, 24, 27, 36, 37, 43], "sy": [20, 37], "os": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 37], "Not": [11, 22, 23, 24, 25, 27], "just": [5, 6, 8, 11, 14, 15, 17, 18, 19, 22, 24, 26, 27, 28, 30, 31, 35, 37, 39], "compil": [13, 14, 15, 26, 27, 28, 34], "warnopt": [], "simplefilt": [5, 6, 18], "pythonwarn": [], "somf": 43, "kneighborsregressor": [33, 43], "make_pipelin": [11, 22, 24, 31, 43], "standardscal": [8, 11, 15, 18, 22, 24, 31, 35, 43], "flatten": [14, 15, 20, 23, 24, 25, 27, 28, 30, 43], "trick": 27, "here": [8, 11, 13, 14, 15, 18, 23, 24, 26, 27, 28, 29, 30, 31, 35, 36, 37, 39, 41], "get": [5, 8, 10, 11, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 41, 42, 44], "nice": [26, 27, 37, 40, 41, 42], "surpass": 43, "yet": [5, 8, 16, 18, 20, 24, 26, 31, 32, 34, 37, 41, 43], "drastic": [19, 43], "catastroph": [27, 43], "bad": [8, 19, 22, 23, 25, 26, 28, 29, 33, 37, 38, 39, 43], "design": [16, 18, 25, 26, 27, 41], "space": [6, 11, 14, 15, 17, 19, 20, 21, 22, 23, 24, 27, 28, 30, 32, 33, 36, 37, 38, 41, 44], "param_a": 43, "num": [11, 20, 29, 30, 31, 35, 36, 37, 43, 44], "param_elast": 43, "11": [5, 15, 17, 19, 20, 21, 23, 24, 26, 27, 30, 31, 32, 37, 43], "param_k": 43, "kneighborsregressor__n_neighbor": 43, "dtype": [10, 14, 20, 22, 24, 26, 27, 28, 30, 31, 35, 37, 43], "int": [5, 14, 16, 20, 22, 24, 25, 26, 27, 29, 30, 36, 37, 38, 43], "1d": [5, 20, 38, 43], "plot_tun": [5, 38, 43], "grid_search": [5, 6, 11, 31, 38, 40, 43], "param_nam": [5, 38, 43], "being": [5, 15, 25, 28, 32, 43], "param_grid": [5, 6, 11, 24, 26, 31, 36, 38, 40, 41, 43], "cv_results_": [5, 11, 22, 24, 35, 36, 38, 40, 41, 43, 44], "mean_test_scor": [5, 11, 22, 24, 35, 36, 38, 40, 41, 43, 44], "mean_train_scor": [5, 22, 36, 38, 43], "acc": [5, 14, 23, 24, 26, 27, 28, 36, 37, 38, 43], "lower": [7, 19, 20, 22, 23, 24, 26, 27, 28, 31, 35, 36, 39, 41, 43, 44], "left": [20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 37, 41, 43, 44], "set_xscal": [5, 22, 36, 43], "set_titl": [5, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 36, 37, 43], "best_estimator_": [5, 6, 11, 24, 31, 35, 36, 38, 43], "bp": [5, 43], "bs": [5, 22, 43], "best_params_": [5, 6, 11, 14, 31, 35, 36, 38, 41, 43], "best_score_": [5, 6, 11, 14, 31, 35, 36, 38, 43], "2e": [5, 19, 22, 27, 36, 37, 43, 44], "r2": [6, 18, 24, 42, 43], "4f": [5, 6, 14, 15, 18, 22, 26, 28, 31, 36, 40, 43], "cv": [7, 8, 9, 11, 14, 15, 19, 20, 22, 23, 24, 26, 31, 36, 37, 38, 39, 40, 41], "fit": [6, 8, 9, 11, 12, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44], "nrow": [20, 24, 27, 36, 43], "ncol": [19, 20, 22, 23, 24, 26, 27, 32, 36, 43], "param": [14, 15, 22, 26, 27, 28, 35, 36, 39, 43], "behav": [21, 35, 37, 43], "similarli": [18, 20, 21, 43], "small": [5, 7, 12, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 43, 44], "around": [18, 20, 26, 27, 34, 35, 36, 39, 40, 41, 43], "gradual": [19, 22, 24, 43], "descent": [15, 19, 23, 24, 43], "than": [5, 7, 8, 17, 18, 20, 22, 23, 24, 26, 27, 28, 30, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "wors": [18, 22, 23, 24, 28, 35, 37, 39, 44], "4175": [], "after": [14, 15, 16, 17, 18, 20, 21, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 43, 44], "reshap": [5, 7, 11, 12, 13, 16, 19, 20, 21, 22, 23, 24, 25, 27, 30, 33, 35, 36, 37, 38, 40, 41, 42, 43], "rcparam": [6, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "font": [20, 21, 23, 24, 25, 27, 32, 37, 39, 40, 41, 43], "map": [6, 7, 8, 10, 13, 16, 19, 20, 22, 23, 25, 26, 28, 29, 35, 43], "lambda": [21, 23, 24, 26, 28, 29, 30, 43], "viridi": [10, 11, 24, 27, 35, 38, 40, 41, 43], "sudden": 43, "ident": [19, 25, 26, 29, 30, 35, 36, 43], "l1_ration": [35, 43], "sharp": [37, 43, 44], "scatter_coeffici": [], "coeff": [20, 43], "col": [27, 43], "b": [7, 12, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 39, 42, 43], "figur": [5, 6, 7, 12, 13, 14, 19, 20, 21, 22, 23, 24, 26, 27, 28, 31, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "xtick": [7, 11, 20, 22, 23, 24, 25, 27, 31, 32, 36, 37, 40, 43], "rotat": [5, 16, 19, 20, 22, 24, 27, 28, 43], "40": [14, 20, 22, 23, 25, 27, 28, 30, 32, 33, 36, 37, 38, 39, 41, 43], "almost": [15, 19, 27, 28, 32, 35, 36, 37, 38, 39, 40, 42, 43], "exactli": [20, 21, 26, 27, 28, 35, 37, 41, 43], "overlap": [21, 22, 43], "influenti": 43, "nearli": 43, "zero": [14, 15, 16, 20, 22, 23, 24, 25, 26, 28, 30, 33, 37, 39, 43], "increas": [16, 20, 21, 22, 23, 24, 25, 26, 27, 31, 36, 37, 38, 39, 44], "carefulli": [19, 20, 23], "fashion": [5, 14, 24, 26, 27, 28], "mnist": [5, 13, 14, 26, 27], "70": [5, 7, 15, 17, 19, 24, 38, 40], "000": [5, 9, 15, 22, 28, 38], "zalando": 5, "product": [5, 17, 20, 21, 24, 25, 26, 27, 28, 30, 37], "cloth": 5, "repres": [5, 19, 20, 22, 23, 25, 26, 27, 28, 30, 31, 32, 33, 37, 41], "28": [1, 5, 13, 14, 20, 25, 26, 27, 28, 36], "pixel": [5, 14, 19, 20, 22, 26, 27, 36, 38], "look": [5, 6, 7, 9, 12, 14, 15, 18, 19, 20, 22, 24, 25, 26, 27, 28, 30, 31, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "action": [5, 6, 18, 19, 37, 44], "fminst": [5, 14, 26], "fmnist": [5, 27], "40996": [5, 14, 26, 27], "fmnist_class": [5, 14, 26], "shirt": [5, 14, 26, 27], "trouser": [5, 14, 26], "pullov": [5, 14, 26], "dress": [5, 14, 26, 27], "coat": [5, 14, 26], "sandal": [5, 14, 26], "sneaker": [5, 14, 26], "bag": [5, 14, 21, 22, 24, 25, 26, 39], "ankl": [5, 14, 26], "boot": [5, 14, 26, 27], "32x32": [5, 16, 38], "randint": [5, 13, 14, 16, 22, 26, 30, 36, 37, 38], "70000": [5, 13, 14, 26], "imshow": [5, 13, 14, 16, 23, 24, 25, 26, 27, 32, 36, 38], "gray_r": [5, 13, 14, 22, 26, 27, 38], "logist": [5, 11, 21, 22, 23, 26, 28, 36, 38, 43], "svm": [5, 6, 8, 11, 12, 19, 22, 24, 28, 31, 36, 40, 41, 43, 44], "point": [5, 6, 7, 9, 12, 13, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32, 33, 36, 38, 39, 40, 41, 42, 43, 44], "cross_val_scor": [5, 6, 11, 19, 22, 24, 31, 35, 36, 37, 38, 39, 40, 43], "interest": [5, 8, 14, 17, 18, 22, 25, 27, 28, 31, 41], "approxim": [5, 20, 21, 23, 24, 28, 31, 35], "logisticregress": [5, 6, 11, 19, 20, 22, 23, 24, 36, 38], "linearsvc": [5, 7, 11, 20, 21, 24, 31, 36], "subsampl": [5, 9, 18, 23, 27, 36, 38, 44], "speed": [5, 9, 14, 19, 23, 24, 26, 36, 37], "experiment": [5, 24, 36], "xs": [5, 21, 22, 23, 25, 26, 36], "ys": [5, 21, 22, 23, 25, 26, 36], "With": [5, 18, 20, 22, 24, 25, 26, 27, 28, 30, 33, 35, 36, 37], "classifier1": 5, "classifier2": 5, "classifiern": 5, "867": [5, 40], "868": 5, "865": 5, "866": [5, 40], "814": 5, "821": 5, "visual": [5, 8, 11, 14, 15, 16, 18, 19, 21, 24, 28, 30, 32, 34, 36, 39, 42, 44], "accuraci": [5, 6, 7, 8, 9, 11, 13, 14, 15, 16, 17, 18, 19, 23, 24, 26, 27, 28, 31, 33, 35, 36, 37, 38, 44], "cost": [5, 7, 20, 21, 24, 37, 43], "chanc": [5, 16, 19, 22, 36, 39], "perfect": [5, 15, 16, 22, 28], "kind": [5, 6, 14, 16, 22, 27, 30, 31], "closer": [5, 18, 21, 24, 28], "misclassifi": [5, 7, 16, 22, 23, 24, 36, 39], "often": [5, 6, 9, 11, 14, 16, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 36, 39, 43], "confus": [5, 6, 16, 24, 36], "1e": [5, 7, 10, 12, 14, 19, 20, 22, 25, 26, 27, 36, 37, 40, 42], "describ": [5, 9, 15, 18, 20, 21, 28, 30, 35, 44], "identifi": [5, 14, 15, 19, 20, 26, 36], "misclassified_sampl": 5, "studi": [5, 24, 29, 31, 32, 36, 40, 42], "indic": [5, 7, 11, 15, 17, 22, 24, 25, 28, 29, 30, 31, 36, 37, 39], "23": [5, 18, 25, 30, 37], "30": [5, 9, 15, 17, 19, 20, 23, 24, 26, 27, 28, 29, 30, 31, 38, 41, 42], "34": [5, 22, 27, 29, 36, 37], "39": [5, 28, 37], "46": [5, 15, 38], "52": [5, 20, 26], "55": [5, 9, 27, 31, 36], "five": 5, "togeth": [5, 16, 19, 20, 30, 31, 36, 38], "nr": [5, 22, 23, 24, 27, 33, 37], "enumer": [5, 15, 20, 21, 22, 23, 24, 26, 28, 32, 35, 36, 37, 39, 43], "systemat": [5, 22, 24, 32], "pair": [5, 22, 23, 29], "certain": [5, 19, 21, 22, 23, 24, 25, 26, 31, 36, 37, 39], "confusion_matrix": [5, 6, 22, 36], "im": [5, 24, 25], "coeffici": [5, 7, 10, 11, 20, 21, 22, 24, 25, 28, 31, 36], "28x28": [5, 14, 26], "784": [5, 14, 20, 26, 28], "logreg": [5, 6, 22, 36, 38], "why": [5, 18, 22, 23, 35, 36], "pai": [5, 27, 28, 36], "attent": [5, 27, 36], "simpli": [5, 6, 10, 11, 21, 23, 24, 25, 27, 31, 34, 36, 38], "titl": [5, 7, 12, 14, 19, 22, 23, 24, 25, 26, 27, 28, 32, 36, 37, 38, 40, 41, 42, 43], "plot_coeffici": 5, "suptitl": [5, 23, 27, 32, 39], "colorbar": [5, 11, 19, 22, 24, 25, 44], "ravel": [5, 7, 12, 21, 22, 23, 24, 25, 27, 28, 30, 32, 40, 41, 42], "tolist": [5, 19, 22], "repeat": [5, 8, 9, 16, 23, 24, 25, 26, 27, 28, 31, 32, 37, 39, 44], "add": [5, 6, 11, 13, 14, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 34, 36, 37, 41], "clf": [7, 11, 15, 20, 21, 22, 23, 24, 26, 32, 33, 36, 37, 39, 40], "nn": [20, 36], "big": [18, 20, 21, 23, 26, 27, 28, 32, 36, 37, 38], "deviat": [14, 20, 24, 25, 26, 36, 37], "hardli": 36, "param_c": [], "properli": [15, 24, 26], "outperform": 28, "slighti": [], "reach": [13, 15, 24, 27, 28], "datset": [], "nonzero": [], "quit": [15, 18, 27, 28, 29, 35, 36, 37, 39, 40], "common": [20, 21, 28, 30], "mistak": [22, 23, 32, 36], "coars": 17, "enough": [14, 20, 22, 23, 26, 27, 28], "curiou": [], "easier": [7, 19, 22, 24, 26, 27, 30, 36, 41], "correctli": [6, 9, 19, 23, 24], "occasion": [], "hand": [14, 24, 39], "close": [14, 15, 20, 21, 22, 23, 24, 25, 26, 32, 37, 43], "half": [24, 31, 32, 44], "predominantli": [], "rememb": [15, 19, 20, 22, 23, 25, 26, 27, 28], "typic": [6, 7, 19, 20, 23, 25, 26, 31, 33, 39, 40], "binari": [9, 11, 14, 19, 20, 23, 24, 25, 26, 27, 28, 31, 32, 36], "multi": [14, 19, 20, 23, 24, 25, 26, 30, 31], "vs": [6, 8, 17, 23, 25, 27, 30, 31, 36, 38, 41], "specif": [9, 11, 14, 15, 18, 19, 22, 24, 26, 27, 28, 31, 32, 37, 39], "lead": [11, 14, 18, 20, 23, 26, 28, 32, 33, 35, 36, 39, 44], "matric": [6, 25, 27, 36], "locat": [8, 15, 17, 25, 27, 28, 36, 37], "correspond": [7, 8, 20, 21, 22, 24, 25, 28, 29, 30, 33, 35, 36, 37], "bright": 22, "low": [9, 19, 20, 21, 22, 23, 24, 26, 28, 31, 32, 33, 37, 39, 40, 41], "dark": [36, 39], "word": [19, 21, 24, 25], "mainli": 24, "recogn": [19, 27, 28, 36, 38], "item": [8, 9, 14, 15, 17, 22, 23, 26, 28, 29, 30, 36, 37], "ye": [12, 24, 25], "blow": [], "edg": [19, 22, 25, 26, 27, 36], "especi": [7, 14, 19, 20, 21, 22, 23, 26, 35, 36, 37, 40, 41], "shoulder": 28, "suppress": [], "background": [7, 8, 23, 27, 36, 39, 40], "outlin": [], "sum": [12, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 39], "posit": [7, 8, 15, 20, 21, 22, 23, 24, 25, 27, 37], "smoother": [20, 22, 24, 26, 33, 37], "moreov": [26, 38], "smaller": [7, 14, 15, 20, 22, 23, 24, 26, 27, 32, 38, 39, 43], "curios": [15, 35], "strong": 23, "believ": [8, 15, 22, 25, 28], "evidenc": [], "extrem": [26, 36], "weight": [6, 7, 11, 17, 18, 19, 20, 21, 23, 24, 27, 28, 32, 33, 36, 39], "short": [10, 18, 19, 29], "sleev": [], "heigh": [], "bottom": [8, 20, 22, 24, 26, 27, 32, 39, 42], "middl": [], "overal": [22, 24, 35, 36, 37, 39, 43, 44], "present": [19, 22, 28, 37], "emphasi": [], "seemingli": [], "higher": [6, 16, 17, 20, 21, 22, 23, 24, 26, 28, 30, 32, 36, 41, 44], "neg": [8, 15, 20, 22, 23, 24, 25, 26, 28, 35], "slight": [35, 37, 44], "variat": [22, 25, 36, 39], "input": [6, 7, 13, 15, 20, 21, 22, 24, 25, 26, 27, 28, 31, 33, 34, 36, 37, 42, 44], "behavior": 20, "illustr": [6, 12, 20, 23, 24, 26, 27, 31, 44], "purpos": [6, 24, 26], "userwarn": [6, 24], "simplest": [6, 14, 22], "subset": [6, 24, 32, 38], "make_blob": [6, 19, 20, 21, 22, 24, 33], "synthet": [6, 19, 22], "instanti": [6, 27], "intern": [6, 18, 19, 22, 23, 31, 36], "averag": [6, 9, 11, 12, 14, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 41], "var": [6, 14, 15, 22, 23, 24, 29, 31, 32, 34, 39, 40], "0006": [6, 31], "kfold": [6, 22], "stratifiedkfold": [6, 22], "randomiz": 6, "leaveoneout": 6, "leav": [6, 19, 20, 23, 24, 25, 27, 31], "n_split": [6, 22, 23, 32, 39], "skfold": 6, "86666667": 6, "83333333": 6, "loo": 6, "iter": [6, 8, 15, 20, 22, 23, 25, 26, 27, 29, 31, 38, 39, 41], "shufflesplit": [6, 22, 23, 32, 38, 39], "stratifiedshufflesplit": [6, 22, 39], "absolut": [6, 15, 22, 28], "total": [6, 13, 14, 15, 18, 22, 23, 26, 27, 28, 30, 32, 37, 39], "shuffle_split": [6, 22, 23, 32, 39], "98666667": 6, "97333333": 6, "94666667": 6, "90666667": 6, "membership": 6, "groupkfold": [6, 22], "n_sampl": [6, 19, 20, 21, 22, 23, 24, 26, 32, 33, 37], "belong": [6, 20, 22, 25, 27], "etc": [6, 9, 19, 27, 30], "66666667": 6, "count": [6, 12, 22, 23, 24, 25, 26, 30, 32, 39, 43], "discuss": [6, 19, 24, 26, 44], "accuracy_scor": [6, 22, 37], "explictli": [6, 15, 25, 28, 29], "classification_report": [6, 22], "tabl": [6, 19, 20, 23, 24, 30, 32, 34, 35], "aggreg": [6, 12, 22, 30, 31], "f1_score": [6, 22], "load_breast_canc": [6, 11, 22, 23, 31, 32], "48": [6, 15, 22], "85": [6, 17, 20, 22, 32, 35], "9300699300699301": 6, "dpi": [6, 22, 31, 38, 39, 40, 41, 42, 43, 44], "f1": [6, 8], "91": [6, 35], "53": [6, 15, 18, 21, 30, 36], "93": [6, 24, 27], "143": 6, "macro": [6, 22], "avg": [6, 27, 32], "pred": [6, 22, 23, 27, 36, 37, 39], "micro": [6, 22], "930": [6, 39], "925": 6, "learner": [6, 22, 24, 31, 36], "decision_funct": [6, 7, 21, 22, 23, 40], "float": [6, 11, 13, 15, 22, 24, 26, 27, 28, 29, 30, 37, 40], "inf": [6, 12, 18, 20, 23], "predict_proba": [6, 19, 22, 23, 24], "threshold": [6, 9, 20, 23, 33], "y_pred_lower_threshold": 6, "89": [6, 20, 24, 26], "95": [6, 17, 19, 20, 22, 25, 27, 37, 42], "multiclass": [6, 15, 22, 24], "n_class": [6, 22], "x_train2": 6, "x_test2": 6, "y_train2": 6, "y_test2": 6, "lr2": 6, "entri": [6, 25, 27], "03499211": 6, "29425161": 6, "7407405": 6, "91897372": 6, "09086147": 6, "0098352": 6, "05185099": 6, "87457159": 6, "17727941": 6, "73279105": 6, "03622549": 6, "69656555": 6, "73730572": 6, "47556657": 6, "26173915": 6, "03557844": 6, "0345983": 6, "07017674": 6, "98547105e": 6, "03": [6, 23, 30, 37], "22130578e": 6, "73883951e": 6, "44175894e": 6, "58237959e": 6, "02": [6, 14, 15, 18, 20, 22, 25, 26, 30, 37], "10136994e": 6, "07": [6, 14, 18, 28, 37], "20891186e": 6, "08": [6, 20, 36, 37], "82799143e": 6, "98171996e": 6, "68180705e": 6, "87139122e": 6, "06179071e": 6, "54224758e": 6, "69786431e": 6, "28671321e": 6, "52618137e": 6, "73816007e": 6, "62163802e": 6, "precision_recall_curv": [6, 22, 24], "roc_curv": [6, 22, 24], "tpr": [6, 22, 24], "fpr": [6, 22, 24], "average_precision_scor": 6, "area": [6, 8, 22, 25, 39, 40], "roc_auc_scor": [6, 22, 39, 40], "auc": [6, 8, 22, 24, 39, 40], "accur": [6, 8, 10, 19, 22, 23, 24, 25, 35], "trapezoid": 6, "rule": [6, 20, 22, 26], "ap_pp": 6, "ap_df": 6, "995": 6, "rf_auc": 6, "svc_auc": 6, "svc": [6, 7, 11, 19, 20, 21, 22, 24, 31, 36, 37, 40, 44], "991": 6, "want": [6, 7, 8, 11, 15, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 32, 35, 37, 41, 44], "through": [6, 14, 16, 18, 19, 20, 26, 27, 28, 30], "argument": [6, 10, 14, 25, 29], "But": [6, 18, 22, 24], "scorer": 6, "sort": [6, 18, 19, 22, 23, 24, 28, 30, 32, 36, 37], "adjusted_mutual_info_scor": 6, "adjusted_rand_scor": 6, "average_precis": 6, "balanced_accuraci": [6, 9], "completeness_scor": 6, "explained_vari": 6, "f1_macro": 6, "f1_micro": 6, "f1_sampl": 6, "f1_weight": 6, "fowlkes_mallows_scor": 6, "homogeneity_scor": 6, "jaccard": 6, "jaccard_macro": 6, "jaccard_micro": 6, "jaccard_sampl": 6, "jaccard_weight": 6, "max_error": 6, "mutual_info_scor": 6, "neg_brier_scor": 6, "neg_log_loss": 6, "neg_mean_absolute_error": 6, "neg_mean_absolute_percentage_error": 6, "neg_mean_gamma_devi": 6, "neg_mean_poisson_devi": 6, "neg_mean_squared_error": [6, 15, 19, 37], "neg_mean_squared_log_error": 6, "neg_median_absolute_error": 6, "neg_root_mean_squared_error": 6, "normalized_mutual_info_scor": 6, "precision_macro": 6, "precision_micro": 6, "precision_sampl": 6, "precision_weight": 6, "rand_scor": 6, "recall_macro": 6, "recall_micro": 6, "recall_sampl": 6, "recall_weight": 6, "roc_auc": [6, 22, 24, 39, 40], "roc_auc_ovo": 6, "roc_auc_ovo_weight": 6, "roc_auc_ovr": 6, "roc_auc_ovr_weight": 6, "top_k_accuraci": 6, "v_measure_scor": 6, "load_digit": 6, "digit": [6, 24, 27, 36], "explicit_accuraci": 6, "explicit": [6, 14, 21, 22], "975": 6, "99166667": 6, "99442897": 6, "98050139": 6, "99717078": 6, "99854252": 6, "999828": 6, "98400413": 6, "know": [6, 11, 15, 18, 19, 20, 22, 24, 25, 26, 27, 28, 31], "improv": [6, 7, 8, 9, 14, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 36, 37, 38, 39, 41, 44], "dictionari": [6, 11, 28, 29, 31], "gamma": [6, 7, 8, 10, 11, 19, 20, 21, 22, 25, 26, 31, 36, 37, 39, 40, 41, 44], "untrain": [6, 25, 31], "access": [6, 22, 27, 28, 31], "rbf": [6, 8, 10, 12, 19, 25, 36, 37, 41, 42, 44], "outer": [6, 8, 22, 31, 38, 44], "inner": [6, 8, 20, 21, 22, 25, 26, 27, 31, 38], "appli": [6, 11, 14, 19, 22, 26, 27, 28, 29, 30, 37], "9666666666666668": 6, "randomizedsearchcv": [6, 14, 22, 31, 36, 38], "n_iter": [6, 14, 31, 36, 38], "fix": [6, 12, 16, 19, 23, 25, 27, 28, 30, 31, 37], "scipi": [6, 21, 22, 24, 25, 27, 36, 37, 38, 41], "stat": [6, 21, 22, 25, 30, 31, 36, 37, 38], "expon": [6, 22, 31, 36, 38], "random_search": [6, 31, 36], "param_distribut": [6, 14, 31, 36, 38], "_distn_infrastructur": 6, "rv_frozen": 6, "0x282abbc40": 6, "0x2824ad1f0": 6, "care": [7, 22, 24, 28, 41, 44], "explor": [7, 10, 16, 19, 20, 23, 25, 27, 31, 35, 37, 40], "artifici": [7, 12, 20, 22, 24, 31, 40, 41], "fetch": [7, 18, 27, 37, 40], "banana": [7, 40], "www": [7, 8, 10, 11, 14, 15, 26, 27, 28, 31, 35, 39, 40, 41, 42], "1460": [7, 40], "id": [7, 14, 15, 16, 18, 20, 24, 26, 27, 28, 36, 40], "dataset_format": [7, 8, 9, 13, 14, 16, 18, 26, 27, 36, 37], "bwr": [7, 20, 21, 23, 24, 26, 40], "helper": [7, 13, 14, 15, 17, 28, 35, 36, 39, 40, 44], "loos": 7, "amuel": [7, 40], "mglearn": [7, 19, 20, 21, 22, 23, 24, 25, 26, 32, 33, 35, 38, 40, 41], "plot_svm_kernel": [7, 21, 40], "support_vector": 7, "dual_coef": 7, "variou": [7, 27], "blue": [7, 20, 21, 22, 23, 24, 25, 26, 28, 30, 32, 35, 39, 40, 41, 44], "circl": [7, 20, 24, 26, 30, 31], "border": 7, "dual": [7, 11, 20, 21, 25], "paint": 7, "darker": 7, "gradient": [7, 14, 15, 19, 22, 24, 27, 28, 35, 37], "boundari": [7, 19, 20, 21, 22, 23, 26, 27, 33, 36, 40], "margin": [7, 18, 21, 25, 26, 27, 37, 40, 41], "dash": [7, 39, 40], "coordin": [7, 30, 37], "linearsvm": [7, 24], "plane": [7, 20, 21, 22, 40], "fignum": [7, 27, 40], "zorder": [7, 12, 20, 21, 26, 37, 40], "edgecolor": [7, 12, 19, 20, 21, 22, 23, 33, 40], "facecolor": [7, 22, 37], "tight": [7, 20, 21, 40], "x_min": [7, 20, 21, 23, 24, 26, 40], "x_max": [7, 20, 21, 23, 24, 26, 40], "y_min": [7, 20, 21, 23, 24, 26, 40], "y_max": [7, 20, 21, 23, 24, 26, 40], "xx": [7, 20, 21, 22, 23, 24, 40], "yy": [7, 20, 21, 22, 23, 24, 40], "mgrid": [7, 21, 40], "300j": [7, 40], "z": [7, 20, 21, 22, 23, 25, 26, 30, 37, 40], "c_": [7, 21, 22, 23, 24, 40], "put": [7, 19, 21, 27, 36, 40], "contour": [7, 20, 21, 22, 23, 25, 26, 40], "linestyl": [7, 14, 20, 21, 22, 23, 24, 26, 28, 31, 32, 36, 40], "pcolormesh": [7, 21, 22, 40], "xlim": [7, 20, 22, 23, 24, 40, 41], "ylim": [7, 20, 22, 23, 24, 25, 31, 32, 35, 40, 41, 44], "minimum": [7, 20, 22, 23, 31], "maximum": [7, 14, 15, 18, 20, 22, 23, 25, 26, 27, 28, 31, 37, 38, 42], "misclassif": [7, 20, 21, 22, 23, 32, 37, 39, 43], "hing": [7, 20], "squared_hing": [7, 20], "squar": [7, 15, 21, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 37, 39, 41, 44], "normal": [7, 10, 13, 15, 16, 18, 19, 20, 22, 23, 25, 27, 28, 30, 31, 32, 35, 36, 41, 42, 44], "strict": [7, 22], "primal": [7, 20], "although": [7, 21, 35, 36, 37, 38, 39, 40], "matter": [7, 25, 27, 31, 32], "hyperplan": [7, 20, 21, 26], "mathbf": [7, 20, 21, 22, 23, 24, 26, 28, 41], "wx": [7, 25], "vice": [7, 22, 23, 28, 36], "versa": [7, 22, 23, 28, 36], "intercept_": [7, 20, 21], "bia": [7, 20, 24, 25, 26, 27, 28, 32], "fall": [7, 20, 24, 33], "insid": [7, 26, 28, 36], "lectur": [7, 16, 18, 31, 34], "extract": [7, 19, 25, 28, 29, 31], "stuck": [7, 19, 20, 41], "afterward": [7, 22, 23, 31, 37], "support_vector_indic": 7, "calcul": [7, 12, 24, 26, 27, 36, 37, 39], "formula": [7, 20], "dot": [7, 20, 21, 24, 25, 26, 27, 28, 30, 32, 36, 37, 41, 44], "must": [7, 14, 19, 20, 23, 25, 26, 27, 34, 35, 44], "either": [7, 10, 11, 13, 21, 22, 23, 24, 35, 37, 40], "poli": [7, 21, 24, 25, 40], "sigmoid": [7, 9, 15, 20, 22, 24, 26, 27, 28], "wider": [7, 20, 21], "polynomi": [7, 11, 19, 20, 40, 41, 43], "life": 7, "support_vectors_": [7, 20, 21, 40], "n_support_": [7, 40], "dual_coef_": [7, 11, 20, 21, 40], "lin_scor": [7, 40], "poly_scor": [7, 40], "rbf_score": [7, 40], "initi": [7, 14, 18, 19, 20, 22, 23, 25, 27, 28, 30, 36, 41, 44], "encircl": [7, 40], "\ud835\udc36": 7, "\ud835\udefe": 7, "1e3": [7, 25], "report": [7, 8, 13, 14, 17, 18, 22, 37, 40], "least": [7, 9, 13, 14, 16, 18, 22, 23, 24, 25, 26, 28, 37, 40, 41, 42], "200": [17, 19, 24, 28, 30, 31, 36, 38, 39, 41], "bigger": [15, 22, 39, 40], "clf1_1": [], "cannot": [18, 20, 21, 22, 23, 24, 28, 31, 39], "within": [10, 14, 18, 24, 26, 33], "57": 20, "5f": [37, 40], "0000": [], "00005": [], "particularli": [36, 37, 40], "stabl": [22, 30, 31, 36], "120": [20, 40, 44], "clf1": [], "tol": [18, 23, 40], "clf2": [20, 24], "clf3": [], "linearli": [20, 28, 30, 33, 40], "separ": [16, 19, 20, 22, 23, 24, 27, 30, 33, 36, 37, 40], "badli": [20, 35, 40], "li": [20, 25, 32, 40], "outsid": [20, 40], "group": [14, 24, 31, 40], "forc": [26, 27, 40], "decreas": [15, 20, 21, 22, 23, 24, 25, 26, 27, 37, 40, 44], "toler": [23, 40], "stop": [17, 18, 23, 27, 28, 30, 32, 36, 38], "criterion": [23, 32], "slow": [20, 21, 23, 24, 26, 27, 28, 33, 36, 38, 40, 41], "clearli": [24, 35, 36, 37, 39, 40, 42], "aren": 40, "divid": [32, 40], "subspac": [19, 40], "captur": [10, 24, 27, 28, 35, 36, 40, 41], "hit": [8, 22, 31, 37, 39, 40, 44], "sweet": [19, 20, 22, 26, 40], "spot": [19, 20, 22, 26, 40], "conveni": [23, 24, 29], "3x3": [16, 27], "fig_num": 40, "clf4": [], "trainacc": [], "testacc": [], "narrow": [21, 26, 27, 40], "datapoint": [31, 36, 39, 40], "island": [28, 40], "everywher": 16, "found": [18, 20, 21, 22, 27, 28, 37], "medium": [12, 40], "fewest": 40, "tend": [22, 32, 37, 40], "unless": [8, 27, 28], "visibl": [26, 37], "larger": [14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 39, 41, 43, 44], "resolut": [16, 27], "18": [14, 15, 17, 20, 21, 23, 26, 27, 28, 30, 37, 40, 41], "isn": [40, 41], "realli": [10, 17, 22, 24, 28, 35, 36, 38, 40, 41], "simpl": [14, 18, 19, 20, 22, 23, 24, 25, 26, 27, 34, 36, 37, 38, 40, 44], "peak": [10, 15, 28, 35, 40], "rather": [8, 24, 27, 30, 35, 36, 37, 38, 40, 41], "4096": 40, "magic": [8, 26, 39, 41], "telescop": [8, 39], "1120": [8, 39], "task": [8, 10, 14, 15, 18, 19, 20, 22, 23, 25, 26, 27, 28, 35, 36, 39], "rai": [8, 39], "consist": [8, 10, 12, 14, 19, 22, 26, 27, 28, 33, 35, 39], "energi": [8, 39], "particl": [8, 39], "chain": [8, 20, 24, 26, 31, 39], "reaction": [8, 39], "shower": [8, 39], "hadron": [8, 39], "ones": [8, 11, 16, 19, 20, 22, 23, 24, 25, 30, 37, 39, 41], "come": [8, 15, 28, 29], "radiat": [8, 39, 42], "pattern": [8, 12, 14, 20, 26, 27, 28, 31, 39], "convert": [8, 15, 20, 22, 23, 24, 26, 27, 28, 29, 30, 31, 36, 39], "research": [8, 25], "occur": [8, 19, 22, 26, 27, 28, 39], "univers": [8, 18, 27, 31], "shown": [8, 22, 28, 34, 36, 39, 41], "seri": [8, 10, 12, 14, 15, 19, 21, 25, 26, 28, 35, 39, 42, 43, 44], "12500": [8, 39], "signal": [8, 12, 19, 20, 22, 27, 30, 39], "6700": [8, 39], "f": [8, 9, 11, 12, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 31, 32, 33, 34, 37, 42], "magic_df": 8, "holdout": [8, 9, 22, 38], "precis": [8, 14, 18, 24, 26, 30, 37], "recal": [8, 24], "roc": [8, 9, 24, 39, 40], "curv": [8, 9, 13, 15, 16, 17, 19, 20, 23, 24, 25, 26, 27, 28, 35, 40, 44], "answer": [8, 18, 25, 29, 44], "real": [8, 10, 13, 14, 23, 25, 26, 28, 31, 35, 37, 42], "back": [8, 17, 27, 28], "scaler": [8, 11, 31, 35], "alon": 8, "assum": [8, 19, 20, 24, 25, 32, 37, 42], "adapt": [8, 20, 24, 41], "transform": [8, 11, 20, 21, 23, 25, 27, 30, 32, 37], "nest": [8, 30, 38], "held": [8, 22, 24, 32], "extra": [8, 23, 24, 27], "reason": [8, 18, 22], "rebuild": [8, 10, 17, 27, 31, 35], "tediou": [8, 11], "sacrif": 8, "twice": [8, 44], "costli": [8, 22], "wast": [8, 14, 20, 26], "miss": [8, 10, 11, 15, 22, 28, 30, 35], "assumpt": [8, 19, 24], "did": [8, 18, 26, 36, 37, 41], "lose": [8, 19, 25, 26, 41], "preambl": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 32, 33, 35, 38, 39, 41, 42, 43, 44], "precision_scor": 22, "recall_scor": 22, "stratif": [14, 22], "ground": [19, 41], "truth": [19, 41], "824": [], "878": [], "581": 28, "700": 22, "769": [], "88": 18, "58": [15, 20, 28], "135": 20, "872": [], "903": [], "711": 20, "796": [], "835": [], "randomsearch": [14, 26], "loguniform": [], "1e12": [], "distibut": [], "rv": 31, "util": [14, 15, 18, 22, 23, 24, 26, 27, 28], "c_sampl": [], "1e4": [22, 42], "g_sampl": [], "set_xlim": [19, 20, 21, 22, 24, 25, 26, 28, 35, 37], "set_ylim": [19, 20, 21, 22, 23, 24, 25, 26, 37], "set_yscal": 19, "could": [11, 14, 15, 16, 17, 18, 19, 20, 22, 26, 27, 28, 31, 32, 36, 37, 41, 43], "njob": [], "parallel": [20, 22, 23, 25, 27, 28], "verbos": [14, 15, 18, 24, 25, 26, 27, 28], "intermedi": 27, "rs": [], "candid": 24, "backend": [14, 26, 27, 30], "lokybackend": [], "concurr": [], "worker": [], "33": [15, 20, 22, 23, 26, 27, 31, 32, 39], "elaps": [], "0s": [15, 27], "8min": [], "finish": 14, "0x7fca10e3ebe0": [], "0x7fca114786d8": [], "9101131972886245": [], "462": 28, "63302228870276": [], "0035856241778658205": [], "inde": [16, 35, 36, 39, 41, 43], "heurist": 23, "n_featur": [22, 23, 27, 32], "_gamma": [], "0999999999483963": [], "best_svm": [], "789": [], "830": [], "keep": [15, 19, 20, 23, 27, 36, 37, 38, 39], "mind": 28, "treat": 20, "probabilist": [23, 37], "closest": [20, 22, 33], "close_zero": 22, "argmin": [19, 20, 22, 39], "ab": [20, 22, 23, 24, 26, 30], "markers": [20, 22, 23, 25, 26, 33, 42], "fillstyl": 22, "mew": 22, "close_t": [], "175": 23, "lw": [12, 13, 14, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 41], "smooth": [12, 20, 23, 24, 25, 26, 27, 37, 41, 44], "equal": [20, 22, 24, 26, 28, 31, 32, 33, 35, 37], "reduc": [19, 22, 23, 24, 25, 26, 27, 29, 32, 36, 39], "move": [14, 19, 26, 27, 28, 37, 44], "littl": [19, 20, 23, 27, 37, 39, 40, 44], "reus": [9, 19, 27], "fn": [22, 24], "fp": [22, 24, 25], "cost_fn": 22, "cost_fp": 22, "ratio_p": 22, "plot_isometr": 22, "c_fn": [], "c_fp": [], "min_cost": 22, "min": [14, 20, 21, 22, 23, 25, 26, 27, 30, 31, 32, 36, 37], "min_thr": 22, "min_thres_v": [], "meshgrid": [20, 21, 22, 23, 24, 25, 26, 37], "max": [9, 11, 14, 20, 21, 22, 23, 25, 26, 28, 30, 31, 32, 35, 36, 37, 38], "append": [11, 12, 14, 15, 19, 20, 22, 23, 24, 26, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 44], "cs": [22, 28, 29, 41], "clabel": [20, 22], "isometr": 22, "ideal": [14, 19, 23, 24, 26, 27, 37, 39], "astyp": [14, 15, 26, 27, 28, 36, 37, 38], "748": [], "591": [], "926": 35, "721": [], "massiv": [], "71": [15, 17], "lost": 27, "59": [11, 23], "covertyp": 9, "spruce": 9, "pine": 9, "cottonwood": 9, "aspen": 9, "elev": [9, 21], "distanc": [9, 19, 20, 21, 24, 25, 27, 28, 32, 33, 36, 37, 41], "water": 9, "soil": 9, "seaborn": [9, 10, 11, 30, 37], "sn": [9, 10, 11, 37], "180": [9, 18, 20, 37], "retrieve_class_label": [9, 38], "cottonwood_willow": 9, "douglas_fir": 9, "krummholz": 9, "lodgepole_pin": 9, "ponderosa_pin": 9, "spruce_fir": 9, "slope": [9, 20], "horizontal_distance_to_hydrolog": 9, "vertical_distance_to_hydrolog": 9, "horizontal_distance_to_roadwai": 9, "hillshade_9am": 9, "hillshade_noon": 9, "hillshade_3pm": 9, "horizontal_distance_to_fire_point": 9, "wilderness_area1": 9, "wilderness_area2": 9, "wilderness_area3": 9, "wilderness_area4": 9, "soil_type_1": 9, "soil_type_2": 9, "soil_type_3": 9, "soil_type_4": 9, "soil_type_5": 9, "soil_type_6": 9, "dougla": 9, "fir": 9, "grow": [9, 19, 20, 26, 31], "surviv": [9, 11, 38], "n_point": [9, 22], "1500": [9, 19, 20, 42], "style": [9, 20, 21, 23, 24, 27, 31, 32, 34], "tick": [9, 22, 27, 44], "pairplot": 9, "hue": 9, "evaluate_rf": 9, "32": [9, 13, 14, 15, 16, 23, 24, 25, 26, 27, 28, 29, 30, 36, 38, 39], "n_estim": [9, 22, 23, 24, 35, 37, 38, 39, 43], "reproduc": [9, 21, 23, 31, 37, 41], "earlier": [9, 27, 36], "max_depth": [9, 23, 24, 32, 37, 39], "balanc": [9, 22, 24, 26, 27, 37], "platt": 9, "calibratedclassifiercv": [9, 22], "prefit": 9, "evaluate_gb": 9, "gradientboostingclassifi": [9, 23, 38, 39], "xgboostclassifi": 9, "rate": [9, 13, 14, 15, 16, 17, 20, 22, 23, 24, 25, 27, 37, 39], "whole": [9, 11, 21, 24, 25, 28, 30, 44], "gbclassifi": 9, "tqdm": [24, 36], "tqdm_notebook": 36, "ipython": [14, 19, 26, 28, 29, 31, 36, 37], "displai": [14, 19, 24, 26, 27, 28, 32, 34, 37], "plot_liv": [], "param_rang": [], "keyword": [10, 14, 29], "signatur": [], "param_valu": 36, "model_1": [], "model_2": [], "logarithm": [], "tupl": [11, 25, 29, 31, 36], "lowest": 37, "highest": [20, 24, 37, 39], "ion": [], "xscale": [23, 35, 36, 39], "empti": [27, 28, 30, 39], "fill": [10, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 32, 33, 35], "set_data": [], "refresh": [], "gcf": 22, "clear_output": [14, 19, 26, 28], "wait": [14, 26, 28], "randomforestclassifi": [22, 23, 24, 38, 39], "balanced_accuracy_scor": [], "xgboost": [], "xgbclassifi": 37, "rf_1": [], "rf_2": [], "md": 34, "rf": [22, 24, 38, 39], "rf_": [], "plot_1": [], "reduct": [23, 24, 27, 28, 36, 39], "evaluate_rf_balanc": [], "plot_feature_import": 24, "feature_importances_": [23, 24, 32, 35], "rf_32": [], "65": [15, 23], "26": [15, 20, 21, 27, 39], "62": [17, 41], "16": [14, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 36, 37, 39], "49": [20, 30], "signific": [14, 24, 26, 36], "robust": [10, 20, 22, 23, 27, 42, 44], "against": [13, 14, 20, 22, 23, 26, 28, 32], "irrelev": 31, "runtim": [16, 18, 36, 38], "tuned_forest": [], "8475": [], "1059": [], "41": [15, 21, 30, 36], "79": [], "661": 28, "12032": [], "73": [], "35": [18, 20, 24, 28, 30, 32], "67": [15, 28, 39, 41], "31": [15, 17, 20, 27, 30, 31], "83": [18, 35], "167": [], "1510": [], "81": [20, 27, 30], "114": [20, 26], "103": [22, 24], "250": [], "19": [14, 15, 17, 18, 20, 21, 22, 24, 25, 28, 29, 36, 41], "260": [], "173": [], "113": 20, "600": 36, "121": [20, 27], "799": [], "x_bin": 24, "y_bin": [], "previous": [19, 26, 27], "binary_forest": [], "fpr_rf": [], "tpr_rf": [], "thresholds_rf": [], "close_default_rf": [], "corner": [], "replic": [], "calibration_curv": 22, "plot_calibration_curv": 22, "y_true": [20, 22], "y_prob": [22, 23], "n_bin": 22, "hist": [13, 22, 24, 43], "prob_tru": 22, "prob_pr": 22, "ones_lik": [22, 25], "fraction": [14, 22, 24, 26], "unfit": [], "prob_po": 22, "warm": [23, 26], "learning_r": [13, 14, 20, 23, 24, 26, 37, 39], "shuffl": [13, 14, 24, 26, 31, 37, 39, 41, 42], "gb_": [], "plot_2": [], "slower": [23, 24, 26, 28, 39, 41], "fewer": [14, 17, 19, 20, 22, 24, 26, 27, 36, 37, 38], "ultim": [24, 39, 41], "overtak": 44, "poorli": [23, 31, 43], "aggress": 26, "overshoot": [], "introduc": 25, "capabl": 30, "fine": [16, 24], "off": [20, 21, 22, 24, 25, 26, 27, 35, 36, 37, 38, 39, 44], "anymor": [], "world": [10, 15, 19, 25, 28, 31, 35], "moneybal": [10, 35], "descript": [10, 30], "inform": [10, 17, 19, 23, 25, 27, 28, 31, 32, 36, 37], "basebal": [10, 35], "player": [10, 35], "factor": [10, 23, 25, 27, 28, 31, 35, 36, 37], "41021": [10, 35], "categor": [10, 11, 14, 19, 23, 26, 31, 32, 35], "saw": [10, 18, 25, 35], "isnul": [10, 35, 37], "team": [10, 35], "leagu": [10, 35], "year": [10, 15, 17, 25, 28, 30, 32, 35], "ra": [10, 35], "obp": [10, 35], "slg": [10, 35], "ba": [10, 35], "playoff": [10, 35], "rankseason": [10, 35], "rankplayoff": [10, 35], "oobp": [10, 35], "oslg": [10, 35], "bool": [10, 29, 35], "imput": [10, 11, 27, 35], "median": [10, 11, 24, 31, 35], "simpleimput": [10, 11, 24, 31], "strategi": [10, 11, 22, 24, 31, 32, 35], "x_clean_arrai": 10, "fit_transform": [10, 19, 24, 28, 31, 35], "x_clean": 10, "strongli": [10, 22, 25, 27, 28, 29, 31, 35], "copyfram": [10, 35], "copi": [10, 22, 23, 24, 25, 27, 34, 35], "thing": [10, 19, 24, 27, 31, 35, 36, 37, 39], "immedi": [10, 35, 37], "stand": [10, 28, 35, 37], "diagon": [10, 25, 27, 35], "encod": [10, 11, 13, 14, 15, 17, 19, 22, 23, 27, 35, 36], "build_pipelin": 10, "nan": [10, 18, 22, 24, 30, 31, 35, 37], "onehotencod": [10, 11, 24, 31, 35], "attach": 10, "clean": [10, 19, 24], "randomforest": [10, 18, 22, 23, 24, 35, 39], "gradientboost": [10, 39], "1e6": [10, 22], "agre": [10, 35], "minmaxscal": [11, 24, 31, 35], "compos": [11, 24, 28, 30], "make_column_transform": 24, "cat_pip": [], "spars": [14, 19, 20, 23, 24, 25, 26, 28, 33, 38], "handle_unknown": [11, 31, 35], "num_pip": [], "insert": [22, 27, 35], "remaind": 24, "reg": [21, 24, 25, 33, 35], "pipe": [11, 24, 31, 35], "randomforestregressor": [24, 35, 37, 43], "gradientboostingregressor": [18, 23], "svr": [20, 21, 41], "22898115995987259424768": [], "27": [1, 17, 21, 24, 25, 26, 30, 36, 37], "latter": [35, 36], "perhap": 35, "improven": [], "unregular": [], "had": [11, 18, 27, 28, 35, 37], "compens": 35, "thu": [20, 35, 39], "sometim": [11, 14, 20, 21, 22, 24, 25, 27, 34, 35, 36], "act": [20, 24, 26, 28, 30, 33, 35], "room": 39, "affect": [18, 19, 21, 22, 24, 27, 31, 37], "grid_alpha": 35, "reg__alpha": 35, "evaluategrid": 35, "ridge_r": 35, "lasso_r": 35, "927": [], "11513953993264481": [], "zoon": [], "heavili": [22, 30, 35], "penal": [20, 35], "slighlti": [], "svm_heat": [], "2d": [20, 25, 26, 27, 28, 35, 37], "grid_svm": [], "reg__c": [], "reg__gamma": [], "svm_re": [], "transpos": [16, 30, 35, 36], "nowher": 24, "mess": [20, 35], "feature_indices_": 35, "hot": [11, 13, 14, 15, 17, 26, 35], "fi": 35, "named_step": [11, 24, 31, 35, 36], "named_transformers_": [], "get_feature_nam": [], "input_featur": [], "new_nam": 35, "extend": [19, 24, 27, 29, 30, 35], "addition": [35, 37], "booster": 23, "rf_pipe": 35, "gb_pipe": [], "get_param": [35, 36, 39, 41], "random_forest": 35, "gradient_boost": [], "ind": [28, 32, 35], "orang": [28, 35, 41, 44], "gb": 39, "285": 35, "roughli": 35, "deem": [21, 35], "lesser": 35, "interestingli": 35, "plai": [12, 17, 19, 25, 28], "american": [], "league_": [], "boston": [15, 20, 22, 24], "baltimor": [], "nymet": [], "oakland": [], "obviou": 35, "phenomenon": [19, 35, 37], "consid": [11, 12, 13, 16, 18, 20, 21, 22, 23, 24, 25, 27, 29, 32, 35, 37, 42], "norm": [20, 21, 22, 23, 24, 26, 28, 35, 37], "wherea": 35, "ve": [18, 26, 28, 31, 35], "seen": [17, 21, 22, 24, 26, 27, 28, 35, 37], "last": [11, 13, 17, 18, 19, 24, 26, 27, 28, 29, 30, 31, 36, 41], "anyth": [11, 25, 31, 41, 44], "__": [11, 24, 31], "svm__c": [11, 24, 31], "cancer": [11, 20, 22, 23, 31, 32], "98245614": [11, 31], "97368421": [11, 31], "96491228": [11, 31], "99115044": [11, 31], "98": [11, 31], "queri": [11, 27, 28, 30, 31], "compon": [11, 12, 19, 20, 23, 31, 36, 39, 41], "pipe_short": [11, 31], "abbrevi": [11, 31], "syntax": [11, 31], "becom": [11, 14, 19, 20, 21, 23, 25, 26, 28, 31, 36, 37], "svm__gamma": [11, 24, 31], "And": [11, 32], "drill": 11, "properti": [11, 15, 21, 29, 30, 31, 36], "39188844": 11, "06940593": 11, "435234": 11, "70025696": 11, "86542086": 11, "41433994": 11, "81390656": 11, "41806527": 11, "90768285": 11, "16897821": 11, "29887055": 11, "13720135": 11, "21362118": 11, "19026766": 11, "12847723": 11, "52216852": 11, "76624729": 11, "01249056": 11, "15920579": 11, "51299862": 11, "71224989": 11, "50141938": 11, "99516035": 11, "9094081": 11, "91913684": 11, "89650891": 11, "39896365": 11, "81123374": 11, "4124202": 11, "41518257": 11, "83036405": 11, "59337629": 11, "37050773": 11, "27947936": 11, "55478824": 11, "58895182": 11, "48679571": 11, "15559387": 11, "39055347": 11, "66341253": 11, "27687797": 11, "65127305": 11, "84096369": 11, "39518826": 11, "50425662": 11, "polynomialfeatur": [11, 19, 21, 24], "fetch_california_h": 11, "hous": [11, 15, 20, 27, 36], "polynomialfeatures__degre": [11, 24], "ridge__alpha": [11, 24], "stall": 11, "my": [11, 15, 24, 28], "matshow": [11, 24, 27], "suboptim": [11, 44], "featurejoin": 11, "feature_select": [11, 24], "selectkbest": [11, 24], "dimension": [11, 20, 21, 22, 23, 24, 26, 27, 28, 30, 33, 36, 38, 41], "n_compon": [11, 19, 36], "mayb": [11, 24, 27, 36, 43], "univari": 11, "combined_featur": 11, "univ_select": 11, "x_featur": 11, "features__pca__n_compon": 11, "features__univ_select__k": 11, "transformer_list": 11, "specifi": [11, 13, 14, 18, 25, 30], "preprocessor": [11, 15, 24, 31], "mask": [11, 21, 24, 27, 31, 36], "handi": [11, 22], "sub": [11, 12, 20, 21, 24], "part": [11, 17, 18, 19, 22, 23, 24, 27, 28, 31, 41], "classfier": 11, "handl": [11, 19, 23, 27, 28, 31, 43, 44], "titan": 11, "seed": [11, 14, 19, 20, 22, 24, 25, 26, 31, 37, 41], "40945": 11, "as_fram": [11, 12, 20, 22, 24], "return_x_i": [11, 24], "altern": [11, 14, 20, 22, 23, 24, 26, 28, 29, 33], "fare": 11, "embark": 11, "q": [11, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "sex": 11, "femal": 11, "male": 11, "pclass": 11, "ordin": 11, "integ": [11, 13, 24, 25, 28, 29, 30, 31], "numeric_featur": [11, 24, 31], "numeric_transform": [11, 31], "categorical_featur": [11, 24, 31, 35], "categorical_transform": [11, 31], "constant": [11, 20, 21, 22, 24, 26, 27, 31, 36], "fill_valu": [11, 31], "onehot": [11, 31], "cat": [11, 16, 24, 27, 30, 31, 36, 37], "790": 11, "relat": [11, 20, 23, 24, 26, 27, 28, 37], "preprocessor__num__imputer__strategi": 11, "classifier__c": 11, "798": 11, "gp": [12, 19, 25, 41, 42], "sinusoid": 12, "sin": [12, 20, 21, 23, 25, 30, 31, 32, 37, 41], "line2d": [12, 24, 26], "0x12d6a0580": 12, "sine": [12, 25, 30, 31, 41], "rng": [12, 22, 23, 24, 32, 41], "randomst": [12, 22, 23, 24, 25, 32, 41], "x_": [12, 20, 21, 22, 23, 24, 26, 27, 32, 37], "uniform": [12, 19, 22, 23, 25, 26, 27, 33, 38], "newaxi": [12, 19, 23, 32, 37, 42], "y_": [12, 14, 22, 26, 37], "plot_gp": [12, 25, 42], "x_full": 12, "y_full": 12, "y_pred_mean": 12, "y_pred_std": 12, "use_titl": 12, "st": 12, "dev": 12, "idx": [12, 37], "argsort": [12, 19, 24, 28], "fill_between": [12, 22, 41, 42], "posterior": [12, 23, 24, 41, 42], "likelihood": [12, 20, 25, 39, 41, 42], "kernel_": [12, 41, 42], "log_marginal_likelihood": 12, "theta": [12, 19, 20, 25, 27], "tight_layout": [12, 20, 21, 22, 23, 24, 25, 26, 27, 37], "chosen": [12, 20, 36], "assist": 12, "n_restarts_optim": [12, 19, 25, 37, 41, 42], "gaussianprocessregressor": [12, 19, 25, 41, 42], "constructor": [12, 14, 29], "major": [12, 20, 22, 23, 24, 33, 37], "role": 12, "rationalquadrat": [12, 41], "expsinesquar": [12, 41], "dotproduct": 12, "matern": [12, 25], "monthli": 12, "co2": 12, "collect": [12, 19, 20, 22, 23, 24, 30, 31, 44], "observatori": 12, "hawaii": 12, "1958": 12, "2001": [12, 19, 30], "sci": [12, 14, 15, 31], "kit": [12, 31], "load_mauna_loa_atmospheric_co2": 12, "ml_data": 12, "data_id": [12, 24], "41187": 12, "month": [12, 17, 24], "ppmv_sum": 12, "month_float": 12, "ppmv": 12, "asarrai": [12, 15, 23, 28], "avg_ppmv": 12, "x_mauna": 12, "y_mauna": 12, "season": 12, "nois": [12, 19, 20, 23, 24, 25, 26, 27, 31, 32, 41, 42], "irregular": 12, "whitenois": 12, "gaussian_process": [12, 19, 25, 37, 41, 42], "whitekernel": [12, 41], "k1": [12, 30, 41], "length_scal": [12, 25, 41], "rise": [12, 15, 17, 34, 41], "k2": [12, 30, 41], "periodicity_bound": 12, "k3": [12, 41], "k4": 12, "noise_level": [12, 41], "noise_level_bound": 12, "0x7fe415cadeb0": [], "constantkernel": [25, 42], "return_std": [19, 25, 37, 41, 42], "x2": [19, 20, 24, 25], "y2": 19, "gp2": [], "y2_pred_mean": [], "y2_pred_std": [], "x3": 19, "y3": 19, "gp3": [], "y3_pred_mean": [], "y3_pred_std": [], "round": [20, 24, 26, 29, 37], "normalize_i": [19, 37, 41, 42], "mesh": [25, 28, 42], "mse": [15, 25, 42], "y_mean": [], "y_sigma": [], "tf": [13, 14, 15, 16, 17, 18, 20, 26, 27, 28], "554": [13, 27, 28], "exist": [13, 14, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 42], "predefin": [13, 14, 31], "60000": [13, 14, 26, 27], "10000": [13, 14, 15, 17, 24, 26, 27, 28, 31, 41], "x_train_norm": 13, "x_test_norm": 13, "y_train_encod": 13, "y_test_encod": 13, "create_model": [13, 14], "topographi": 13, "layer": [13, 15, 16, 17, 19, 25], "node": [13, 14, 15, 16, 17, 19, 20, 23, 24, 25, 26, 27, 28], "dropout": [13, 15, 16, 17, 27, 28], "layer_1_unit": 13, "layer_2_unit": 13, "dropout_r": 13, "train_model": 13, "histori": [13, 14, 15, 26, 27, 28], "validation_split": [13, 28], "epoch": [13, 14, 15, 16, 17, 24, 26, 27, 28], "batch_siz": [13, 14, 15, 26, 27, 28], "asid": [13, 19, 24, 31], "batch": [13, 15, 16, 17, 20, 22, 23, 27], "minibatch": [13, 15, 20, 26], "sgd": [13, 14, 15], "003": [13, 28], "4000": [13, 22, 27], "otherwis": [13, 16, 20, 22, 23, 24, 26, 27], "feel": [13, 15, 16, 20, 28], "callback": [13, 14, 26, 28], "list_of_metr": 13, "plot_curv": 13, "hidden": [13, 14, 15, 16, 17, 19, 22, 28, 34], "global": [19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 37], "__version__": 18, "tf_cpp_min_log_level": [27, 28], "to_categor": [14, 15, 26, 27], "sequenti": [15, 20, 26, 27, 28], "input_shap": [14, 15, 26, 27, 28], "unit": [14, 15, 17, 19, 20, 21, 26, 31], "relu": [14, 15, 16, 17, 27, 28], "among": [23, 30, 37], "inclus": 27, "softmax": [14, 15, 26, 27, 28], "construct": [18, 21, 23, 25, 31], "adam": [14, 28], "rmsprop": [14, 15, 17, 26, 27, 28], "categorical_crossentropi": [14, 15, 26, 27], "x_val": [14, 15, 26, 28], "y_val": [14, 15, 26, 28], "validation_data": [14, 15, 26, 27, 28], "val_accuraci": [14, 15, 26, 28], "val_loss": [14, 15, 26, 27, 28], "devic": [14, 15, 20, 26, 27], "appl": [14, 15, 20, 26, 27], "m1": [14, 15, 20, 24, 26, 27], "pro": [14, 15, 20, 26, 27], "miniforge3": [18, 31], "optimizer_v2": [], "105": 28, "deprec": [14, 15, 18, 25], "super": [], "kwarg": [14, 25, 27, 29, 37], "21780921518802643": [], "9358000159263611": [], "hunch": [], "ad": [14, 15, 16, 19, 22, 24, 25, 26, 27, 28, 34, 35, 36, 37, 41, 43], "pretti": [], "800": [19, 22], "9571000337600708": [], "wa": [15, 17, 18, 27, 28, 36, 37, 38], "keras_tun": 14, "kt": 14, "build_model": [14, 15, 26], "hp": [14, 22, 26, 37], "hp_unit": 14, "min_valu": [14, 26], "max_valu": [14, 26], "hp_units2": [], "units2": [], "hp_dropout": [], "tuner": [14, 26], "max_trial": [14, 26], "project_nam": 14, "mnist_tun": [], "best_hp": 14, "get_best_hyperparamet": 14, "num_trial": 14, "faster": [14, 16, 20, 23, 24, 26, 27, 30, 39, 44], "divis": [14, 26], "leakag": [14, 19], "float32": [14, 15, 20, 26, 27, 28, 31], "hold": [14, 26, 28, 30], "account": [14, 22, 28, 38], "concern": 14, "xf_train": [14, 26], "yf_train": [14, 26], "50000": 14, "fulli": [14, 20, 26], "connect": [14, 19, 20, 25, 26, 27, 28], "kernel_initi": [14, 26], "kernel_regular": [14, 15, 26], "use_bia": 14, "glorot_uniform": 14, "bias_initi": 14, "bias_regular": 14, "activity_regular": 14, "kernel_constraint": 14, "bias_constraint": 14, "512": [14, 15, 17, 23, 26, 27, 28, 36, 39, 42], "2022": [14, 15, 18], "21": [1, 14, 20, 24, 25, 28, 30], "042917": 14, "common_runtim": [14, 15, 20, 26], "pluggable_devic": [14, 15, 20, 26], "pluggable_device_factori": [14, 15, 20, 26], "cc": [14, 15, 20, 26], "305": [14, 15], "numa": [14, 15, 20, 26], "platform": [14, 15, 20, 26], "043031": 14, "271": [14, 15, 17], "job": [14, 15, 20, 26, 36], "localhost": [14, 15, 20, 26], "replica": [14, 15, 20, 26], "mb": [14, 15, 20, 26, 31], "memori": [14, 15, 20, 21, 26, 27, 28, 30, 31, 33], "physic": [14, 15, 19, 20, 26], "pluggabledevic": [14, 15, 20, 26], "pci": [14, 15, 20, 26], "bu": [14, 15, 20, 26], "undefin": [14, 15, 20, 26], "inputlay": [14, 27], "negative_slop": 14, "leaki": [14, 26], "wise": [14, 20, 23, 25, 27], "401920": [14, 26], "262656": [14, 26], "5130": [14, 26], "sequential_3": [14, 27], "_________________________________________________________________": [14, 15, 26, 27, 28], "dense_6": 14, "dense_7": 14, "dense_8": 14, "669": [14, 26], "706": [14, 26, 28], "trainabl": [14, 15, 26, 27, 28], "entropi": [14, 15, 17, 24, 26, 28, 32], "crossentropi": [14, 26], "monitor": [14, 26], "dure": [14, 18, 19, 22, 23, 24, 25, 26, 27, 36, 37], "shorthand": [14, 26, 30], "categoricalcrossentropi": [14, 26], "label_smooth": [14, 26], "momentum": [14, 20], "noisi": [14, 22, 24, 26, 27, 33, 42], "recreat": 14, "scratch": [14, 23, 26, 27, 37], "wrap": [14, 22, 26, 27], "he_norm": [14, 26], "314333": 14, "profile_util": [14, 15, 26], "cpu_util": [14, 15, 26], "128": [14, 15, 16, 23, 24, 26, 27, 28, 39], "fail": [14, 15, 19, 26, 41], "cpu": [14, 15, 16, 26], "frequenc": [14, 15, 23, 26, 27, 28, 32], "hz": [14, 15, 26], "463989": 14, "grappler": [14, 15, 26], "custom_graph_optimizer_registri": [14, 15, 26], "plugin": [14, 15, 26], "device_typ": [14, 15, 26], "enabl": [14, 15, 16, 26, 34], "782": [14, 28, 39], "6s": 14, "8m": [14, 15], "5242": 14, "8115": 14, "3855": 14, "8602": 14, "3558": 14, "8713": 14, "to_json": 14, "class_nam": [14, 31, 32], "config": 14, "sequential_4": 14, "batch_input_shap": 14, "null": 14, "rag": 14, "dense_9_input": 14, "dense_9": 14, "henorm": 14, "dense_10": 14, "dense_11": 14, "glorotuniform": 14, "keras_vers": 14, "304700": 14, "51": [14, 28, 30], "524872": 14, "5196696519851685": 14, "4197826385498047": 14, "3965308368206024": 14, "8141800761222839": 14, "8545200824737549": 14, "8647000789642334": 14, "444828063249588": 14, "45543763041496277": 14, "4412410259246826": 14, "8461000323295593": 14, "8510000109672546": 14, "8672000169754028": 14, "test_loss": [14, 26], "test_acc": [14, 26], "sample_id": [14, 26], "set_printopt": [14, 26], "614863": 14, "71400239e": 14, "29640335e": 14, "66167177e": 14, "84634490e": 14, "18418960e": 14, "10093026e": 14, "03666283e": 14, "59356839e": 14, "06": [14, 36, 37], "37293778e": 14, "99990344e": 14, "313": 14, "2s": [14, 15, 28], "6m": 14, "4312": 14, "8653": 14, "8653000593185425": 14, "until": [14, 15, 22, 23, 24, 25, 26, 27, 28, 29, 44], "extern": [14, 19], "tensorboard": [14, 15], "commerci": [14, 18], "weightsandbias": 14, "trainingplot": [14, 26, 28], "begin": [14, 17, 20, 21, 22, 24, 25, 26, 28], "on_train_begin": [14, 26, 28], "val_acc": [14, 26, 27, 28], "max_acc": [14, 26, 28], "on_epoch_end": [14, 26, 28], "val": [14, 22, 26, 28], "train_loss": [14, 26, 28], "train_acc": [14, 26, 28], "plot_loss": [14, 20, 26, 28, 37], "longer": [14, 18, 20, 23, 26, 28, 37], "bumpi": [14, 26], "earlystop": [14, 26], "patienc": [14, 26], "memor": 14, "256": [14, 23, 26, 27, 38, 39], "across": [14, 26, 27, 28], "badg": [14, 26], "exponenti": [14, 19, 20, 23, 25, 26, 31, 38, 41], "prone": [14, 26], "vanish": [14, 26, 27, 28], "explod": [14, 24, 26], "batchnorm": [14, 26], "debat": 14, "deepest": 14, "likewis": 14, "paper": [14, 23, 28, 37], "topic": 14, "associ": [14, 20, 24, 37], "hyperband": [14, 26, 44], "bayesianoptim": [14, 26, 37], "0001": [14, 35, 37, 38], "hp_learning_r": 14, "choic": [14, 16, 17, 19, 21, 22, 25, 26, 33, 37], "lab7": 14, "info": [14, 18, 25, 26], "reload": [14, 27], "oracl": 14, "json": [14, 15], "tuner0": 14, "uncom": [14, 16, 27], "kerasclassifi": [14, 15, 26], "wrapper": [14, 15, 24, 26], "scikit_learn": [14, 15, 26], "var_activ": 14, "var_optim": 14, "_activ": 14, "tanh": [14, 17], "selu": 14, "_optim": 14, "_batch_siz": 14, "build_fn": [14, 15], "0t": [14, 15], "5d8ttqzd773fy0wq3h5db0xr0000gn": [14, 15], "ipykernel_63314": 14, "5830362": 14, "24": [14, 17, 18, 20, 26, 27, 31, 37, 44], "deprecationwarn": [14, 15, 43], "adriangb": [14, 15], "scikera": [14, 15], "rscv": 14, "rscv_result": 14, "playground": [14, 15], "movi": [15, 28], "price": [15, 32], "integr": [15, 25, 30], "imdb": [15, 17, 28], "frequent": [15, 17, 21, 22, 24, 28, 31, 33], "retain": [15, 19], "raw": [15, 19, 25, 42], "token": [15, 28], "train_data": [15, 17, 28], "train_label": [15, 17, 27, 28], "test_data": [15, 17, 28], "test_label": [15, 17, 28], "load_data": [15, 17, 22, 27, 28], "num_word": [15, 17, 28], "word_index": [15, 17, 28], "get_word_index": [15, 17, 28], "reverse_word_index": [15, 17, 28], "43": [15, 28], "530": 15, "973": 15, "1622": 15, "1385": 15, "film": [15, 17, 28], "brilliant": [15, 17, 28], "cast": [15, 17, 28, 37], "sceneri": [15, 17, 28], "stori": [15, 17, 28], "sequenc": [15, 21, 24, 30], "idf": [15, 28], "14th": 15, "vectorize_sequ": [15, 28], "dimens": [15, 19, 20, 21, 24, 25, 26, 27, 28, 30, 36, 37], "1s": [15, 28], "binary_crossentropi": [15, 27, 28], "951585": 15, "951739": 15, "binary_accuraci": 15, "track": [15, 19, 23, 26, 37], "partial_x_train": [15, 26, 28], "partial_y_train": [15, 26, 28], "782619": 15, "945021": 15, "41m": 15, "5020": 15, "7869": 15, "3738": 15, "8746": 15, "eta": [15, 20, 23, 26, 27], "3289": 15, "9082": 15, "44": [15, 18], "153087": 15, "15m": 15, "2986": 15, "9037": 15, "3359": 15, "8650": 15, "13m": 15, "2214": 15, "9287": 15, "2797": 15, "8905": 15, "14m": 15, "1777": 15, "9451": 15, "2818": 15, "8880": 15, "1419": 15, "9561": 15, "2808": 15, "8868": 15, "1189": 15, "9645": 15, "2959": 15, "8857": 15, "0949": 15, "9735": 15, "3122": 15, "8812": 15, "0790": 15, "9782": 15, "4285": 15, "8579": 15, "0689": 15, "9810": 15, "3521": 15, "8793": 15, "0525": 15, "9881": 15, "3976": 15, "8747": 15, "0451": 15, "9897": 15, "4112": 15, "8725": 15, "0344": 15, "9934": 15, "4426": 15, "8699": 15, "0284": 15, "9940": 15, "4725": 15, "8716": 15, "0224": 15, "9965": 15, "5169": 15, "8676": 15, "0175": 15, "9972": 15, "5244": 15, "8726": 15, "0126": 15, "9986": 15, "5545": 15, "8710": 15, "12m": 15, "0110": 15, "9987": 15, "5868": 15, "8687": 15, "0104": 15, "9981": 15, "6241": 15, "8672": 15, "0046": 15, "9999": 15, "6510": 15, "8658": 15, "0059": 15, "9993": 15, "6874": 15, "8656": 15, "due": [15, 22], "nreview": [15, 28], "294314": 15, "br": [15, 28], "rest": [15, 17, 23, 24, 26, 28], "terribl": [15, 28], "flat": [15, 26, 28, 30, 37], "michael": [15, 28], "madison": [15, 28], "hi": [15, 28], "plate": [15, 28], "he": [15, 26, 28], "wasn": [15, 28], "fan": [15, 26, 28], "00635761": 15, "1996": [15, 28], "watch": [15, 28], "never": [15, 19, 20, 22, 24, 26, 28, 37, 39, 44], "satisfact": [15, 28], "god": [15, 28], "ten": [15, 28], "ago": [15, 28], "dialogu": [15, 28], "novel": [15, 28], "willem": [15, 28], "strang": [15, 28], "voic": [15, 28], "spell": [15, 28], "night": [15, 28], "sai": [15, 20, 24, 28, 29, 30, 37], "bore": [15, 28], "music": [15, 28], "me": [15, 28], "anoth": [15, 16, 17, 20, 21, 23, 24, 25, 26, 27, 28, 30, 32, 35, 36, 39, 43], "heart": [15, 28], "anyon": [15, 28], "thank": [15, 28], "80061406": 15, "reuter": [15, 17], "offset": [15, 17, 25], "reserv": 15, "pad": [15, 16, 19, 20, 21, 23, 24, 25, 28, 37], "unknown": [15, 19, 24, 28, 37], "decoded_newswir": 15, "wire": [15, 17], "storag": [15, 24], "googleapi": 15, "npz": 15, "2113536": 15, "2110848": 15, "4s": 15, "2u": 15, "2121728": 15, "reuters_word_index": 15, "557056": 15, "550378": 15, "0u": 15, "565248": 15, "said": [15, 17], "decemb": [15, 17], "acquisit": [15, 17, 37], "co": [15, 17, 19, 20, 21, 28, 30, 37], "earn": [15, 17], "share": [15, 17, 19, 21, 28], "1987": [15, 17], "dlr": [15, 17], "ct": [15, 17], "1986": [15, 17], "compani": [15, 17], "pretax": [15, 17], "nine": [15, 17], "mln": [15, 17], "six": [15, 17, 37], "rental": [15, 17], "oper": [15, 17, 27, 28, 29], "revenu": [15, 17], "cash": [15, 17], "flow": [15, 17, 27], "447": [15, 39], "207": 15, "270": [15, 19], "3095": 15, "111": [15, 22, 23, 32, 43], "369": 15, "186": 15, "one_hot_train_label": 15, "one_hot_test_label": 15, "history2": 15, "291793": 15, "17m": 15, "7551": 15, "5128": 15, "7982": 15, "6560": 15, "5043": 15, "6980": 15, "201983": 15, "4631": 15, "7048": 15, "3179": 15, "7110": 15, "11m": 15, "0819": 15, "7645": 15, "1319": 15, "7540": 15, "8560": 15, "8092": 15, "0311": 15, "7890": 15, "6840": 15, "8530": 15, "9559": 15, "7980": 15, "5503": 15, "8887": 15, "9247": 15, "8000": 15, "4419": 15, "9107": 15, "9400": 15, "7940": 15, "3577": 15, "9275": 15, "9076": 15, "8100": 15, "3002": 15, "9374": 15, "8816": 15, "8230": 15, "2513": 15, "9445": 15, "9024": 15, "8180": 15, "2127": 15, "9481": 15, "9468": 15, "1888": 15, "9501": 15, "9425": 15, "8130": 15, "1700": [15, 27], "9543": 15, "9748": 15, "8080": 15, "1521": 15, "9540": 15, "9547": 15, "8110": 15, "1447": 15, "9819": 15, "1320": 15, "9574": 15, "9855": 15, "8150": 15, "1278": [15, 20], "9560": 15, "0335": 15, "8170": 15, "1223": 15, "0732": 15, "8030": 15, "1167": 15, "9575": 15, "0764": 15, "1115": 15, "9592": 15, "1050": 15, "8040": 15, "3110": 15, "7832": 15, "506": [15, 20], "sale": 15, "neighborhood": 15, "boston_h": 15, "train_target": 15, "test_target": 15, "57344": 15, "57026": 15, "7u": 15, "65536": 15, "6u": 15, "scalar": [15, 20], "penalti": [15, 20, 36], "mae": 15, "ourselv": [15, 41], "futureproof": 15, "tfx": 15, "kerasregressor": 15, "standardis": [15, 35], "ipykernel_63784": 15, "292072420": 15, "concaten": [15, 19, 20, 22, 24, 25, 26], "fit_param": 15, "keras__epoch": 15, "keras__batch_s": 15, "keras__verbos": 15, "146990890": 15, "090909": 15, "676628": 15, "988794": 15, "757530": 15, "929908": 15, "757842": 15, "731411012765486": 15, "l2_model": 15, "summari": [15, 27, 41], "sequential_5": 15, "dense_15": 15, "160016": 15, "dense_16": 15, "272": [15, 20, 26], "dense_17": 15, "160": 15, "dpt_model": 15, "sequential_6": 15, "dense_18": 15, "dense_19": 15, "dropout_1": 15, "dense_20": 15, "glove": [15, 17], "max_length": [15, 28], "vocab_s": [15, 28], "vocabulari": [15, 28], "embedding_length": [15, 28], "300": [15, 17, 28, 30, 31, 38, 39], "input_length": [15, 28], "summar": [15, 28], "sequential_7": 15, "3000000": 15, "6000": 15, "dense_21": 15, "6001": 15, "006": 15, "cifar": [16, 18], "confid": [16, 19, 22, 25, 26, 33, 42], "pytorch": [16, 26], "tip": [16, 27], "quiet": [16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "3x32x32": 16, "96x96x3": 16, "41103": 16, "40926": [16, 18], "cifar_class": 16, "airplan": 16, "automobil": 16, "bird": 16, "deer": 16, "dog": [16, 27], "frog": 16, "hors": 16, "ship": 16, "truck": 16, "weird": 16, "xr": [16, 25, 32, 37], "80": [16, 18, 20, 23, 28, 32, 36, 37, 38], "convnet": [16, 18, 28], "interspers": 16, "maxpool": [16, 27], "filter": [16, 18, 22, 26, 28, 29], "ration": 16, "simplifi": [16, 19, 27], "block": [16, 22, 27, 28], "shift": [16, 27, 36], "shear": [16, 27], "flip": [16, 27], "imagedatagener": [16, 27], "retrain": [16, 17, 22, 27, 37], "someth": [16, 17, 24, 28], "41983": 16, "luck": 16, "everyon": [17, 28], "suit": [17, 28], "funni": [17, 28], "russian": [17, 28], "submarin": [17, 28], "crew": [17, 28], "actor": [17, 28], "scene": [17, 28], "french": [17, 28], "horror": [17, 28], "cinema": [17, 28], "reviv": [17, 28], "coupl": [17, 28, 31], "earli": [17, 19, 22, 23, 32], "adagrad": [17, 26], "agricultur": 17, "depart": 17, "canada": 17, "87": 17, "wheat": [17, 37], "crop": [17, 27], "tonn": 17, "1985": 17, "86": 17, "canadian": 17, "grain": 17, "export": [17, 30], "forecast": [17, 32], "72": [17, 27, 30], "shr": 17, "profit": 17, "224": [17, 27], "511": [17, 20, 28], "349": 17, "rev": 17, "258": 17, "688": [17, 27], "sensibl": 17, "bottleneck": [17, 19], "pretrain": [17, 27, 28], "om": 17, "wikipedia": [17, 22, 28], "openbla": 18, "brew": [18, 32], "pars": 18, "outdat": 18, "ok": 18, "subject": [18, 22], "budget": [18, 25], "inher": [18, 22, 25], "evolutionari": 18, "gamaclassifi": 18, "gamaregressor": 18, "max_total_tim": 18, "subprocess": 18, "progress": [18, 19], "output_directori": 18, "gama_log": 18, "record": [1, 18, 23, 24, 37], "statsmodel": 18, "_test": [18, 24], "public": [18, 30], "tm": 18, "0x2a2e21940": 18, "18004587099500413": 18, "4796": 18, "keep_analysis_log": 18, "builtin": 18, "gamareport": 18, "transform_evalu": 18, "hard": [18, 19, 20, 21, 22, 23, 24, 25, 27, 28, 39], "useless": 18, "clariti": 18, "length_cummax": 18, "relative_end": 18, "log_directori": 18, "0009": 18, "asyncea": 18, "0824": 18, "postprocess": 18, "bestfitpostprocess": 18, "1582": 18, "pid": 18, "durat": [18, 37], "t_process": 18, "parent0": 18, "parent1": 18, "r2_cummax": 18, "19593": 18, "79783": 18, "645673": 18, "000124931": 18, "000132": 18, "nystroem": 18, "nystr": 18, "lt": 18, "typeerror": [18, 29], "gt": 18, "check_cv": 18, "4aa674e3": 18, "e797": 18, "490a": 18, "b405": 18, "e125558a5f88": 18, "mut_insert": 18, "22148": 18, "818902": 18, "000092983": 18, "000101": 18, "maxabsscal": [18, 24], "dab8c779": 18, "2661": 18, "4110": 18, "acc3": 18, "fe463080337": 18, "42800": 18, "461106": 18, "000218153": 18, "000224": 18, "selectfw": 18, "sele": 18, "27903398": 18, "5556": 18, "469f": 18, "9c6c": 18, "e23f8593484d": 18, "42865": 18, "538670": 18, "000098944": 18, "000103": 18, "018364fe": 18, "f35c": 18, "4c82": 18, "a383": 18, "bdccbcf7ce43": 18, "43600": 18, "36": [18, 25, 27, 28, 29, 30], "388697": 18, "000099182": 18, "gradientboosti": 18, "ec5cc934": 18, "0d3b": 18, "4fc8": 18, "95ab": 18, "2d3a17f2b338": 18, "mut_replace_termin": 18, "th": [18, 20, 21, 22, 23, 24, 32, 37], "took": [18, 38], "tie": 18, "ascend": [18, 30], "drop_dupl": [18, 30], "711950": 18, "000200987": 18, "000197": 18, "maxab": 18, "29319": 18, "406984": 18, "000093937": 18, "000100": [18, 37], "b664ffba": 18, "b8e4": 18, "4989": 18, "b205": 18, "0717fbcb3995": 18, "29311": 18, "398273": 18, "000107050": 18, "000112": 18, "extratreesregressor": 18, "fastica": 18, "f5292317": 18, "1ea0": 18, "42a9": 18, "8ee3": 18, "505328a6bd9c": 18, "748849": 18, "000212908": 18, "000219": 18, "decisiontreeregressor": [18, 23, 24, 32], "d4670a36": 18, "d05a": 18, "445d": 18, "9d17": 18, "18dd92f205b2": 18, "axessubplot": 18, "break": [18, 20, 23, 24, 26, 27, 44], "onc": [18, 21, 22, 26, 27, 37], "x_sub": [18, 27], "y_sub": [18, 27], "gama_log2": 18, "init": 18, "regularize_length": 18, "max_pipeline_length": 18, "max_eval_tim": 18, "max_memory_mb": 18, "post_process": 18, "0864": 18, "ea": 18, "popul": [18, 37], "downsampl": [18, 19, 27], "constraint": [18, 20, 23], "gain": [18, 23, 24, 32, 38], "configur": [18, 22, 25, 34, 35, 38, 41, 44], "post_processing_method": 18, "ensemblepostprocess": 18, "automl_with_ensembl": 18, "gama_log3": 18, "independ": [18, 19, 22, 24, 25, 28, 31, 44], "might": [18, 25, 37], "post": [18, 22, 27, 32, 34], "hoc": 18, "switch": [18, 20, 35], "log_loss": 18, "_evaluation_librari": 18, "n_best": 18, "best_pipelin": 18, "benefit": [18, 19, 20, 23, 24, 37], "vote": [18, 20, 23, 33], "caruana": 18, "2004": 18, "scenario": [18, 37], "experienc": 18, "assig": 18, "awar": 18, "halt": 18, "tabular": [18, 28, 30], "wildli": 18, "architectur": [18, 19, 27], "autokera": 18, "texa": 18, "autogluon": 18, "amazon": 18, "cloud": 18, "eager": 18, "own": [18, 19, 23, 27, 30, 37], "system": [18, 30], "requirements_colab": [19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "fig_scal": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "print_config": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "netflix": 19, "translat": [19, 27, 28, 36], "speech": [19, 24], "siri": 19, "alexa": 19, "game": 19, "alphago": 19, "drive": [19, 23, 27, 28], "person": [19, 22], "medicin": 19, "genet": [19, 31], "astronomi": 19, "chemistri": 19, "neurolog": 19, "mathcal": [19, 20, 21, 22, 23, 25, 26, 28], "f_": [19, 20, 22, 23, 25], "underset": [19, 20, 22, 23, 32], "operatornam": [19, 20, 22, 23, 32], "form": [19, 20, 21, 24, 25, 26], "bias": [19, 22, 24, 26, 28, 36], "mimick": 19, "human": [19, 25, 26], "brain": 19, "logic": 19, "assupt": 19, "sim": [19, 25, 28], "mu": [19, 20, 21, 23, 24, 25], "sigma": [19, 20, 24, 25, 26, 27, 28, 37, 42], "transfer": [19, 25], "f_1": 19, "f_2": 19, "f_3": 19, "longrightarrow": 19, "breiman": 19, "cultur": 19, "natur": [19, 24, 26, 27], "phenomena": [19, 22], "autom": [19, 22, 24], "partial": [19, 20, 23, 26, 27], "orient": 19, "theori": [19, 26], "star": [19, 26], "galaxi": 19, "sky": 19, "meaning": [19, 22], "anomal": 19, "semi": [19, 21, 24], "unlabel": 19, "agent": 19, "desir": [19, 25], "outcom": [19, 20, 22], "subtyp": 19, "discret": [19, 20, 23, 24, 30, 37], "unord": [19, 20, 29], "spam": [19, 22], "letter": [19, 20, 28, 38], "recognit": 19, "make_moon": [19, 23, 26, 32], "ipywidget": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "widget": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "interact_manu": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "x1": [19, 20, 24, 25], "y1": 19, "plot_classifi": [19, 21, 23, 25, 32], "plot_2d_separ": [19, 20, 21, 22, 23, 26, 33], "cm2": [19, 20, 21, 22, 24, 33], "scores_imag": [19, 22], "plot_2d_scor": [19, 22], "rebl": [19, 22], "discrete_scatt": [19, 20, 21, 22, 23, 32, 33], "labelpad": [19, 20, 21, 23, 25, 37], "cbar": [19, 22], "set_label": [19, 44], "set_alpha": [19, 22], "draw_al": [19, 22], "pictur": [19, 27], "interv": [19, 20, 24, 25, 37, 42], "predictor": [19, 27, 35, 38], "make_wav": [19, 20, 21, 24, 33], "plot_help": 19, "bayesianridg": [19, 24, 25], "atleast_2d": [19, 25], "1e2": [19, 22, 25, 42], "plot_regress": [19, 25], "9600": [19, 25], "fc": [19, 25], "ec": [19, 25, 26], "organ": 19, "subgroup": [19, 22], "dissimilar": 19, "distinguish": [19, 28], "recent": [19, 28, 36], "uninstal": 19, "threadpoolctl": 19, "nr_sampl": [19, 25], "plot_clust": 19, "cluster_std": [19, 22, 24, 33], "n_cluster": 19, "fit_predict": 19, "difficult": [19, 37], "compress": [19, 22, 23, 26, 30], "contrari": [19, 28], "make_swiss_rol": 19, "locally_linear_embed": 19, "mpl_toolkit": [19, 20, 21, 25, 37], "mplot3d": [19, 20, 21, 25, 37], "axes3d": [19, 21, 25], "123": [19, 23, 30], "figaspect": [19, 25], "ax1": [19, 24, 25, 27], "add_subplot": [19, 22, 25, 27, 37], "3d": [19, 20, 21, 25, 26, 28, 37, 40], "xaxi": [19, 24, 25, 37], "pane": 19, "yaxi": [19, 22, 24, 25, 37], "zaxi": [19, 37], "rainbow": 19, "swiss": 19, "roll": [19, 26], "ax2": [19, 24, 25, 27, 35, 36, 38], "scikit_pca": 19, "x_spca": 19, "ax3": 19, "x_lle": 19, "err": [19, 22, 28], "chess": 19, "reward": 19, "polici": 19, "formal": 19, "languag": 19, "hypothesi": [19, 25], "annot": [19, 20, 21], "l": [19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 32, 36, 41], "relax": [19, 20], "refin": [19, 26], "optima": 19, "flexibl": [19, 20, 22, 23, 28], "theta_i": 19, "receiv": 19, "emit": 19, "neuron": [19, 20, 26], "imagin": [19, 20, 26, 28, 37], "mini": 19, "theta_0": 19, "theta_1": 19, "surfac": [19, 20, 26, 37, 44], "frac": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 37, 41], "peculiar": 19, "simpler": [19, 22, 24, 30, 32, 37], "overcom": 19, "true_fun": 19, "pi": [19, 20, 21, 25, 27, 30, 31, 41, 43], "rand": [19, 23, 24, 32, 41], "randn": [19, 20, 22, 24, 25, 30], "x3_test": 19, "scores_x": 19, "scores_i": 19, "show_output": 19, "plot_poli": 19, "polynomial_featur": 19, "include_bia": [19, 21, 24], "linear_regress": 19, "crossvalid": 19, "nmse": 19, "intslid": 19, "feedback": [19, 22], "xkcd": [19, 25], "plot_threefold_split": [19, 22], "miniz": [19, 22], "diagnos": 19, "accid": 19, "necessari": [19, 23, 24, 27, 31, 36, 37], "andrew": [19, 22], "ng": [19, 22], "noth": [19, 25, 26, 29], "domain": [19, 20], "leaf": [19, 23, 24, 32], "unstructur": 19, "increasingli": [19, 27, 36, 42], "intuit": [19, 20, 21, 23], "hypercub": 19, "peter": 19, "norvig": 19, "corner_count": 19, "99": [19, 22, 26, 27, 31], "ds": 19, "proport": [19, 22], "bless": 19, "live": [19, 22, 28], "parametr": [19, 33], "suffici": [19, 23, 27, 36, 41], "minima": [19, 20, 24, 26, 41], "huge": [19, 21, 22, 24], "million": 19, "scalabl": [19, 20, 25], "upcom": 19, "rare": [19, 20], "bring": [19, 24, 26, 31], "imbal": [19, 24, 36], "uninterest": 19, "No": [19, 20, 22, 27, 28], "workflow": [19, 31], "drift": [19, 22, 23], "gather": 19, "deploy": 19, "denot": 20, "ital": 20, "bold": [20, 32], "x_i": [20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 41], "x_0": [20, 21, 22, 25], "uniqu": [20, 22, 23, 24, 28, 37], "caligraph": 20, "capit": [20, 28], "bmatrix": [20, 21, 25, 26], "textbf": [20, 21, 25], "basi": [20, 21, 24, 25], "euclidean": [20, 24, 28, 31, 33, 41], "tensor": [20, 27, 28], "rank": [20, 24, 28, 30, 31], "t_": 20, "4d": [20, 26, 27, 30], "height": [20, 23, 26, 27, 31], "channel": [20, 26, 27], "sum_": [20, 21, 22, 23, 26, 28, 32], "x_1": [20, 21, 22, 24, 25, 26], "x_p": [20, 21, 22, 24, 26], "quad": [20, 21, 25, 26, 32], "prod_": [20, 25], "cdot": [20, 21, 22, 23, 24, 25, 28, 33, 41], "z_0": [20, 26], "z_1": 20, "z_p": 20, "w_i": [20, 21, 22, 23, 24, 25, 26, 28], "w_0": [20, 21, 22, 25, 26], "w_1": [20, 21, 22, 25, 26], "w_p": [20, 21, 22, 26], "geq": [20, 21], "epsilon": [20, 25, 26], "consum": 20, "largest": [20, 23, 28], "argmax": [20, 23, 32], "deriv": [20, 23, 25, 26], "differenti": [20, 23, 26, 30], "rightarrow": [20, 21], "infinit": [20, 25], "nabla": [20, 26], "2x_0": 20, "3x_1": 20, "x_2": [20, 21, 24, 25, 26], "6x_1": 20, "2x_1": 20, "respect": [20, 30, 32], "x0": [20, 21, 23, 25], "g_f": 20, "g_dfx0": 20, "g_dfx1": 20, "plot_gradi": 20, "240": 20, "plot_surfac": [20, 21, 25], "rstride": [20, 21], "cstride": [20, 21], "winter": [20, 24], "i0": 20, "i1": 20, "iz": 20, "82": [20, 24, 39], "scatter3d": 20, "i_0": 20, "i_1": 20, "plot3d": 20, "linewidth": [20, 21, 22, 23, 24, 25, 26, 31, 32, 37], "silver": 20, "set_zlim": [20, 37], "intersect": 20, "dx0": 20, "get_zaxi": 20, "set_tick": 20, "view_init": 20, "box": [20, 22, 23, 24, 25, 34, 37], "get_posit": [20, 23], "set_posit": [20, 23, 24], "y0": [20, 23], "f_x": 20, "mathbb": [20, 21, 25], "dx": 20, "mass": 20, "pmf": 20, "mu_x": 20, "pr": [20, 22, 24], "w_": [20, 23, 24, 26, 28], "augment": 20, "poisson": 20, "tweedi": 20, "intercept": [20, 21], "hat": [20, 21, 22, 23, 26, 32], "w_2": [20, 21, 25, 26], "xw": 20, "yw": 20, "xw_train": 20, "xw_test": 20, "yw_train": 20, "yw_test": 20, "393906": 20, "031804": 20, "sse": 20, "residu": [20, 22, 23, 27, 28], "_i": [20, 22, 23, 24, 25, 28, 41], "y_i": [20, 21, 22, 23, 25, 31, 32], "y_n": [20, 22], "_n": [20, 25], "x_n": [20, 21, 22, 25], "convex": [20, 33], "front": 20, "quadrat": [20, 21, 24, 25, 32], "2n": [20, 21], "steep": 20, "inclin": 20, "declin": 20, "wrt": [20, 27], "downhil": [20, 26], "diverg": [20, 26, 32], "decai": [20, 24], "ks": [20, 26], "invers": [20, 22, 25, 26, 28], "math": [20, 21, 30, 37], "l_fx": 20, "l_dfx0": 20, "plot_learning_r": 20, "learn_rat": 20, "exp_decai": 20, "101": [20, 26], "w_current": 20, "learn_rate_curr": 20, "fw": 20, "fl": 20, "exp": [20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 41], "ls": [20, 23, 25, 32], "bo": [20, 30, 37], "tensorflow_addon": [20, 26], "tfa": [20, 26], "625": [20, 26, 29], "lr_schedul": [20, 26], "schedul": 20, "exponentialdecai": [20, 26], "decay_step": [20, 26], "decay_r": [20, 26], "sgd_decai": [20, 26], "opt_nam": [20, 26], "tab10": [20, 24, 26], "all_path": [20, 26], "opt": [20, 26], "x_histori": [20, 26], "y_histori": [20, 26], "loss_prev": [20, 26], "max_step": [20, 26], "gradienttap": [20, 26], "grad": [20, 26, 27], "apply_gradi": [20, 26], "expand_dim": [20, 26, 27, 36], "lognorm": [20, 24, 26], "x_init": [20, 26], "y_init": [20, 26], "z_prev": [20, 26], "dz_dx": [20, 26], "dz_dy": [20, 26], "number_of_point": [20, 26], "minima_": [20, 26], "x_point": [20, 26], "y_point": [20, 26], "x_mesh": [20, 26], "y_mesh": [20, 26], "xp": [20, 22, 23, 26], "yp": [20, 22, 23, 26], "plot_optim": [20, 26, 36], "jet": [20, 24, 25, 26], "quiver": [20, 26], "scale_unit": [20, 26], "xy": [20, 25, 26], "angl": [20, 21, 26, 27, 31, 37], "prop": [20, 21, 22, 24, 26, 37, 41], "decim": [20, 26, 29], "all_lr_path": [20, 26], "lr_rang": [20, 26], "005": [20, 26], "nesterov": [20, 26], "compat": [20, 23, 24, 26, 27], "v1": [20, 26, 27], "get_vari": [20, 26], "plot_learning_rate_optim": [20, 26], "lrate": [20, 26], "plot_lr": [20, 26], "04": [20, 22, 24, 25, 26, 30, 37], "compare_optim": [20, 26], "optimizer1": [20, 26], "optimizer2": [20, 26], "walk": 20, "nearbi": [20, 21, 25], "karpathi": 20, "l_i": 20, "variant": [20, 24, 26], "sag": 20, "saga": 20, "i_": 20, "increment": [20, 23, 25], "v_i": [20, 28], "sgdregressor": 20, "squared_loss": 20, "x_b": 20, "y_b": 20, "load_extended_boston": 20, "x_b_train": 20, "x_b_test": 20, "y_b_train": 20, "y_b_test": 20, "412": 20, "243": 20, "131": [20, 27], "899": 20, "004": [20, 21], "716": 20, "54": [20, 24], "704": 20, "535": 20, "582": 20, "37": [20, 21, 23, 27, 29, 30], "062": 20, "828": 20, "058": 20, "525": [20, 39], "203": 20, "2980": 20, "781": 20, "843": 20, "187": [20, 28], "961": 20, "264": [20, 21, 27], "616": 20, "2239": 20, "869": 20, "222": 20, "825": 20, "182": 20, "996": 20, "398": 20, "389": 20, "575": 20, "013": [20, 25], "66": [20, 22, 41], "914": [20, 39], "812": [20, 27], "647": 20, "446": 20, "68": [20, 28], "508": 20, "375": [20, 28], "813": 20, "934563673643297": [], "61": [20, 23, 25, 30], "explicitli": [20, 21, 30], "restrict": 20, "strength": 20, "choleski": [20, 25], "conjug": [20, 28], "cg": 20, "414": [20, 36], "557": [20, 28], "465": 20, "127": 20, "079": [20, 27], "332": 20, "941": 20, "059": 20, "584": 20, "051": [20, 28], "012": [20, 37], "334": 20, "849": 20, "745": 20, "431": [20, 28], "63": [20, 24], "405": 20, "045": [20, 28], "746": 20, "467": 20, "692": 20, "622": 20, "092": 20, "195": 20, "275": 20, "671": 20, "098": 20, "634": 20, "277": 20, "913": 20, "395": 20, "792": 20, "390525958610134": [], "__future__": [20, 27, 32], "print_funct": [20, 27, 32], "plot_ridg": 20, "magnitud": [20, 27], "hline": 20, "unimport": 20, "plot_ridge_n_sampl": 20, "Will": [20, 23, 25, 30], "analyz": [20, 22], "happen": [20, 28, 32, 35, 44], "plot_lasso": 20, "00001": 20, "robin": [20, 24], "slowli": 20, "subgradi": 20, "partial_": 20, "subdifferenti": 20, "rho_i": 20, "z_i": [20, 26], "plot_rho": 20, "rho": [20, 24], "c_fx": 20, "fx": 20, "c_fl2": 20, "c_fl1": 20, "rp": 20, "lp": 20, "opt_f": 20, "opt_r": 20, "opt_l": 20, "diamond": 20, "plot_loss_interpret": 20, "1001": 20, "elastic_net": [20, 35], "elastic_net_contour": 20, "darkorang": [20, 22, 23, 32, 41], "l2_contour": 20, "l1_contour": 20, "navi": [20, 22, 41], "spine": [20, 22, 24], "set_color": [20, 24], "sqrt": [20, 21, 22, 23, 25, 26, 27, 28, 30, 31, 32, 39], "cp": 20, "trade": [20, 21, 22, 24, 25, 37, 38, 44], "maintain": [20, 22, 24, 27], "pick": [20, 23, 24, 27, 31, 37, 40], "huber": 20, "past": [20, 28], "insensit": [20, 22], "xf": 20, "yf": 20, "make_forg": [20, 33], "po": [20, 22, 25], "sgdclassifi": 20, "modified_hub": 20, "textrm": [20, 28], "x_1w_1": 20, "w1": [20, 25], "w0": 20, "plot_logreg": 20, "axvlin": [20, 36, 39], "ymin": [20, 25, 31], "ymax": [20, 25, 31], "lr_clf": 20, "sigmoid2d": 20, "w2": [20, 25], "plot_logistic_fit": 20, "360": 20, "xz": 20, "yz": 20, "plot_wirefram": 20, "bug": [20, 25, 34, 37], "l_": [20, 22, 23], "h": [20, 21, 24, 26, 28], "p_n": 20, "q_n": 20, "p_": [20, 22, 23], "q_": [20, 22, 24], "surpris": 20, "cross_entropi": 20, "yhat": 20, "thereof": [20, 26], "saddlepoint": 20, "liblinear": 20, "newton": 20, "rhapson": 20, "hessian": 20, "x_j": [20, 21, 26, 28, 32, 41], "quasi": 20, "broyden": 20, "fletcher": 20, "goldfarb": 20, "shanno": 20, "lbfg": [20, 26], "tri": [20, 23], "c_log": 20, "breast": 20, "spam_data": 20, "banknot": 20, "authent": 20, "x_c": 20, "y_c": [20, 22], "x_c_train": 20, "x_c_test": 20, "y_c_train": 20, "y_c_test": 20, "far": [20, 28, 32, 36, 41], "awai": [20, 28, 41], "sum_1": 20, "sum_i": [20, 22, 24, 31], "sx": 20, "r_": [20, 22, 23, 24], "s_clf": 20, "plot_svc_fit": 20, "rotationx": 20, "rotationi": 20, "zz": [20, 21, 23], "yy_down": 20, "yy_up": 20, "rescal": [20, 24, 27, 31], "set_axis_off": [20, 23, 32], "dist": [20, 37, 41], "foral": [20, 21], "satifi": 20, "lagrangian": 20, "a_i": [20, 21, 26], "reflect": [20, 22, 37], "pm1": 20, "formul": [20, 21], "a_j": [20, 21], "y_j": [20, 21, 26], "smo": 20, "plot_linear_svm": 20, "grai": [20, 27, 36], "coef": [20, 21, 28, 36], "svm_x": 20, "svm_y": 20, "svm_fig": 20, "svm_ax": 20, "side": [20, 22, 23, 27, 32, 36, 39], "sign": [20, 23], "truli": 20, "meaningless": 20, "contraint": 20, "xi_": 20, "attenu": 20, "hinge_loss": 20, "equat": [20, 22, 24, 30], "prune": [20, 23, 32], "plot_linear_svc_regular": 20, "linearsvr": 20, "dat": 20, "021": [20, 28], "241": 20, "531": 20, "951": 20, "048": [20, 28], "569": 20, "617": 20, "decent": 20, "equival": [20, 24, 25, 28], "modifi": [20, 22, 27, 30], "modified_huber_loss": 20, "xmin": [20, 25], "xmax": [20, 25], "yellowgreen": [20, 23, 32], "log2": [20, 23, 32], "darkorchid": 20, "upper": [20, 23, 24, 25, 26, 31, 32, 37, 44], "synapt": 20, "linear_svm": [20, 21], "cm3": 20, "win": [20, 22, 23], "plot_2d_classif": [20, 24, 26, 33], "amongst": 20, "td": [20, 21, 23, 24, 32], "16px": 20, "rendered_html": [20, 23, 24, 32], "cf": 20, "sq": 20, "mod": [20, 36], "egress": 20, "lassif": 20, "dim": [20, 27, 28, 30, 36], "expans": [21, 24, 25], "phi": [21, 25], "xrightarrow": [21, 22, 24], "w_3": 21, "endpoint": [21, 24, 27], "418": 21, "constantli": 21, "x_poli": [21, 24], "selector": [21, 24], "get_feature_names_out": [21, 28], "set_table_styl": [21, 24], "nbsp": [21, 24], "752759": [21, 24], "566647": 21, "426548": 21, "321088": 21, "241702": 21, "181944": 21, "136960": 21, "103098": 21, "077608": 21, "058420": 21, "704286": [21, 24], "313162": 21, "776880": 21, "482337": 21, "144": 21, "631526": 21, "391": 21, "124988": 21, "1057": 21, "713767": 21, "2860": 21, "360362": 21, "7735": 21, "232021": 21, "20918": 21, "278410": 21, "391964": [21, 24], "937563": 21, "697017": 21, "754150": 21, "225640": 21, "273901": 21, "125005": 21, "093639": 21, "617834": 21, "307312": 21, "591951": 21, "350406": 21, "207423": 21, "122784": 21, "072682": 21, "043024": 21, "025468": 21, "015076": 21, "008924": 21, "005283": 21, "063888": 21, "259634": 21, "791409": 21, "144485": 21, "448187": 21, "77": [21, 31], "288869": 21, "159": 21, "515582": 21, "329": [21, 28], "222321": 21, "679": 21, "478050": 21, "1402": 21, "366700": 21, "line_poli": [21, 24], "643": 21, "297": 21, "69": 21, "096": 21, "076": 21, "014": [21, 32], "feature1": 21, "hstack": [21, 22, 24, 25, 28, 30], "152": 21, "azim": 21, "feature2": 21, "set_zlabel": [21, 25, 37], "1200x600": 21, "linear_svm_3d": 21, "dec": [21, 22], "contourf": [21, 22, 23], "cheapli": 21, "k_": 21, "hilbert": 21, "rkh": 21, "poly_degre": [21, 25], "isinst": [21, 24], "grei": [21, 34], "200j": [21, 40], "mercer": 21, "symmetri": [21, 26], "gram": [21, 28], "ldot": [21, 26], "vdot": [21, 25, 26], "ddot": [21, 26], "lookup": 21, "suppli": [21, 37], "precomput": [21, 25], "geometr": [21, 38], "radian": [21, 37], "pairwis": 21, "linear_kernel": 21, "polynomial_kernel": 21, "rbf_kernel": [21, 41], "plot_lin_kernel": 21, "lin_kernel": [21, 41], "k_1": [21, 22], "k_2": [21, 22], "c_0": 21, "plot_poly_kernel": 21, "coef0": 21, "poly_kernel": [21, 41], "radial": 21, "taylor": 21, "plot_rbf_kernel": 21, "goe": [21, 39], "doubl": 21, "plot_rbf_kernel_valu": 21, "rfb_kernel": 21, "remain": [21, 23, 24, 26, 32, 38, 44], "plot_rbf_data": 21, "violat": [21, 24], "punish": 21, "reveal": [21, 34], "0px": 21, "025": 21, "figures": [21, 23, 25, 32], "finetun": [21, 22, 26, 27, 28], "beforehand": [21, 24, 27, 31], "inspect": [21, 24, 27, 41], "tfidf": 21, "subsequ": [21, 26], "idea": [21, 22, 24, 26], "subgraph": 21, "arbitrari": [21, 22, 27], "perceptron": [21, 26], "alpha_i": 21, "alpha_j": 21, "kernelridg": [21, 25, 41], "plot_kernel_ridg": [21, 25], "a1": [21, 32], "a2": [21, 32], "a3": 21, "kernel_ridg": [21, 25, 41], "dualperceptron": 21, "plot_kernel_ridge_svr": 21, "driven": 22, "convinc": 22, "peer": 22, "leadership": 22, "client": 22, "artifact": [22, 27, 34], "marco": 22, "ribeiro": 22, "favourit": 22, "success": [22, 36, 44], "involv": 22, "endlessli": [22, 27], "reformul": 22, "overli": [22, 33], "credit": 22, "card": 22, "technic": 22, "debt": 22, "bewar": 22, "medic": 22, "wild": 22, "bandit": [22, 31], "pretend": 22, "timeseriessplit": [22, 41], "groupshufflesplit": 22, "patch": [22, 27, 28, 37, 44], "1338": 22, "cmap_data": 22, "cmap_group": 22, "cmap_cv": 22, "coolwarm": 22, "percentiles_class": 22, "ii": [22, 28], "perc": 22, "evenli": [22, 33], "group_prior": 22, "dirichlet": 22, "multinomi": 22, "examin": [22, 39], "unstabl": [22, 23], "expens": [22, 23, 24, 25, 27, 28, 31, 37], "plot_cv_indic": 22, "show_group": 22, "get_n_split": 22, "tt": 22, "set_vis": [22, 24, 25, 27], "logistic_regress": 22, "unbalanc": 22, "conserv": 22, "strata": 22, "unbias": 22, "computation": 22, "duplic": [22, 30], "unsampl": 22, "resampl": 22, "repeatedstratifiedkfold": 22, "rectangl": 22, "n_repeat": [22, 23, 24, 32, 39], "400": [22, 23, 28, 38, 39, 44], "102": [22, 28], "rect": 22, "add_artist": [22, 26], "patient": [22, 31], "peopl": [22, 24, 25], "approv": 22, "read_csv": [22, 30, 32], "fivethirtyeight": 22, "trump": 22, "approval_toplin": 22, "adult": 22, "groupbi": [22, 30], "get_group": 22, "set_index": 22, "modeld": 22, "approve_estim": 22, "get_xlim": 22, "get_ylim": 22, "ffaaaa": 22, "presidenti": 22, "kth": 22, "max_train_s": 22, "guidelin": 22, "popular": [22, 23, 25], "theoret": [22, 23], "sound": 22, "literatur": 22, "5x2": 22, "monei": 22, "incorrect": [22, 23, 24], "tn": 22, "tp": [22, 25], "imbalanc": 22, "fraud": 22, "plot_confusion_matrix": 22, "xtickrot": 22, "fsize": 22, "matpotlib": 22, "clip": [22, 27], "set_size_inch": [22, 25, 44], "invert_yaxi": 22, "y_pred_1": 22, "y_pred_2": 22, "y_pred_3": 22, "plot_measur": 22, "clinic": 22, "trail": 22, "drug": 22, "diagnosi": 22, "seriou": 22, "diseas": 22, "omit": 22, "comparison": [22, 36], "zoo": 22, "en": 22, "wiki": [22, 30], "precision_and_recal": 22, "_c": [22, 23], "w_c": [22, 23], "aka": [22, 26], "fontnam": 22, "courier": 22, "cohen": 22, "kappa": 22, "agreement": 22, "inter": [22, 24], "rater": 22, "guess": [22, 28, 37], "p_0": [22, 32], "p_e": 22, "p_o": 22, "matthew": 22, "mcc": 22, "uncertainti": [22, 23, 25, 37], "predicion": 22, "renam": [22, 24], "ys_name": 22, "manner": [22, 36], "ys_train_nam": 22, "ys_test_nam": 22, "transpar": 22, "svc1": 22, "plot_decision_threshold": 22, "subplot_kw": [22, 23, 24, 32], "tick_right": 22, "treshold": 22, "jag": 22, "xp_train": [22, 23], "xp_test": [22, 23], "yp_train": [22, 23], "yp_test": [22, 23], "svc2": 22, "rf2": 22, "plot_pr_curv": 22, "yp_pred": 22, "achiev": [22, 37], "Of": [22, 41], "svc3": 22, "svc4": 22, "textit": 22, "plot_roc_curv": 22, "histogram": [22, 23, 30, 43], "magenta": 22, "cyan": 22, "xb": 22, "yb": 22, "xb_train": 22, "xb_test": 22, "yb_train": 22, "yb_test": 22, "svc_roc": 22, "probs_roc": 22, "plot_roc_threshold": 22, "constrained_layout": 22, "gs": [22, 36], "add_gridspec": 22, "color_fil": 22, "ps": 22, "dummyclassifi": 22, "dc": [22, 24], "most_frequ": [22, 24, 31], "dc2": 22, "irrespect": 22, "itertool": [22, 29, 37], "cycl": 22, "label_binar": 22, "onevsrestclassifi": 22, "interp": 22, "xi": [22, 23], "yi": [22, 23], "binar": 22, "xi_train": 22, "xi_test": 22, "yi_train": 22, "yi_test": 22, "y_score": 22, "all_fpr": 22, "interpol": [22, 25, 27, 42], "mean_tpr": 22, "zeros_lik": [22, 25], "deeppink": 22, "aqua": 22, "cornflowerblu": [22, 23, 26, 32], "make_classif": [22, 23], "brier_score_loss": 22, "100000": [22, 37], "train_sampl": 22, "2000": [22, 27, 30, 32, 40], "xc_train": [22, 23], "xc_test": [22, 23], "yc_train": [22, 23], "yc_test": [22, 23], "calibrate": 22, "plot_calibration_comparison": 22, "get_prob": 22, "nr_plot": [22, 24], "uncalibr": 22, "y_sort": 22, "nicer": [22, 24], "cal_prob": 22, "prob": [22, 23, 24], "0322": 22, "0795": 22, "calib": 22, "svm_platt": 22, "monoton": [22, 23], "distort": 22, "isotonicregress": 22, "iso": 22, "reweight": [22, 23], "oversampl": 22, "minor": [22, 37], "undersampl": 22, "boost": 22, "plot_decision_funct": 22, "sample_weight": [22, 23], "bone": 22, "plot_class_weight": 22, "clf_weight": 22, "class_weight": [22, 24], "clf_no_weight": 22, "underrepres": 22, "w_n": 22, "auto_exampl": 22, "plot_weighted_sampl": 22, "plot_instance_weight": 22, "sample_weight_last_ten": 22, "sample_weight_const": 22, "metacost": 22, "relabel": 22, "sum_j": 22, "p_j": 22, "adacost": 22, "cost_": 22, "ratio_": 22, "pred_i": 22, "actual_i": 22, "root": [22, 30, 31, 32, 33], "rmse": 22, "underpredict": 22, "ridge_pip": 22, "wrong": [22, 39], "inaccur": 22, "class_1": 22, "class_2": 22, "class_i": 22, "w_x": 22, "compute_bias_vari": [22, 23, 32, 39], "y_all_pr": [22, 23, 32, 39], "train_index": [22, 23, 32, 39], "test_index": [22, 23, 32, 39], "bias_sq": [22, 23, 32, 39], "stabil": 22, "inabl": 22, "harder": [22, 25, 27], "adaboostclassifi": [22, 23], "plot_bias_vari": [22, 23, 32, 39], "bias_scor": [22, 23, 32, 39], "var_scor": [22, 23, 32, 39], "err_scor": [22, 23, 32, 39], "v": [22, 23, 24, 25, 26, 28, 29, 32, 33, 36, 38, 39, 40, 41], "set_param": [22, 23, 32, 39], "plot_train_test": 22, "flowchart": 22, "combinatori": [22, 31], "explos": [22, 31], "plot_grid_search_overview": 22, "risk": [22, 23, 28], "retun": 22, "tradeoff": [22, 23], "rel": [22, 23, 32, 37, 38, 39, 40, 44], "Be": [22, 24], "unrepres": 22, "crowd": 23, "intellig": 23, "ti": 23, "soft": [23, 28, 33], "votingclassifi": 23, "decisiontreeclassifi": [23, 32], "x_lin": 23, "y_lin": 23, "x_grid": [23, 24], "y_grid": 23, "combine_vot": 23, "estimators_": [23, 37, 39], "expert": 23, "uncorrel": 23, "puriti": 23, "gini": [23, 32], "recurs": [23, 24, 32], "greedi": [23, 24, 32], "hunt": [23, 32], "adjac": [23, 28, 32, 37], "purest": 23, "plot_depth": [23, 32], "plot_tre": [23, 32], "tree_imag": [23, 32], "criteria": 23, "x_l": 23, "neq": [23, 24, 32], "log_": [23, 32], "idem": [23, 26, 30], "classification_error": [23, 32], "ent": [23, 32], "scaled_": [23, 32], "c_err": [23, 32], "lightgrai": [23, 32], "fancybox": [23, 32], "shadow": [23, 32], "axhlin": [23, 32, 36], "extrapol": [23, 25, 32], "plot_decision_tree_regress": [23, 32], "regr_1": [23, 32], "regr_2": [23, 32], "y_1": [23, 32], "y_2": [23, 32], "emor": 23, "plot_feature_importances_canc": [23, 32], "shallow": [23, 32, 39], "dt": [23, 32], "max_featur": [23, 24, 38], "extratreesclassifi": 23, "run_forest_run": 23, "plot_tree_partit": 23, "mostli": [23, 25, 27, 28, 30, 32, 36], "unaffect": [23, 25], "oversmooth": 23, "plot_bias_variance_rf": 23, "warm_start": 23, "1024": [23, 31, 36, 38, 39], "nr_tree": 23, "prev_n_estim": 23, "histgradientboostingclassifi": 23, "max_it": [23, 24], "baggingclassifi": 23, "diminish": [23, 38], "min_samples_split": 23, "preprun": 23, "overdo": 23, "oob": 23, "grown": 23, "althought": 23, "pessimist": 23, "oob_error": 23, "oob_score_": 23, "ordereddict": 23, "n_clusters_per_class": 23, "n_inform": 23, "disabl": 23, "trajectori": 23, "ensemble_clf": 23, "oob_scor": 23, "error_r": 23, "min_estim": 23, "max_estim": 23, "clf_err": 23, "hypothes": 23, "calibr": 23, "isoton": 23, "heterogen": 23, "implictli": 23, "downsid": [23, 27, 31], "parallelliz": 23, "focus": [23, 27], "stump": [23, 39], "f_i": 23, "g_i": 23, "varepsilon": 23, "s_": [23, 27], "logit": [23, 26], "shrinkag": [23, 24], "impact": [23, 35, 39], "incorrectli": 23, "gentleboost": 23, "bound": [23, 26], "logitboost": 23, "listedcolormap": [23, 44], "xavierbourretsicott": 23, "io": [23, 27, 37], "adaboost_scratch": 23, "estimator_list": 23, "y_predict_list": 23, "estimator_error_list": 23, "estimator_weight_list": 23, "sample_weight_list": 23, "max_leaf_nod": [23, 32], "y_predict": 23, "estimator_error": 23, "estimator_weight": 23, "invert": [23, 24, 28], "linalg": [23, 25, 28, 30], "plot_decision_boundari": 23, "scatter_weight": 23, "cm_bright": 23, "ff0000": 23, "0000ff": 23, "elif": [23, 24, 25, 26, 37], "rdbu": 23, "make_circl": 23, "xa": 23, "ya": 23, "current_ax": 23, "weight_scal": 23, "plot_adaboost": 23, "s_weight": 23, "eventu": 23, "g_0": 23, "pseudo": 23, "r_i": 23, "approx": 23, "g_m": 23, "make_poli": 23, "rnd": 23, "y_no_nois": 23, "gbrt": 23, "staged_predict": 23, "preds_train": 23, "plot_gradient_boosting_step": 23, "vline": 23, "plot_gradient_boost": 23, "all_ax": 23, "p_i": 23, "xa_train": 23, "xa_test": 23, "ya_train": 23, "ya_test": 23, "gbct": 23, "preds_train_cl": 23, "staged_predict_proba": 23, "current_gb_ax": 23, "plot_gb_decision_boundari": 23, "gbmodel": 23, "plot_gboost": 23, "pseudo_residu": 23, "thread": 23, "spawn": 23, "overhead": 23, "n_iter_no_chang": 23, "quantil": [23, 24], "sketch_ep": 23, "multicor": 23, "chunk": 23, "sped": 23, "ram": 23, "shard": 23, "conda": [23, 32, 34], "smarter": [23, 24, 28], "symmetr": 23, "stacker": 23, "meta": [23, 26, 27], "cascad": 23, "hyper": [23, 33, 37], "bay": 23, "20px": [23, 24, 32], "gradientboostingregress": 23, "gradientboostingclassif": 23, "realiti": 24, "seek": 24, "empir": [24, 25], "overpow": [24, 26, 31], "labelencod": [24, 31], "robustscal": [24, 31], "noisy_iri": 24, "skew": 24, "label_encod": 24, "plot_scal": 24, "set_ticks_posit": 24, "tweak": [24, 34], "ep": [24, 33], "unnecessarili": 24, "decision_valu": 24, "extent": [24, 26, 28], "plot_scaling_effect": 24, "show_test": 24, "clf_unscal": 24, "simplic": [24, 26, 37], "x_train_scal": [24, 31], "x_test_scal": [24, 31], "clf_scale": 24, "subtract": 24, "arbitrarili": [24, 26], "feature_rang": 24, "cosin": [24, 28], "twitter": 24, "cox": 24, "yeo": 24, "johnson": 24, "bc_": 24, "eric": 24, "nicola": 24, "hug": 24, "powertransform": 24, "bc": 24, "304": 24, "x_lognorm": 24, "x_chisq": 24, "chisquar": 24, "chi": 24, "x_weibul": 24, "weibul": 24, "d81b60": 24, "0188ff": 24, "ffc107": 24, "axes_idx": 24, "axes_list": 24, "x_trans_bc": 24, "lmbda_bc": 24, "lambdas_": 24, "ax_origin": 24, "ax_bc": 24, "table_font_s": 24, "heading_properti": 24, "cell_properti": 24, "dfstyle": 24, "10px": 24, "boro": 24, "manhattan": 24, "queen": [24, 28], "brooklyn": 24, "bronx": 24, "salari": 24, "142": 24, "219": [24, 28], "vegan": 24, "columntransform": [24, 31], "ordinalencod": 24, "passthrough": 24, "x_ordin": 24, "boro_ordin": 24, "concat": [24, 28, 30], "boro_bronx": 24, "boro_brooklyn": 24, "boro_manhattan": 24, "boro_queen": 24, "blend": 24, "n_": 24, "iy": 24, "n_i": 24, "prior": [24, 37, 41], "n_y": 24, "enc": 24, "plot_blend": 24, "ny": [24, 26], "nii": 24, "ni": 24, "category_encod": 24, "targetencod": 24, "return_df": 24, "pd_te": 24, "boro_encod": 24, "286050": 24, "289964": 24, "427901": 24, "ordinal_encod": 24, "one_hot_encod": 24, "target_encod": 24, "paradigm": 24, "prepar": 24, "x_encod": 24, "mislead": 24, "improperli": 24, "_ax": 24, "_log": 24, "matplotlib_axes_logg": 24, "setlevel": 24, "NOT": [24, 30, 39], "test_scal": 24, "x_test_scaled_badli": 24, "wrongli": 24, "leak": [24, 31], "optimist": [24, 31, 38], "merg": [24, 30], "featureunion": 24, "numeric_pip": 24, "categorical_pip": 24, "union": 24, "safe": 24, "best_pip": 24, "curs": [24, 33], "gene": 24, "express": [24, 30], "cubic": [24, 25], "demand": 24, "rent": 24, "washington": 24, "temp": 24, "feel_temp": 24, "42713": 24, "x_bike_cat": 24, "y_bike": 24, "x_bike": 24, "random_featur": 24, "bike_nam": 24, "summer": 24, "spring": 24, "misti": 24, "rain": 24, "heavy_rain": 24, "random_1": 24, "random_2": 24, "set_opt": 24, "max_column": 24, "get_yaxi": [24, 25, 27], "infrequ": 24, "variancethreshold": 24, "variances_": 24, "var_sort": 24, "ypo": 24, "mathrm": 24, "cov": [24, 25], "overlin": 24, "hierarchi": 24, "x_bike_sc": 24, "rowvar": 24, "dendrogram": 24, "ward": 24, "no_plot": 24, "ivl": 24, "bike_names_ord": 24, "046": [24, 32], "f_regress": 24, "selectpercentil": 24, "mutual_info_regress": 24, "selectfrommodel": 24, "rfe": 24, "ridgecv": 24, "lassocv": 24, "mlxtend": 24, "sequentialfeatureselector": 24, "permutation_import": 24, "trang": 24, "fs": 24, "ftest": 24, "mutualinform": 24, "forwardselect": 24, "floatingforwardselect": 24, "cv_score": 24, "select_pip": 24, "randomforestcv": 24, "scaled_scor": 24, "score_func": 24, "percentil": 24, "get_support": 24, "discrete_featur": 24, "elimin": [24, 39], "n_features_to_select": 24, "ranking_": 24, "support_": 24, "forward": [24, 27, 28, 37, 44], "k_featur": 24, "k_feature_idx_": 24, "importances_mean": 24, "sorted_idx": 24, "resort": 24, "method1": 24, "f_test": [24, 25], "method2": 24, "imp": [24, 31, 35], "imp2": 24, "mask2": 24, "twinx": [24, 36, 38], "m2": 24, "compare_feature_import": 24, "anova": 24, "mi": 24, "judg": 24, "cardin": 24, "nearmiss": 24, "nearhit": 24, "relieff": 24, "rrelieff": 24, "recomput": [24, 27], "backward": [24, 27], "worst": [24, 28, 36], "stochast": 24, "mutat": 24, "simul": [24, 37, 39], "anneal": [24, 26], "agnost": 24, "variancetreshold": 24, "x_select": 24, "f_classif": 24, "chi2": 24, "mutual_info_class": 24, "selectfpr": 24, "selected_featur": 24, "f_valu": 24, "p_valu": 24, "mi_valu": 24, "rfecv": 24, "rfe_selector": 24, "rf_import": 24, "feature_id": 24, "themselv": [24, 25, 36], "wavi": [24, 37], "lreg": 24, "preg": 24, "partit": 24, "which_bin": 24, "bin_nam": 24, "1f": [24, 39], "df_orig": 24, "orig": [24, 28], "df_nr": 24, "x_combin": 24, "ohedf": 24, "000000": [24, 30], "line_bin": 24, "line_combin": 24, "x_product": 24, "bin_snam": 24, "bindf": 24, "b0": 24, "b1": 24, "b2": 24, "b3": 24, "line_product": 24, "multipli": [24, 25, 26, 27, 28], "submodel": 24, "gender": [24, 28, 31], "pageview": 24, "269": 24, "1522": 24, "235": 24, "get_dummi": [24, 35], "df_f": 24, "gender_f": 24, "_f": [24, 25], "df_m": 24, "gender_m": 24, "_m": 24, "gender_f_m": 24, "gender_m_f": 24, "age_m": 24, "pageviews_m": 24, "time_m": 24, "gender_m_m": 24, "age_f": 24, "pageviews_f": 24, "time_f": 24, "gender_f_f": 24, "mcar": 24, "pure": [24, 27, 32], "missing": 24, "faulti": 24, "sensor": [24, 37, 44], "mnar": 24, "sick": 24, "na": 24, "enable_iterative_imput": 24, "knnimput": 24, "iterativeimput": 24, "softimput": 24, "iterativesvd": 24, "matrixfactor": 24, "ignore_warn": 24, "mline": 24, "missing_iri": 24, "smallest": [24, 44], "favorit": 24, "plot_imput": 24, "imputed_mask": 24, "isnan": 24, "x_imp": 24, "imp_pip": 24, "markerfacecolor": 24, "markeredgecolor": 24, "markeredgewidth": 24, "numpoint": 24, "compare_imput": 24, "3rd": [24, 27], "4th": [24, 27], "mice": 24, "eigenvalu": 24, "lambda_i": 24, "missing_valu": [24, 31], "add_ind": 24, "x_complet": 24, "eigenvector": 24, "shrinkage_valu": 24, "over_sampl": 24, "randomoversampl": 24, "adasyn": 24, "under_sampl": 24, "randomundersampl": 24, "editednearestneighbour": 24, "condensednearestneighbour": 24, "easyensembleclassifi": 24, "balancedbaggingclassifi": 24, "smoteenn": 24, "make_imb_pipelin": 24, "n_samples_1": 24, "n_samples_2": 24, "x_syn": 24, "y_syn": 24, "x_syn_train": 24, "x_syn_test": 24, "y_syn_train": 24, "y_syn_test": 24, "x0min": 24, "x0max": 24, "x1min": 24, "x1max": 24, "sampler": 24, "plot_imbal": 24, "sampler2": 24, "simulate_bag": 24, "x_resampl": 24, "y_resampl": 24, "fit_resampl": 24, "x_resampled_i": 24, "y_resampled_i": 24, "build_evalu": 24, "sampling_strategi": 24, "base_estim": 24, "orig_scor": 24, "setp": 24, "mode": [24, 27], "condens": 24, "doen": 24, "es": 24, "repeatedli": [24, 32], "enn": 24, "balancedbag": 24, "bootstrap": [24, 31, 32, 39], "throw": [24, 27, 29, 36], "tradition": 24, "adaboost": 24, "appropri": 24, "forget": [24, 27, 28], "compare_imbal": 24, "k_neighbor": 24, "fit_sampl": 24, "smote_pip": 24, "unpredict": [24, 32], "mc1": 24, "mammographi": 24, "data_imb": 24, "x_imb": 24, "y_imb": 24, "x_imb_train": 24, "x_imb_test": 24, "y_imb_train": 24, "y_imb_test": 24, "probs_origin": 24, "fpr_org": 24, "tpr_org": 24, "sname": 24, "hsv": 24, "roccol": 24, "roc_imbal": 24, "curvi": 24, "crucial": 24, "encapsul": 24, "proper": [24, 41], "uncertain": 25, "randal": 25, "monro": 25, "circumst": 25, "lifespan": 25, "billion": 25, "detector": [25, 27], "25226": 25, "015": 25, "117m": 25, "9b": 25, "notc": 25, "268": 25, "985": 25, "2023": [20, 25, 26], "760m": 25, "718": 25, "joint": 25, "turn": [25, 27, 28, 37, 44], "crank": 25, "plot_joint_distribut": 25, "covariance_matrix": 25, "plot_intersect": 25, "delta": 25, "yr": [25, 32, 37], "multivariate_norm": 25, "cset": 25, "zdir": 25, "zy": 25, "set_ztick": 25, "interact_joint_distribut": 25, "particular": [25, 37], "fake": [25, 31], "gan": 25, "theorem": 25, "condition": 25, "friend": [25, 28], "golf": 25, "weather": [25, 42], "sunni": 25, "gaussiannb": 25, "mu_c": 25, "sigma_c": 25, "mid": 25, "2_c": 25, "naive_bay": 25, "bernoullinb": 25, "multinomialnb": 25, "acycl": 25, "inverseprob": 25, "mlai2015": 25, "compute_kernel": 25, "exponentiated_quadrat": 25, "x_prime": 25, "lengthscal": 25, "squared_dist": 25, "sigma2": 25, "kernel_arg": 25, "update_invers": 25, "quantiti": [25, 27], "eas": 25, "kinv": 25, "inv": 25, "ey": [25, 27, 28, 30], "determin": [25, 28], "logdetk": 25, "det": 25, "kinvi": 25, "ykinvi": 25, "log_likelihood": 25, "posterior_f": 25, "k_star": 25, "k_starstar": 25, "mu_f": 25, "c_f": 25, "nr_point": 25, "add_mean": 25, "show_covari": 25, "show_stdev": 25, "gp_ax": 25, "ro": 25, "stdev": [25, 37], "var_f": 25, "diag": [25, 27], "std_f": 25, "plot_sin": 25, "x_sin": 25, "y_sin": 25, "x_sin_test": 25, "_1": [25, 32], "_2": [25, 28, 32], "pod": 25, "olympic_marathon_men": 25, "xtx": 25, "xty": 25, "895": 25, "1890": 25, "2020": 25, "130": [25, 39, 41], "poly_gamma": 25, "rbf_gamma": 25, "rbf_alpha": 25, "reg2": 25, "un": 25, "certainti": 25, "slack": 25, "epsilon_i": 25, "alpha_1": 25, "mle": 25, "posteriori": 25, "multivari": 25, "int_w": 25, "dw": 25, "drawn": [25, 26], "interact_prior": 25, "impos": 25, "priori": 25, "boldsymbol": 25, "num_pred_data": 25, "x_pred": 25, "1880": 25, "2030": 25, "plot_function_spac": 25, "phi_pr": 25, "num_sampl": 25, "z_vec": 25, "w_sampl": 25, "f_sampl": 25, "beta": 25, "mean_matrix": 25, "tell": [25, 28, 29, 41], "interact_covari": 25, "ticker": [25, 37], "maxnloc": 25, "plot_process": 25, "ax_d": 25, "ax_": 25, "ax_c": 25, "set_major_loc": 25, "get_data_ratio": 25, "plot_process_noiseless": 25, "plot_covm_nois": 25, "prime": 25, "vert": 25, "ell": 25, "smoothli": 25, "plot_gprocess": 25, "AND": 25, "write": [25, 29, 30], "_j": [25, 26, 28, 41], "ast": 25, "analog": [25, 28], "shuffled_olymp": 25, "perm": 25, "permut": [25, 28, 42], "x_shuffl": 25, "y_shuffl": 25, "plot_gp_olymp": 25, "xt": [25, 36], "plot_gp_olympics_mean": 25, "plot_gp_olympics_stdev": 25, "gpyregress": 25, "kern": 25, "input_dim": [25, 27, 28], "basisfunckernel": 25, "gpregress": 25, "custom_kernel": [25, 41], "ratquad": 25, "matern32": 25, "matern52": 25, "brownian": 25, "periodicexponenti": 25, "mlp": [25, 26], "kerneldict": 25, "deepcopi": 25, "plot_kernel": 25, "gridspec_kw": 25, "width_ratio": 25, "optimize_restart": 25, "num_restart": 25, "get_xaxi": [25, 27], "shade": 25, "region": [25, 26, 27, 36], "restart": [25, 26, 36, 41], "ker": 25, "ard": 25, "max_f_ev": 25, "slice": [25, 27, 37], "fixed_input": 25, "plotting_librari": 25, "canva": 25, "plot_data": 25, "tikhonov": 25, "potenti": 25, "instanci": [25, 42], "dy": [25, 26], "errorbar": 25, "advantag": 25, "versatil": 25, "disadvantag": 25, "exce": 25, "dozen": 25, "prove": 25, "band": 25, "performac": 25, "exploit": [25, 37], "asquisit": 25, "shahriari": 25, "induc": 25, "thompson": 25, "mixtur": [25, 28], "ei": [25, 37], "addon": 26, "nightli": 26, "adamax": 26, "draw_neural_net": 26, "layer_s": 26, "draw_bia": 26, "weight_count": 26, "random_weight": 26, "show_activ": 26, "educ": 26, "scale_ratio": 26, "n_layer": 26, "v_space": 26, "h_space": 26, "greenyellow": 26, "lightcor": 26, "w_count": 26, "b_count": 26, "txtarg": 26, "verticalalign": [26, 37], "horizontalalign": 26, "layer_top": 26, "node_s": 26, "radiu": 26, "nx": 26, "nsx": 26, "nsy": 26, "z_": 26, "o_": 26, "a_": 26, "h_": 26, "layer_size_a": 26, "layer_size_b": 26, "layer_top_a": 26, "layer_top_b": 26, "wl": 26, "diff": 26, "neuro": 26, "inspir": 26, "plu": 26, "tini": 26, "_0": 26, "plot_dense_net": 26, "nr_layer": 26, "nr_node": 26, "mathit": 26, "light": [26, 36, 39], "recurr": 26, "mismatch": 26, "regard": [26, 27], "todo": [26, 28, 38], "draw_upd": 26, "nameerror": [28, 36], "traceback": [28, 36], "timestep": 26, "5d": 26, "broadcast": 26, "along": [26, 30, 31], "redund": 26, "a_1": 26, "a_2": 26, "a_p": 26, "nudg": 26, "anim": [26, 37], "a_o": 26, "h_1": 26, "w_l": 26, "b_": 26, "decompos": [26, 30, 39], "z_o": 26, "2z": 26, "rectifi": 26, "01z": 26, "leaky_relu": 26, "activation_deriv": 26, "sig": 26, "plot_activ": [26, 27], "h_l": 26, "recov": 26, "recoveri": 26, "plot_activations_deriv": 26, "piecewis": 26, "neural_network": 26, "mlpclassifi": 26, "plot_boundari": 26, "solver": [26, 30], "hidden_layer_s": 26, "relu_tim": 26, "relu_acc": 26, "mlp_tanh": 26, "tanh_tim": 26, "tanh_acc": 26, "sec": [26, 31], "exact": 26, "output_funct": 26, "plot_output_activ": 26, "shrink": [26, 27, 33], "zig": 26, "zag": 26, "glorot": 26, "xavier": 26, "fan_in": 26, "fan_out": 26, "frozen": [26, 28], "sgd_cyclic": 26, "cyclicallearningr": 26, "initial_learning_r": 26, "maximal_learning_r": 26, "step_siz": 26, "clr_schedul": 26, "scale_fn": 26, "beta_1": 26, "beta_2": 26, "999": 26, "adadelta": 26, "rmsprop_momentum": 26, "250129": [], "306": [20, 26, 28], "250578": [], "plot_nesterov": 26, "lookahead": 26, "_s": 26, "eta_": 26, "cyclic": 26, "hopefulli": 26, "reset": 26, "ball": 26, "accumul": 26, "steepest": 26, "oscil": [26, 41], "veloc": 26, "qquad": 26, "respond": [26, 27], "g_": 26, "m_": 26, "dwindl": 26, "rmsprop_mom": 26, "gamma_2": 26, "u_": 26, "set_se": 26, "pythonhashse": 26, "seed_valu": 26, "cntk": 26, "theano": 26, "branch": [26, 27, 32], "dense_1": [26, 27], "dense_2": [26, 27], "xf_test": 26, "yf_test": 26, "453607": [], "721562": [], "468465": [], "0988096": [], "0003385": [], "6747018": [], "0004403": [], "017712": [], "2071131": [], "0000004": [], "0008842": [], "401243": [], "8699000477790833": [], "learnabl": [26, 28], "earlystop5": 26, "accident": 26, "make_model": 26, "kerastun": 26, "eindhoven": [27, 31], "technolog": [27, 31], "data_dir": [27, 28], "dogs_smal": 27, "model_dir": 27, "makedir": 27, "gdown": [27, 28], "zipfil": 27, "cats_and_dogs_small_1": 27, "h5": 27, "url": [27, 28, 30, 34], "uc": [27, 28], "1p10qm5jvtsjsw3060jkksbrxdy9hwbko": 27, "lecture9_model": 27, "zip_ref": 27, "extractal": 27, "download_cat": 27, "1xojwqgmrwiwlbbcvnxurbz0oyfqss_v0": 27, "lecture9_data": 27, "image_patch": 27, "pixel_out": 27, "skimag": 27, "tonysyu": 27, "iter_pixel": 27, "intens": 27, "imshow_pair": 27, "image_pair": 27, "fontdict": 27, "imshow_tripl": 27, "padding_for_kernel": 27, "rgb": [27, 36], "image_shap": 27, "odd": 27, "assert": 27, "add_pad": 27, "h_pad": 27, "w_pad": 27, "constant_valu": 27, "remove_pad": 27, "inner_region": 27, "grab": 27, "slice_i": 27, "broken": [27, 37], "window_slic": 27, "r_pad": 27, "c_pad": 27, "exclus": 27, "apply_kernel": 27, "original_imag": 27, "iter_kernel_label": 27, "i_pad": 27, "j_pad": 27, "visualize_kernel": 27, "kernel_label": 27, "label2rgb": 27, "bg_label": 27, "convolution_demo": 27, "ever": [27, 28], "cach": 27, "gen_kernel_label": 27, "image_cach": 27, "image_pad": 27, "overlai": 27, "i_step": 27, "convolution_step": 27, "kernel_overlai": 27, "filtered_prev": 27, "overwrit": [27, 36], "convolution_ful": 27, "image_tripl": 27, "horizontal_edge_kernel": 27, "diagonal_edge_kernel": 27, "edge_detect_kernel": 27, "mnist_data": 27, "x_mnist": 27, "y_mnist": 27, "ptp": 27, "hor": 27, "0x2cca0c2e0": [], "photograph": 27, "imageri": 27, "svhn": [27, 36], "41081": [27, 36], "attr": [27, 36, 37], "plot_imag": [27, 36], "grayscal": [27, 36], "x_sub_color": 27, "rgb2grai": [27, 36], "2990": [27, 36], "5870": [27, 36], "1140": [27, 36], "xsm": 27, "normalize_imag": 27, "demo2": 27, "0x2cca0f680": [], "famili": 27, "gabor": 27, "sobel": 27, "haar": 27, "wavelet": 27, "wave": [27, 31, 33], "ondul": 27, "ndimag": 27, "ndi": 27, "img_as_float": 27, "gabor_kernel": 27, "demogabor": 27, "sigma_x": 27, "sigma_i": 27, "freq": [27, 30], "respons": 27, "convolv": 27, "demogabor2": 27, "132": [27, 28], "133": [27, 28], "image3": 27, "image5": 27, "image13": 27, "image_nam": 27, "plot_filter_bank": 27, "kernel_param": 27, "nfrequenc": 27, "nsigma": 27, "ax_col": 27, "contrast": [27, 37], "fmnist_data": 27, "x_fm": 27, "y_fm": 27, "buildfigurelist": 27, "subfiglist": 27, "imgplot": 27, "image2": 27, "demogabor3": 27, "discov": 27, "1x1xd": 27, "reassembl": 27, "5x5": 27, "2x2": 27, "lenght": 27, "agress": 27, "spread": 27, "invari": [27, 28, 36], "abstract": 27, "preserv": [27, 28, 30], "descreas": 27, "conv2d": 27, "maxpooling2d": 27, "28x28x1": 27, "3x3x64": 27, "320": 27, "halv": [27, 44], "max_pooling2d": 27, "conv2d_1": 27, "18496": 27, "max_pooling2d_1": 27, "conv2d_2": 27, "36928": 27, "744": 27, "576": 27, "650": 27, "globalaveragepool": 27, "globalaveragepooling2d": 27, "caution": 27, "destroi": [27, 28], "sequential_1": [27, 28], "conv2d_3": 27, "max_pooling2d_2": 27, "conv2d_4": 27, "max_pooling2d_3": 27, "conv2d_5": 27, "global_average_pooling2d": 27, "lobalaveragepooling2d": 27, "56": [27, 28], "394": 27, "train_imag": 27, "validation_imag": 27, "validation_label": 27, "pickl": 27, "mnist_histori": 27, "wb": 27, "file_pi": 27, "dump": 27, "load_model": 27, "validation_loss": 27, "validation_acc": 27, "1500x900": 27, "rb": 27, "988800048828125": [], "disk": 27, "realist": 27, "jpeg": 27, "3000": [27, 30], "decod": 27, "resiz": [27, 30], "150x150": 27, "shutil": 27, "kaggl": 27, "uncompress": 27, "original_dataset_dir": 27, "dogs_origin": 27, "train_dir": 27, "validation_dir": 27, "mkdir": 27, "train_cats_dir": 27, "train_dogs_dir": 27, "validation_cats_dir": 27, "validation_dogs_dir": 27, "fname": 27, "jpg": [27, 30], "src": 27, "dst": 27, "copyfil": 27, "fly": [27, 29], "train_gener": 27, "flow_from_directori": 27, "target_s": 27, "class_mod": 27, "train_datagen": 27, "validation_datagen": 27, "validation_gener": 27, "data_batch": 27, "labels_batch": 27, "171": [27, 28], "148": 27, "896": [27, 40], "74": [27, 40], "73856": 27, "147584": 27, "flatten_1": 27, "6272": 27, "3211776": 27, "dense_3": [27, 28], "513": 27, "453": [27, 28], "steps_per_epoch": 27, "validation_step": 27, "cats_and_dogs_small_1_histori": 27, "datagen": 27, "rotation_rang": 27, "width_shift_rang": 27, "height_shift_rang": 27, "shear_rang": 27, "slant": 27, "zoom_rang": 27, "horizontal_flip": 27, "horizont": 27, "fill_mod": 27, "didn": 27, "listdir": [27, 37], "img_path": 27, "load_img": 27, "img_to_arrai": 27, "indefinit": 27, "141": 27, "array_to_img": 27, "fit_gener": 27, "cats_and_dogs_small_2": 27, "cats_and_dogs_small_2_histori": 27, "textur": 27, "incept": 27, "7x7": 27, "conv": 27, "1x3": 27, "3x1": 27, "cheaper": [27, 30], "1x1": 27, "nin": 27, "auxiliari": [27, 28], "bypass": 27, "148x148": 27, "72x72": 27, "34x34": 27, "15x15": 27, "remind": 27, "conv2d_10": 27, "max_pooling2d_8": 27, "conv2d_11": 27, "max_pooling2d_9": 27, "conv2d_12": 27, "max_pooling2d_10": 27, "maxpoolin": 27, "g2d": 27, "conv2d_13": 27, "max_pooling2d_11": 27, "flatten_2": 27, "dense_4": 27, "dense_5": 27, "img_tensor": 27, "layer_output": 27, "activation_model": 27, "86m": [], "first_layer_activ": 27, "sharei": 27, "1528": 27, "img_tensor2": 27, "activations2": 27, "first_layer_activation2": 27, "9m": 27, "images_per_row": 27, "layer_nam": 27, "layer_index": 27, "layer_activ": 27, "tile": 27, "n_col": 27, "display_grid": 27, "channel_imag": 27, "palat": 27, "uint8": 27, "ear": 27, "ascent": 27, "input_img": 27, "filter_index": 27, "loss_v": 27, "grads_v": 27, "input_img_data": 27, "disable_eager_execut": 27, "framework": 27, "op": 27, "deprocess_imag": 27, "generate_pattern": 27, "nth": 27, "get_lay": 27, "loss_valu": 27, "grads_valu": 27, "visualize_filt": 27, "filter_img": 27, "horizontal_start": 27, "horizontal_end": 27, "vertical_start": 27, "vertical_end": 27, "vagu": 27, "imagenet": [26, 27], "include_top": 27, "block3_conv1": 27, "input_1": 27, "block1_conv1": 27, "1792": 27, "block1_conv2": 27, "block1_pool": 27, "block2_conv1": 27, "block2_conv2": 27, "block2_pool": 27, "295168": 27, "block3_conv2": 27, "590080": 27, "block3_conv3": 27, "block3_pool": 27, "block4_conv1": 27, "1180160": 27, "block4_conv2": 27, "2359808": 27, "block4_conv3": 27, "block4_pool": 27, "block5_conv1": 27, "block5_conv2": 27, "block5_conv3": 27, "block5_pool": 27, "714": 27, "vgg": 27, "1st": 27, "patterns1": 27, "patterns2": 27, "patterns3": 27, "patterns4": 27, "feather": 27, "greatest": 27, "clear_sess": 27, "discard": [27, 28], "cam": 27, "preprocess_input": 27, "decode_predict": 27, "10_eleph": 27, "pil": 27, "224x224": 27, "african": 27, "eleph": 27, "african_elephant_output": 27, "386": 27, "last_conv_lay": 27, "pooled_grad": 27, "pooled_grads_valu": 27, "conv_layer_output_valu": 27, "14x14": 27, "output_shap": 27, "saniti": 27, "n02504458": 27, "african_eleph": 27, "90988594": 27, "n01871265": 27, "tusker": 27, "085724816": [], "n02504013": 27, "indian_eleph": 27, "0043471307": [], "opencv": 27, "cv2": 27, "imread": [27, 37], "applycolormap": 27, "colormap_jet": 27, "superimposed_img": 27, "imwrit": 27, "elephant_cam": 27, "upscal": 27, "superimpos": [27, 44], "face": [27, 37], "babi": 27, "trunk": 27, "rgb_im": 27, "cvtcolor": 27, "color_bgr2rgb": 27, "contruct": 27, "conv_bas": 27, "input_2": 27, "somewhat": 27, "unfreez": 27, "extract_featur": 27, "sample_count": 27, "inputs_batch": 27, "features_batch": 27, "train_featur": 27, "validation_featur": 27, "cats_and_dogs_small_3a": 27, "cats_and_dogs_small_3a_histori": 27, "despit": [27, 37], "90500003": 27, "freez": [27, 28], "14714688": 27, "8192": [27, 37], "2097408": 27, "257": [27, 28], "353": [27, 28], "097": 27, "665": 27, "cats_and_dogs_small_3b": 27, "cats_and_dogs_small_3b_histori": 27, "906": 27, "set_train": 27, "424": 27, "635": 27, "unlearn": 27, "cats_and_dogs_small_4": 27, "cats_and_dogs_small_4_histori": 27, "90800005": 27, "smooth_curv": 27, "smoothed_point": 27, "smooth_histori": 27, "9039536851123335": 27, "address": [27, 36], "modular": 27, "fight": 27, "imbd": 28, "databas": [28, 30], "markup": 28, "punctuat": 28, "index_from": 28, "88584": 28, "redford": 28, "amaz": 28, "director": 28, "norman": 28, "father": 28, "came": [28, 41], "scottish": 28, "myself": 28, "documentari": 28, "shot": 28, "spoiler": 28, "messag": 28, "dechif": 28, "switchblad": 28, "romanc": 28, "burst": 28, "mal\u00e9fiqu": 28, "preced": [28, 43], "modern": 28, "nencod": 28, "scot": 28, "storytel": 28, "tradit": 28, "event": [28, 31], "elderli": 28, "ladi": 28, "mother": 28, "retel": 28, "battl": 28, "culloden": 28, "she": 28, "charact": [28, 29], "aliv": 28, "her": 28, "passion": 28, "wit": 28, "sodden": 28, "heath": 28, "mile": 28, "born": 28, "wouldn": 28, "18606": 28, "16082": 28, "2801": 28, "2037": 28, "429": 28, "108": 28, "1491": 28, "15302": 28, "3712": 28, "758": 28, "5763": 28, "449": 28, "9211": 28, "982": 28, "64314": 28, "163": 28, "213": 28, "1236": 28, "1794": 28, "2410": 28, "684": 28, "33926": 28, "7336": 28, "3690": 28, "118": 28, "262": [28, 40], "572": 28, "156": 28, "1444": 28, "583": 28, "479": [28, 43], "countvector": 28, "stem": 28, "stopword": 28, "ter": 28, "eri": 28, "feature_extract": 28, "vect": 28, "toarrai": 28, "boob": 28, "cheesi": 28, "giant": 28, "got": [28, 41], "hair": 28, "hundr": 28, "pin": 28, "ridicul": 28, "safeti": 28, "thin": 28, "logisticregressioncv": 28, "5000": [28, 37], "data_s": 28, "train_text": 28, "test_text": 28, "train_text_vec": 28, "test_text_vec": 28, "8538": 28, "plot_important_featur": 28, "top_n": 28, "myrang": 28, "set_frame_on": 28, "naiv": [28, 33], "meet": 28, "lemmat": 28, "nlp": 28, "noun": 28, "verb": 28, "hash": 28, "collis": 28, "awesom": 28, "creativ": 28, "aw": 28, "eso": 28, "nltk": 28, "spaci": 28, "gensim": 28, "t_i": 28, "tfidftransform": 28, "2m": 28, "emb": 28, "surround": 28, "itself": [28, 34], "occurr": 28, "latent": 28, "context": 28, "pool": 28, "cbow": 28, "corpora": 28, "arithmet": [28, 29, 30], "plural": 28, "vec_": 28, "king": 28, "man": 28, "woman": 28, "countri": 28, "unsolv": 28, "footbal": 28, "fo": 28, "foo": [28, 29, 30], "oot": 28, "otb": 28, "tba": 28, "bal": 28, "b_i": 28, "ij": 28, "doc2vec": [], "semant": [28, 31], "tricki": 32, "rnn": [], "leverag": 43, "competit": [], "sequential_8": [], "embedding_2": [], "160000": [], "321": [], "maxlen": 28, "pad_sequ": 28, "elsewher": 28, "maxpooling1d": 28, "globalmaxpooling1d": 28, "home": [], "max_word": 28, "157": [], "3s": [], "18m": [], "0807": [], "9932": [], "5570": [], "8172": [], "400k": [], "embedding_dim": 28, "embedding_lay": 28, "num_token": [], "embeddings_initi": [], "embedding_matrix": [], "stanford": 28, "edu": [28, 41], "6b": 28, "cmu": 28, "af": 28, "theo": 28, "news20": 28, "tar": 28, "gz": 28, "tarfil": 28, "1zod5p9kreabyg5oh2n5mcc": 28, "bozycskih": 28, "unpack": 29, "newsgroup": [], "my_tar": [], "embeddings_index": 28, "maxsplit": 28, "fromstr": 28, "sep": [28, 30], "400000": 28, "board": [], "textvector": [], "lowercas": [], "max_token": [], "20000": [], "output_sequence_length": [], "val_sampl": [], "news_dir": [], "20_newsgroup": [], "dirnam": [], "comp": [], "graphic": [], "38987": [], "class_index": [], "dirpath": [], "fpath": [], "latin": [], "19997": [], "1337": [], "num_validation_sampl": [], "val_label": [], "text_d": [], "from_tensor_slic": [], "voc": [], "get_vocabulari": [], "100d": [], "embedding_vector": 28, "oov": [], "17999": [], "int64": 30, "embedding_5": [], "2000200": [], "64128": [], "max_pooling1d": [], "conv1d_1": [], "82048": [], "global_max_pooling1d": [], "globa": [], "lmaxpooling1d": [], "16512": [], "2580": [], "165": [], "468": [], "sparse_categorical_crossentropi": [], "9509": [], "1686": [], "0x293648430": [], "nowadai": [], "disclaim": 29, "everyth": [28, 29], "comment": 29, "shell": 29, "dynam": 29, "creation": [29, 30, 32], "redeclar": 29, "boolean": [29, 30], "implicitli": 29, "immut": 29, "mutabl": 29, "pack": 29, "bob": 29, "14159265": 29, "place": [29, 30, 37], "hodor": 29, "indent": 29, "scope": 29, "bracket": [29, 44], "myfunc": 29, "func": 29, "argv": 29, "sum1": 29, "sum2": 29, "ret": 29, "greet": 29, "call_func": 29, "other_nam": 29, "john": [29, 30], "compose_greet_func": 29, "get_messag": 29, "testclass": 29, "inherit": 29, "myvar": 29, "mystr": 29, "static": [29, 44], "staticmethod": 29, "decor": 29, "saystat": 29, "declar": 29, "eleg": 29, "functool": 29, "anonym": 29, "mydata": 29, "cumul": [29, 30], "lazi": 29, "lc": 29, "lg": 29, "newlin": 29, "fahrenheit": 29, "celsiu": 29, "t1": 29, "t2": 29, "t3": 29, "t4": 29, "44444444444444": 29, "77777777777778": 29, "fourier": 30, "pseudorandom": 30, "fundament": 30, "richer": 30, "my_arrai": 30, "ndim": 30, "items": 30, "byte": 30, "placehold": [30, 31], "float64": [30, 37], "sit": 30, "elementwis": 30, "upcast": 30, "unari": 30, "9572624389610684": 30, "06832338227931944": 30, "2641917094515025": 30, "familiar": 30, "floor": 30, "ufunc": 30, "84147098": 30, "90929743": 30, "14112001": 30, "7568025": 30, "95892427": 30, "2794155": 30, "6569866": 30, "98935825": 30, "41211849": 30, "stack": 30, "hsplit": 30, "vsplit": 30, "idenm": 30, "vstack": 30, "stepsiz": 30, "comma": 30, "colon": 30, "tentative_numpy_tutori": 30, "reilli": 30, "routin": 30, "sparse_matrix": 30, "csr_matrix": 30, "coo": 30, "row_indic": 30, "col_indic": 30, "eye_coo": 30, "coo_matrix": 30, "sql": 30, "414214": 30, "732051": 30, "mari": 30, "andr": 30, "cecilia": 30, "3200": 30, "1100": 30, "ohio": 30, "nevada": 30, "2002": 30, "pop": 30, "date_rang": 30, "20130101": 30, "abcd": 30, "2013": 30, "279229": 30, "014442": 30, "206311": 30, "444963": 30, "836939": 30, "328902": 30, "361891": 30, "621461": 30, "647378": 30, "271949": 30, "122788": 30, "726806": 30, "569523": 30, "378494": 30, "881282": 30, "589848": 30, "27922882": 30, "01444176": 30, "20631052": 30, "44496293": 30, "83693931": 30, "32890157": 30, "36189055": 30, "62146103": 30, "64737828": 30, "2719488": 30, "12278808": 30, "72680583": 30, "56952335": 30, "37849357": 30, "88128234": 30, "58984755": 30, "read_tabl": 30, "delimit": 30, "to_csv": 30, "tail": 30, "298506": 30, "991226": 30, "643068": 30, "623288": 30, "623289": 30, "023244": 30, "491169": 30, "833890": 30, "694769": 30, "564663": 30, "302115": 30, "942566": 30, "463304": 30, "853698": 30, "621586": 30, "674133": 30, "067041": 30, "280260": 30, "962539": 30, "354855": 30, "sort_index": 30, "iloc": [30, 37], "20130102": 30, "20130103": 30, "346622": 30, "606353": 30, "880836": 30, "129384": 30, "funct": 30, "406463": 30, "286391": 30, "083522": 30, "034810": 30, "616006": 30, "040805": 30, "959403": 30, "993623": 30, "202516": 30, "039395": 30, "832403": 30, "605941": 30, "df1": 30, "data1": 30, "df2": 30, "data2": 30, "ignore_index": [30, 37], "sentinel": 30, "cut": 30, "value_count": 30, "pydata": 30, "bitbucket": 30, "hroja": 30, "primari": 30, "svg": 30, "png": [30, 37], "bmp": 30, "gif": 30, "ecosystem": 30, "pluss": 30, "customiz": 30, "cumsum": 30, "boxplot": 30, "plasma": [30, 37], "gen_web_traffic_data": 31, "weekli": 31, "week": 31, "rhythm": 31, "ma": 31, "plot_web_traff": 31, "mx": 31, "inch": 31, "autoscal": 31, "mimic": 31, "visit": 31, "tweet": 31, "hashtag": 31, "polyfit": [31, 43], "poly1d": 31, "f2": 31, "f10": 31, "f50": 31, "interactiveshel": 31, "3457": 31, "rankwarn": 31, "exec": 31, "code_obj": 31, "user_global_n": 31, "user_n": 31, "sophist": 31, "play_with_degre": 31, "materi": [31, 34], "thorough": 31, "compris": 31, "inbalanc": 31, "whenev": [31, 37], "trustworthi": 31, "greatli": 31, "40536": 31, "app": 31, "lawyer": 31, "quartil": 31, "lq": 31, "uq": 31, "x1_train": 31, "x_enc": 31, "pref_o_attract": 31, "d_d_age": 31, "race": 31, "arm": 31, "9800000000000001": 31, "jump": 31, "210": 31, "39084256954456": 31, "003623016212739808": 31, "lack": 31, "autosklearn": 31, "autosklearnclassifi": 31, "time_left_for_this_task": 31, "per_run_time_limit": 31, "ml_memory_limit": 31, "obliqu": 32, "rq": [32, 33], "homebrew": 32, "debian": 32, "apt": 32, "_k": 32, "impur": 32, "misclassification_error": 32, "leaf1_distr": 32, "leaf2_distr": 32, "leaf1_siz": 32, "leaf2_siz": 32, "gini_index": 32, "plot_heurist": 32, "top_0": 32, "top_1": 32, "bottom_0": 32, "bottom_1": 32, "p_1": 32, "fontweight": 32, "royalblu": 32, "misclass": 32, "kullback": 32, "leibler": 32, "ex": 32, "log_2": 32, "9183": 32, "0817": 32, "gainratio": 32, "splitinfo": 32, "fragment": 32, "borderaxespad": [32, 36], "0x29c5f2580": 32, "interpet": 32, "export_graphviz": 32, "out_fil": 32, "malign": 32, "benign": 32, "dot_graph": 32, "008": 32, "009": 32, "002": 32, "007": 32, "695": 32, "054": 32, "017": 32, "117": [28, 32], "011": 32, "halfwai": 32, "splitpoint": 32, "r_1": 32, "leq": 32, "r_2": 32, "c_i": 32, "min_": 32, "c_1": 32, "c_2": 32, "xr_test": 32, "ram_pric": 32, "semilog": 32, "mbyte": 32, "histor": 32, "data_train": 32, "data_test": 32, "xl_train": 32, "yl_train": 32, "linear_reg": 32, "x_all": [32, 42], "pred_tre": 32, "pred_lr": 32, "undo": 32, "price_tre": 32, "price_lr": 32, "min_samples_leaf": 32, "xc": 32, "yc": 32, "kl": 32, "div": 32, "scheme": 33, "kd": 33, "plot_knn_classif": 33, "member": 33, "parameter": 33, "shrink_threshold": 33, "nearestcentroid": 33, "nc": 33, "centroids_": 33, "suffer": 33, "est": 33, "nrclass": 33, "plot_knn_regress": 33, "_config": 34, "yml": 34, "_toc": 34, "parent": 34, "push": 34, "ghp": 34, "_build": 34, "hide_input_al": 34, "jupyter_nbextensions_configur": 34, "nbextens": 34, "jupyterlab": 34, "slideshow": 34, "nbconvert": 34, "templat": 34, "slidesexport": 34, "reveal_them": 34, "serv": 34, "notebooknam": 34, "handout": 34, "sidenot": 34, "reader": 34, "preview": 34, "acrobat": 34, "chrome": 34, "theme": 34, "css": 34, "custom_rev": 34, "slides_html": 34, "j2": 34, "el": 34, "getelementsbytagnam": 34, "textcont": 34, "indexof": 34, "return_categorical_ind": 35, "return_attribute_nam": [35, 39, 43, 44], "ballfram": 35, "adequ": 35, "ballframe_clean": 35, "trip": 35, "workaround": 35, "76": 35, "elasticsearch": 35, "071968567300115138": 35, "grid_elastic_net": 35, "reg__l1_ratio": 35, "en_r": 35, "biggest": 35, "lesd": 35, "disastr": 35, "favour": 35, "confirm": [35, 36], "10000000000000001": 35, "strech": 35, "en_res2": 35, "encoded_feat": 35, "non_encoded_feat": 35, "oh": [35, 37], "75230929412401049": 35, "twini": 35, "street": 36, "distractor": 36, "1gb": 36, "99289": 36, "x_random": 36, "y_random": 36, "yt": 36, "plot_comparison": 36, "neither": 36, "run_model": [36, 38], "modelname_list": [36, 38], "sample_size_list": [36, 38], "training_times_list": 36, "prediction_times_list": 36, "train_score_list": [36, 38], "test_score_list": [36, 38], "sample_s": [36, 38], "x_sampl": [36, 38], "y_sampl": [36, 38], "survivor": [36, 38], "start_tim": [36, 38], "kick": [36, 38], "eval": [36, 38], "training_tim": [36, 38], "prediction_tim": 36, "05000000000000001": 36, "476": 36, "eval_m": [36, 38], "x_grai": 36, "squeez": 36, "x_st": 36, "9a3742b104a3": 36, "988": 36, "174": 36, "621": 36, "439222354928997": 36, "5362443526132585": 36, "convers": 36, "greyscal": 36, "plotter": 36, "standiz": 36, "xvals_grei": 36, "xvals_st": 36, "interweav": 36, "xvals_al": 36, "3x": 36, "apart": 36, "pca__n_compon": 36, "pca_search": 36, "regul": 36, "run_optim": 36, "5553": 36, "0001668100537200059": 36, "2459": 36, "742636826811277e": 36, "2456": 36, "broad": 36, "promis": 36, "finer": 36, "liklei": 36, "456150627423057": 36, "0028255571775323562": 36, "6846": 36, "y_new": 36, "x_new_grai": 36, "x_new_st": 36, "x_wrong": 36, "y_correct": 36, "y_wrong": 36, "char": 36, "oftentim": 36, "preval": 36, "leaern": 36, "plot_coef": 36, "x_all_grai": 36, "x_all_st": 36, "c_opt": 36, "clearest": 36, "64e": 36, "sift": 36, "movement": 37, "wall": [37, 44], "equip": [37, 44], "ultrasound": [37, 44], "offic": [37, 44], "obstacl": [37, 44], "robotnav": 37, "1497": [37, 44], "angle_": 37, "trial": [37, 41], "plausibl": 37, "meter": 37, "triangl": 37, "mpatch": [37, 44], "funcanim": 37, "embed_limit": 37, "set_tight_layout": 37, "cx": 37, "cy": 37, "curr_x": 37, "cl": 37, "wall_point": 37, "to_jshtml": 37, "mtick": 37, "imageio": 37, "xgbmodel": 37, "runtimewarn": 37, "curr_best": 37, "cdf": 37, "robotarm": 37, "189": 37, "5456": 37, "hyperparam_obj": 37, "hyperparams_sur": 37, "surrogate_model": 37, "objective_model": 37, "acquisition_funct": 37, "hyperparam_spac": 37, "x_obj": 37, "y_obj": 37, "hyperparam_nam": 37, "highest_ei": 37, "model_nam": 37, "surrogate_model_nam": 37, "time_surrog": 37, "hyperparams_obj": 37, "optimal_hyperparam": 37, "hyperparam_point": 37, "lin": 37, "hyperparam_cartesian": 37, "cartesian": 37, "hyperparam_sampl": 37, "static_hyperparam": 37, "to_dict": 37, "regressor_predict": 37, "surrogate_predict": 37, "x_sur": 37, "expected_improv": 37, "next_sampl": 37, "prevent": 37, "parameters_idx": 37, "idxmax": 37, "opt_param": 37, "force_dtyp": 37, "fucntion": 37, "plot_surrog": 37, "show_confid": 37, "show_plot": 37, "store_plot": 37, "ax_sur": 37, "ax_acq": 37, "z_loss": 37, "z_loss_obj": 37, "z_acq": 37, "first_param": 37, "second_param": 37, "x_plot": [37, 41], "y_plot": 37, "x_plot_obj": 37, "y_plot_obj": 37, "logaritm": 37, "log10": 37, "loss_max": 37, "plot_trisurf": 37, "first_hyperparam": 37, "second_hyperparam": 37, "set_major_formatt": 37, "formatstrformatt": 37, "alter": 37, "savefig": [37, 38, 43, 44], "gif_imag": 37, "_it_": 37, "generate_gif": 37, "png_dir": 37, "file_nam": 37, "startswith": 37, "file_path": 37, "gif_filenam": 37, "mimsav": 37, "min_point": 37, "min_loss": 37, "textstr": 37, "boxstyl": 37, "coord": 37, "transax": 37, "bbox": 37, "metadata": 37, "750827e": 37, "738762e": 37, "595858": 37, "110203e": 37, "959110e": 37, "306997": 37, "479472e": 37, "961225e": 37, "595125": 37, "691330e": 37, "086665e": 37, "678333": 37, "569049e": 37, "095662e": 37, "577841e": 37, "329994e": 37, "546295e": 37, "514968e": 37, "955651e": 37, "850456e": 37, "404216e": 37, "023295e": 37, "796360e": 37, "195248e": 37, "180344": 37, "xgclas_param_templ": 37, "xgcla": 37, "classifier_predict": 37, "xgreg_param_templ": 37, "xgreg": 37, "elas_param_templ": 37, "ela": 37, "587": 37, "801607": 37, "007017": 37, "147878": 37, "083768": 37, "00751077": 37, "05878": 37, "0166366": 37, "017038e": 37, "512821": 37, "0408401": 37, "40x40": 37, "stark": 37, "conbin": 37, "conduct": 37, "appar": 37, "conclus": 37, "situat": 37, "decid": 37, "grasp": 37, "suddenli": 37, "broke": 37, "revisit": 37, "svm_best_param": 37, "reset_index": 37, "inplac": 37, "878016e": 37, "028943": 37, "701254e": 37, "000000e": 37, "000024": 37, "xgclas_best_param": 37, "041246": 37, "040984": 37, "017013": 37, "007480": 37, "017999": 37, "kept_column": 37, "x_broken": 37, "svm_broken": 37, "svm_param_templ": 37, "xgclas_broken": 37, "170125": 37, "427985": 37, "168778": 37, "0544343": 37, "rapidli": 37, "third": 37, "versu": 37, "encourag": 37, "herebi": 37, "y_normal": 37, "gpr": [37, 41], "xgreg_gp": 37, "compare_time_sur": 37, "0151084": 37, "elas_gpr": 37, "645191e": 37, "557558": 37, "consider": 37, "led": 37, "prfr": 37, "blocki": 37, "decept": 37, "lastli": 37, "conclud": 37, "distinct": 37, "devnagari": 38, "devanagari": 38, "40923": 38, "90000": 38, "running_times_list": 38, "kdtree": 38, "surprisingli": 38, "lesad": 38, "beyond": 38, "grid_search_rf": 38, "802065217391": 38, "grid_search_knn": 38, "790869565217": 38, "_estim": 38, "_featur": 38, "simultan": 38, "param_dist": 38, "grid_search_rf2": 38, "intrins": 39, "sh": 39, "fun": 39, "938": 39, "578": 39, "754": 39, "125": 39, "421": 39, "84": 39, "profil": 39, "basex": 39, "fact": 39, "perfectli": [39, 41], "auroc": 39, "validation_curv": 39, "staged_decision_funct": 39, "best_it": 39, "test_lin": 39, "colour": 39, "get_color": 39, "4685": 39, "gbt_clf": 39, "rebound": 39, "0021": 40, "0004": 40, "00002": 40, "ns": 40, "893": 40, "47911033421644406": 40, "6153278890011744": 40, "261": 40, "9723302085577779": 40, "5096196352034442": 40, "snd": 40, "true_i": 41, "expsin": 41, "spatial": 41, "pdist": 41, "cdist": 41, "expsine_kernel": 41, "svr_lin": 41, "y_svr_lin": 41, "svr_poli": 41, "y_svr_poli": 41, "svr_rbf": 41, "y_svr_rbf": 41, "svr2": 41, "y_svr2": 41, "scatterpoint": 41, "obvious": [41, 44], "meant": 41, "closur": 41, "build_kernel": 41, "length_scale_rang": 41, "periodicity_rang": 41, "grid_search_expsin": 41, "getfullargspec": 41, "20000000000000001": 41, "875": 41, "svr_opt1": 41, "svr_opt2": 41, "svr_opt3": 41, "upward": 41, "fanci": 41, "gp_expsin": 41, "y_gpr": 41, "y_std": 41, "svr_kernel": 41, "revert": 41, "toronto": 41, "duvenaud": 41, "cookbook": 41, "k_mix": 41, "kernel_simpl": 41, "ko1": 41, "ko2": 41, "ko3": 41, "134": 41, "kernel_opt": 41, "gpr2": 41, "y_gpr2": 41, "y_std2": 41, "gpr3": 41, "y_gpr3": 41, "y_std3": 41, "gpr_mix": 41, "gpr_opt": 41, "solar": 42, "balloon": 42, "balloon_data": 42, "humbl": 42, "x_train_perm": 42, "y_train_perm": 42, "x_test_perm": 42, "y_test_perm": 42, "gpy": 42, "nonthi": 43, "delet": 43, "get_ax": 43, "polar": 43, "par": 43, "hurt": 43, "valdat": 43, "5856": 43, "0508": 43, "mdoel": 43, "regularli": 44, "busi": 44, "trace": 44, "legend_handl": 44, "hp_rang": 44, "log_3": 44, "2_": 44, "3_": 44, "eg": 44, "4_": 44, "critic": 44, "956": [], "nxv": 28, "vxn": 28, "paragraph": 28, "globalaveragepooling1d": 28, "embedding_4": [], "global_average_pooling1d": 28, "lobalaveragepooling1d": 28, "sequential_13": [], "embedding_11": [], "200000": 28, "global_average_pooling1d_7": [], "english": 28, "urigin": [], "redirect": [], "uuid": [], "bf2a469d": [], "0c15": [], "4e31": [], "a0b4": [], "ea05f143b0ac": [], "347m": [], "4mb": [], "708": 28, "673": 28, "225": 28, "603": 28, "739": 28, "654": 28, "216": 28, "338": 28, "245": 28, "515": 28, "857": 28, "372": 28, "588": 28, "619": 28, "549": 28, "027": 28, "976": 28, "115": 28, "998": 28, "066": 28, "208": 28, "532": 28, "409": 28, "041": 28, "249": 28, "415": 28, "954": 28, "368": 28, "379": 28, "146": 28, "201": 28, "719": 28, "236": 28, "495": 28, "158": 28, "091": 28, "266": 28, "516": 28, "648": 28, "164": 28, "081": 28, "336": 28, "228": 28, "638": 28, "473": 28, "328": 28, "084": 28, "785": 28, "099": 28, "039": 28, "279": 28, "579": 28, "044": 28, "049": 28, "325": 28, "498": 28, "607": 28, "181": 28, "166": 28, "803": 28, "666": 28, "637": 28, "561": 28, "output_dim": 28, "set_weight": 28, "weigth": 28, "cnt": 28, "sentenc": 28, "autoregress": 28, "recept": 28, "dilat": 28, "causal": 28, "conv1d": 28, "h_t": 28, "_t": 28, "unbound": 28, "backpropag": 28, "gate": 28, "lstm": 28, "gru": 28, "seq": 28, "sentiment": 28, "contribut": 28, "presenc": 28, "aganinst": 28, "k_i": 28, "b_k": 28, "q_i": 28, "b_q": 28, "b_v": 28, "negat": 28, "strengten": 28, "sequencet": [], "fron": [], "acknowledg": 28, "vu": 28, "list_physical_devic": [], "6492500305175781": [], "6827500462532043": [], "nornmal": [], "7305000424385071": [], "lessen": [], "7412500381469727": [], "7827500104904175": [], "it_train": [], "8022500276565552": [], "sheer": [], "conv2d_27": [], "batch_normalization_7": [], "batc": [], "hnormal": [], "conv2d_28": [], "9248": [], "batch_normalization_8": [], "max_pooling2d_14": [], "dropout_12": [], "conv2d_29": [], "batch_normalization_9": [], "conv2d_30": [], "batch_normalization_10": [], "bat": [], "chnormal": [], "max_pooling2d_15": [], "dropout_13": [], "conv2d_31": [], "batch_normalization_11": [], "conv2d_32": [], "batch_normalization_12": [], "max_pooling2d_16": [], "dropout_14": [], "flatten_5": [], "2048": [], "262272": [], "batch_normalization_13": [], "dropout_15": [], "1290": [], "552": [], "874": [], "551": [], "722": [], "ipykernel_34025": [], "2702396986": [], "invalid": [], "true_divid": [], "25000": [], "100u": [], "2879": [], "8862": [], "worth": [], "114u": [], "3511": [], "8770": [], "error_scor": [], "0x134b7e0f0": [], "iid": [], "pre_dispatch": [], "refit": [], "pivot_t": [], "param_epoch": [], "param_learning_r": [], "00e": [], "np_util": [], "2246": [], "88u": [], "0950": [], "6901": [], "original_model": [], "smaller_model": [], "original_hist": [], "smaller_model_hist": [], "original_val_loss": [], "smaller_model_val_loss": [], "l2_model_hist": [], "resist": [], "l2_model_val_loss": [], "dpt_model_hist": [], "dpt_model_val_loss": [], "sequential_39": [], "dense_119": [], "pend": 1, "tue": 1, "47": 20, "169040": 20, "169176": 20, "93456367364179": 20, "39052595861006": 20, "unfix": 25, "height_ratio": 25, "458370": [], "458531": [], "309857": [], "363654": [], "483482": [], "329407": [], "divers": 26, "09": 26, "551679": 26, "551955": 26, "549837": 26, "889092": 26, "963181": 26, "0090286": 26, "0000066": 26, "8731063": 26, "0004194": 26, "0108315": 26, "0000054": 26, "1064771": 26, "0000001": 26, "0001248": 26, "0000002": 26, "8842999935150146": 26, "9887999892234802": 27, "sequential_2": 27, "conv2d_6": 27, "max_pooling2d_4": 27, "conv2d_7": 27, "max_pooling2d_5": 27, "conv2d_8": 27, "max_pooling2d_6": 27, "conv2d_9": 27, "max_pooling2d_7": 27, "410m": 27, "08572481": 27, "0043471297": 27, "816": 28}, "objects": {}, "objtypes": {}, "objnames": {}, "titleterms": {"an": [0, 2], "open": 0, "machin": [0, 3, 19, 20, 22, 31, 40], "learn": [0, 3, 6, 14, 15, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 36, 38], "cours": [0, 2], "sourc": 0, "practic": [0, 19, 20, 21, 23, 24, 25, 26, 27], "orient": 0, "materi": [0, 1, 2], "theori": 0, "welcom": 1, "lectur": [1, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "get": [1, 7, 40], "your": [1, 3], "hand": 1, "dirti": 1, "have": 1, "some": [1, 30, 31], "feedback": 1, "lab": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18], "background": 1, "tutori": [1, 6, 11, 14, 15], "recommend": 1, "resourc": 1, "prerequisit": 2, "python": [2, 3, 29, 30, 31], "os": 2, "specif": 2, "note": [2, 32, 36, 37], "appl": 2, "silicon": 2, "m1": 2, "m2": 2, "virtual": 2, "environ": 2, "us": [2, 6, 9, 11, 18, 22, 27, 31], "conda": 2, "virtualenv": 2, "instal": [2, 18, 32], "tensorflow": [2, 14], "github": 2, "requir": 2, "packag": 2, "run": [2, 14, 37], "notebook": 2, "altern": 2, "googl": [2, 27], "colab": 2, "1": [3, 4, 5, 7, 8, 9, 10, 12, 13, 16, 17, 18, 19, 37], "overview": [3, 20, 23, 24, 26, 27, 28, 32], "why": [3, 19, 24, 26, 31], "numpi": [3, 30, 31], "scipi": [3, 30, 31], "matplotlib": [3, 30, 31], "scikit": [3, 6, 20, 24, 25, 31, 32], "algorithm": [3, 19, 22, 23, 31, 32], "data": [3, 7, 10, 11, 12, 13, 15, 16, 18, 19, 24, 25, 27, 29, 30, 31, 36, 37, 40, 44], "import": [3, 9, 10, 23, 24, 31], "build": [3, 10, 11, 14, 15, 19, 26, 31], "model": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 19, 20, 22, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 40, 43], "train": [3, 13, 14, 15, 22, 26, 27, 28, 31, 35], "test": [3, 10, 13, 14, 22, 24, 25, 31], "look": 3, "panda": [3, 30], "fit": [3, 7, 14, 31, 40], "make": [3, 20, 25, 31], "predict": [3, 6, 12, 14, 15, 20, 22, 25, 26, 28, 31, 43], "evalu": [3, 6, 13, 14, 19, 22, 23, 26, 28, 31, 42], "introspect": 3, "1a": 4, "linear": [4, 5, 7, 10, 20, 21, 35, 36, 43], "regress": [4, 15, 19, 20, 21, 22, 23, 25, 32, 33, 35, 37, 43], "quick": [4, 5, 36, 43], "visual": [4, 7, 10, 12, 22, 27, 35, 37, 40, 43], "exercis": [4, 5, 7, 8, 9, 10, 12, 13, 16, 17, 18], "benchmark": [4, 5, 10, 36, 43], "2": [4, 5, 7, 8, 9, 10, 12, 13, 16, 17, 18, 20, 26, 28, 37], "3": [4, 5, 6, 7, 8, 9, 10, 12, 13, 15, 16, 17, 18, 21, 26, 27, 28, 37], "regular": [4, 5, 14, 15, 16, 17, 20, 26, 36, 43], "coeffici": [4, 35, 43], "part": [], "solut": [5, 20], "1b": 5, "classif": [5, 6, 15, 17, 19, 20, 21, 22, 23, 28, 32, 33, 37], "A": [5, 9, 10, 16, 41], "interpret": [5, 16, 20, 25, 27, 36, 37], "misclassif": [5, 16, 36], "4": [5, 8, 9, 10, 11, 12, 13, 16, 17, 18, 22], "paramet": [5, 11, 32, 33], "select": [6, 8, 9, 15, 19, 20, 22, 24, 26, 30, 31], "procedur": [6, 22], "holdout": 6, "cross": [6, 20, 22, 31], "valid": [6, 22, 31, 39], "custom": [6, 34], "cv": 6, "split": [6, 13, 14, 22], "shuffl": [6, 22], "group": [6, 22], "metric": [6, 8, 14, 22, 26], "binari": [6, 15, 22], "probabilist": [6, 22, 25], "uncertainti": [6, 12], "multi": [6, 15, 22, 44], "class": [6, 15, 22, 27, 29, 37], "precis": [6, 22], "recal": [6, 22], "roc": [6, 22], "curv": [6, 14, 22, 36, 38, 39], "hyperparamet": [6, 7, 8, 14, 22, 26, 31, 35, 37, 38, 40], "tune": [6, 10, 14, 15, 21, 22, 24, 26, 27, 31, 35, 38, 40, 41, 44], "grid": [6, 11, 31], "search": [6, 11, 31], "nest": [6, 22, 31], "parallel": 6, "random": [6, 9, 23, 24, 31, 37], "2a": 7, "kernel": [7, 12, 21, 25, 40, 41], "svm": [7, 10, 20, 21, 37], "rbf": [7, 21, 40], "space": [7, 25, 40], "support": [20, 40], "vector": [20, 28, 40], "2b": 8, "dark": 8, "matter": 8, "preprocess": [8, 10, 11, 13, 14, 15, 24, 26, 28], "optim": [8, 13, 14, 19, 20, 22, 25, 26, 37, 44], "threshold": [8, 22, 24], "calibr": [8, 9, 22], "5": [8, 9, 10, 12, 13, 16, 18, 23], "cost": [8, 22], "function": [8, 13, 20, 22, 23, 25, 26, 29, 30, 37], "ensembl": [9, 18, 23, 24, 39], "tree": [9, 23, 32], "detect": 9, "forest": [9, 23], "other": [9, 18, 20, 21, 22, 23, 26], "measur": 9, "featur": [9, 10, 19, 21, 23, 24, 27, 31, 32, 43], "confus": [9, 22], "matrix": [9, 24], "6": [9, 10, 13, 14, 16, 18, 24, 37], "second": 9, "level": [9, 30], "7": [9, 15, 25], "8": [9, 18, 26], "gradient": [9, 20, 23, 26, 39], "boost": [9, 23, 37, 39], "exploratori": [10, 35], "analysi": [10, 17, 23, 29, 33, 35, 39, 44], "pipelin": [10, 11, 24, 31], "first": 10, "5b": 10, "discuss": 37, "engin": [11, 19, 24], "step": [11, 16, 24, 42], "featureunion": 11, "columntransform": 11, "bayesian": [12, 25, 37, 42], "reduc": [12, 20], "mauna": 12, "loa": 12, "neural": [13, 16, 17, 19, 25, 26, 27, 28], "network": [13, 14, 15, 17, 19, 25, 26, 27, 28], "load": [13, 37], "creat": 13, "deep": [13, 14, 15], "net": [13, 16, 20, 26, 27], "exampl": [14, 15, 19, 21, 23, 24, 25, 26, 27, 30, 31, 32], "reshap": [14, 26], "rescal": 14, "label": [14, 19], "format": 14, "sequenti": [14, 24], "The": [14, 21, 22, 44], "input": [14, 19], "layer": [14, 26, 27, 28], "activ": [14, 26, 27], "summari": [14, 19, 20, 21, 22, 23, 24, 26, 28], "choos": [14, 22, 26], "loss": [14, 20, 23, 26, 37], "repeat": [14, 22], "track": 14, "progress": 14, "check": 14, "earli": [14, 26], "stop": [14, 26], "weight": [14, 22, 25, 26], "decai": [14, 26], "dropout": [14, 26], "batch": [14, 26], "normal": [14, 24, 26], "combin": [14, 24, 41], "multipl": [14, 24, 26], "further": [14, 15, 16, 30], "read": [14, 15, 30], "text": [15, 17, 28], "topic": [15, 17], "prepar": 15, "word": [15, 17, 28], "embed": [15, 17, 28], "kera": [15, 27], "7a": 16, "convolut": [16, 27, 28], "simpl": [16, 28, 30, 41], "vgg": 16, "like": 16, "augment": [16, 27], "option": 16, "take": [16, 27], "7b": 17, "sentiment": 17, "automl": 18, "gama": 18, "standard": [18, 24, 28], "case": 18, "NO": 18, "sub": 18, "automat": [18, 24], "covertyp": 18, "imag": [18, 27], "recognit": [18, 38], "tool": 18, "introduct": 19, "what": 19, "induct": 19, "bia": [19, 22, 23, 39], "vs": [19, 20, 22, 26, 37], "statist": [19, 24], "type": [19, 29], "supervis": [19, 24], "flower": 19, "represent": [19, 21, 28, 36], "unsupervis": [19, 24], "cluster": 19, "dimension": [19, 25], "reduct": 19, "reinforc": 19, "overfit": [19, 20, 22, 23, 32], "underfit": [19, 22], "onli": 19, "gener": [19, 20, 25, 27, 34], "count": [19, 28], "better": 19, "transform": [19, 24, 28, 31], "end": 19, "digit": 19, "curs": 19, "consequ": 19, "more": [19, 26, 31, 41], "can": 19, "beat": 19, "clever": 19, "system": [19, 22], "notat": 20, "definit": 20, "basic": [20, 26, 29, 30], "oper": [20, 22, 26, 30], "distribut": [20, 25, 43], "probabl": [20, 22, 25], "aka": 20, "ordinari": 20, "least": 20, "squar": [20, 22], "solv": 20, "descent": [20, 26], "stochast": [20, 25, 26], "sgd": [20, 26], "In": [20, 23, 24, 32], "ridg": [20, 21], "wai": [20, 27], "lasso": 20, "absolut": [20, 24], "shrinkag": 20, "coordin": 20, "l1": 20, "l2": 20, "elast": 20, "logist": 20, "entropi": [20, 23], "method": [20, 21], "solver": 20, "lagrang": 20, "multipli": 20, "geometr": 20, "knn": [20, 24, 33], "soft": [20, 24], "margin": 20, "effect": [20, 22, 23, 25, 26, 27], "perceptron": 20, "multiclass": 20, "one": [20, 28], "rest": 20, "all": 20, "map": [21, 27], "how": [21, 25, 30], "expens": 21, "thi": 21, "trick": 21, "which": 21, "exist": 21, "polynomi": [21, 24, 25, 31], "gaussian": [21, 25, 37, 41, 42], "theorem": 21, "design": 22, "real": [22, 24, 27], "world": [22, 24, 27, 29], "perform": [22, 37], "estim": [22, 26], "techniqu": [22, 23, 24], "k": [22, 33], "fold": 22, "stratifi": 22, "leav": 22, "One": [22, 24], "out": [22, 23], "bootstrap": [22, 23], "time": [22, 37], "seri": [22, 30], "prequenti": 22, "matric": [22, 30], "accuraci": 22, "f1": 22, "score": 22, "decis": [22, 23, 32], "receiv": 22, "characterist": 22, "auroc": 22, "auprc": 22, "brier": 22, "platt": 22, "scale": [22, 24, 28, 31], "isoton": 22, "sensit": 22, "deal": 22, "imbal": 22, "instanc": 22, "r": 22, "error": [22, 23], "varianc": [22, 23, 39], "decomposit": [22, 24], "comput": [22, 25, 30], "understand": [22, 25], "under": [22, 23, 32], "recap": [23, 25, 26, 32, 33], "impur": 23, "base": [23, 24], "bag": [23, 28], "aggreg": 23, "tip": 23, "strength": [23, 32, 33], "weak": [23, 32, 33], "adapt": [23, 26], "adaboost": 23, "variant": [23, 31], "action": 23, "gradientboost": 23, "extrem": 23, "xgboost": [23, 37], "lightgbm": 23, "catboost": 23, "stack": 23, "do": 24, "we": 24, "need": 24, "min": 24, "max": [24, 27], "robust": 24, "maximum": 24, "scaler": 24, "power": 24, "categor": [24, 25], "encod": [24, 26, 28, 31], "ordin": 24, "hot": [24, 28], "dummi": 24, "target": 24, "appli": [24, 31], "set": 24, "distort": 24, "leakag": [24, 31], "onc": 24, "bike": 24, "share": 24, "covari": [24, 25], "univari": 24, "f": 24, "mutual": 24, "inform": [24, 26], "relief": 24, "iter": [24, 30, 37], "wrap": 24, "permut": 24, "comparison": [24, 37], "bin": 24, "interact": [24, 34], "miss": [24, 31], "valu": [24, 31, 32], "imput": [24, 31], "mean": 24, "factor": 24, "singular": 24, "svd": 24, "fancyimput": 24, "handl": [24, 32], "imbalanc": 24, "undersampl": [24, 27], "oversampl": 24, "synthet": 24, "minor": 24, "smote": 24, "resampl": 24, "imblearn": 24, "bay": 25, "rule": 25, "explod": 25, "sun": 25, "covid": 25, "naiv": 25, "On": [25, 32], "numer": 25, "process": [25, 37, 41, 42], "olymp": 25, "marathon": 25, "prior": 25, "p": 25, "w": 25, "sampl": [25, 37], "from": [25, 28, 37], "higher": 25, "noisi": 25, "posterior": 25, "mathbf": 25, "y": 25, "x": 25, "condit": 25, "densiti": 25, "x_": 25, "gpy": 25, "differ": [25, 37, 40], "conclus": 25, "see": 25, "figur": 25, "surrog": [25, 37], "acquisit": 25, "architectur": 26, "mini": 26, "forward": 26, "pass": 26, "tensor": 26, "element": 26, "wise": 26, "backward": 26, "backpropag": 26, "hidden": 26, "relu": 26, "tanh": 26, "output": 26, "initi": [26, 37], "transfer": [26, 27], "rate": 26, "schedul": 26, "momentum": 26, "adam": 26, "moment": 26, "zoo": 26, "memor": 26, "capac": 26, "bottleneck": 26, "9": 27, "demonstr": 27, "streetview": [27, 36], "filter": 27, "bank": 27, "convnet": 27, "border": 27, "zero": 27, "pad": 27, "stride": 27, "pool": 27, "cnn": 27, "vgg16": 27, "inceptionv3": 27, "resnet50": 27, "spatial": 27, "hierarchi": 27, "pre": [27, 28], "fast": 27, "extract": 27, "without": 27, "fine": 27, "awai": 27, "10": [28, 37], "scratch": 28, "word2vec": 28, "properti": 28, "fasttext": 28, "global": 28, "glove": 28, "document": [], "paragraph": [], "1d": 28, "conv1d": [], "pretrain": [], "hello": 29, "complex": [29, 32, 41], "string": 29, "For": 29, "loop": 29, "If": 29, "statement": 29, "scientif": 30, "ndarrai": 30, "univers": 30, "shape": 30, "manipul": 30, "index": 30, "slice": 30, "copi": 30, "view": 30, "shoot": 30, "yourself": 30, "foot": 30, "spars": 30, "datafram": 30, "wrangl": 30, "low": 30, "usag": 30, "advanc": 30, "plot": [30, 37], "librari": 30, "link": 30, "web": 31, "traffic": 31, "line": 31, "avoid": 31, "speed": 31, "date": 31, "autom": 31, "heurist": 32, "mani": 32, "control": 32, "nearest": 33, "neighbor": 33, "shrunken": 33, "centroid": 33, "scalabl": 33, "product": 34, "onlin": 34, "book": 34, "slide": 34, "static": 34, "final": 36, "robot": [37, 44], "navig": [37, 44], "helper": 37, "implement": 37, "60": 37, "point": 37, "xg": 37, "elasticnet": 37, "30": 37, "q1": 37, "warm": 37, "start": 37, "20": 37, "best": 37, "configur": 37, "randomli": 37, "remov": 37, "column": 37, "dataset": 37, "re": 37, "state": 37, "subsequ": 37, "q2": 37, "guassian": 37, "xgbregressor": 37, "gif": 37, "minimum": 37, "over": 37, "object": 37, "runtim": 37, "compar": 37, "gaussianprocessregressor": 37, "probrandomforestregressor": 37, "rfr": 37, "gp": 37, "q3": 37, "nepales": 38, "charact": 38, "randomforest": 38, "size": 39, "try": 40, "extrapol": [41, 42], "wave": 41, "updat": 42, "pollut": 43, "depend": 43, "fidel": 44, "self": [28, 44], "landscap": 44, "doc2vec": 28, "sequenc": 28, "seq2seq": 28, "recurr": 28, "rnn": 28, "attent": 28, "posit": 28}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 6, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.intersphinx": 1, "sphinx": 56}})
\ No newline at end of file
+Search.setIndex({"docnames": ["README", "intro", "labs/Lab 0 - Prerequisites", "labs/Lab 1 - Tutorial", "labs/Lab 1a - Linear Models for Regression", "labs/Lab 1b - Linear Models for Classification", "labs/Lab 2 - Tutorial", "labs/Lab 2a - Kernelization", "labs/Lab 2b - Model Selection", "labs/Lab 3 - Ensembles", "labs/Lab 4 - Pipelines", "labs/Lab 4 - Tutorial", "labs/Lab 5 - Bayesian learning", "labs/Lab 6 - Neural Networks", "labs/Lab 6 - Tutorial", "labs/Lab 7 - Tutorial", "labs/Lab 7a - Convolutional Neural Networks", "labs/Lab 7b - Neural Networks for text", "labs/Lab 8 - AutoML", "notebooks/01 - Introduction", "notebooks/02 - Linear Models", "notebooks/03 - Kernelization", "notebooks/04 - Model Selection", "notebooks/05 - Ensemble Learning", "notebooks/06 - Data Preprocessing", "notebooks/07 - Bayesian Learning", "notebooks/08 - Neural Networks", "notebooks/09 - Convolutional Neural Networks", "notebooks/10 - Neural Networks for text", "notebooks/Tutorial 1 - Python", "notebooks/Tutorial 2 - Python for Data Analysis", "notebooks/Tutorial 3 - Machine Learning in Python", "notebooks/Tutorial 4 - Decision Trees", "notebooks/Tutorial 5 - Nearest Neighbors", "production", "studies/S1 Regression with linear models", "studies/S10 Streetview with linear models", "studies/S11 Bayesian Robots", "studies/S2 Nepalese Character Recognition", "studies/S3 Bias-Variance and Ensembles", "studies/S4 Tuning Support Vector Machines", "studies/S5 Building Kernels", "studies/S6 Bayesian Updates", "studies/S8 Linear models for predicting pollution", "studies/S9 Multi-fidelity optimization"], "filenames": ["README.md", "intro.md", "labs/Lab 0 - Prerequisites.ipynb", "labs/Lab 1 - Tutorial.ipynb", "labs/Lab 1a - Linear Models for Regression.ipynb", "labs/Lab 1b - Linear Models for Classification.ipynb", "labs/Lab 2 - Tutorial.ipynb", "labs/Lab 2a - Kernelization.ipynb", "labs/Lab 2b - Model Selection.ipynb", "labs/Lab 3 - Ensembles.ipynb", "labs/Lab 4 - Pipelines.ipynb", "labs/Lab 4 - Tutorial.ipynb", "labs/Lab 5 - Bayesian learning.ipynb", "labs/Lab 6 - Neural Networks.ipynb", "labs/Lab 6 - Tutorial.ipynb", "labs/Lab 7 - Tutorial.ipynb", "labs/Lab 7a - Convolutional Neural Networks.ipynb", "labs/Lab 7b - Neural Networks for text.ipynb", "labs/Lab 8 - AutoML.ipynb", "notebooks/01 - Introduction.ipynb", "notebooks/02 - Linear Models.ipynb", "notebooks/03 - Kernelization.ipynb", "notebooks/04 - Model Selection.ipynb", "notebooks/05 - Ensemble Learning.ipynb", "notebooks/06 - Data Preprocessing.ipynb", "notebooks/07 - Bayesian Learning.ipynb", "notebooks/08 - Neural Networks.ipynb", "notebooks/09 - Convolutional Neural Networks.ipynb", "notebooks/10 - Neural Networks for text.ipynb", "notebooks/Tutorial 1 - Python.ipynb", "notebooks/Tutorial 2 - Python for Data Analysis.ipynb", "notebooks/Tutorial 3 - Machine Learning in Python.ipynb", "notebooks/Tutorial 4 - Decision Trees.ipynb", "notebooks/Tutorial 5 - Nearest Neighbors.ipynb", "production.md", "studies/S1 Regression with linear models.ipynb", "studies/S10 Streetview with linear models.ipynb", "studies/S11 Bayesian Robots.ipynb", "studies/S2 Nepalese Character Recognition.ipynb", "studies/S3 Bias-Variance and Ensembles.ipynb", "studies/S4 Tuning Support Vector Machines.ipynb", "studies/S5 Building Kernels.ipynb", "studies/S6 Bayesian Updates.ipynb", "studies/S8 Linear models for predicting pollution.ipynb", "studies/S9 Multi-fidelity optimization.ipynb"], "titles": ["An Open Machine Learning Course", "Welcome", "Prerequisites", "Lab 1: Machine Learning with Python", "Lab 1a: Linear regression", "Lab 1b: Linear classification", "Lab 2 Tutorial: Model Selection in scikit-learn", "Lab 2a: Kernelization", "Lab 2b: Model selection", "Lab 3: Ensembles", "Lab 4:  Data preprocessing", "Lab 4 Tutorial: Data engineering pipelines", "Lab 5: Bayesian models", "Lab 6: Neural networks", "Lab 6 Tutorial: Deep Learning with TensorFlow", "Lab 7 Tutorial: Deep Learning for text", "Lab 7a: Convolutional neural nets", "Lab 7b: Neural Networks for text", "Lab 8: AutoML", "Lecture 1: Introduction", "Lecture 2: Linear models", "Lecture 3: Kernelization", "Lecture 4: Model Selection", "Lecture 5. Ensemble Learning", "Lecture 6. Data preprocessing", "Lecture 7. Bayesian Learning", "Lecture 8. Neural Networks", "Lecture 9: Convolutional Neural Networks", "Lecture 10. Neural Networks for text", "Python for data analysis", "Python for scientific computing", "Machine Learning in Python", "Recap: Decision Trees", "Recap: k-Nearest Neighbor", "Production", "Regression with linear models", "Streetview with linear models", "Bayesian Robots!", "Nepalese character recognition", "Bias-Variance and Ensembles", "Tuning Support Vector Machines", "Kernels and Extrapolation", "Gaussian Processes, step by step", "Linear regression models for predicting pollution", "Multi-fidelity optimization for self-tuning robots"], "terms": {"jupyt": [0, 1, 2, 3, 30, 34], "notebook": [0, 1, 3, 9, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 32, 33, 34], "teach": [0, 23], "base": [0, 3, 7, 9, 12, 18, 19, 20, 21, 22, 25, 26, 27, 28, 30, 31, 32, 37, 38, 40, 42, 44], "scikit": [0, 4, 5, 11, 14, 15, 18, 22, 23, 26, 30, 37], "kera": [0, 13, 14, 17, 26, 28], "openml": [0, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 24, 31, 35, 36, 37, 38, 39, 40, 42, 44], "us": [0, 1, 3, 4, 5, 7, 8, 10, 12, 13, 14, 15, 16, 17, 19, 20, 21, 23, 24, 25, 26, 28, 29, 30, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "experi": [0, 5, 12, 16, 18, 19], "more": [0, 1, 2, 3, 4, 5, 7, 9, 10, 12, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 40, 42, 43, 44], "extens": [0, 2, 22, 30, 34], "mani": [0, 3, 4, 5, 6, 7, 8, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 33, 35, 36], "dataset": [0, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "onlin": [0, 1, 2, 3, 29, 31], "book": [0, 3, 31], "power": [0, 7, 19, 20, 21, 23, 29], "we": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "code": [0, 2, 3, 4, 5, 7, 8, 9, 17, 18, 19, 23, 29, 30, 31, 34, 37, 44], "exampl": [0, 3, 4, 5, 6, 8, 9, 11, 13, 16, 18, 20, 22, 28, 33, 34, 36, 38, 39, 41], "from": [0, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 29, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44], "follow": [0, 2, 3, 8, 10, 11, 12, 13, 15, 18, 20, 24, 25, 26, 27, 29, 31, 32, 34, 37, 43, 44], "excel": [0, 28, 30], "urg": 0, "you": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 37, 39, 40, 41, 44], "read": [0, 2, 5, 9, 13, 17, 23, 25, 27, 32, 37, 38, 41, 44], "them": [0, 1, 5, 6, 8, 15, 18, 19, 22, 23, 24, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 41, 43, 44], "complet": [0, 2, 4, 5, 15, 19, 20, 22, 24, 29, 30, 32, 37, 39, 42, 43, 44], "coverag": [0, 2], "python": [0, 1, 4, 5, 15, 17, 23, 24, 27, 32], "introduct": [0, 1, 29], "andrea": [0, 23, 24], "mueller": [0, 23, 24, 25], "sarah": 0, "guido": 0, "focuss": 0, "entir": [0, 12, 14, 19, 20, 22, 26, 28, 31, 36, 37, 38], "written": [0, 29, 30], "one": [0, 2, 4, 5, 6, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 37, 38, 39, 44], "its": [0, 6, 13, 15, 17, 19, 23, 24, 25, 27, 28, 30, 31, 33, 41, 43, 44], "core": [0, 6, 14, 15, 20, 23, 26, 31], "develop": [0, 2, 3, 18, 19, 31, 39], "thi": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "offer": [0, 3, 6, 22, 23, 30, 31], "clear": [0, 4, 14, 24, 26, 28, 35, 36, 37, 40, 41, 43], "guidanc": [0, 22], "how": [0, 1, 3, 4, 5, 6, 7, 8, 14, 15, 16, 18, 19, 20, 22, 23, 24, 26, 27, 28, 29, 31, 32, 34, 37, 39, 41, 42, 44], "do": [0, 2, 3, 4, 5, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 25, 26, 27, 29, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44], "deep": [0, 1, 17, 19, 21, 22, 23, 25, 27, 28, 30, 32], "fran\u00e7oi": [0, 15], "chollet": [0, 15], "author": [0, 30], "librari": [0, 2, 3, 14, 28, 29, 31], "explan": [0, 27], "sebastian": 0, "raschka": 0, "One": [0, 3, 15, 23, 26, 27, 28, 31, 32, 33, 34, 35, 38], "classic": 0, "textbook": 0, "data": [0, 1, 2, 4, 5, 6, 8, 9, 14, 17, 20, 21, 22, 23, 26, 28, 32, 33, 35, 38, 39, 41, 42, 43], "analysi": [0, 1, 8, 19, 30], "mckinnei": [0, 30], "A": [0, 1, 2, 3, 8, 11, 12, 14, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 36, 37, 39, 40, 44], "introductori": [0, 2, 29], "broader": 0, "text": [0, 1, 4, 5, 7, 10, 12, 19, 20, 21, 22, 23, 24, 25, 26, 32, 33, 34, 36, 37, 40, 43, 44], "scienc": [0, 2, 19, 29], "For": [0, 2, 3, 4, 5, 7, 8, 9, 10, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 37, 39, 40, 41, 43, 44], "deeper": [0, 14, 16, 26, 27, 39], "understand": [0, 1, 4, 5, 7, 9, 10, 16, 19, 33, 35, 39, 41, 42], "techniqu": [0, 1, 3, 11, 14, 19, 20, 25, 26, 31, 36, 39, 44], "can": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "recommend": [0, 2, 6, 7, 19, 20, 22, 29, 32], "mathemat": [0, 1, 19, 30], "marc": 0, "deisenroth": [0, 1], "aldo": 0, "faisal": 0, "cheng": 0, "soon": [0, 44], "ong": 0, "provid": [0, 2, 4, 5, 6, 19, 22, 23, 27, 28, 29, 30, 31, 44], "basic": [0, 1, 12, 19, 23, 24, 31, 37], "linear": [0, 1, 3, 6, 9, 11, 12, 14, 16, 19, 22, 23, 24, 25, 26, 28, 30, 31, 32, 37, 38, 40, 41], "algebra": [0, 21, 25, 30], "geometri": [0, 37], "probabl": [0, 2, 6, 9, 10, 19, 23, 24, 26, 30, 32, 36, 37, 38], "continu": [0, 14, 18, 19, 20, 25, 32, 37], "optim": [0, 4, 6, 7, 9, 10, 11, 15, 17, 18, 23, 27, 28, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 43], "thei": [0, 1, 2, 4, 5, 6, 7, 8, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 36, 37, 39, 40, 41, 43], "ar": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "sever": [0, 2, 10, 14, 18, 24, 27, 28, 30, 31, 32, 35, 36, 38, 40, 41], "algorithm": [0, 1, 4, 5, 10, 11, 20, 24, 25, 27, 30, 33, 36, 37, 38, 39, 43, 44], "The": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 15, 16, 18, 19, 20, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], "pdf": [0, 1, 20, 21, 25, 30, 34, 37], "avail": [0, 2, 3, 6, 14, 19, 23, 24, 31, 32], "free": [0, 13, 16], "element": [0, 20, 21, 27, 29, 30, 34], "statist": [0, 14, 20, 25, 30, 31], "mine": 0, "infer": 0, "predict": [0, 4, 5, 7, 8, 9, 10, 11, 18, 19, 21, 23, 24, 27, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42], "2nd": [0, 23, 25, 27], "edit": [0, 2, 24], "trevor": 0, "hasti": 0, "robert": [0, 28], "tibshirani": 0, "jerom": 0, "friedman": 0, "kei": [0, 3, 6, 8, 15, 17, 24, 25, 26, 28, 29, 30, 31, 37], "refer": [0, 3, 5, 11, 22, 24, 30, 31, 36, 39], "field": [0, 28, 31], "great": [0, 17, 22, 23, 28, 30, 31, 36], "model": [0, 1, 17, 18, 21, 23, 33, 38, 39, 42, 44], "regular": [0, 7, 10, 11, 13, 19, 21, 22, 23, 24, 25, 27, 32, 33, 35, 37, 38, 41, 42, 44], "kernel": [0, 1, 6, 8, 11, 14, 15, 19, 20, 24, 26, 27, 28, 36, 37, 42, 44], "method": [0, 3, 4, 5, 7, 9, 11, 13, 18, 19, 22, 23, 24, 26, 30, 31, 35, 39, 44], "evalu": [0, 4, 5, 7, 8, 9, 10, 15, 17, 18, 20, 24, 25, 27, 32, 35, 36, 37, 38, 39, 40, 41, 43, 44], "ensembl": [0, 1, 19, 22, 35, 37, 38, 43], "neural": [0, 1, 3, 14, 15, 18, 20, 23, 24, 31, 36], "net": [0, 1, 3, 14, 15, 17, 19, 24, 28, 31, 36], "unsupervis": [0, 3, 28, 31], "ian": 0, "goodfellow": 0, "yoshua": 0, "bengio": 0, "aaron": 0, "courvil": 0, "current": [0, 13, 18, 22, 23, 27, 28, 36, 37], "chapter": [0, 2], "download": [0, 1, 2, 4, 5, 8, 9, 10, 13, 14, 15, 16, 17, 18, 26, 27, 28, 35, 36, 37, 38, 39, 42, 43, 44], "websit": [0, 31], "applic": [0, 3, 19, 22, 27, 31], "r": [0, 1, 2, 3, 4, 10, 11, 12, 14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 42, 43], "gareth": 0, "jame": 0, "daniela": 0, "witten": 0, "version": [0, 2, 3, 5, 10, 11, 14, 16, 18, 19, 20, 23, 24, 26, 27, 28, 31, 34], "abov": [0, 2, 4, 5, 7, 26, 27, 32, 35, 36, 37, 41, 44], "also": [0, 1, 2, 3, 4, 5, 6, 7, 8, 10, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "note": [0, 3, 6, 7, 8, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 33, 38, 39], "won": [0, 2, 7, 14, 29], "t": [0, 2, 4, 5, 6, 7, 8, 11, 12, 13, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 41, 42, 43], "main": [0, 4, 5, 23, 24, 29, 30, 33, 36, 42, 43, 44], "still": [0, 5, 9, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 36, 37, 38, 39, 40, 41, 44], "veri": [0, 3, 4, 7, 9, 10, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "gaussian": [0, 3, 7, 20, 31, 40], "process": [0, 3, 11, 18, 19, 20, 22, 24, 26, 27, 30, 31], "carl": 0, "edward": 0, "rasmussen": 0, "christoph": 0, "k": [0, 3, 4, 5, 7, 10, 11, 12, 14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 31, 32, 36, 37, 38, 40, 41, 43, 44], "i": [0, 4, 5, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 41, 43, 44], "william": 0, "bayesian": [0, 1, 14, 19, 23, 31], "see": [0, 1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 26, 27, 28, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], "david": 0, "mackai": 0, "s": [0, 3, 4, 5, 7, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "addit": [0, 4, 5, 18, 22, 23, 26, 27, 36, 37, 39, 43, 44], "insight": [0, 5, 22], "neil": [0, 25], "lawrenc": [0, 25], "all": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 43, 44], "first": [0, 2, 3, 4, 5, 6, 7, 8, 9, 12, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "principl": 0, "made": [0, 7, 15, 19, 22, 26, 28, 32, 35, 37, 40], "love": [0, 15, 28], "joaquin": [0, 3, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31], "vanschoren": [0, 3, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31], "releas": [0, 1], "under": [0, 2, 6, 7, 8, 18, 19, 24, 25, 39, 40], "cc0": 0, "licens": 0, "like": [0, 1, 2, 4, 5, 6, 9, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 37, 39, 40, 43, 44], "partli": 0, "licenc": 0, "mit": 0, "permiss": 0, "machin": [1, 2, 7, 11, 24, 25, 37, 41], "learn": [1, 4, 5, 7, 9, 11, 12, 13, 16, 17, 18, 21, 30, 37, 39, 42, 43, 44], "cours": [1, 3, 4, 5, 9, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 33, 38, 41], "creat": [1, 2, 3, 4, 5, 6, 7, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 40], "allow": [1, 2, 3, 4, 5, 6, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 34, 36, 37], "interact": [1, 4, 10, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 37, 43], "concept": [1, 19, 22, 23, 27, 32, 37], "better": [1, 3, 6, 7, 8, 9, 11, 14, 15, 17, 18, 22, 23, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "At": [1, 13, 23, 24, 26, 38, 39, 42], "same": [1, 3, 4, 6, 7, 9, 11, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 40, 41, 42, 43, 44], "time": [1, 3, 4, 5, 6, 8, 9, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 36, 38, 39, 41, 42, 43, 44], "ll": [1, 2, 3, 4, 5, 7, 8, 11, 14, 15, 19, 20, 24, 26, 27, 28, 29, 30, 31, 32, 34, 36, 38, 39, 40, 41, 42, 43], "control": [1, 7, 14, 15, 20, 23, 25, 28, 31, 36, 38, 39, 43, 44], "practic": [1, 2, 6, 22, 28, 29, 31, 36], "view": [1, 22, 36], "slide": [1, 7, 27, 37], "video": [1, 23, 26, 34], "host": 1, "youtub": 1, "content": [1, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34], "upon": [1, 29], "open": [1, 2, 27, 28, 32, 34], "launch": [1, 2, 34], "googl": [1, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 32, 33, 36], "colab": [1, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "binder": [1, 2], "run": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 13, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 34, 35, 36, 38, 40, 43, 44], "local": [1, 2, 16, 19, 20, 21, 24, 26, 27, 28, 31, 41], "1": [1, 6, 11, 14, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 39, 40, 41, 42, 43, 44], "html": [1, 3, 20, 21, 22, 23, 24, 32, 34, 37], "2": [1, 2, 3, 11, 14, 15, 19, 21, 22, 23, 24, 25, 27, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "3": [1, 2, 3, 6, 11, 14, 19, 20, 22, 23, 24, 25, 29, 30, 31, 32, 33, 35, 36, 38, 40, 41, 43, 44], "4": [1, 2, 3, 4, 6, 14, 15, 19, 20, 21, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "select": [1, 2, 3, 7, 11, 23, 25, 32, 36, 38, 44], "5": [1, 3, 4, 5, 6, 7, 11, 14, 15, 17, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "6": [1, 2, 3, 4, 5, 6, 8, 11, 15, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 38, 42, 43], "preprocess": [1, 18, 19, 20, 21, 22, 23, 27, 31, 35, 36, 43], "7": [1, 2, 3, 4, 5, 6, 11, 14, 16, 17, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 36, 37, 38, 41], "8": [1, 3, 4, 5, 6, 10, 12, 14, 15, 16, 19, 20, 21, 22, 23, 24, 25, 27, 28, 29, 30, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42], "network": [1, 3, 16, 18, 20, 23, 31], "9": [1, 3, 5, 6, 7, 11, 12, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 36, 37, 38, 40, 41, 42, 43], "convolut": [1, 26, 36, 37], "10": [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "order": [1, 4, 5, 8, 11, 14, 18, 19, 20, 21, 22, 23, 24, 25, 28, 31, 37, 39, 43], "slightli": [1, 20, 23, 28, 35, 36, 39, 40, 41, 43], "differ": [1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 14, 16, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 31, 32, 33, 35, 36, 38, 39, 41, 43], "significantli": [1, 35, 36], "updat": [1, 2, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 37, 39, 40, 43], "stai": [10, 32], "tune": [4, 5, 7, 8, 9, 11, 12, 13, 17, 18, 19, 20, 23, 33, 36, 37, 42, 43], "retriev": [1, 3, 6, 9, 10, 11, 16, 24, 25, 27, 29, 30, 31], "clone": [1, 2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "github": [1, 3, 7, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34, 40], "repo": [1, 34], "To": [1, 2, 3, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 18, 19, 20, 22, 26, 27, 28, 29, 31, 32, 33, 34, 35, 36, 38, 42], "prerequisit": 1, "If": [1, 2, 4, 5, 7, 8, 10, 11, 14, 15, 16, 18, 20, 21, 22, 23, 24, 25, 26, 27, 31, 37, 43, 44], "notic": [1, 36, 37, 44], "ani": [1, 2, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 38, 39, 40, 43], "issu": [1, 2, 20, 24, 25, 36, 37, 40], "suggest": [1, 22, 36, 37], "request": [1, 11], "pleas": [1, 3, 15, 18, 28], "go": [1, 15, 17, 18, 19, 26, 27, 28, 35, 41], "tracker": 1, "directli": [1, 11, 18, 20, 21, 22, 24, 25], "click": [1, 2, 5], "icon": [1, 34], "top": [1, 5, 8, 14, 20, 21, 22, 24, 25, 26, 27, 28, 32, 37, 39, 40, 44], "page": [1, 2, 3, 10, 34, 35], "pull": [1, 2], "solv": [1, 4, 5, 7, 15, 16, 19, 24, 25, 31], "question": [1, 8, 9, 18, 25, 37], "review": [1, 15, 17, 25, 28], "relev": [1, 6, 7, 9, 23, 27], "befor": [1, 6, 7, 8, 9, 14, 17, 22, 24, 25, 26, 27, 28, 31, 34, 35, 37, 40], "start": [1, 2, 5, 14, 15, 17, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 32, 34, 35, 36, 38, 39, 41, 42, 43, 44], "solut": [1, 8, 18, 21, 25, 28, 31, 39, 41, 44], "appear": [1, 21, 24, 28, 36, 40, 43], "toward": [1, 22, 24, 36], "end": [1, 10, 11, 12, 14, 15, 17, 20, 21, 22, 24, 25, 26, 27, 28, 29, 37, 39, 42], "each": [1, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 39, 40, 41, 43, 44], "session": [1, 18], "regress": [1, 3, 5, 10, 11, 24, 26, 28, 31, 36, 38, 41], "classif": [1, 3, 8, 13, 14, 18, 24, 25, 26, 27, 31, 36, 38, 39], "1a": 1, "1b": 1, "date": [1, 12, 30, 32], "feb": 1, "12": [1, 4, 5, 6, 7, 8, 12, 15, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 37, 39, 40, 43, 44], "00": [1, 15, 17, 18, 36], "2a": 1, "2b": 1, "15": [3, 7, 14, 15, 17, 19, 20, 22, 23, 24, 26, 27, 28, 30, 31, 33, 36, 37, 38, 40, 43, 44], "mar": [1, 24], "engin": [1, 22], "22": [14, 15, 17, 18, 22, 24, 26, 28, 30, 43], "imag": [1, 5, 14, 16, 19, 20, 22, 25, 26, 28, 36, 37, 38, 40, 44], "7a": 1, "7b": 1, "29": [15, 36], "automl": [24, 31], "mai": [2, 3, 4, 5, 8, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 38, 40, 41, 44], "chang": [3, 6, 11, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 26, 27, 29, 30, 31, 35, 37, 39, 44], "apr": [], "gener": [1, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 23, 24, 26, 28, 29, 30, 31, 35, 36, 37, 38, 39, 41, 42, 43, 44], "scientif": [1, 29], "program": [1, 4, 5, 20], "well": [1, 2, 3, 4, 5, 8, 11, 13, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 31, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "novic": 1, "cover": [1, 8, 14, 19, 24, 29, 34], "knowledg": [1, 19], "gap": [1, 14, 26, 27], "while": [1, 2, 4, 5, 9, 13, 14, 16, 19, 20, 22, 26, 27, 29, 33, 36, 37, 38, 39, 40, 41, 43], "advanc": [1, 3, 20, 22, 31], "student": [1, 34, 42], "skip": [1, 10, 21, 27, 28, 38, 41], "recap": 1, "decis": [1, 6, 7, 19, 20, 21, 26, 33, 39, 40], "tree": [1, 3, 18, 19, 24, 31, 33, 38, 39], "nearest": [1, 3, 5, 7, 19, 20, 21, 22, 24, 27, 31, 36, 37, 38, 40, 43], "neighbor": [1, 3, 4, 5, 19, 20, 23, 24, 27, 31, 36, 38, 43], "These": [1, 3, 6, 20, 21, 22, 25, 26, 27, 31, 34, 39], "help": [1, 4, 11, 14, 19, 20, 22, 24, 27, 30, 35, 36, 37, 39], "further": [1, 23, 28, 36, 38], "deepen": 1, "skill": [1, 2, 29], "align": [1, 20, 23, 24, 25, 30, 32], "j": [1, 3, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 39], "johansson": [1, 3, 31], "m": [1, 5, 12, 13, 18, 22, 23, 24, 25, 26, 28, 30, 31, 37, 43], "p": [1, 4, 7, 10, 19, 20, 21, 22, 23, 24, 26, 27, 30, 32, 33, 34, 38, 40, 41, 42, 43], "et": [1, 18, 22, 25], "al": [1, 18, 22, 25], "fast": [1, 3, 20, 23, 25, 26, 28, 30, 31, 33, 37, 38, 44], "ai": [1, 20, 26], "crash": 1, "guid": [2, 29, 30], "set": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44], "up": [2, 5, 6, 11, 14, 15, 17, 18, 20, 21, 22, 23, 24, 26, 27, 28, 32, 35, 36, 37, 39, 41], "need": [2, 3, 6, 7, 8, 10, 11, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "have": [2, 4, 5, 6, 7, 8, 10, 11, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 43, 44], "done": [2, 5, 9, 14, 19, 20, 21, 22, 23, 24, 25, 28, 29, 30, 32, 36, 44], "so": [2, 3, 4, 5, 6, 7, 8, 11, 12, 14, 15, 16, 18, 20, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 38, 39, 40, 43, 44], "alreadi": [2, 3, 4, 5, 7, 9, 10, 14, 15, 18, 23, 24, 27, 28, 31, 35, 37, 39], "easiest": 2, "wai": [2, 3, 7, 11, 14, 16, 19, 22, 24, 25, 26, 28, 30, 31, 32, 36, 37, 40, 42], "miniconda": 2, "which": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 22, 23, 24, 25, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43], "commonli": [2, 22, 25], "sure": [2, 10, 13, 18, 22, 24, 27, 28, 37, 42], "right": [2, 5, 11, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 41, 42, 43, 44], "alwai": [2, 3, 6, 10, 14, 15, 19, 20, 21, 22, 24, 26, 28, 31, 36, 39, 40, 41], "64": [2, 9, 14, 15, 16, 17, 23, 24, 26, 27, 28, 29, 30, 38, 39], "bit": [2, 9, 16, 19, 36, 37, 39, 40, 41], "your": [2, 5, 7, 8, 9, 11, 13, 14, 15, 16, 18, 19, 20, 22, 23, 24, 25, 26, 27, 29, 31, 36, 37, 38, 41, 43, 44], "support": [2, 3, 6, 7, 11, 14, 15, 16, 18, 21, 22, 23, 26, 27, 31, 32, 34, 37, 39, 41, 42], "later": [2, 4, 5, 14, 15, 16, 19, 20, 22, 23, 26, 27, 28, 30, 31, 35, 36, 44], "new": [1, 2, 3, 4, 9, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 36, 37, 44], "handbook": 2, "take": [2, 4, 5, 9, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 29, 31, 32, 36, 37, 38, 40, 41, 43, 44], "definit": [2, 21, 29, 41], "whirlwind": [2, 29], "tour": [2, 29], "step": [2, 4, 14, 15, 18, 20, 23, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 43, 44], "approach": [2, 18, 20, 22, 24, 25, 27, 28, 29, 32, 37, 43], "try": [2, 3, 4, 5, 7, 9, 12, 13, 16, 17, 22, 24, 26, 28, 29, 30, 36, 37, 38, 41, 42, 43], "datacamp": [2, 3, 29, 31], "intro": [2, 3, 29, 34], "some": [2, 4, 5, 7, 10, 11, 12, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 34, 35, 36, 37, 38, 39, 40, 41, 44], "hackerrank": [2, 29], "challeng": [2, 8, 29, 41], "window": [2, 22, 27, 28, 31, 32], "user": [2, 3, 18, 19, 22, 31], "anaconda": [2, 32], "prompt": 2, "command": [2, 27, 29], "lab": [2, 23, 31, 32], "mac": 2, "termin": 2, "make": [2, 4, 5, 6, 7, 8, 10, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 26, 27, 28, 30, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "line": [2, 4, 5, 7, 10, 12, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 33, 35, 39, 40], "tool": [2, 14, 19, 20, 22, 23, 30, 32, 33, 35, 38, 41], "xcode": 2, "full": [2, 5, 7, 11, 19, 22, 27, 28, 32, 39, 40], "correct": [2, 3, 7, 9, 10, 12, 19, 20, 22, 23, 24, 25, 26, 27, 31, 32, 36, 38, 44], "graphviz": [2, 23, 32], "accord": [2, 6, 9, 19, 20, 21, 22, 23, 25, 26, 27, 28, 32, 37, 38], "those": [2, 9, 17, 18, 27, 28, 29, 40], "who": [2, 29], "laptop": 2, "effect": [2, 4, 10, 14, 16, 24, 32, 33, 35, 36, 37, 39, 40, 43], "gpu": [2, 14, 15, 16, 20, 23, 26, 27], "howev": [2, 8, 10, 14, 18, 21, 22, 30, 35, 36, 37, 41, 44], "latest": [2, 19, 23], "maco": [2, 18], "doesn": [2, 4, 6, 19, 20, 22, 23, 26, 27, 28, 39, 41, 43], "work": [2, 3, 4, 6, 10, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 40, 41], "reliabl": [2, 23], "downgrad": 2, "older": 2, "procedur": [2, 18, 21, 23, 24, 29, 31, 44], "ha": [1, 2, 4, 5, 6, 7, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 40, 43, 44], "been": [1, 2, 14, 15, 18, 20, 26, 27, 37, 44], "known": [2, 7, 20, 24, 25, 28, 44], "miniconda3": [2, 3], "chip": 2, "cd": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "directori": [2, 27, 34], "c": [2, 3, 4, 5, 6, 7, 8, 10, 11, 12, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 40, 41, 42, 43, 44], "dep": 2, "forg": [2, 23, 34], "cvxpy": 2, "pip": [2, 3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34, 36], "metal": [2, 14, 15, 20, 26, 27], "0": [2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "resolv": [2, 24], "poor": 2, "e": [2, 4, 5, 7, 8, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "g": [2, 4, 5, 8, 10, 11, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 42], "fancyimput": 2, "custom": [2, 7, 15, 19, 27, 28, 30], "possibl": [2, 6, 7, 14, 18, 19, 20, 21, 22, 23, 24, 25, 27, 29, 31, 33, 35, 37, 44], "highli": [2, 3, 24, 31, 37], "avoid": [2, 14, 19, 20, 22, 23, 24, 26, 27, 29, 36], "interfer": 2, "other": [2, 3, 4, 5, 6, 8, 10, 11, 14, 17, 19, 24, 25, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 39, 40, 41, 43, 44], "project": [2, 14, 17, 19, 20, 21, 22, 25, 28, 31, 37], "class": [2, 3, 5, 7, 9, 13, 14, 16, 18, 19, 20, 21, 23, 24, 25, 26, 28, 31, 32, 33, 36, 38, 39, 40], "strictli": [2, 20], "fresh": 2, "sinc": [1, 2, 4, 5, 10, 13, 14, 15, 20, 21, 22, 25, 27, 28, 34, 35, 36, 37, 38, 39, 43, 44], "automat": [2, 6, 11, 12, 19, 20, 31], "call": [2, 3, 4, 5, 7, 8, 11, 14, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29, 30, 31, 36, 39, 44], "mlcours": 2, "whatev": [2, 30], "n": [2, 3, 5, 6, 11, 12, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 36, 37, 38, 39, 42, 43, 44], "activ": [2, 13, 15, 16, 17, 18, 20, 25, 28], "deactic": 2, "deactiv": 2, "venv": 2, "prefer": [2, 14, 18, 20, 22, 24, 26, 35], "sourc": [2, 8, 30, 32], "bin": [2, 3, 22, 23, 28, 30, 43], "script": [2, 34, 38], "type": [2, 3, 5, 9, 14, 15, 16, 18, 20, 22, 24, 26, 27, 28, 30, 31, 32, 36, 37, 41], "haven": 2, "instruct": [2, 34], "ubuntu": [2, 32], "even": [2, 4, 16, 18, 21, 23, 24, 26, 27, 28, 31, 36, 37, 38, 40, 41, 43], "setup": [2, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 32, 33, 37], "easili": [2, 6, 20, 23, 24, 25, 28, 30, 31, 32, 33, 36, 41, 42], "git": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "repositori": 2, "gui": [2, 30], "http": [2, 7, 8, 10, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 39, 40, 41, 42], "com": [2, 7, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 40], "ml": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "master": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 34], "detail": [2, 3, 5, 7, 14, 26, 40], "minut": [2, 18, 36, 38], "tutori": [2, 3, 13, 16, 17, 26, 30, 31], "ag": [2, 11, 24, 29, 30, 31], "submit": 2, "assign": [2, 9, 11, 20, 24, 29, 30, 31, 44], "zip": [2, 3, 4, 5, 7, 10, 12, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 36, 40, 43], "file": [2, 3, 18, 28, 30, 31, 32, 34], "Or": [2, 6, 11, 15, 20, 22, 23, 24, 28, 31], "individu": [2, 11, 18, 20, 23, 24, 27, 28, 39], "save": [2, 4, 5, 23, 24, 27, 37, 38, 43], "link": [2, 5, 24], "As": [2, 9, 15, 21, 23, 26, 27, 32, 34, 37, 42], "next": [2, 9, 10, 14, 16, 18, 19, 20, 22, 24, 25, 26, 27, 28, 31, 35, 37, 38, 39, 40, 42, 43, 44], "index": [2, 10, 15, 20, 22, 23, 27, 28, 29, 32, 34, 35, 36, 37, 39], "folder": [2, 14, 15], "where": [2, 7, 8, 11, 16, 20, 21, 22, 25, 26, 27, 28, 32, 37], "adjust": [2, 37, 41, 43], "path": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 37], "txt": [2, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "upgrad": 2, "u": [2, 3, 14, 17, 20, 21, 24, 25, 42], "option": [2, 3, 5, 10, 22, 23, 24, 25, 28, 29, 30, 31, 32, 35, 37], "should": [2, 3, 4, 5, 6, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 38, 39, 40, 41, 43, 44], "our": [2, 3, 5, 7, 8, 11, 14, 15, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 31, 35, 36, 37, 38, 41, 44], "interleav": 2, "document": [2, 3, 5, 7, 9, 15, 18, 23, 24, 28, 31, 34, 37], "markdown": [2, 18], "execut": [2, 31, 32], "browser": 2, "That": [2, 25], "mean": [2, 3, 4, 5, 6, 7, 10, 11, 12, 14, 15, 18, 19, 20, 22, 23, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 43, 44], "re": [2, 9, 14, 22, 23, 24, 25, 27, 40, 44], "quick": [2, 7, 8, 10, 12, 29, 30, 39], "depth": [2, 9, 19, 23, 26, 32, 39], "check": [2, 4, 5, 7, 8, 12, 18, 19, 23, 26, 30, 35, 36, 37], "cell": [2, 3, 18, 26, 28, 34], "shut": 2, "down": [2, 11, 20, 25, 26, 27, 36, 39, 43], "ctrl": 2, "without": [2, 8, 10, 11, 14, 15, 16, 20, 21, 22, 24, 25, 26, 28, 30, 35, 37, 40, 41, 43, 44], "It": [2, 3, 4, 5, 7, 9, 11, 13, 14, 16, 18, 19, 20, 21, 23, 24, 27, 30, 31, 35, 36, 37, 38, 39, 40, 41, 43, 44], "limit": [2, 20, 22, 28, 29, 31, 32, 36], "resourc": [2, 20, 22, 26, 37], "case": [2, 7, 14, 20, 22, 24, 25, 26, 29, 36, 37, 39, 42], "encount": [2, 24], "don": [2, 5, 6, 8, 11, 13, 14, 15, 20, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 34, 36, 40, 41, 43], "overview": [2, 14, 21, 35], "button": 2, "upload": [2, 16], "yourself": [2, 7, 22], "pieter": 3, "gijsber": 3, "bilg": 3, "celik": 3, "prabhant": 3, "singh": 3, "inlin": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "np": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "pd": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 24, 27, 30, 31, 32, 35, 36, 37, 38, 39, 40, 42, 43], "exercis": 3, "heavi": [3, 31], "now": [3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 21, 22, 24, 25, 26, 27, 28, 30, 31, 35, 36, 37, 39, 41, 42, 43], "readabl": [3, 31], "less": [3, 6, 7, 14, 19, 20, 22, 23, 24, 26, 27, 28, 31, 35, 36, 39], "complex": [3, 4, 5, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 33, 37, 43], "prototyp": [3, 19, 22, 31], "easi": [3, 6, 15, 19, 22, 23, 24, 27, 28, 31, 32, 33, 44], "offload": [3, 31], "number": [3, 4, 5, 6, 7, 9, 10, 13, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 41, 43], "crunch": [3, 31], "underli": [3, 31], "fortran": [3, 30, 31], "instal": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 33, 34, 36], "rich": [3, 31], "effici": [3, 19, 22, 24, 25, 26, 27, 28, 30, 31, 37], "structur": [3, 14, 19, 25, 30, 31, 38], "numer": [3, 8, 10, 11, 15, 19, 20, 22, 23, 24, 26, 28, 30, 31, 37, 39], "recip": [3, 31], "high": [3, 7, 8, 9, 11, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 37, 38, 39, 41, 42], "qualiti": [3, 5, 30, 31], "graph": [3, 21, 25, 28, 31, 37], "tensorflow": [3, 13, 15, 16, 17, 18, 20, 26, 27, 28, 31], "good": [3, 11, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 36, 37, 38, 39, 41], "jake": [3, 31], "vanderpla": [3, 31], "most": [3, 7, 9, 10, 14, 15, 17, 19, 20, 22, 23, 24, 25, 26, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 40, 43], "promin": [3, 31], "contain": [3, 4, 5, 6, 9, 11, 14, 15, 18, 19, 22, 24, 25, 28, 30, 31, 36, 37, 38, 43, 44], "state": [3, 19, 21, 23, 25, 28, 30, 31], "art": [3, 31], "implement": [3, 4, 5, 6, 9, 10, 13, 14, 15, 16, 22, 23, 24, 25, 26, 28, 31, 41, 44], "wide": [3, 21, 23, 27, 30, 31, 40], "rang": [3, 4, 5, 9, 10, 11, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "measur": [3, 4, 6, 19, 21, 22, 23, 24, 25, 26, 31, 32, 37, 38, 39, 42, 43], "comprehens": [3, 29, 31], "about": [3, 4, 5, 8, 9, 14, 16, 17, 18, 19, 22, 23, 24, 25, 27, 28, 31, 36, 37, 38, 39, 41, 42, 43], "wealth": [3, 31], "snippet": [3, 31], "supervis": [3, 28, 31], "ridg": [3, 4, 10, 11, 19, 22, 24, 25, 31, 35, 40, 43, 44], "lasso": [3, 4, 10, 24, 31, 35, 43], "elast": [3, 31], "vector": [3, 7, 11, 15, 17, 19, 21, 22, 25, 26, 27, 30, 31, 37, 41], "random": [3, 5, 8, 11, 12, 13, 14, 16, 18, 19, 20, 22, 25, 26, 27, 28, 30, 32, 36, 38, 39, 41, 42, 43, 44], "forest": [3, 6, 24, 25, 31, 37, 38, 39, 43], "featur": [3, 4, 5, 7, 8, 11, 13, 15, 16, 20, 22, 25, 26, 28, 33, 35, 36, 38, 39], "cluster": [3, 24, 31], "kmean": [3, 19, 31], "matrix": [3, 4, 5, 6, 10, 16, 20, 21, 22, 25, 26, 27, 28, 30, 31, 35, 36], "decomposit": [3, 11, 19, 25, 30, 31, 36, 39], "pca": [3, 11, 19, 20, 24, 28, 31, 36], "manifold": [3, 19, 31], "embed": [3, 19, 20, 21, 24, 25, 26, 31], "densiti": [3, 20, 31], "estim": [3, 6, 8, 9, 11, 15, 17, 18, 19, 23, 24, 25, 31, 32, 35, 36, 38, 39, 42], "outlier": [3, 19, 20, 22, 24, 31, 38], "detect": [3, 8, 16, 19, 24, 27, 31, 37, 39], "cross": [3, 4, 5, 7, 8, 9, 10, 11, 14, 15, 17, 18, 19, 23, 24, 25, 26, 28, 35, 36, 37, 38, 40, 43, 44], "valid": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 35, 36, 37, 38, 40, 41, 43], "grid": [3, 4, 5, 7, 17, 20, 21, 22, 23, 24, 26, 27, 35, 36, 37, 38, 40, 41, 42, 43, 44], "search": [3, 4, 5, 7, 8, 14, 17, 18, 19, 22, 23, 24, 25, 32, 35, 36, 37, 38, 40, 41, 43, 44], "lot": [3, 4, 5, 8, 10, 14, 15, 16, 19, 21, 23, 24, 25, 26, 27, 28, 31, 35, 36, 37, 39, 40, 41], "metric": [3, 5, 13, 15, 17, 18, 19, 21, 24, 27, 28, 31, 36, 37, 39, 40, 41], "multipl": [3, 5, 6, 8, 11, 12, 19, 20, 22, 27, 28, 29, 30, 31], "few": [3, 6, 7, 15, 16, 18, 19, 21, 22, 24, 25, 26, 27, 28, 29, 31, 33, 34, 36, 37, 38, 41], "toi": [3, 20, 22, 23, 26, 31], "includ": [3, 4, 5, 10, 11, 14, 15, 20, 21, 22, 24, 27, 28, 31, 35, 38, 41, 43], "sklearn": [3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "1000": [3, 9, 12, 15, 17, 21, 23, 24, 25, 27, 30, 31, 33, 36, 37, 40, 41, 42], "via": [3, 9, 14, 25, 27, 31], "fetch_openml": [3, 11, 12, 20, 22, 24, 31], "csv": [3, 22, 30, 31, 32], "load_iri": [3, 6, 11, 22, 31], "iris_data": [3, 31], "dating_data": [3, 31], "speeddat": [3, 31], "jvanscho": [3, 18, 31], "lib": [3, 18, 31], "python3": [3, 18, 31], "site": [3, 18, 31], "packag": [3, 18, 23, 24, 29, 30, 31, 32], "_openml": 3, "py": [3, 14, 15, 18, 31], "932": 3, "futurewarn": [3, 18], "default": [3, 4, 5, 6, 7, 8, 10, 12, 13, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 40, 41, 42, 43], "valu": [3, 4, 5, 6, 7, 9, 10, 11, 12, 13, 14, 15, 17, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 30, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "parser": [3, 18], "liac": 3, "arff": 3, "auto": [3, 4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32, 33, 43], "silenc": [3, 14], "warn": [3, 4, 5, 6, 18, 37, 43], "therefor": [3, 7, 13, 14, 37], "an": [3, 4, 6, 7, 8, 9, 10, 11, 12, 13, 14, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "importerror": 3, "rais": 3, "dens": [3, 13, 14, 15, 16, 17, 26, 27, 28, 30], "return": [3, 4, 5, 6, 7, 9, 10, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "section": [3, 22], "api": [3, 14, 15, 18, 26], "doc": [3, 28, 30], "bunch": [3, 31], "object": [3, 6, 13, 14, 15, 19, 20, 22, 25, 27, 28, 29, 30, 31], "similar": [3, 6, 8, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 37, 38, 39], "dict": [3, 11, 14, 15, 17, 21, 22, 24, 28, 29, 30, 31, 37], "print": [3, 4, 6, 7, 11, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 35, 36, 37, 38, 39, 40, 41, 43, 44], "iris_dataset": [3, 31], "format": [3, 4, 5, 6, 7, 11, 13, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 42, 43, 44], "descr": [3, 31], "193": [3, 31], "dict_kei": [3, 31], "target": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 26, 27, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "frame": [3, 11, 26, 31, 37], "target_nam": [3, 31, 38], "feature_nam": [3, 23, 28, 31, 32], "filenam": [3, 18, 31, 37], "data_modul": [3, 31], "_iris_dataset": [3, 31], "iri": [3, 6, 11, 19, 22, 24, 31], "plant": [3, 31], "characterist": [3, 31], "instanc": [3, 5, 7, 8, 10, 14, 15, 20, 23, 26, 29, 31, 32, 35, 36, 39, 40, 44], "150": [3, 6, 20, 21, 22, 24, 27, 28, 31, 40], "50": [3, 4, 5, 8, 9, 12, 13, 14, 15, 16, 17, 18, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 33, 35, 36, 38, 39, 40, 42, 43, 44], "three": [3, 5, 6, 15, 17, 18, 30, 31, 37], "attribut": [3, 5, 7, 10, 11, 12, 16, 31, 32, 35], "pre": [3, 15, 19, 23, 24, 25, 31, 32, 34, 41], "list": [3, 4, 5, 6, 7, 10, 11, 14, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 35, 36, 37, 39, 41, 42, 43, 44], "string": [3, 11, 14, 22, 30, 31], "ndarrai": [3, 22, 31, 37], "shape": [3, 6, 7, 11, 13, 14, 15, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 37, 40, 41], "row": [3, 15, 20, 21, 22, 23, 24, 25, 27, 28, 30, 31, 36, 37], "setosa": [3, 19, 31], "versicolor": [3, 19, 31], "virginica": [3, 19, 31], "sepal": [3, 31], "length": [3, 17, 18, 19, 25, 27, 28, 29, 31, 34, 41], "cm": [3, 4, 5, 6, 7, 8, 13, 14, 19, 20, 21, 22, 24, 25, 26, 31, 36, 38, 40, 43], "width": [3, 4, 5, 7, 19, 20, 21, 23, 24, 25, 26, 27, 31, 32, 35, 36, 40, 41, 43], "petal": [3, 31], "scikitlearn": [3, 31], "interfac": [3, 18, 24, 30, 31], "supervisedestim": [3, 31], "def": [3, 4, 5, 7, 10, 12, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "__init__": [3, 22, 25, 29, 31, 37], "self": [3, 14, 18, 19, 22, 25, 26, 29, 31, 37], "hyperparam": [3, 31, 37, 44], "x": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "y": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "given": [3, 4, 5, 6, 7, 10, 13, 14, 19, 20, 22, 23, 24, 25, 27, 28, 29, 30, 31, 36, 37, 38, 41], "unseen": [3, 22, 24, 25, 28, 31], "y_pred": [3, 5, 6, 19, 20, 22, 23, 25, 31, 32, 36, 37, 39, 42], "score": [3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 17, 18, 19, 20, 21, 23, 24, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "compar": [3, 5, 10, 15, 18, 19, 21, 22, 23, 24, 27, 31, 35, 41], "true": [3, 5, 6, 7, 10, 11, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 41, 42, 43, 44], "label": [3, 4, 5, 6, 7, 12, 13, 15, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "classifi": [3, 4, 5, 6, 7, 8, 9, 11, 18, 19, 20, 21, 22, 23, 24, 25, 27, 31, 32, 36, 37, 39], "train_test_split": [3, 5, 6, 11, 13, 14, 18, 20, 22, 23, 24, 26, 31, 32, 33, 36, 37, 38, 39, 40, 43], "split": [3, 4, 5, 7, 8, 9, 11, 15, 16, 17, 18, 19, 23, 24, 28, 30, 31, 32, 33, 39, 41, 44], "randomli": [3, 14, 19, 20, 22, 23, 24, 26, 27, 31, 44], "75": [3, 12, 20, 22, 24, 27, 30, 31], "25": [3, 8, 10, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 38, 39, 40, 41, 43], "model_select": [3, 5, 6, 11, 13, 14, 15, 18, 19, 20, 22, 23, 24, 26, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 43, 44], "x_train": [3, 5, 6, 8, 11, 12, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 37, 38, 39, 42], "x_test": [3, 5, 6, 8, 11, 13, 14, 15, 18, 20, 22, 23, 24, 25, 26, 28, 31, 32, 33, 36, 38, 39, 42], "y_train": [3, 5, 6, 11, 12, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 37, 38, 39, 42], "y_test": [3, 5, 6, 11, 13, 14, 15, 18, 20, 22, 23, 24, 26, 28, 31, 32, 33, 36, 38, 39, 42], "random_st": [3, 5, 6, 9, 11, 13, 14, 18, 19, 20, 21, 22, 23, 24, 26, 31, 32, 33, 36, 38, 39, 44], "112": [3, 14, 15, 31], "38": [3, 15, 25, 28, 30, 31, 41], "choos": [3, 4, 9, 19, 20, 23, 24, 25, 27, 30, 31], "when": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 34, 36, 37, 39, 40, 41, 44], "deal": [3, 5, 18, 26, 27, 36, 44], "larg": [3, 4, 14, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 33, 35, 36, 37, 38, 39, 40, 42, 44], "stratifi": [3, 5, 6, 9, 13, 14, 18, 23, 24, 26, 31, 32, 36, 38], "defin": [3, 4, 6, 7, 11, 12, 13, 14, 15, 19, 20, 21, 24, 25, 26, 27, 28, 29, 30, 31, 32, 34, 36, 37, 39, 41], "ensur": [3, 9, 14, 24, 26, 27, 28, 31], "distribut": [3, 6, 10, 19, 22, 24, 27, 30, 31, 32, 35, 38, 42], "kept": [3, 23, 41], "xs_train": [3, 8, 22], "xs_test": [3, 8, 22], "ys_train": [3, 22], "ys_test": [3, 22], "train_siz": [3, 5, 6, 13, 14, 18, 22, 26, 36, 38], "test_siz": [3, 6, 11, 22, 23, 24, 32, 39], "05": [3, 4, 5, 20, 21, 22, 25, 26, 27, 32, 35, 36, 37, 38, 43], "plot": [3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "scatter_matrix": [3, 10, 35], "datafram": [3, 4, 8, 9, 10, 13, 15, 18, 21, 24, 27, 35, 36, 37, 38, 39, 40, 43], "name": [3, 4, 5, 6, 7, 8, 9, 10, 11, 14, 15, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 43], "iris_df": 3, "column": [3, 4, 8, 9, 10, 11, 18, 19, 20, 21, 22, 23, 24, 25, 27, 30, 35, 39, 43], "scatter": [3, 7, 9, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 33, 35, 37, 40, 41, 43, 44], "color": [3, 4, 5, 7, 10, 12, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 43, 44], "sm": 3, "figsiz": [3, 4, 5, 7, 8, 10, 12, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43], "marker": [3, 5, 7, 10, 19, 21, 22, 24, 26, 30, 33, 35, 37, 38, 40, 43], "o": [3, 10, 19, 20, 21, 22, 23, 24, 25, 26, 30, 33, 35, 38], "hist_kwd": 3, "20": [1, 3, 4, 5, 6, 9, 10, 13, 14, 15, 16, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 38, 39, 41, 42, 43, 44], "60": [3, 16, 18, 19, 20, 22, 23, 25, 27, 28, 30, 31, 38, 41, 43], "alpha": [3, 4, 7, 10, 11, 12, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 33, 35, 37, 38, 40, 41, 42, 43, 44], "knn": [3, 4, 5, 19, 28, 31, 36, 38, 43], "let": [3, 4, 5, 7, 8, 10, 11, 15, 19, 22, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 41, 43, 44], "kneighborsclassifi": [3, 5, 19, 23, 24, 31, 33, 36, 38], "n_neighbor": [3, 4, 5, 19, 23, 24, 31, 33, 36, 38, 43], "In": [3, 5, 7, 10, 11, 13, 14, 15, 16, 18, 19, 21, 22, 25, 26, 27, 28, 29, 30, 31, 36, 37, 39, 44], "environ": [3, 19, 26, 27, 28], "rerun": [3, 34], "show": [3, 4, 5, 6, 7, 13, 14, 15, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 34, 35, 36, 37, 38, 39, 40, 43, 44], "represent": [3, 13, 20, 23, 26, 27, 32, 33], "trust": [3, 22], "On": [3, 6, 18, 19, 22, 28, 39], "unabl": 3, "render": [3, 15, 28, 34], "load": [3, 11, 27, 28, 30], "nbviewer": 3, "org": [3, 7, 8, 10, 11, 14, 15, 22, 26, 30, 31, 35, 39, 40, 42], "kneighborsclassifierkneighborsclassifi": 3, "ask": [3, 18, 25, 31, 35, 42], "x_new": [3, 21, 31, 36], "arrai": [3, 4, 6, 7, 8, 9, 10, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 40, 41, 42, 43], "feed": [3, 14, 24, 26, 27, 28, 31], "yield": [3, 8, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 33, 36, 38, 40, 41, 43], "function": [3, 4, 5, 6, 7, 9, 10, 12, 14, 15, 17, 18, 19, 21, 24, 27, 28, 31, 32, 33, 35, 36, 39, 41, 42, 44], "comput": [3, 6, 7, 16, 19, 20, 21, 23, 24, 26, 27, 28, 31, 32, 37, 39], "percentag": [3, 6, 13, 22, 31], "2f": [3, 4, 6, 7, 10, 11, 20, 21, 22, 23, 24, 26, 27, 29, 31, 32, 33, 35, 39, 40, 42, 43, 44], "97": [3, 6, 11, 20, 27, 31, 40], "instead": [3, 5, 6, 7, 14, 15, 16, 17, 18, 20, 23, 25, 26, 27, 28, 29, 31, 32, 36, 38, 41, 42, 44], "singl": [3, 11, 14, 15, 18, 19, 20, 22, 24, 26, 27, 28, 30, 31, 32, 36, 44], "cross_valid": [3, 4, 5, 6, 15, 20, 24, 36, 43], "everi": [3, 4, 5, 6, 7, 10, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 43, 44], "fold": [3, 4, 5, 6, 7, 8, 9, 10, 14, 18, 24, 31, 36, 37, 38, 40, 43], "By": [3, 22, 23, 30, 36], "doe": [3, 4, 5, 6, 10, 14, 17, 18, 20, 21, 22, 23, 24, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 44], "henc": [3, 4, 5, 8, 11, 15, 20, 21, 22, 23, 25, 26, 27, 28, 31, 32, 35, 36, 37, 39], "joblib": 3, "requir": [3, 4, 6, 7, 8, 14, 19, 20, 22, 23, 24, 25, 26, 28, 29, 30, 32, 37, 41, 43, 44], "satisfi": 3, "xval": [3, 36, 43], "return_train_scor": [3, 15, 20, 22, 36, 43], "n_job": [3, 6, 11, 14, 18, 23, 24, 36, 37, 38, 39, 40, 41, 43, 44], "fit_tim": 3, "0004108": 3, "00043321": 3, "00047421": 3, "00054502": 3, "00044918": 3, "score_tim": 3, "00080895": 3, "00081778": 3, "00089979": 3, "00099206": 3, "00093198": 3, "test_scor": [3, 4, 5, 15, 18, 20, 24, 32, 36, 38, 39, 43], "96666667": [3, 6, 31], "93333333": [3, 6, 31], "train_scor": [3, 4, 5, 20, 32, 36, 38, 39, 43], "give": [3, 7, 15, 18, 22, 23, 24, 25, 27, 28, 29, 35, 37, 38, 41], "perform": [3, 4, 7, 8, 9, 10, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 30, 31, 35, 36, 38, 39, 40, 41, 43, 44], "96": [3, 6, 12, 13, 20, 25, 26, 31], "paramet": [3, 4, 6, 7, 8, 9, 13, 14, 19, 20, 22, 23, 25, 26, 27, 28, 29, 30, 31, 36, 37, 38, 40, 41, 42, 43], "usual": [3, 12, 14, 18, 19, 20, 22, 25, 26, 27, 28], "coef_": [3, 5, 7, 20, 21, 24, 28, 35, 36, 43], "linear_model": [3, 4, 5, 6, 11, 19, 20, 21, 22, 23, 24, 25, 28, 32, 35, 36, 37, 38, 43], "linearregress": [3, 4, 19, 20, 24, 32, 35, 43], "lr": [3, 6, 15, 19, 20, 22, 26, 27, 28], "15330146": 3, "02540761": 3, "26698013": 3, "57386186": 3, "match": [3, 4, 5, 10, 14, 22, 26, 27, 28, 30, 35], "primarili": 3, "d": [3, 7, 8, 10, 11, 12, 19, 21, 24, 25, 27, 28, 29, 30, 31, 32, 35, 36, 37, 39, 40, 41, 42], "2669801292888399": 3, "5738618608875331": 3, "15330145645467938": 3, "025407610745503684": 3, "analys": 3, "no2": [4, 18, 43], "500": [4, 22, 23, 24, 30, 38, 39, 42, 43], "pollut": 4, "caus": [4, 14, 19, 20, 21, 23, 24, 26, 36, 39, 40, 43], "car": [4, 19, 43], "goal": [4, 22, 24, 36, 38, 43], "concentr": [4, 12, 43], "no_2": [4, 43], "traffic": [4, 43], "atmospher": [4, 8, 39, 43], "condit": [4, 26, 27, 29, 31, 43], "variabl": [4, 5, 10, 19, 20, 22, 23, 25, 26, 29, 30, 32, 35, 43], "per": [4, 5, 6, 7, 14, 15, 17, 19, 20, 22, 23, 24, 25, 26, 27, 30, 32, 37, 38, 39, 40, 43], "hour": [4, 18, 24, 31, 38, 43], "temperatur": [4, 19, 43], "wind": [4, 43], "dai": [4, 18, 21, 31, 43], "str": [4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 32, 33, 36, 38, 41, 42], "get_ipython": [4, 5, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "import": [4, 5, 6, 7, 8, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 25, 26, 27, 28, 29, 30, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "matplotlib": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "numpi": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 26, 27, 36, 37, 40, 43], "panda": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 22, 24, 31, 35, 36, 37], "pyplot": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 22, 25, 30, 31, 36, 37, 40], "plt": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "oml": [4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 16, 17, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "hide": [4, 5, 24, 34], "converg": [4, 5, 14, 19, 20, 22, 23, 25, 26, 41], "except": [4, 5, 19, 24, 26, 29, 35, 37], "convergencewarn": [4, 5, 6, 24], "catch_warn": 4, "filterwarn": [4, 37, 43], "ignor": [4, 5, 6, 7, 11, 18, 20, 23, 24, 25, 27, 31, 35, 37, 38, 43], "categori": [4, 5, 6, 11, 18, 19, 24, 30, 31, 37, 43], "get_dataset": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "547": [4, 18, 43], "_": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 28, 32, 33, 35, 36, 37, 38, 39, 42, 43], "get_data": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "default_target_attribut": [4, 5, 7, 8, 9, 10, 13, 14, 16, 18, 26, 27, 35, 36, 37, 38, 39, 40, 42, 43, 44], "attribute_nam": [4, 8, 10, 35, 39, 43, 44], "quickli": [4, 23, 27, 36, 37, 41, 43], "remov": [4, 10, 12, 14, 19, 20, 24, 27, 28, 30, 33, 34, 35, 43, 44], "focu": [4, 24, 26, 30, 37, 43], "non": [4, 6, 12, 14, 15, 19, 20, 21, 23, 24, 25, 26, 27, 28, 31, 33, 36, 40, 41, 43], "tempor": [4, 43], "aspect": [4, 8, 9, 12, 22, 24, 27, 43], "aim": [4, 19, 20, 23, 24, 43], "futur": [4, 6, 8, 19, 22, 25, 28, 31, 41, 42, 43], "level": [4, 6, 7, 18, 20, 21, 22, 23, 25, 26, 27, 28, 38, 39, 40, 43, 44], "would": [4, 8, 10, 16, 18, 19, 24, 25, 26, 28, 32, 35, 36, 37, 38], "special": [4, 19, 22, 24, 26, 43], "treatment": [4, 22, 43], "train": [4, 5, 6, 7, 8, 9, 11, 12, 16, 17, 18, 19, 20, 21, 23, 24, 25, 32, 33, 36, 37, 38, 39, 41, 42, 43, 44], "test": [4, 5, 6, 7, 8, 9, 11, 15, 16, 17, 18, 19, 20, 21, 23, 26, 27, 30, 32, 33, 36, 37, 38, 39, 42, 43], "There": [4, 6, 7, 14, 16, 18, 19, 20, 21, 22, 24, 26, 27, 30, 31, 34, 36, 40, 42, 43], "seem": [4, 5, 10, 15, 19, 27, 28, 34, 35, 36, 37, 38, 39, 40, 43, 44], "long": [4, 12, 20, 25, 26, 27, 28, 29, 36, 37, 38, 41, 43], "term": [4, 12, 20, 21, 22, 24, 28, 37, 41, 43], "trend": [4, 12, 41, 42, 43], "though": [4, 18, 26, 27, 31, 37, 38, 41, 43, 44], "period": [4, 12, 17, 30, 41, 43], "df": [4, 9, 18, 20, 24, 30, 35, 43], "join": [4, 11, 15, 17, 27, 28, 30, 32, 37, 43], "sort_valu": [4, 18, 30, 37, 43], "hour_of_dai": [4, 43], "drop": [4, 11, 17, 18, 23, 24, 26, 27, 31, 35, 37, 43], "axi": [4, 5, 7, 11, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 36, 37, 40, 42, 43, 44], "use_index": [4, 43], "fals": [4, 8, 10, 12, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 34, 35, 36, 37, 38, 43], "cmap": [4, 5, 7, 10, 11, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 35, 36, 37, 38, 40, 41, 43, 44], "get_cmap": [4, 20, 24, 25, 26, 43], "brg": [4, 22, 24, 43], "head": [4, 21, 24, 27, 28, 30], "cars_per_hour": [4, 43], "temperature_at_2m": 4, "wind_spe": [4, 43], "temperature_diff_2m_25m": [4, 43], "wind_direct": [4, 43], "42": [4, 6, 15, 20, 22, 23, 24, 26, 29, 30, 32, 36], "64300": 4, "322": [4, 27], "13": [1, 4, 14, 15, 20, 24, 25, 26, 27, 28, 30, 40, 43], "22287": 4, "75061": 4, "307": [4, 28], "14": [4, 5, 14, 15, 20, 21, 22, 24, 27, 29, 30, 37], "15274": 4, "255": [4, 13, 14, 16, 20, 26, 27, 36], "12415": 4, "209": 4, "19570": 4, "488": 4, "64108": 4, "247": 4, "98155": 4, "94": [4, 6], "31630": 4, "265": [4, 14, 26], "17": [4, 15, 17, 20, 23, 26, 27, 29], "14155": 4, "direct": [4, 17, 20, 21, 22, 25, 26, 27, 28, 31, 37, 43], "angular": [4, 43], "degre": [4, 7, 11, 19, 20, 21, 24, 25, 27, 31, 35, 37, 41, 43], "scale": [4, 5, 6, 7, 8, 9, 10, 11, 14, 19, 20, 21, 23, 25, 26, 27, 30, 32, 33, 35, 36, 37, 39, 40, 41, 43], "zoom": [4, 16, 27, 36, 43], "correl": [4, 10, 19, 20, 22, 23, 24, 35, 43], "sens": [4, 14, 16, 22, 24, 36, 38, 43], "becaus": [4, 8, 15, 18, 20, 22, 23, 24, 25, 28, 30, 35, 36, 39, 41, 43, 44], "produc": [4, 5, 7, 8, 11, 12, 18, 19, 20, 23, 26, 27, 28, 30, 39, 43, 44], "influenc": [4, 20, 21, 22, 24, 25, 27, 28, 37, 40, 41, 43], "air": [4, 43], "subtl": [4, 43], "depend": [4, 6, 14, 19, 20, 21, 22, 24, 25, 26, 31, 32, 37], "combin": [4, 7, 10, 11, 12, 19, 20, 21, 22, 23, 26, 27, 28, 30, 31, 32, 35, 37, 40, 43, 44], "relationship": [4, 19, 24, 26, 27, 28, 32, 43], "problem": [4, 7, 12, 13, 14, 15, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 36, 41, 42, 43], "elasticnet": [4, 35, 43], "observ": [4, 5, 8, 9, 10, 12, 17, 22, 25, 27, 37, 41, 42, 43], "build": [4, 6, 8, 9, 13, 16, 17, 18, 21, 22, 23, 24, 25, 27, 28, 32, 33, 34, 35, 36, 37, 38, 39, 41, 43, 44], "pipelin": [4, 8, 15, 18, 19, 22, 25, 35, 36, 43], "stick": [4, 38, 43], "hyperparamet": [4, 5, 11, 12, 15, 17, 19, 20, 21, 23, 24, 25, 32, 36, 39, 41, 42, 43, 44], "below": [4, 5, 6, 7, 8, 12, 13, 14, 18, 22, 27, 31, 33, 37, 39, 40, 41, 42, 44], "pass": [4, 5, 10, 13, 14, 20, 22, 27, 28, 29, 30, 41], "both": [4, 5, 6, 8, 9, 10, 11, 18, 19, 20, 21, 24, 25, 26, 28, 30, 31, 33, 35, 37, 38, 39, 43, 44], "whichev": [4, 5], "modul": [4, 5, 27, 36], "abl": [4, 5, 8, 14, 16, 43], "standard": [4, 5, 6, 7, 8, 9, 10, 14, 15, 20, 25, 26, 36, 37], "built": [4, 5, 6, 11, 14, 15, 20, 24, 26, 29, 30, 31, 32], "ins": [4, 5, 20], "find": [4, 5, 7, 8, 10, 11, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 37, 38, 39, 41, 43, 44], "output": [4, 5, 6, 7, 14, 15, 17, 18, 19, 20, 21, 22, 24, 25, 27, 28, 29, 30, 31, 33, 34, 37, 44], "evaluate_learn": [4, 5], "model1": [4, 23, 37], "model2": [4, 23, 37], "modeln": 4, "two": [4, 5, 7, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 29, 30, 34, 35, 37, 38, 39, 40, 43, 44], "obtain": [4, 5, 11, 15, 22, 23, 25, 35, 42], "sampl": [4, 5, 6, 8, 9, 12, 14, 15, 17, 18, 19, 20, 21, 22, 23, 24, 26, 27, 28, 31, 32, 36, 38, 39, 41, 42, 44], "were": [4, 5, 15, 17, 24, 27, 36, 37], "origin": [4, 5, 8, 10, 11, 12, 15, 18, 19, 20, 21, 24, 26, 27, 28, 36, 38, 39, 44], "92": [4, 5, 6, 22, 38], "924": [4, 5], "916": [4, 5, 40], "917": [4, 5], "921": [4, 5], "963": [4, 5], "962": [4, 5], "953": [4, 5], "912": [4, 5], "934": [4, 5], "801": [4, 5, 28], "811": [4, 5], "806": [4, 5], "826": [4, 5], "804": [4, 5], "766": [4, 5], "756": [4, 5], "773": [4, 5], "741": [4, 5, 28], "store": [4, 5, 13, 14, 16, 18, 19, 22, 23, 24, 27, 28, 29, 32, 33, 36, 37, 38, 39], "Then": [4, 5, 7, 8, 18, 21, 22, 31, 36, 38, 43], "dummi": [4, 5, 22], "replac": [4, 5, 10, 15, 19, 21, 22, 24, 25, 26, 27, 29, 30, 31, 35, 36, 37, 40], "actual": [4, 5, 8, 14, 19, 22, 24, 26, 28, 32, 39, 40, 43], "bar": [4, 5, 10, 24, 28, 29, 30, 36, 37, 43], "chart": [4, 5, 10, 30], "varianc": [4, 5, 6, 7, 14, 19, 24, 25, 26, 31, 32, 33, 36], "error": [4, 5, 15, 16, 18, 19, 20, 24, 27, 31, 32, 33, 36, 37, 39, 41, 43], "fig": [4, 5, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 35, 36, 37, 38, 40, 42, 43], "ax": [4, 5, 7, 10, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 32, 33, 35, 36, 37, 38, 40, 43, 44], "subplot": [4, 5, 13, 14, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 35, 36, 37, 38, 40, 43], "45": [4, 5, 20, 22, 24, 30, 38, 43], "barh": [4, 5, 23, 24, 32, 35, 36, 43], "arang": [4, 5, 7, 10, 14, 22, 23, 24, 25, 26, 28, 30, 31, 32, 35, 36, 37, 40, 43, 44], "len": [4, 5, 6, 7, 10, 11, 14, 15, 16, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 39, 40, 42, 43, 44], "yerr": [4, 5, 36, 43], "std": [4, 5, 19, 24, 27, 30, 36, 37, 43], "green": [4, 5, 20, 23, 24, 25, 26, 27, 28, 32, 35, 36, 37, 39, 41, 43, 44], "red": [4, 5, 7, 20, 21, 22, 23, 25, 26, 28, 30, 32, 35, 36, 37, 39, 40, 41, 43, 44], "te": [4, 5, 36, 43], "tr": [4, 5, 22, 36, 43], "3f": [4, 6, 11, 12, 18, 20, 22, 24, 35, 38, 39, 40, 43], "white": [4, 5, 7, 12, 25, 36, 43, 44], "els": [4, 5, 7, 10, 12, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 36, 37, 40, 43], "black": [4, 7, 15, 22, 24, 25, 27, 28, 32, 36, 37, 43], "va": [4, 5, 7, 10, 22, 26, 36, 40, 43, 44], "center": [4, 5, 6, 7, 10, 20, 21, 22, 23, 24, 26, 27, 32, 33, 36, 40, 41, 43, 44], "__class__": [4, 5, 19, 22, 23, 24, 32, 33, 35, 36, 38, 39, 43], "__name__": [4, 5, 19, 22, 23, 24, 32, 33, 35, 36, 37, 38, 39, 43], "hasattr": [4, 22, 23, 43], "ytick": [4, 5, 7, 11, 22, 23, 24, 25, 27, 32, 36, 40, 43], "yticklabel": [4, 5, 7, 10, 22, 35, 36, 38, 40, 41, 43, 44], "legend": [4, 5, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44], "bbox_to_anchor": [4, 5, 20, 21, 23, 26, 32, 36, 43], "loc": [4, 5, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 33, 35, 36, 37, 39, 41, 42, 43, 44], "interpret": [4, 7, 9, 10, 15, 18, 21, 22, 23, 24, 32, 44], "best": [4, 5, 6, 8, 11, 12, 14, 16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "regressor": [4, 10, 12, 18, 19, 35, 37], "overfit": [4, 5, 7, 14, 15, 16, 21, 24, 26, 27, 28, 33, 35, 36, 38, 39, 40, 41, 42, 43, 44], "what": [4, 5, 7, 10, 12, 13, 14, 15, 16, 17, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 32, 35, 36, 41, 44], "Is": [4, 5, 8, 16, 44], "result": [4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 27, 28, 30, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "expect": [4, 5, 15, 16, 17, 19, 20, 21, 22, 25, 31, 36, 37, 43], "optimum": [4, 5, 20, 36, 43, 44], "lie": [4, 5, 25, 43], "between": [4, 5, 6, 7, 9, 10, 12, 13, 14, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 35, 37, 39, 43], "vari": [4, 5, 8, 10, 18, 37, 39, 43], "log": [4, 5, 7, 8, 12, 14, 18, 19, 20, 22, 23, 24, 25, 26, 28, 32, 33, 35, 36, 37, 39, 40, 41, 43], "01": [4, 5, 6, 9, 11, 14, 15, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 31, 32, 35, 36, 37, 38, 41, 42, 43], "100": [4, 5, 6, 9, 11, 12, 16, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 35, 36, 37, 38, 39, 41, 42, 43, 44], "uniformli": [4, 5, 24], "onli": [4, 5, 6, 7, 9, 14, 15, 17, 18, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 33, 35, 36, 37, 38, 39, 42, 43, 44], "hint": [4, 5, 7, 20, 35, 37, 40], "think": [4, 5, 7, 16, 18, 25, 41], "too": [4, 5, 8, 11, 14, 19, 20, 22, 23, 26, 27, 30, 31, 35, 36, 38, 41, 44], "much": [4, 5, 7, 8, 14, 15, 18, 19, 20, 22, 23, 24, 26, 27, 28, 30, 32, 35, 36, 37, 38, 39, 40, 42], "logspac": [4, 5, 20, 26, 35, 36, 37, 38, 40, 43, 44], "geomspac": [4, 5, 43], "linspac": [4, 5, 12, 19, 20, 21, 22, 23, 24, 25, 26, 30, 31, 33, 35, 36, 37, 41, 43], "manual": [4, 5, 6, 7, 10, 11, 13, 17, 19, 20, 22, 24, 25, 27, 28, 31, 37, 40, 41], "loop": [4, 5, 6, 8, 22, 25, 27, 30, 31, 37, 38, 44], "over": [4, 5, 7, 11, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 35, 40, 41, 43], "out": [4, 5, 6, 8, 10, 14, 15, 17, 18, 19, 20, 24, 25, 26, 28, 31, 32, 35, 36, 37, 38, 39, 44], "gridsearchcv": [4, 5, 6, 7, 11, 22, 24, 26, 31, 35, 36, 38, 40, 41, 43, 44], "again": [4, 5, 6, 10, 11, 14, 15, 17, 18, 20, 21, 22, 27, 28, 31, 33, 35, 37], "underfit": [4, 5, 7, 20, 21, 23, 26, 32, 35, 36, 39, 40, 41, 43], "sensit": [4, 5, 20, 24, 25, 27, 35], "mix": [4, 28, 32, 36], "l1": [4, 14, 15, 21, 24, 26, 27, 35, 36], "l2": [4, 11, 14, 15, 17, 21, 22, 24, 26, 27, 28, 35], "loss": [4, 7, 13, 15, 17, 19, 21, 22, 24, 25, 27, 28, 32, 33, 35, 39], "l1_ratio": [4, 35, 37, 43], "ratio": [4, 20, 22, 24, 26, 32, 35], "heatmap": [4, 5, 7, 10, 11, 22, 27, 35, 38, 40, 41, 43, 44], "explain": [4, 5, 7, 12, 17, 20, 22, 24, 37, 40, 41, 44], "xlabel": [4, 7, 10, 11, 12, 13, 14, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "ylabel": [4, 7, 10, 11, 12, 13, 14, 19, 20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "xticklabel": [4, 7, 10, 22, 35, 38, 40, 41, 43, 44], "none": [4, 5, 7, 10, 13, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 34, 36, 37, 40, 41, 43, 44], "vmin": [4, 7, 10, 11, 22, 24, 27, 40, 43, 44], "vmax": [4, 7, 10, 22, 27, 40, 43, 44], "fmt": [4, 7, 10, 20, 22, 25, 40, 43, 44], "printvalu": [4, 43], "nxn": [4, 43], "second": [4, 17, 18, 23, 26, 27, 36, 37, 43], "colormap": [4, 22, 43], "minim": [4, 19, 20, 22, 23, 24, 25, 26, 28, 30, 32, 38, 43], "maxim": [4, 19, 20, 22, 23, 25, 26, 27, 43], "whether": [4, 5, 7, 8, 10, 14, 19, 22, 24, 26, 36, 38, 39, 41, 43], "gca": [4, 7, 10, 20, 22, 23, 24, 26, 28, 32, 36, 38, 40, 43, 44], "img": [4, 7, 10, 21, 22, 27, 28, 36, 40, 43, 44], "pcolor": [4, 7, 10, 22, 40, 43, 44], "update_scalarmapp": [4, 7, 10, 22, 40, 43, 44], "set_xlabel": [4, 5, 7, 10, 13, 14, 16, 19, 20, 21, 22, 24, 25, 26, 27, 33, 35, 36, 37, 38, 40, 43, 44], "fontsiz": [4, 7, 12, 20, 21, 22, 24, 25, 26, 27, 37, 40, 43, 44], "set_ylabel": [4, 5, 7, 10, 19, 20, 21, 22, 24, 25, 26, 27, 33, 36, 37, 38, 40, 43, 44], "set_xtick": [4, 5, 7, 10, 13, 14, 16, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 36, 40, 43, 44], "set_ytick": [4, 5, 7, 10, 13, 14, 16, 20, 21, 22, 23, 24, 25, 26, 27, 32, 35, 36, 40, 43, 44], "set_xticklabel": [4, 5, 7, 10, 20, 22, 24, 28, 36, 40, 43, 44], "set_yticklabel": [4, 5, 7, 10, 22, 24, 35, 36, 40, 43, 44], "set_aspect": [4, 7, 10, 20, 22, 25, 26, 33, 40, 43, 44], "tick_param": [4, 7, 19, 20, 21, 22, 24, 25, 26, 36, 37, 38, 40, 43, 44], "labels": [4, 7, 20, 21, 22, 25, 26, 27, 37, 40, 43, 44], "labelrot": [4, 7, 40, 43, 44], "90": [4, 6, 7, 15, 20, 22, 27, 35, 36, 38, 40, 41, 43, 44], "get_path": [4, 7, 10, 22, 40, 43], "get_facecolor": [4, 7, 10, 22, 40, 43], "get_arrai": [4, 7, 10, 22, 40, 43], "vertic": [4, 7, 10, 22, 25, 30, 39, 40, 43], "w": [4, 5, 7, 10, 14, 15, 20, 21, 22, 24, 26, 28, 31, 35, 40, 43, 44], "size": [4, 7, 13, 14, 15, 16, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 35, 36, 37, 38, 40, 41, 43, 44], "final": [4, 5, 8, 9, 10, 11, 13, 15, 19, 22, 24, 25, 27, 31, 35, 37, 39, 40, 43, 44], "verifi": [4, 36, 43], "draw": [4, 5, 14, 25, 26, 36, 37], "scatterplot": 4, "previou": [4, 5, 9, 14, 15, 18, 19, 20, 23, 25, 26, 27, 28, 35, 44], "doubt": [4, 5], "001": [4, 6, 7, 11, 13, 14, 15, 17, 20, 21, 24, 25, 26, 31, 35, 40, 43], "redraw": [4, 10], "amount": [4, 5, 7, 13, 19, 22, 24, 27, 36, 37, 43], "sy": [20, 37], "os": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 37], "Not": [11, 22, 23, 24, 25, 27], "just": [5, 6, 8, 11, 14, 15, 17, 18, 19, 22, 24, 26, 27, 28, 30, 31, 35, 37, 39], "compil": [13, 14, 15, 26, 27, 28, 34], "warnopt": [], "simplefilt": [5, 6, 18], "pythonwarn": [], "somf": 43, "kneighborsregressor": [33, 43], "make_pipelin": [11, 22, 24, 31, 43], "standardscal": [8, 11, 15, 18, 22, 24, 31, 35, 43], "flatten": [14, 15, 20, 23, 24, 25, 27, 28, 30, 43], "trick": 27, "here": [8, 11, 13, 14, 15, 18, 23, 24, 26, 27, 28, 29, 30, 31, 35, 36, 37, 39, 41], "get": [5, 8, 10, 11, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 41, 42, 44], "nice": [26, 27, 37, 40, 41, 42], "surpass": 43, "yet": [5, 8, 16, 18, 20, 24, 26, 31, 32, 34, 37, 41, 43], "drastic": [19, 43], "catastroph": [27, 43], "bad": [8, 19, 22, 23, 25, 26, 28, 29, 33, 37, 38, 39, 43], "design": [16, 18, 25, 26, 27, 41], "space": [6, 11, 14, 15, 17, 19, 20, 21, 22, 23, 24, 27, 28, 30, 32, 33, 36, 37, 38, 41, 44], "param_a": 43, "num": [11, 20, 29, 30, 31, 35, 36, 37, 43, 44], "param_elast": 43, "11": [5, 15, 17, 19, 20, 21, 23, 24, 26, 27, 30, 31, 32, 37, 43], "param_k": 43, "kneighborsregressor__n_neighbor": 43, "dtype": [10, 14, 20, 22, 24, 26, 27, 28, 30, 31, 35, 37, 43], "int": [5, 14, 16, 20, 22, 24, 25, 26, 27, 29, 30, 36, 37, 38, 43], "1d": [5, 20, 38, 43], "plot_tun": [5, 38, 43], "grid_search": [5, 6, 11, 31, 38, 40, 43], "param_nam": [5, 38, 43], "being": [5, 15, 25, 28, 32, 43], "param_grid": [5, 6, 11, 24, 26, 31, 36, 38, 40, 41, 43], "cv_results_": [5, 11, 22, 24, 35, 36, 38, 40, 41, 43, 44], "mean_test_scor": [5, 11, 22, 24, 35, 36, 38, 40, 41, 43, 44], "mean_train_scor": [5, 22, 36, 38, 43], "acc": [5, 14, 23, 24, 26, 27, 28, 36, 37, 38, 43], "lower": [7, 19, 20, 22, 23, 24, 26, 27, 28, 31, 35, 36, 39, 41, 43, 44], "left": [20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 37, 41, 43, 44], "set_xscal": [5, 22, 36, 43], "set_titl": [5, 19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 36, 37, 43], "best_estimator_": [5, 6, 11, 24, 31, 35, 36, 38, 43], "bp": [5, 43], "bs": [5, 22, 43], "best_params_": [5, 6, 11, 14, 31, 35, 36, 38, 41, 43], "best_score_": [5, 6, 11, 14, 31, 35, 36, 38, 43], "2e": [5, 19, 22, 27, 36, 37, 43, 44], "r2": [6, 18, 24, 42, 43], "4f": [5, 6, 14, 15, 18, 22, 26, 28, 31, 36, 40, 43], "cv": [7, 8, 9, 11, 14, 15, 19, 20, 22, 23, 24, 26, 31, 36, 37, 38, 39, 40, 41], "fit": [6, 8, 9, 11, 12, 13, 15, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 37, 38, 39, 41, 42, 43, 44], "nrow": [20, 24, 27, 36, 43], "ncol": [19, 20, 22, 23, 24, 26, 27, 32, 36, 43], "param": [14, 15, 22, 26, 27, 28, 35, 36, 39, 43], "behav": [21, 35, 37, 43], "similarli": [18, 20, 21, 43], "small": [5, 7, 12, 14, 15, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 35, 36, 37, 38, 39, 40, 43, 44], "around": [18, 20, 26, 27, 34, 35, 36, 39, 40, 41, 43], "gradual": [19, 22, 24, 43], "descent": [15, 19, 23, 24, 43], "than": [5, 7, 8, 17, 18, 20, 22, 23, 24, 26, 27, 28, 30, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44], "wors": [18, 22, 23, 24, 28, 35, 37, 39, 44], "4175": [], "after": [14, 15, 16, 17, 18, 20, 21, 24, 25, 26, 27, 28, 29, 31, 32, 35, 36, 37, 38, 39, 43, 44], "reshap": [5, 7, 11, 12, 13, 16, 19, 20, 21, 22, 23, 24, 25, 27, 30, 33, 35, 36, 37, 38, 40, 41, 42, 43], "rcparam": [6, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "font": [20, 21, 23, 24, 25, 27, 32, 37, 39, 40, 41, 43], "map": [6, 7, 8, 10, 13, 16, 19, 20, 22, 23, 25, 26, 28, 29, 35, 43], "lambda": [21, 23, 24, 26, 28, 29, 30, 43], "viridi": [10, 11, 24, 27, 35, 38, 40, 41, 43], "sudden": 43, "ident": [19, 25, 26, 29, 30, 35, 36, 43], "l1_ration": [35, 43], "sharp": [37, 43, 44], "scatter_coeffici": [], "coeff": [20, 43], "col": [27, 43], "b": [7, 12, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 35, 36, 39, 42, 43], "figur": [5, 6, 7, 12, 13, 14, 19, 20, 21, 22, 23, 24, 26, 27, 28, 31, 32, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "xtick": [7, 11, 20, 22, 23, 24, 25, 27, 31, 32, 36, 37, 40, 43], "rotat": [5, 16, 19, 20, 22, 24, 27, 28, 43], "40": [14, 20, 22, 23, 25, 27, 28, 30, 32, 33, 36, 37, 38, 39, 41, 43], "almost": [15, 19, 27, 28, 32, 35, 36, 37, 38, 39, 40, 42, 43], "exactli": [20, 21, 26, 27, 28, 35, 37, 41, 43], "overlap": [21, 22, 43], "influenti": 43, "nearli": 43, "zero": [14, 15, 16, 20, 22, 23, 24, 25, 26, 28, 30, 33, 37, 39, 43], "increas": [16, 20, 21, 22, 23, 24, 25, 26, 27, 31, 36, 37, 38, 39, 44], "carefulli": [19, 20, 23], "fashion": [5, 14, 24, 26, 27, 28], "mnist": [5, 13, 14, 26, 27], "70": [5, 7, 15, 17, 19, 24, 38, 40], "000": [5, 9, 15, 22, 28, 38], "zalando": 5, "product": [5, 17, 20, 21, 24, 25, 26, 27, 28, 30, 37], "cloth": 5, "repres": [5, 19, 20, 22, 23, 25, 26, 27, 28, 30, 31, 32, 33, 37, 41], "28": [1, 5, 13, 14, 20, 25, 26, 27, 28, 36], "pixel": [5, 14, 19, 20, 22, 26, 27, 36, 38], "look": [5, 6, 7, 9, 12, 14, 15, 18, 19, 20, 22, 24, 25, 26, 27, 28, 30, 31, 33, 36, 37, 38, 39, 40, 41, 42, 43, 44], "action": [5, 6, 18, 19, 37, 44], "fminst": [5, 14, 26], "fmnist": [5, 27], "40996": [5, 14, 26, 27], "fmnist_class": [5, 14, 26], "shirt": [5, 14, 26, 27], "trouser": [5, 14, 26], "pullov": [5, 14, 26], "dress": [5, 14, 26, 27], "coat": [5, 14, 26], "sandal": [5, 14, 26], "sneaker": [5, 14, 26], "bag": [5, 14, 21, 22, 24, 25, 26, 39], "ankl": [5, 14, 26], "boot": [5, 14, 26, 27], "32x32": [5, 16, 38], "randint": [5, 13, 14, 16, 22, 26, 30, 36, 37, 38], "70000": [5, 13, 14, 26], "imshow": [5, 13, 14, 16, 23, 24, 25, 26, 27, 32, 36, 38], "gray_r": [5, 13, 14, 22, 26, 27, 38], "logist": [5, 11, 21, 22, 23, 26, 28, 36, 38, 43], "svm": [5, 6, 8, 11, 12, 19, 22, 24, 28, 31, 36, 40, 41, 43, 44], "point": [5, 6, 7, 9, 12, 13, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32, 33, 36, 38, 39, 40, 41, 42, 43, 44], "cross_val_scor": [5, 6, 11, 19, 22, 24, 31, 35, 36, 37, 38, 39, 40, 43], "interest": [5, 8, 14, 17, 18, 22, 25, 27, 28, 31, 41], "approxim": [5, 20, 21, 23, 24, 28, 31, 35], "logisticregress": [5, 6, 11, 19, 20, 22, 23, 24, 36, 38], "linearsvc": [5, 7, 11, 20, 21, 24, 31, 36], "subsampl": [5, 9, 18, 23, 27, 36, 38, 44], "speed": [5, 9, 14, 19, 23, 24, 26, 36, 37], "experiment": [5, 24, 36], "xs": [5, 21, 22, 23, 25, 26, 36], "ys": [5, 21, 22, 23, 25, 26, 36], "With": [5, 18, 20, 22, 24, 25, 26, 27, 28, 30, 33, 35, 36, 37], "classifier1": 5, "classifier2": 5, "classifiern": 5, "867": [5, 40], "868": 5, "865": 5, "866": [5, 40], "814": 5, "821": 5, "visual": [5, 8, 11, 14, 15, 16, 18, 19, 21, 24, 28, 30, 32, 34, 36, 39, 42, 44], "accuraci": [5, 6, 7, 8, 9, 11, 13, 14, 15, 16, 17, 18, 19, 23, 24, 26, 27, 28, 31, 33, 35, 36, 37, 38, 44], "cost": [5, 7, 20, 21, 24, 37, 43], "chanc": [5, 16, 19, 22, 36, 39], "perfect": [5, 15, 16, 22, 28], "kind": [5, 6, 14, 16, 22, 27, 30, 31], "closer": [5, 18, 21, 24, 28], "misclassifi": [5, 7, 16, 22, 23, 24, 36, 39], "often": [5, 6, 9, 11, 14, 16, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 36, 39, 43], "confus": [5, 6, 16, 24, 36], "1e": [5, 7, 10, 12, 14, 19, 20, 22, 25, 26, 27, 36, 37, 40, 42], "describ": [5, 9, 15, 18, 20, 21, 28, 30, 35, 44], "identifi": [5, 14, 15, 19, 20, 26, 36], "misclassified_sampl": 5, "studi": [5, 24, 29, 31, 32, 36, 40, 42], "indic": [5, 7, 11, 15, 17, 22, 24, 25, 28, 29, 30, 31, 36, 37, 39], "23": [5, 18, 25, 30, 37], "30": [5, 9, 15, 17, 19, 20, 23, 24, 26, 27, 28, 29, 30, 31, 38, 41, 42], "34": [5, 22, 27, 29, 36, 37], "39": [5, 28, 37], "46": [5, 15, 38], "52": [5, 20, 26], "55": [5, 9, 27, 31, 36], "five": 5, "togeth": [5, 16, 19, 20, 30, 31, 36, 38], "nr": [5, 22, 23, 24, 27, 33, 37], "enumer": [5, 15, 20, 21, 22, 23, 24, 26, 28, 32, 35, 36, 37, 39, 43], "systemat": [5, 22, 24, 32], "pair": [5, 22, 23, 29], "certain": [5, 19, 21, 22, 23, 24, 25, 26, 31, 36, 37, 39], "confusion_matrix": [5, 6, 22, 36], "im": [5, 24, 25], "coeffici": [5, 7, 10, 11, 20, 21, 22, 24, 25, 28, 31, 36], "28x28": [5, 14, 26], "784": [5, 14, 20, 26, 28], "logreg": [5, 6, 22, 36, 38], "why": [5, 18, 22, 23, 35, 36], "pai": [5, 27, 28, 36], "attent": [5, 27, 36], "simpli": [5, 6, 10, 11, 21, 23, 24, 25, 27, 31, 34, 36, 38], "titl": [5, 7, 12, 14, 19, 22, 23, 24, 25, 26, 27, 28, 32, 36, 37, 38, 40, 41, 42, 43], "plot_coeffici": 5, "suptitl": [5, 23, 27, 32, 39], "colorbar": [5, 11, 19, 22, 24, 25, 44], "ravel": [5, 7, 12, 21, 22, 23, 24, 25, 27, 28, 30, 32, 40, 41, 42], "tolist": [5, 19, 22], "repeat": [5, 8, 9, 16, 23, 24, 25, 26, 27, 28, 31, 32, 37, 39, 44], "add": [5, 6, 11, 13, 14, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 34, 36, 37, 41], "clf": [7, 11, 15, 20, 21, 22, 23, 24, 26, 32, 33, 36, 37, 39, 40], "nn": [20, 36], "big": [18, 20, 21, 23, 26, 27, 28, 32, 36, 37, 38], "deviat": [14, 20, 24, 25, 26, 36, 37], "hardli": 36, "param_c": [], "properli": [15, 24, 26], "outperform": 28, "slighti": [], "reach": [13, 15, 24, 27, 28], "datset": [], "nonzero": [], "quit": [15, 18, 27, 28, 29, 35, 36, 37, 39, 40], "common": [20, 21, 28, 30], "mistak": [22, 23, 32, 36], "coars": 17, "enough": [14, 20, 22, 23, 26, 27, 28], "curiou": [], "easier": [7, 19, 22, 24, 26, 27, 30, 36, 41], "correctli": [6, 9, 19, 23, 24], "occasion": [], "hand": [14, 24, 39], "close": [14, 15, 20, 21, 22, 23, 24, 25, 26, 32, 37, 43], "half": [24, 31, 32, 44], "predominantli": [], "rememb": [15, 19, 20, 22, 23, 25, 26, 27, 28], "typic": [6, 7, 19, 20, 23, 25, 26, 31, 33, 39, 40], "binari": [9, 11, 14, 19, 20, 23, 24, 25, 26, 27, 28, 31, 32, 36], "multi": [14, 19, 20, 23, 24, 25, 26, 30, 31], "vs": [6, 8, 17, 23, 25, 27, 30, 31, 36, 38, 41], "specif": [9, 11, 14, 15, 18, 19, 22, 24, 26, 27, 28, 31, 32, 37, 39], "lead": [11, 14, 18, 20, 23, 26, 28, 32, 33, 35, 36, 39, 44], "matric": [6, 25, 27, 36], "locat": [8, 15, 17, 25, 27, 28, 36, 37], "correspond": [7, 8, 20, 21, 22, 24, 25, 28, 29, 30, 33, 35, 36, 37], "bright": 22, "low": [9, 19, 20, 21, 22, 23, 24, 26, 28, 31, 32, 33, 37, 39, 40, 41], "dark": [36, 39], "word": [19, 21, 24, 25], "mainli": 24, "recogn": [19, 27, 28, 36, 38], "item": [8, 9, 14, 15, 17, 22, 23, 26, 28, 29, 30, 36, 37], "ye": [12, 24, 25], "blow": [], "edg": [19, 22, 25, 26, 27, 36], "especi": [7, 14, 19, 20, 21, 22, 23, 26, 35, 36, 37, 40, 41], "shoulder": 28, "suppress": [], "background": [7, 8, 23, 27, 36, 39, 40], "outlin": [], "sum": [12, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 39], "posit": [7, 8, 15, 20, 21, 22, 23, 24, 25, 27, 37], "smoother": [20, 22, 24, 26, 33, 37], "moreov": [26, 38], "smaller": [7, 14, 15, 20, 22, 23, 24, 26, 27, 32, 38, 39, 43], "curios": [15, 35], "strong": 23, "believ": [8, 15, 22, 25, 28], "evidenc": [], "extrem": [26, 36], "weight": [6, 7, 11, 17, 18, 19, 20, 21, 23, 24, 27, 28, 32, 33, 36, 39], "short": [10, 18, 19, 29], "sleev": [], "heigh": [], "bottom": [8, 20, 22, 24, 26, 27, 32, 39, 42], "middl": [], "overal": [22, 24, 35, 36, 37, 39, 43, 44], "present": [19, 22, 28, 37], "emphasi": [], "seemingli": [], "higher": [6, 16, 17, 20, 21, 22, 23, 24, 26, 28, 30, 32, 36, 41, 44], "neg": [8, 15, 20, 22, 23, 24, 25, 26, 28, 35], "slight": [35, 37, 44], "variat": [22, 25, 36, 39], "input": [6, 7, 13, 15, 20, 21, 22, 24, 25, 26, 27, 28, 31, 33, 34, 36, 37, 42, 44], "behavior": 20, "illustr": [6, 12, 20, 23, 24, 26, 27, 31, 44], "purpos": [6, 24, 26], "userwarn": [6, 24], "simplest": [6, 14, 22], "subset": [6, 24, 32, 38], "make_blob": [6, 19, 20, 21, 22, 24, 33], "synthet": [6, 19, 22], "instanti": [6, 27], "intern": [6, 18, 19, 22, 23, 31, 36], "averag": [6, 9, 11, 12, 14, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 33, 41], "var": [6, 14, 15, 22, 23, 24, 29, 31, 32, 34, 39, 40], "0006": [6, 31], "kfold": [6, 22], "stratifiedkfold": [6, 22], "randomiz": 6, "leaveoneout": 6, "leav": [6, 19, 20, 23, 24, 25, 27, 31], "n_split": [6, 22, 23, 32, 39], "skfold": 6, "86666667": 6, "83333333": 6, "loo": 6, "iter": [6, 8, 15, 20, 22, 23, 25, 26, 27, 29, 31, 38, 39, 41], "shufflesplit": [6, 22, 23, 32, 38, 39], "stratifiedshufflesplit": [6, 22, 39], "absolut": [6, 15, 22, 28], "total": [6, 13, 14, 15, 18, 22, 23, 26, 27, 28, 30, 32, 37, 39], "shuffle_split": [6, 22, 23, 32, 39], "98666667": 6, "97333333": 6, "94666667": 6, "90666667": 6, "membership": 6, "groupkfold": [6, 22], "n_sampl": [6, 19, 20, 21, 22, 23, 24, 26, 32, 33, 37], "belong": [6, 20, 22, 25, 27], "etc": [6, 9, 19, 27, 30], "66666667": 6, "count": [6, 12, 22, 23, 24, 25, 26, 30, 32, 39, 43], "discuss": [6, 19, 24, 26, 44], "accuracy_scor": [6, 22, 37], "explictli": [6, 15, 25, 28, 29], "classification_report": [6, 22], "tabl": [6, 19, 20, 23, 24, 30, 32, 34, 35], "aggreg": [6, 12, 22, 30, 31], "f1_score": [6, 22], "load_breast_canc": [6, 11, 22, 23, 31, 32], "48": [6, 15, 22], "85": [6, 17, 20, 22, 32, 35], "9300699300699301": 6, "dpi": [6, 22, 31, 38, 39, 40, 41, 42, 43, 44], "f1": [6, 8], "91": [6, 35], "53": [6, 15, 18, 21, 30, 36], "93": [6, 24, 27], "143": 6, "macro": [6, 22], "avg": [6, 27, 32], "pred": [6, 22, 23, 27, 36, 37, 39], "micro": [6, 22], "930": [6, 39], "925": 6, "learner": [6, 22, 24, 31, 36], "decision_funct": [6, 7, 21, 22, 23, 40], "float": [6, 11, 13, 15, 22, 24, 26, 27, 28, 29, 30, 37, 40], "inf": [6, 12, 18, 20, 23], "predict_proba": [6, 19, 22, 23, 24], "threshold": [6, 9, 20, 23, 33], "y_pred_lower_threshold": 6, "89": [6, 20, 24, 26], "95": [6, 17, 19, 20, 22, 25, 27, 37, 42], "multiclass": [6, 15, 22, 24], "n_class": [6, 22], "x_train2": 6, "x_test2": 6, "y_train2": 6, "y_test2": 6, "lr2": 6, "entri": [6, 25, 27], "03499211": 6, "29425161": 6, "7407405": 6, "91897372": 6, "09086147": 6, "0098352": 6, "05185099": 6, "87457159": 6, "17727941": 6, "73279105": 6, "03622549": 6, "69656555": 6, "73730572": 6, "47556657": 6, "26173915": 6, "03557844": 6, "0345983": 6, "07017674": 6, "98547105e": 6, "03": [6, 23, 30, 37], "22130578e": 6, "73883951e": 6, "44175894e": 6, "58237959e": 6, "02": [6, 14, 15, 18, 20, 22, 25, 26, 30, 37], "10136994e": 6, "07": [6, 14, 18, 28, 37], "20891186e": 6, "08": [6, 20, 36, 37], "82799143e": 6, "98171996e": 6, "68180705e": 6, "87139122e": 6, "06179071e": 6, "54224758e": 6, "69786431e": 6, "28671321e": 6, "52618137e": 6, "73816007e": 6, "62163802e": 6, "precision_recall_curv": [6, 22, 24], "roc_curv": [6, 22, 24], "tpr": [6, 22, 24], "fpr": [6, 22, 24], "average_precision_scor": 6, "area": [6, 8, 22, 25, 39, 40], "roc_auc_scor": [6, 22, 39, 40], "auc": [6, 8, 22, 24, 39, 40], "accur": [6, 8, 10, 19, 22, 23, 24, 25, 35], "trapezoid": 6, "rule": [6, 20, 22, 26], "ap_pp": 6, "ap_df": 6, "995": 6, "rf_auc": 6, "svc_auc": 6, "svc": [6, 7, 11, 19, 20, 21, 22, 24, 31, 36, 37, 40, 44], "991": 6, "want": [6, 7, 8, 11, 15, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 30, 31, 32, 35, 37, 41, 44], "through": [6, 14, 16, 18, 19, 20, 26, 27, 28, 30], "argument": [6, 10, 14, 25, 29], "But": [6, 18, 22, 24], "scorer": 6, "sort": [6, 18, 19, 22, 23, 24, 28, 30, 32, 36, 37], "adjusted_mutual_info_scor": 6, "adjusted_rand_scor": 6, "average_precis": 6, "balanced_accuraci": [6, 9], "completeness_scor": 6, "explained_vari": 6, "f1_macro": 6, "f1_micro": 6, "f1_sampl": 6, "f1_weight": 6, "fowlkes_mallows_scor": 6, "homogeneity_scor": 6, "jaccard": 6, "jaccard_macro": 6, "jaccard_micro": 6, "jaccard_sampl": 6, "jaccard_weight": 6, "max_error": 6, "mutual_info_scor": 6, "neg_brier_scor": 6, "neg_log_loss": 6, "neg_mean_absolute_error": 6, "neg_mean_absolute_percentage_error": 6, "neg_mean_gamma_devi": 6, "neg_mean_poisson_devi": 6, "neg_mean_squared_error": [6, 15, 19, 37], "neg_mean_squared_log_error": 6, "neg_median_absolute_error": 6, "neg_root_mean_squared_error": 6, "normalized_mutual_info_scor": 6, "precision_macro": 6, "precision_micro": 6, "precision_sampl": 6, "precision_weight": 6, "rand_scor": 6, "recall_macro": 6, "recall_micro": 6, "recall_sampl": 6, "recall_weight": 6, "roc_auc": [6, 22, 24, 39, 40], "roc_auc_ovo": 6, "roc_auc_ovo_weight": 6, "roc_auc_ovr": 6, "roc_auc_ovr_weight": 6, "top_k_accuraci": 6, "v_measure_scor": 6, "load_digit": 6, "digit": [6, 24, 27, 36], "explicit_accuraci": 6, "explicit": [6, 14, 21, 22], "975": 6, "99166667": 6, "99442897": 6, "98050139": 6, "99717078": 6, "99854252": 6, "999828": 6, "98400413": 6, "know": [6, 11, 15, 18, 19, 20, 22, 24, 25, 26, 27, 28, 31], "improv": [6, 7, 8, 9, 14, 16, 17, 18, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 36, 37, 38, 39, 41, 44], "dictionari": [6, 11, 28, 29, 31], "gamma": [6, 7, 8, 10, 11, 19, 20, 21, 22, 25, 26, 31, 36, 37, 39, 40, 41, 44], "untrain": [6, 25, 31], "access": [6, 22, 27, 28, 31], "rbf": [6, 8, 10, 12, 19, 25, 36, 37, 41, 42, 44], "outer": [6, 8, 22, 31, 38, 44], "inner": [6, 8, 20, 21, 22, 25, 26, 27, 31, 38], "appli": [6, 11, 14, 19, 22, 26, 27, 28, 29, 30, 37], "9666666666666668": 6, "randomizedsearchcv": [6, 14, 22, 31, 36, 38], "n_iter": [6, 14, 31, 36, 38], "fix": [6, 12, 16, 19, 23, 25, 27, 28, 30, 31, 37], "scipi": [6, 21, 22, 24, 25, 27, 36, 37, 38, 41], "stat": [6, 21, 22, 25, 30, 31, 36, 37, 38], "expon": [6, 22, 31, 36, 38], "random_search": [6, 31, 36], "param_distribut": [6, 14, 31, 36, 38], "_distn_infrastructur": 6, "rv_frozen": 6, "0x282abbc40": 6, "0x2824ad1f0": 6, "care": [7, 22, 24, 28, 41, 44], "explor": [7, 10, 16, 19, 20, 23, 25, 27, 31, 35, 37, 40], "artifici": [7, 12, 20, 22, 24, 31, 40, 41], "fetch": [7, 18, 27, 37, 40], "banana": [7, 40], "www": [7, 8, 10, 11, 14, 15, 26, 27, 28, 31, 35, 39, 40, 41, 42], "1460": [7, 40], "id": [7, 14, 15, 16, 18, 20, 24, 26, 27, 28, 36, 40], "dataset_format": [7, 8, 9, 13, 14, 16, 18, 26, 27, 36, 37], "bwr": [7, 20, 21, 23, 24, 26, 40], "helper": [7, 13, 14, 15, 17, 28, 35, 36, 39, 40, 44], "loos": 7, "amuel": [7, 40], "mglearn": [7, 19, 20, 21, 22, 23, 24, 25, 26, 32, 33, 35, 38, 40, 41], "plot_svm_kernel": [7, 21, 40], "support_vector": 7, "dual_coef": 7, "variou": [7, 27], "blue": [7, 20, 21, 22, 23, 24, 25, 26, 28, 30, 32, 35, 39, 40, 41, 44], "circl": [7, 20, 24, 26, 30, 31], "border": 7, "dual": [7, 11, 20, 21, 25], "paint": 7, "darker": 7, "gradient": [7, 14, 15, 19, 22, 24, 27, 28, 35, 37], "boundari": [7, 19, 20, 21, 22, 23, 26, 27, 33, 36, 40], "margin": [7, 18, 21, 25, 26, 27, 37, 40, 41], "dash": [7, 39, 40], "coordin": [7, 30, 37], "linearsvm": [7, 24], "plane": [7, 20, 21, 22, 40], "fignum": [7, 27, 40], "zorder": [7, 12, 20, 21, 26, 37, 40], "edgecolor": [7, 12, 19, 20, 21, 22, 23, 33, 40], "facecolor": [7, 22, 37], "tight": [7, 20, 21, 40], "x_min": [7, 20, 21, 23, 24, 26, 40], "x_max": [7, 20, 21, 23, 24, 26, 40], "y_min": [7, 20, 21, 23, 24, 26, 40], "y_max": [7, 20, 21, 23, 24, 26, 40], "xx": [7, 20, 21, 22, 23, 24, 40], "yy": [7, 20, 21, 22, 23, 24, 40], "mgrid": [7, 21, 40], "300j": [7, 40], "z": [7, 20, 21, 22, 23, 25, 26, 30, 37, 40], "c_": [7, 21, 22, 23, 24, 40], "put": [7, 19, 21, 27, 36, 40], "contour": [7, 20, 21, 22, 23, 25, 26, 40], "linestyl": [7, 14, 20, 21, 22, 23, 24, 26, 28, 31, 32, 36, 40], "pcolormesh": [7, 21, 22, 40], "xlim": [7, 20, 22, 23, 24, 40, 41], "ylim": [7, 20, 22, 23, 24, 25, 31, 32, 35, 40, 41, 44], "minimum": [7, 20, 22, 23, 31], "maximum": [7, 14, 15, 18, 20, 22, 23, 25, 26, 27, 28, 31, 37, 38, 42], "misclassif": [7, 20, 21, 22, 23, 32, 37, 39, 43], "hing": [7, 20], "squared_hing": [7, 20], "squar": [7, 15, 21, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 37, 39, 41, 44], "normal": [7, 10, 13, 15, 16, 18, 19, 20, 22, 23, 25, 27, 28, 30, 31, 32, 35, 36, 41, 42, 44], "strict": [7, 22], "primal": [7, 20], "although": [7, 21, 35, 36, 37, 38, 39, 40], "matter": [7, 25, 27, 31, 32], "hyperplan": [7, 20, 21, 26], "mathbf": [7, 20, 21, 22, 23, 24, 26, 28, 41], "wx": [7, 25], "vice": [7, 22, 23, 28, 36], "versa": [7, 22, 23, 28, 36], "intercept_": [7, 20, 21], "bia": [7, 20, 24, 25, 26, 27, 28, 32], "fall": [7, 20, 24, 33], "insid": [7, 26, 28, 36], "lectur": [7, 16, 18, 31, 34], "extract": [7, 19, 25, 28, 29, 31], "stuck": [7, 19, 20, 41], "afterward": [7, 22, 23, 31, 37], "support_vector_indic": 7, "calcul": [7, 12, 24, 26, 27, 36, 37, 39], "formula": [7, 20], "dot": [7, 20, 21, 24, 25, 26, 27, 28, 30, 32, 36, 37, 41, 44], "must": [7, 14, 19, 20, 23, 25, 26, 27, 34, 35, 44], "either": [7, 10, 11, 13, 21, 22, 23, 24, 35, 37, 40], "poli": [7, 21, 24, 25, 40], "sigmoid": [7, 9, 15, 20, 22, 24, 26, 27, 28], "wider": [7, 20, 21], "polynomi": [7, 11, 19, 20, 40, 41, 43], "life": 7, "support_vectors_": [7, 20, 21, 40], "n_support_": [7, 40], "dual_coef_": [7, 11, 20, 21, 40], "lin_scor": [7, 40], "poly_scor": [7, 40], "rbf_score": [7, 40], "initi": [7, 14, 18, 19, 20, 22, 23, 25, 27, 28, 30, 36, 41, 44], "encircl": [7, 40], "\ud835\udc36": 7, "\ud835\udefe": 7, "1e3": [7, 25], "report": [7, 8, 13, 14, 17, 18, 22, 37, 40], "least": [7, 9, 13, 14, 16, 18, 22, 23, 24, 25, 26, 28, 37, 40, 41, 42], "200": [17, 19, 24, 28, 30, 31, 36, 38, 39, 41], "bigger": [15, 22, 39, 40], "clf1_1": [], "cannot": [18, 20, 21, 22, 23, 24, 28, 31, 39], "within": [10, 14, 18, 24, 26, 33], "57": 20, "5f": [37, 40], "0000": [], "00005": [], "particularli": [36, 37, 40], "stabl": [22, 30, 31, 36], "120": [20, 40, 44], "clf1": [], "tol": [18, 23, 40], "clf2": [20, 24], "clf3": [], "linearli": [20, 28, 30, 33, 40], "separ": [16, 19, 20, 22, 23, 24, 27, 30, 33, 36, 37, 40], "badli": [20, 35, 40], "li": [20, 25, 32, 40], "outsid": [20, 40], "group": [14, 24, 31, 40], "forc": [26, 27, 40], "decreas": [15, 20, 21, 22, 23, 24, 25, 26, 27, 37, 40, 44], "toler": [23, 40], "stop": [17, 18, 23, 27, 28, 30, 32, 36, 38], "criterion": [23, 32], "slow": [20, 21, 23, 24, 26, 27, 28, 33, 36, 38, 40, 41], "clearli": [24, 35, 36, 37, 39, 40, 42], "aren": 40, "divid": [32, 40], "subspac": [19, 40], "captur": [10, 24, 27, 28, 35, 36, 40, 41], "hit": [8, 22, 31, 37, 39, 40, 44], "sweet": [19, 20, 22, 26, 40], "spot": [19, 20, 22, 26, 40], "conveni": [23, 24, 29], "3x3": [16, 27], "fig_num": 40, "clf4": [], "trainacc": [], "testacc": [], "narrow": [21, 26, 27, 40], "datapoint": [31, 36, 39, 40], "island": [28, 40], "everywher": 16, "found": [18, 20, 21, 22, 27, 28, 37], "medium": [12, 40], "fewest": 40, "tend": [22, 32, 37, 40], "unless": [8, 27, 28], "visibl": [26, 37], "larger": [14, 19, 20, 21, 23, 24, 25, 26, 27, 28, 32, 33, 35, 36, 39, 41, 43, 44], "resolut": [16, 27], "18": [14, 15, 17, 20, 21, 23, 26, 27, 28, 30, 37, 40, 41], "isn": [40, 41], "realli": [10, 17, 22, 24, 28, 35, 36, 38, 40, 41], "simpl": [14, 18, 19, 20, 22, 23, 24, 25, 26, 27, 34, 36, 37, 38, 40, 44], "peak": [10, 15, 28, 35, 40], "rather": [8, 24, 27, 30, 35, 36, 37, 38, 40, 41], "4096": 40, "magic": [8, 26, 39, 41], "telescop": [8, 39], "1120": [8, 39], "task": [8, 10, 14, 15, 18, 19, 20, 22, 23, 25, 26, 27, 28, 35, 36, 39], "rai": [8, 39], "consist": [8, 10, 12, 14, 19, 22, 26, 27, 28, 33, 35, 39], "energi": [8, 39], "particl": [8, 39], "chain": [8, 20, 24, 26, 31, 39], "reaction": [8, 39], "shower": [8, 39], "hadron": [8, 39], "ones": [8, 11, 16, 19, 20, 22, 23, 24, 25, 30, 37, 39, 41], "come": [8, 15, 28, 29], "radiat": [8, 39, 42], "pattern": [8, 12, 14, 20, 26, 27, 28, 31, 39], "convert": [8, 15, 20, 22, 23, 24, 26, 27, 28, 29, 30, 31, 36, 39], "research": [8, 25], "occur": [8, 19, 22, 26, 27, 28, 39], "univers": [8, 18, 27, 31], "shown": [8, 22, 28, 34, 36, 39, 41], "seri": [8, 10, 12, 14, 15, 19, 21, 25, 26, 28, 35, 39, 42, 43, 44], "12500": [8, 39], "signal": [8, 12, 19, 20, 22, 27, 30, 39], "6700": [8, 39], "f": [8, 9, 11, 12, 19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 31, 32, 33, 34, 37, 42], "magic_df": 8, "holdout": [8, 9, 22, 38], "precis": [8, 14, 18, 24, 26, 30, 37], "recal": [8, 24], "roc": [8, 9, 24, 39, 40], "curv": [8, 9, 13, 15, 16, 17, 19, 20, 23, 24, 25, 26, 27, 28, 35, 40, 44], "answer": [8, 18, 25, 29, 44], "real": [8, 10, 13, 14, 23, 25, 26, 28, 31, 35, 37, 42], "back": [8, 17, 27, 28], "scaler": [8, 11, 31, 35], "alon": 8, "assum": [8, 19, 20, 24, 25, 32, 37, 42], "adapt": [8, 20, 24, 41], "transform": [8, 11, 20, 21, 23, 25, 27, 30, 32, 37], "nest": [8, 30, 38], "held": [8, 22, 24, 32], "extra": [8, 23, 24, 27], "reason": [8, 18, 22], "rebuild": [8, 10, 17, 27, 31, 35], "tediou": [8, 11], "sacrif": 8, "twice": [8, 44], "costli": [8, 22], "wast": [8, 14, 20, 26], "miss": [8, 10, 11, 15, 22, 28, 30, 35], "assumpt": [8, 19, 24], "did": [8, 18, 26, 36, 37, 41], "lose": [8, 19, 25, 26, 41], "preambl": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 30, 32, 33, 35, 38, 39, 41, 42, 43, 44], "precision_scor": 22, "recall_scor": 22, "stratif": [14, 22], "ground": [19, 41], "truth": [19, 41], "824": [], "878": [], "581": 28, "700": 22, "769": [], "88": 18, "58": [15, 20, 28], "135": 20, "872": [], "903": [], "711": 20, "796": [], "835": [], "randomsearch": [14, 26], "loguniform": [], "1e12": [], "distibut": [], "rv": 31, "util": [14, 15, 18, 22, 23, 24, 26, 27, 28], "c_sampl": [], "1e4": [22, 42], "g_sampl": [], "set_xlim": [19, 20, 21, 22, 24, 25, 26, 28, 35, 37], "set_ylim": [19, 20, 21, 22, 23, 24, 25, 26, 37], "set_yscal": 19, "could": [11, 14, 15, 16, 17, 18, 19, 20, 22, 26, 27, 28, 31, 32, 36, 37, 41, 43], "njob": [], "parallel": [20, 22, 23, 25, 27, 28], "verbos": [14, 15, 18, 24, 25, 26, 27, 28], "intermedi": 27, "rs": [], "candid": 24, "backend": [14, 26, 27, 30], "lokybackend": [], "concurr": [], "worker": [], "33": [15, 20, 22, 23, 26, 27, 31, 32, 39], "elaps": [], "0s": [15, 27], "8min": [], "finish": 14, "0x7fca10e3ebe0": [], "0x7fca114786d8": [], "9101131972886245": [], "462": 28, "63302228870276": [], "0035856241778658205": [], "inde": [16, 35, 36, 39, 41, 43], "heurist": 23, "n_featur": [22, 23, 27, 32], "_gamma": [], "0999999999483963": [], "best_svm": [], "789": [], "830": [], "keep": [15, 19, 20, 23, 27, 36, 37, 38, 39], "mind": 28, "treat": 20, "probabilist": [23, 37], "closest": [20, 22, 33], "close_zero": 22, "argmin": [19, 20, 22, 39], "ab": [20, 22, 23, 24, 26, 30], "markers": [20, 22, 23, 25, 26, 33, 42], "fillstyl": 22, "mew": 22, "close_t": [], "175": 23, "lw": [12, 13, 14, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 41], "smooth": [12, 20, 23, 24, 25, 26, 27, 37, 41, 44], "equal": [20, 22, 24, 26, 28, 31, 32, 33, 35, 37], "reduc": [19, 22, 23, 24, 25, 26, 27, 29, 32, 36, 39], "move": [14, 19, 26, 27, 28, 37, 44], "littl": [19, 20, 23, 27, 37, 39, 40, 44], "reus": [9, 19, 27], "fn": [22, 24], "fp": [22, 24, 25], "cost_fn": 22, "cost_fp": 22, "ratio_p": 22, "plot_isometr": 22, "c_fn": [], "c_fp": [], "min_cost": 22, "min": [14, 20, 21, 22, 23, 25, 26, 27, 30, 31, 32, 36, 37], "min_thr": 22, "min_thres_v": [], "meshgrid": [20, 21, 22, 23, 24, 25, 26, 37], "max": [9, 11, 14, 20, 21, 22, 23, 25, 26, 28, 30, 31, 32, 35, 36, 37, 38], "append": [11, 12, 14, 15, 19, 20, 22, 23, 24, 26, 27, 28, 29, 30, 32, 35, 36, 37, 38, 39, 44], "cs": [22, 28, 29, 41], "clabel": [20, 22], "isometr": 22, "ideal": [14, 19, 23, 24, 26, 27, 37, 39], "astyp": [14, 15, 26, 27, 28, 36, 37, 38], "748": [], "591": [], "926": 35, "721": [], "massiv": [], "71": [15, 17], "lost": 27, "59": [11, 23], "covertyp": 9, "spruce": 9, "pine": 9, "cottonwood": 9, "aspen": 9, "elev": [9, 21], "distanc": [9, 19, 20, 21, 24, 25, 27, 28, 32, 33, 36, 37, 41], "water": 9, "soil": 9, "seaborn": [9, 10, 11, 30, 37], "sn": [9, 10, 11, 37], "180": [9, 18, 20, 37], "retrieve_class_label": [9, 38], "cottonwood_willow": 9, "douglas_fir": 9, "krummholz": 9, "lodgepole_pin": 9, "ponderosa_pin": 9, "spruce_fir": 9, "slope": [9, 20], "horizontal_distance_to_hydrolog": 9, "vertical_distance_to_hydrolog": 9, "horizontal_distance_to_roadwai": 9, "hillshade_9am": 9, "hillshade_noon": 9, "hillshade_3pm": 9, "horizontal_distance_to_fire_point": 9, "wilderness_area1": 9, "wilderness_area2": 9, "wilderness_area3": 9, "wilderness_area4": 9, "soil_type_1": 9, "soil_type_2": 9, "soil_type_3": 9, "soil_type_4": 9, "soil_type_5": 9, "soil_type_6": 9, "dougla": 9, "fir": 9, "grow": [9, 19, 20, 26, 31], "surviv": [9, 11, 38], "n_point": [9, 22], "1500": [9, 19, 20, 42], "style": [9, 20, 21, 23, 24, 27, 31, 32, 34], "tick": [9, 22, 27, 44], "pairplot": 9, "hue": 9, "evaluate_rf": 9, "32": [9, 13, 14, 15, 16, 23, 24, 25, 26, 27, 28, 29, 30, 36, 38, 39], "n_estim": [9, 22, 23, 24, 35, 37, 38, 39, 43], "reproduc": [9, 21, 23, 31, 37, 41], "earlier": [9, 27, 36], "max_depth": [9, 23, 24, 32, 37, 39], "balanc": [9, 22, 24, 26, 27, 37], "platt": 9, "calibratedclassifiercv": [9, 22], "prefit": 9, "evaluate_gb": 9, "gradientboostingclassifi": [9, 23, 38, 39], "xgboostclassifi": 9, "rate": [9, 13, 14, 15, 16, 17, 20, 22, 23, 24, 25, 27, 37, 39], "whole": [9, 11, 21, 24, 25, 28, 30, 44], "gbclassifi": 9, "tqdm": [24, 36], "tqdm_notebook": 36, "ipython": [14, 19, 26, 28, 29, 31, 36, 37], "displai": [14, 19, 24, 26, 27, 28, 32, 34, 37], "plot_liv": [], "param_rang": [], "keyword": [10, 14, 29], "signatur": [], "param_valu": 36, "model_1": [], "model_2": [], "logarithm": [], "tupl": [11, 25, 29, 31, 36], "lowest": 37, "highest": [20, 24, 37, 39], "ion": [], "xscale": [23, 35, 36, 39], "empti": [27, 28, 30, 39], "fill": [10, 19, 20, 21, 22, 23, 24, 25, 26, 27, 30, 32, 33, 35], "set_data": [], "refresh": [], "gcf": 22, "clear_output": [14, 19, 26, 28], "wait": [14, 26, 28], "randomforestclassifi": [22, 23, 24, 38, 39], "balanced_accuracy_scor": [], "xgboost": [], "xgbclassifi": 37, "rf_1": [], "rf_2": [], "md": 34, "rf": [22, 24, 38, 39], "rf_": [], "plot_1": [], "reduct": [23, 24, 27, 28, 36, 39], "evaluate_rf_balanc": [], "plot_feature_import": 24, "feature_importances_": [23, 24, 32, 35], "rf_32": [], "65": [15, 23], "26": [15, 20, 21, 27, 39], "62": [17, 41], "16": [14, 15, 17, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 32, 36, 37, 39], "49": [20, 30], "signific": [14, 24, 26, 36], "robust": [10, 20, 22, 23, 27, 42, 44], "against": [13, 14, 20, 22, 23, 26, 28, 32], "irrelev": 31, "runtim": [16, 18, 36, 38], "tuned_forest": [], "8475": [], "1059": [], "41": [15, 21, 30, 36], "79": [], "661": 28, "12032": [], "73": [], "35": [18, 20, 24, 28, 30, 32], "67": [15, 28, 39, 41], "31": [15, 17, 20, 27, 30, 31], "83": [18, 35], "167": [], "1510": [], "81": [20, 27, 30], "114": [20, 26], "103": [22, 24], "250": [], "19": [14, 15, 17, 18, 20, 21, 22, 24, 25, 28, 29, 36, 41], "260": [], "173": [], "113": 20, "600": 36, "121": [20, 27], "799": [], "x_bin": 24, "y_bin": [], "previous": [19, 26, 27], "binary_forest": [], "fpr_rf": [], "tpr_rf": [], "thresholds_rf": [], "close_default_rf": [], "corner": [], "replic": [], "calibration_curv": 22, "plot_calibration_curv": 22, "y_true": [20, 22], "y_prob": [22, 23], "n_bin": 22, "hist": [13, 22, 24, 43], "prob_tru": 22, "prob_pr": 22, "ones_lik": [22, 25], "fraction": [14, 22, 24, 26], "unfit": [], "prob_po": 22, "warm": [23, 26], "learning_r": [13, 14, 20, 23, 24, 26, 37, 39], "shuffl": [13, 14, 24, 26, 31, 37, 39, 41, 42], "gb_": [], "plot_2": [], "slower": [23, 24, 26, 28, 39, 41], "fewer": [14, 17, 19, 20, 22, 24, 26, 27, 36, 37, 38], "ultim": [24, 39, 41], "overtak": 44, "poorli": [23, 31, 43], "aggress": 26, "overshoot": [], "introduc": 25, "capabl": 30, "fine": [16, 24], "off": [20, 21, 22, 24, 25, 26, 27, 35, 36, 37, 38, 39, 44], "anymor": [], "world": [10, 15, 19, 25, 28, 31, 35], "moneybal": [10, 35], "descript": [10, 30], "inform": [10, 17, 19, 23, 25, 27, 28, 31, 32, 36, 37], "basebal": [10, 35], "player": [10, 35], "factor": [10, 23, 25, 27, 28, 31, 35, 36, 37], "41021": [10, 35], "categor": [10, 11, 14, 19, 23, 26, 31, 32, 35], "saw": [10, 18, 25, 35], "isnul": [10, 35, 37], "team": [10, 35], "leagu": [10, 35], "year": [10, 15, 17, 25, 28, 30, 32, 35], "ra": [10, 35], "obp": [10, 35], "slg": [10, 35], "ba": [10, 35], "playoff": [10, 35], "rankseason": [10, 35], "rankplayoff": [10, 35], "oobp": [10, 35], "oslg": [10, 35], "bool": [10, 29, 35], "imput": [10, 11, 27, 35], "median": [10, 11, 24, 31, 35], "simpleimput": [10, 11, 24, 31], "strategi": [10, 11, 22, 24, 31, 32, 35], "x_clean_arrai": 10, "fit_transform": [10, 19, 24, 28, 31, 35], "x_clean": 10, "strongli": [10, 22, 25, 27, 28, 29, 31, 35], "copyfram": [10, 35], "copi": [10, 22, 23, 24, 25, 27, 34, 35], "thing": [10, 19, 24, 27, 31, 35, 36, 37, 39], "immedi": [10, 35, 37], "stand": [10, 28, 35, 37], "diagon": [10, 25, 27, 35], "encod": [10, 11, 13, 14, 15, 17, 19, 22, 23, 27, 35, 36], "build_pipelin": 10, "nan": [10, 18, 22, 24, 30, 31, 35, 37], "onehotencod": [10, 11, 24, 31, 35], "attach": 10, "clean": [10, 19, 24], "randomforest": [10, 18, 22, 23, 24, 35, 39], "gradientboost": [10, 39], "1e6": [10, 22], "agre": [10, 35], "minmaxscal": [11, 24, 31, 35], "compos": [11, 24, 28, 30], "make_column_transform": 24, "cat_pip": [], "spars": [14, 19, 20, 23, 24, 25, 26, 28, 33, 38], "handle_unknown": [11, 31, 35], "num_pip": [], "insert": [22, 27, 35], "remaind": 24, "reg": [21, 24, 25, 33, 35], "pipe": [11, 24, 31, 35], "randomforestregressor": [24, 35, 37, 43], "gradientboostingregressor": [18, 23], "svr": [20, 21, 41], "22898115995987259424768": [], "27": [1, 17, 21, 24, 25, 26, 30, 36, 37], "latter": [35, 36], "perhap": 35, "improven": [], "unregular": [], "had": [11, 18, 27, 28, 35, 37], "compens": 35, "thu": [20, 35, 39], "sometim": [11, 14, 20, 21, 22, 24, 25, 27, 34, 35, 36], "act": [20, 24, 26, 28, 30, 33, 35], "room": 39, "affect": [18, 19, 21, 22, 24, 27, 31, 37], "grid_alpha": 35, "reg__alpha": 35, "evaluategrid": 35, "ridge_r": 35, "lasso_r": 35, "927": [], "11513953993264481": [], "zoon": [], "heavili": [22, 30, 35], "penal": [20, 35], "slighlti": [], "svm_heat": [], "2d": [20, 25, 26, 27, 28, 35, 37], "grid_svm": [], "reg__c": [], "reg__gamma": [], "svm_re": [], "transpos": [16, 30, 35, 36], "nowher": 24, "mess": [20, 35], "feature_indices_": 35, "hot": [11, 13, 14, 15, 17, 26, 35], "fi": 35, "named_step": [11, 24, 31, 35, 36], "named_transformers_": [], "get_feature_nam": [], "input_featur": [], "new_nam": 35, "extend": [19, 24, 27, 29, 30, 35], "addition": [35, 37], "booster": 23, "rf_pipe": 35, "gb_pipe": [], "get_param": [35, 36, 39, 41], "random_forest": 35, "gradient_boost": [], "ind": [28, 32, 35], "orang": [28, 35, 41, 44], "gb": 39, "285": 35, "roughli": 35, "deem": [21, 35], "lesser": 35, "interestingli": 35, "plai": [12, 17, 19, 25, 28], "american": [], "league_": [], "boston": [15, 20, 22, 24], "baltimor": [], "nymet": [], "oakland": [], "obviou": 35, "phenomenon": [19, 35, 37], "consid": [11, 12, 13, 16, 18, 20, 21, 22, 23, 24, 25, 27, 29, 32, 35, 37, 42], "norm": [20, 21, 22, 23, 24, 26, 28, 35, 37], "wherea": 35, "ve": [18, 26, 28, 31, 35], "seen": [17, 21, 22, 24, 26, 27, 28, 35, 37], "last": [11, 13, 17, 18, 19, 24, 26, 27, 28, 29, 30, 31, 36, 41], "anyth": [11, 25, 31, 41, 44], "__": [11, 24, 31], "svm__c": [11, 24, 31], "cancer": [11, 20, 22, 23, 31, 32], "98245614": [11, 31], "97368421": [11, 31], "96491228": [11, 31], "99115044": [11, 31], "98": [11, 31], "queri": [11, 27, 28, 30, 31], "compon": [11, 12, 19, 20, 23, 31, 36, 39, 41], "pipe_short": [11, 31], "abbrevi": [11, 31], "syntax": [11, 31], "becom": [11, 14, 19, 20, 21, 23, 25, 26, 28, 31, 36, 37], "svm__gamma": [11, 24, 31], "And": [11, 32], "drill": 11, "properti": [11, 15, 21, 29, 30, 31, 36], "39188844": 11, "06940593": 11, "435234": 11, "70025696": 11, "86542086": 11, "41433994": 11, "81390656": 11, "41806527": 11, "90768285": 11, "16897821": 11, "29887055": 11, "13720135": 11, "21362118": 11, "19026766": 11, "12847723": 11, "52216852": 11, "76624729": 11, "01249056": 11, "15920579": 11, "51299862": 11, "71224989": 11, "50141938": 11, "99516035": 11, "9094081": 11, "91913684": 11, "89650891": 11, "39896365": 11, "81123374": 11, "4124202": 11, "41518257": 11, "83036405": 11, "59337629": 11, "37050773": 11, "27947936": 11, "55478824": 11, "58895182": 11, "48679571": 11, "15559387": 11, "39055347": 11, "66341253": 11, "27687797": 11, "65127305": 11, "84096369": 11, "39518826": 11, "50425662": 11, "polynomialfeatur": [11, 19, 21, 24], "fetch_california_h": 11, "hous": [11, 15, 20, 27, 36], "polynomialfeatures__degre": [11, 24], "ridge__alpha": [11, 24], "stall": 11, "my": [11, 15, 24, 28], "matshow": [11, 24, 27], "suboptim": [11, 44], "featurejoin": 11, "feature_select": [11, 24], "selectkbest": [11, 24], "dimension": [11, 20, 21, 22, 23, 24, 26, 27, 28, 30, 33, 36, 38, 41], "n_compon": [11, 19, 36], "mayb": [11, 24, 27, 36, 43], "univari": 11, "combined_featur": 11, "univ_select": 11, "x_featur": 11, "features__pca__n_compon": 11, "features__univ_select__k": 11, "transformer_list": 11, "specifi": [11, 13, 14, 18, 25, 30], "preprocessor": [11, 15, 24, 31], "mask": [11, 21, 24, 27, 31, 36], "handi": [11, 22], "sub": [11, 12, 20, 21, 24], "part": [11, 17, 18, 19, 22, 23, 24, 27, 28, 31, 41], "classfier": 11, "handl": [11, 19, 23, 27, 28, 31, 43, 44], "titan": 11, "seed": [11, 14, 19, 20, 22, 24, 25, 26, 31, 37, 41], "40945": 11, "as_fram": [11, 12, 20, 22, 24], "return_x_i": [11, 24], "altern": [11, 14, 20, 22, 23, 24, 26, 28, 29, 33], "fare": 11, "embark": 11, "q": [11, 14, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "sex": 11, "femal": 11, "male": 11, "pclass": 11, "ordin": 11, "integ": [11, 13, 24, 25, 28, 29, 30, 31], "numeric_featur": [11, 24, 31], "numeric_transform": [11, 31], "categorical_featur": [11, 24, 31, 35], "categorical_transform": [11, 31], "constant": [11, 20, 21, 22, 24, 26, 27, 31, 36], "fill_valu": [11, 31], "onehot": [11, 31], "cat": [11, 16, 24, 27, 30, 31, 36, 37], "790": 11, "relat": [11, 20, 23, 24, 26, 27, 28, 37], "preprocessor__num__imputer__strategi": 11, "classifier__c": 11, "798": 11, "gp": [12, 19, 25, 41, 42], "sinusoid": 12, "sin": [12, 20, 21, 23, 25, 30, 31, 32, 37, 41], "line2d": [12, 24, 26], "0x12d6a0580": 12, "sine": [12, 25, 30, 31, 41], "rng": [12, 22, 23, 24, 32, 41], "randomst": [12, 22, 23, 24, 25, 32, 41], "x_": [12, 20, 21, 22, 23, 24, 26, 27, 32, 37], "uniform": [12, 19, 22, 23, 25, 26, 27, 33, 38], "newaxi": [12, 19, 23, 32, 37, 42], "y_": [12, 14, 22, 26, 37], "plot_gp": [12, 25, 42], "x_full": 12, "y_full": 12, "y_pred_mean": 12, "y_pred_std": 12, "use_titl": 12, "st": 12, "dev": 12, "idx": [12, 37], "argsort": [12, 19, 24, 28], "fill_between": [12, 22, 41, 42], "posterior": [12, 23, 24, 41, 42], "likelihood": [12, 20, 25, 39, 41, 42], "kernel_": [12, 41, 42], "log_marginal_likelihood": 12, "theta": [12, 19, 20, 25, 27], "tight_layout": [12, 20, 21, 22, 23, 24, 25, 26, 27, 37], "chosen": [12, 20, 36], "assist": 12, "n_restarts_optim": [12, 19, 25, 37, 41, 42], "gaussianprocessregressor": [12, 19, 25, 41, 42], "constructor": [12, 14, 29], "major": [12, 20, 22, 23, 24, 33, 37], "role": 12, "rationalquadrat": [12, 41], "expsinesquar": [12, 41], "dotproduct": 12, "matern": [12, 25], "monthli": 12, "co2": 12, "collect": [12, 19, 20, 22, 23, 24, 30, 31, 44], "observatori": 12, "hawaii": 12, "1958": 12, "2001": [12, 19, 30], "sci": [12, 14, 15, 31], "kit": [12, 31], "load_mauna_loa_atmospheric_co2": 12, "ml_data": 12, "data_id": [12, 24], "41187": 12, "month": [12, 17, 24], "ppmv_sum": 12, "month_float": 12, "ppmv": 12, "asarrai": [12, 15, 23, 28], "avg_ppmv": 12, "x_mauna": 12, "y_mauna": 12, "season": 12, "nois": [12, 19, 20, 23, 24, 25, 26, 27, 31, 32, 41, 42], "irregular": 12, "whitenois": 12, "gaussian_process": [12, 19, 25, 37, 41, 42], "whitekernel": [12, 41], "k1": [12, 30, 41], "length_scal": [12, 25, 41], "rise": [12, 15, 17, 34, 41], "k2": [12, 30, 41], "periodicity_bound": 12, "k3": [12, 41], "k4": 12, "noise_level": [12, 41], "noise_level_bound": 12, "0x7fe415cadeb0": [], "constantkernel": [25, 42], "return_std": [19, 25, 37, 41, 42], "x2": [19, 20, 24, 25], "y2": 19, "gp2": [], "y2_pred_mean": [], "y2_pred_std": [], "x3": 19, "y3": 19, "gp3": [], "y3_pred_mean": [], "y3_pred_std": [], "round": [20, 24, 26, 29, 37], "normalize_i": [19, 37, 41, 42], "mesh": [25, 28, 42], "mse": [15, 25, 42], "y_mean": [], "y_sigma": [], "tf": [13, 14, 15, 16, 17, 18, 20, 26, 27, 28], "554": [13, 27, 28], "exist": [13, 14, 19, 20, 22, 23, 24, 25, 26, 27, 28, 30, 31, 32, 33, 36, 42], "predefin": [13, 14, 31], "60000": [13, 14, 26, 27], "10000": [13, 14, 15, 17, 24, 26, 27, 28, 31, 41], "x_train_norm": 13, "x_test_norm": 13, "y_train_encod": 13, "y_test_encod": 13, "create_model": [13, 14], "topographi": 13, "layer": [13, 15, 16, 17, 19, 25], "node": [13, 14, 15, 16, 17, 19, 20, 23, 24, 25, 26, 27, 28], "dropout": [13, 15, 16, 17, 27, 28], "layer_1_unit": 13, "layer_2_unit": 13, "dropout_r": 13, "train_model": 13, "histori": [13, 14, 15, 26, 27, 28], "validation_split": [13, 28], "epoch": [13, 14, 15, 16, 17, 24, 26, 27, 28], "batch_siz": [13, 14, 15, 26, 27, 28], "asid": [13, 19, 24, 31], "batch": [13, 15, 16, 17, 20, 22, 23, 27], "minibatch": [13, 15, 20, 26], "sgd": [13, 14, 15], "003": [13, 28], "4000": [13, 22, 27], "otherwis": [13, 16, 20, 22, 23, 24, 26, 27], "feel": [13, 15, 16, 20, 28], "callback": [13, 14, 26, 28], "list_of_metr": 13, "plot_curv": 13, "hidden": [13, 14, 15, 16, 17, 19, 22, 28, 34], "global": [19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33, 37], "__version__": 18, "tf_cpp_min_log_level": [27, 28], "to_categor": [14, 15, 26, 27], "sequenti": [15, 20, 26, 27, 28], "input_shap": [14, 15, 26, 27, 28], "unit": [14, 15, 17, 19, 20, 21, 26, 31], "relu": [14, 15, 16, 17, 27, 28], "among": [23, 30, 37], "inclus": 27, "softmax": [14, 15, 26, 27, 28], "construct": [18, 21, 23, 25, 31], "adam": [14, 28], "rmsprop": [14, 15, 17, 26, 27, 28], "categorical_crossentropi": [14, 15, 26, 27], "x_val": [14, 15, 26, 28], "y_val": [14, 15, 26, 28], "validation_data": [14, 15, 26, 27, 28], "val_accuraci": [14, 15, 26, 28], "val_loss": [14, 15, 26, 27, 28], "devic": [14, 15, 20, 26, 27], "appl": [14, 15, 20, 26, 27], "m1": [14, 15, 20, 24, 26, 27], "pro": [14, 15, 20, 26, 27], "miniforge3": [18, 31], "optimizer_v2": [], "105": 28, "deprec": [14, 15, 18, 25], "super": [], "kwarg": [14, 25, 27, 29, 37], "21780921518802643": [], "9358000159263611": [], "hunch": [], "ad": [14, 15, 16, 19, 22, 24, 25, 26, 27, 28, 34, 35, 36, 37, 41, 43], "pretti": [], "800": [19, 22], "9571000337600708": [], "wa": [15, 17, 18, 27, 28, 36, 37, 38], "keras_tun": 14, "kt": 14, "build_model": [14, 15, 26], "hp": [14, 22, 26, 37], "hp_unit": 14, "min_valu": [14, 26], "max_valu": [14, 26], "hp_units2": [], "units2": [], "hp_dropout": [], "tuner": [14, 26], "max_trial": [14, 26], "project_nam": 14, "mnist_tun": [], "best_hp": 14, "get_best_hyperparamet": 14, "num_trial": 14, "faster": [14, 16, 20, 23, 24, 26, 27, 30, 39, 44], "divis": [14, 26], "leakag": [14, 19], "float32": [14, 15, 20, 26, 27, 28, 31], "hold": [14, 26, 28, 30], "account": [14, 22, 28, 38], "concern": 14, "xf_train": [14, 26], "yf_train": [14, 26], "50000": 14, "fulli": [14, 20, 26], "connect": [14, 19, 20, 25, 26, 27, 28], "kernel_initi": [14, 26], "kernel_regular": [14, 15, 26], "use_bia": 14, "glorot_uniform": 14, "bias_initi": 14, "bias_regular": 14, "activity_regular": 14, "kernel_constraint": 14, "bias_constraint": 14, "512": [14, 15, 17, 23, 26, 27, 28, 36, 39, 42], "2022": [14, 15, 18], "21": [1, 14, 20, 24, 25, 28, 30], "042917": 14, "common_runtim": [14, 15, 20, 26], "pluggable_devic": [14, 15, 20, 26], "pluggable_device_factori": [14, 15, 20, 26], "cc": [14, 15, 20, 26], "305": [14, 15], "numa": [14, 15, 20, 26], "platform": [14, 15, 20, 26], "043031": 14, "271": [14, 15, 17], "job": [14, 15, 20, 26, 36], "localhost": [14, 15, 20, 26], "replica": [14, 15, 20, 26], "mb": [14, 15, 20, 26, 31], "memori": [14, 15, 20, 21, 26, 27, 28, 30, 31, 33], "physic": [14, 15, 19, 20, 26], "pluggabledevic": [14, 15, 20, 26], "pci": [14, 15, 20, 26], "bu": [14, 15, 20, 26], "undefin": [14, 15, 20, 26], "inputlay": [14, 27], "negative_slop": 14, "leaki": [14, 26], "wise": [14, 20, 23, 25, 27], "401920": [14, 26], "262656": [14, 26], "5130": [14, 26], "sequential_3": [14, 27], "_________________________________________________________________": [14, 15, 26, 27, 28], "dense_6": 14, "dense_7": 14, "dense_8": 14, "669": [14, 26], "706": [14, 26, 28], "trainabl": [14, 15, 26, 27, 28], "entropi": [14, 15, 17, 24, 26, 28, 32], "crossentropi": [14, 26], "monitor": [14, 26], "dure": [14, 18, 19, 22, 23, 24, 25, 26, 27, 36, 37], "shorthand": [14, 26, 30], "categoricalcrossentropi": [14, 26], "label_smooth": [14, 26], "momentum": [14, 20], "noisi": [14, 22, 24, 26, 27, 33, 42], "recreat": 14, "scratch": [14, 23, 26, 27, 37], "wrap": [14, 22, 26, 27], "he_norm": [14, 26], "314333": 14, "profile_util": [14, 15, 26], "cpu_util": [14, 15, 26], "128": [14, 15, 16, 23, 24, 26, 27, 28, 39], "fail": [14, 15, 19, 26, 41], "cpu": [14, 15, 16, 26], "frequenc": [14, 15, 23, 26, 27, 28, 32], "hz": [14, 15, 26], "463989": 14, "grappler": [14, 15, 26], "custom_graph_optimizer_registri": [14, 15, 26], "plugin": [14, 15, 26], "device_typ": [14, 15, 26], "enabl": [14, 15, 16, 26, 34], "782": [14, 28, 39], "6s": 14, "8m": [14, 15], "5242": 14, "8115": 14, "3855": 14, "8602": 14, "3558": 14, "8713": 14, "to_json": 14, "class_nam": [14, 31, 32], "config": 14, "sequential_4": 14, "batch_input_shap": 14, "null": 14, "rag": 14, "dense_9_input": 14, "dense_9": 14, "henorm": 14, "dense_10": 14, "dense_11": 14, "glorotuniform": 14, "keras_vers": 14, "304700": 14, "51": [14, 28, 30], "524872": 14, "5196696519851685": 14, "4197826385498047": 14, "3965308368206024": 14, "8141800761222839": 14, "8545200824737549": 14, "8647000789642334": 14, "444828063249588": 14, "45543763041496277": 14, "4412410259246826": 14, "8461000323295593": 14, "8510000109672546": 14, "8672000169754028": 14, "test_loss": [14, 26], "test_acc": [14, 26], "sample_id": [14, 26], "set_printopt": [14, 26], "614863": 14, "71400239e": 14, "29640335e": 14, "66167177e": 14, "84634490e": 14, "18418960e": 14, "10093026e": 14, "03666283e": 14, "59356839e": 14, "06": [14, 36, 37], "37293778e": 14, "99990344e": 14, "313": 14, "2s": [14, 15, 28], "6m": 14, "4312": 14, "8653": 14, "8653000593185425": 14, "until": [14, 15, 22, 23, 24, 25, 26, 27, 28, 29, 44], "extern": [14, 19], "tensorboard": [14, 15], "commerci": [14, 18], "weightsandbias": 14, "trainingplot": [14, 26, 28], "begin": [14, 17, 20, 21, 22, 24, 25, 26, 28], "on_train_begin": [14, 26, 28], "val_acc": [14, 26, 27, 28], "max_acc": [14, 26, 28], "on_epoch_end": [14, 26, 28], "val": [14, 22, 26, 28], "train_loss": [14, 26, 28], "train_acc": [14, 26, 28], "plot_loss": [14, 20, 26, 28, 37], "longer": [14, 18, 20, 23, 26, 28, 37], "bumpi": [14, 26], "earlystop": [14, 26], "patienc": [14, 26], "memor": 14, "256": [14, 23, 26, 27, 38, 39], "across": [14, 26, 27, 28], "badg": [14, 26], "exponenti": [14, 19, 20, 23, 25, 26, 31, 38, 41], "prone": [14, 26], "vanish": [14, 26, 27, 28], "explod": [14, 24, 26], "batchnorm": [14, 26], "debat": 14, "deepest": 14, "likewis": 14, "paper": [14, 23, 28, 37], "topic": 14, "associ": [14, 20, 24, 37], "hyperband": [14, 26, 44], "bayesianoptim": [14, 26, 37], "0001": [14, 35, 37, 38], "hp_learning_r": 14, "choic": [14, 16, 17, 19, 21, 22, 25, 26, 33, 37], "lab7": 14, "info": [14, 18, 25, 26], "reload": [14, 27], "oracl": 14, "json": [14, 15], "tuner0": 14, "uncom": [14, 16, 27], "kerasclassifi": [14, 15, 26], "wrapper": [14, 15, 24, 26], "scikit_learn": [14, 15, 26], "var_activ": 14, "var_optim": 14, "_activ": 14, "tanh": [14, 17], "selu": 14, "_optim": 14, "_batch_siz": 14, "build_fn": [14, 15], "0t": [14, 15], "5d8ttqzd773fy0wq3h5db0xr0000gn": [14, 15], "ipykernel_63314": 14, "5830362": 14, "24": [14, 17, 18, 20, 26, 27, 31, 37, 44], "deprecationwarn": [14, 15, 43], "adriangb": [14, 15], "scikera": [14, 15], "rscv": 14, "rscv_result": 14, "playground": [14, 15], "movi": [15, 28], "price": [15, 32], "integr": [15, 25, 30], "imdb": [15, 17, 28], "frequent": [15, 17, 21, 22, 24, 28, 31, 33], "retain": [15, 19], "raw": [15, 19, 25, 42], "token": [15, 28], "train_data": [15, 17, 28], "train_label": [15, 17, 27, 28], "test_data": [15, 17, 28], "test_label": [15, 17, 28], "load_data": [15, 17, 22, 27, 28], "num_word": [15, 17, 28], "word_index": [15, 17, 28], "get_word_index": [15, 17, 28], "reverse_word_index": [15, 17, 28], "43": [15, 28], "530": 15, "973": 15, "1622": 15, "1385": 15, "film": [15, 17, 28], "brilliant": [15, 17, 28], "cast": [15, 17, 28, 37], "sceneri": [15, 17, 28], "stori": [15, 17, 28], "sequenc": [15, 21, 24, 30], "idf": [15, 28], "14th": 15, "vectorize_sequ": [15, 28], "dimens": [15, 19, 20, 21, 24, 25, 26, 27, 28, 30, 36, 37], "1s": [15, 28], "binary_crossentropi": [15, 27, 28], "951585": 15, "951739": 15, "binary_accuraci": 15, "track": [15, 19, 23, 26, 37], "partial_x_train": [15, 26, 28], "partial_y_train": [15, 26, 28], "782619": 15, "945021": 15, "41m": 15, "5020": 15, "7869": 15, "3738": 15, "8746": 15, "eta": [15, 20, 23, 26, 27], "3289": 15, "9082": 15, "44": [15, 18], "153087": 15, "15m": 15, "2986": 15, "9037": 15, "3359": 15, "8650": 15, "13m": 15, "2214": 15, "9287": 15, "2797": 15, "8905": 15, "14m": 15, "1777": 15, "9451": 15, "2818": 15, "8880": 15, "1419": 15, "9561": 15, "2808": 15, "8868": 15, "1189": 15, "9645": 15, "2959": 15, "8857": 15, "0949": 15, "9735": 15, "3122": 15, "8812": 15, "0790": 15, "9782": 15, "4285": 15, "8579": 15, "0689": 15, "9810": 15, "3521": 15, "8793": 15, "0525": 15, "9881": 15, "3976": 15, "8747": 15, "0451": 15, "9897": 15, "4112": 15, "8725": 15, "0344": 15, "9934": 15, "4426": 15, "8699": 15, "0284": 15, "9940": 15, "4725": 15, "8716": 15, "0224": 15, "9965": 15, "5169": 15, "8676": 15, "0175": 15, "9972": 15, "5244": 15, "8726": 15, "0126": 15, "9986": 15, "5545": 15, "8710": 15, "12m": 15, "0110": 15, "9987": 15, "5868": 15, "8687": 15, "0104": 15, "9981": 15, "6241": 15, "8672": 15, "0046": 15, "9999": 15, "6510": 15, "8658": 15, "0059": 15, "9993": 15, "6874": 15, "8656": 15, "due": [15, 22], "nreview": [15, 28], "294314": 15, "br": [15, 28], "rest": [15, 17, 23, 24, 26, 28], "terribl": [15, 28], "flat": [15, 26, 28, 30, 37], "michael": [15, 28], "madison": [15, 28], "hi": [15, 28], "plate": [15, 28], "he": [15, 26, 28], "wasn": [15, 28], "fan": [15, 26, 28], "00635761": 15, "1996": [15, 28], "watch": [15, 28], "never": [15, 19, 20, 22, 24, 26, 28, 37, 39, 44], "satisfact": [15, 28], "god": [15, 28], "ten": [15, 28], "ago": [15, 28], "dialogu": [15, 28], "novel": [15, 28], "willem": [15, 28], "strang": [15, 28], "voic": [15, 28], "spell": [15, 28], "night": [15, 28], "sai": [15, 20, 24, 28, 29, 30, 37], "bore": [15, 28], "music": [15, 28], "me": [15, 28], "anoth": [15, 16, 17, 20, 21, 23, 24, 25, 26, 27, 28, 30, 32, 35, 36, 39, 43], "heart": [15, 28], "anyon": [15, 28], "thank": [15, 28], "80061406": 15, "reuter": [15, 17], "offset": [15, 17, 25], "reserv": 15, "pad": [15, 16, 19, 20, 21, 23, 24, 25, 28, 37], "unknown": [15, 19, 24, 28, 37], "decoded_newswir": 15, "wire": [15, 17], "storag": [15, 24], "googleapi": 15, "npz": 15, "2113536": 15, "2110848": 15, "4s": 15, "2u": 15, "2121728": 15, "reuters_word_index": 15, "557056": 15, "550378": 15, "0u": 15, "565248": 15, "said": [15, 17], "decemb": [15, 17], "acquisit": [15, 17, 37], "co": [15, 17, 19, 20, 21, 28, 30, 37], "earn": [15, 17], "share": [15, 17, 19, 21, 28], "1987": [15, 17], "dlr": [15, 17], "ct": [15, 17], "1986": [15, 17], "compani": [15, 17], "pretax": [15, 17], "nine": [15, 17], "mln": [15, 17], "six": [15, 17, 37], "rental": [15, 17], "oper": [15, 17, 27, 28, 29], "revenu": [15, 17], "cash": [15, 17], "flow": [15, 17, 27], "447": [15, 39], "207": 15, "270": [15, 19], "3095": 15, "111": [15, 22, 23, 32, 43], "369": 15, "186": 15, "one_hot_train_label": 15, "one_hot_test_label": 15, "history2": 15, "291793": 15, "17m": 15, "7551": 15, "5128": 15, "7982": 15, "6560": 15, "5043": 15, "6980": 15, "201983": 15, "4631": 15, "7048": 15, "3179": 15, "7110": 15, "11m": 15, "0819": 15, "7645": 15, "1319": 15, "7540": 15, "8560": 15, "8092": 15, "0311": 15, "7890": 15, "6840": 15, "8530": 15, "9559": 15, "7980": 15, "5503": 15, "8887": 15, "9247": 15, "8000": 15, "4419": 15, "9107": 15, "9400": 15, "7940": 15, "3577": 15, "9275": 15, "9076": 15, "8100": 15, "3002": 15, "9374": 15, "8816": 15, "8230": 15, "2513": 15, "9445": 15, "9024": 15, "8180": 15, "2127": 15, "9481": 15, "9468": 15, "1888": 15, "9501": 15, "9425": 15, "8130": 15, "1700": [15, 27], "9543": 15, "9748": 15, "8080": 15, "1521": 15, "9540": 15, "9547": 15, "8110": 15, "1447": 15, "9819": 15, "1320": 15, "9574": 15, "9855": 15, "8150": 15, "1278": [15, 20], "9560": 15, "0335": 15, "8170": 15, "1223": 15, "0732": 15, "8030": 15, "1167": 15, "9575": 15, "0764": 15, "1115": 15, "9592": 15, "1050": 15, "8040": 15, "3110": 15, "7832": 15, "506": [15, 20], "sale": 15, "neighborhood": 15, "boston_h": 15, "train_target": 15, "test_target": 15, "57344": 15, "57026": 15, "7u": 15, "65536": 15, "6u": 15, "scalar": [15, 20], "penalti": [15, 20, 36], "mae": 15, "ourselv": [15, 41], "futureproof": 15, "tfx": 15, "kerasregressor": 15, "standardis": [15, 35], "ipykernel_63784": 15, "292072420": 15, "concaten": [15, 19, 20, 22, 24, 25, 26], "fit_param": 15, "keras__epoch": 15, "keras__batch_s": 15, "keras__verbos": 15, "146990890": 15, "090909": 15, "676628": 15, "988794": 15, "757530": 15, "929908": 15, "757842": 15, "731411012765486": 15, "l2_model": 15, "summari": [15, 27, 41], "sequential_5": 15, "dense_15": 15, "160016": 15, "dense_16": 15, "272": [15, 20, 26], "dense_17": 15, "160": 15, "dpt_model": 15, "sequential_6": 15, "dense_18": 15, "dense_19": 15, "dropout_1": 15, "dense_20": 15, "glove": [15, 17], "max_length": [15, 28], "vocab_s": [15, 28], "vocabulari": [15, 28], "embedding_length": [15, 28], "300": [15, 17, 28, 30, 31, 38, 39], "input_length": [15, 28], "summar": [15, 28], "sequential_7": 15, "3000000": 15, "6000": 15, "dense_21": 15, "6001": 15, "006": 15, "cifar": [16, 18], "confid": [16, 19, 22, 25, 26, 33, 42], "pytorch": [16, 26], "tip": [16, 27], "quiet": [16, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "3x32x32": 16, "96x96x3": 16, "41103": 16, "40926": [16, 18], "cifar_class": 16, "airplan": 16, "automobil": 16, "bird": 16, "deer": 16, "dog": [16, 27], "frog": 16, "hors": 16, "ship": 16, "truck": 16, "weird": 16, "xr": [16, 25, 32, 37], "80": [16, 18, 20, 23, 28, 32, 36, 37, 38], "convnet": [16, 18, 28], "interspers": 16, "maxpool": [16, 27], "filter": [16, 18, 22, 26, 28, 29], "ration": 16, "simplifi": [16, 19, 27], "block": [16, 22, 27, 28], "shift": [16, 27, 36], "shear": [16, 27], "flip": [16, 27], "imagedatagener": [16, 27], "retrain": [16, 17, 22, 27, 37], "someth": [16, 17, 24, 28], "41983": 16, "luck": 16, "everyon": [17, 28], "suit": [17, 28], "funni": [17, 28], "russian": [17, 28], "submarin": [17, 28], "crew": [17, 28], "actor": [17, 28], "scene": [17, 28], "french": [17, 28], "horror": [17, 28], "cinema": [17, 28], "reviv": [17, 28], "coupl": [17, 28, 31], "earli": [17, 19, 22, 23, 32], "adagrad": [17, 26], "agricultur": 17, "depart": 17, "canada": 17, "87": 17, "wheat": [17, 37], "crop": [17, 27], "tonn": 17, "1985": 17, "86": 17, "canadian": 17, "grain": 17, "export": [17, 30], "forecast": [17, 32], "72": [17, 27, 30], "shr": 17, "profit": 17, "224": [17, 27], "511": [17, 20, 28], "349": 17, "rev": 17, "258": 17, "688": [17, 27], "sensibl": 17, "bottleneck": [17, 19], "pretrain": [17, 27, 28], "om": 17, "wikipedia": [17, 22, 28], "openbla": 18, "brew": [18, 32], "pars": 18, "outdat": 18, "ok": 18, "subject": [18, 22], "budget": [18, 25], "inher": [18, 22, 25], "evolutionari": 18, "gamaclassifi": 18, "gamaregressor": 18, "max_total_tim": 18, "subprocess": 18, "progress": [18, 19], "output_directori": 18, "gama_log": 18, "record": [1, 18, 23, 24, 37], "statsmodel": 18, "_test": [18, 24], "public": [18, 30], "tm": 18, "0x2a2e21940": 18, "18004587099500413": 18, "4796": 18, "keep_analysis_log": 18, "builtin": 18, "gamareport": 18, "transform_evalu": 18, "hard": [18, 19, 20, 21, 22, 23, 24, 25, 27, 28, 39], "useless": 18, "clariti": 18, "length_cummax": 18, "relative_end": 18, "log_directori": 18, "0009": 18, "asyncea": 18, "0824": 18, "postprocess": 18, "bestfitpostprocess": 18, "1582": 18, "pid": 18, "durat": [18, 37], "t_process": 18, "parent0": 18, "parent1": 18, "r2_cummax": 18, "19593": 18, "79783": 18, "645673": 18, "000124931": 18, "000132": 18, "nystroem": 18, "nystr": 18, "lt": 18, "typeerror": [18, 29], "gt": 18, "check_cv": 18, "4aa674e3": 18, "e797": 18, "490a": 18, "b405": 18, "e125558a5f88": 18, "mut_insert": 18, "22148": 18, "818902": 18, "000092983": 18, "000101": 18, "maxabsscal": [18, 24], "dab8c779": 18, "2661": 18, "4110": 18, "acc3": 18, "fe463080337": 18, "42800": 18, "461106": 18, "000218153": 18, "000224": 18, "selectfw": 18, "sele": 18, "27903398": 18, "5556": 18, "469f": 18, "9c6c": 18, "e23f8593484d": 18, "42865": 18, "538670": 18, "000098944": 18, "000103": 18, "018364fe": 18, "f35c": 18, "4c82": 18, "a383": 18, "bdccbcf7ce43": 18, "43600": 18, "36": [18, 25, 27, 28, 29, 30], "388697": 18, "000099182": 18, "gradientboosti": 18, "ec5cc934": 18, "0d3b": 18, "4fc8": 18, "95ab": 18, "2d3a17f2b338": 18, "mut_replace_termin": 18, "th": [18, 20, 21, 22, 23, 24, 32, 37], "took": [18, 38], "tie": 18, "ascend": [18, 30], "drop_dupl": [18, 30], "711950": 18, "000200987": 18, "000197": 18, "maxab": 18, "29319": 18, "406984": 18, "000093937": 18, "000100": [18, 37], "b664ffba": 18, "b8e4": 18, "4989": 18, "b205": 18, "0717fbcb3995": 18, "29311": 18, "398273": 18, "000107050": 18, "000112": 18, "extratreesregressor": 18, "fastica": 18, "f5292317": 18, "1ea0": 18, "42a9": 18, "8ee3": 18, "505328a6bd9c": 18, "748849": 18, "000212908": 18, "000219": 18, "decisiontreeregressor": [18, 23, 24, 32], "d4670a36": 18, "d05a": 18, "445d": 18, "9d17": 18, "18dd92f205b2": 18, "axessubplot": 18, "break": [18, 20, 23, 24, 26, 27, 44], "onc": [18, 21, 22, 26, 27, 37], "x_sub": [18, 27], "y_sub": [18, 27], "gama_log2": 18, "init": 18, "regularize_length": 18, "max_pipeline_length": 18, "max_eval_tim": 18, "max_memory_mb": 18, "post_process": 18, "0864": 18, "ea": 18, "popul": [18, 37], "downsampl": [18, 19, 27], "constraint": [18, 20, 23], "gain": [18, 23, 24, 32, 38], "configur": [18, 22, 25, 34, 35, 38, 41, 44], "post_processing_method": 18, "ensemblepostprocess": 18, "automl_with_ensembl": 18, "gama_log3": 18, "independ": [18, 19, 22, 24, 25, 28, 31, 44], "might": [18, 25, 37], "post": [18, 22, 27, 32, 34], "hoc": 18, "switch": [18, 20, 35], "log_loss": 18, "_evaluation_librari": 18, "n_best": 18, "best_pipelin": 18, "benefit": [18, 19, 20, 23, 24, 37], "vote": [18, 20, 23, 33], "caruana": 18, "2004": 18, "scenario": [18, 37], "experienc": 18, "assig": 18, "awar": 18, "halt": 18, "tabular": [18, 28, 30], "wildli": 18, "architectur": [18, 19, 27], "autokera": 18, "texa": 18, "autogluon": 18, "amazon": 18, "cloud": 18, "eager": 18, "own": [18, 19, 23, 27, 30, 37], "system": [18, 30], "requirements_colab": [19, 20, 21, 22, 23, 24, 25, 26, 27, 32, 33], "fig_scal": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33], "print_config": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "netflix": 19, "translat": [19, 27, 28, 36], "speech": [19, 24], "siri": 19, "alexa": 19, "game": 19, "alphago": 19, "drive": [19, 23, 27, 28], "person": [19, 22], "medicin": 19, "genet": [19, 31], "astronomi": 19, "chemistri": 19, "neurolog": 19, "mathcal": [19, 20, 21, 22, 23, 25, 26, 28], "f_": [19, 20, 22, 23, 25], "underset": [19, 20, 22, 23, 32], "operatornam": [19, 20, 22, 23, 32], "form": [19, 20, 21, 24, 25, 26], "bias": [19, 22, 24, 26, 28, 36], "mimick": 19, "human": [19, 25, 26], "brain": 19, "logic": 19, "assupt": 19, "sim": [19, 25, 28], "mu": [19, 20, 21, 23, 24, 25], "sigma": [19, 20, 24, 25, 26, 27, 28, 37, 42], "transfer": [19, 25], "f_1": 19, "f_2": 19, "f_3": 19, "longrightarrow": 19, "breiman": 19, "cultur": 19, "natur": [19, 24, 26, 27], "phenomena": [19, 22], "autom": [19, 22, 24], "partial": [19, 20, 23, 26, 27], "orient": 19, "theori": [19, 26], "star": [19, 26], "galaxi": 19, "sky": 19, "meaning": [19, 22], "anomal": 19, "semi": [19, 21, 24], "unlabel": 19, "agent": 19, "desir": [19, 25], "outcom": [19, 20, 22], "subtyp": 19, "discret": [19, 20, 23, 24, 30, 37], "unord": [19, 20, 29], "spam": [19, 22], "letter": [19, 20, 28, 38], "recognit": 19, "make_moon": [19, 23, 26, 32], "ipywidget": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "widget": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "interact_manu": [19, 20, 21, 22, 23, 24, 25, 26, 27, 31, 32], "x1": [19, 20, 24, 25], "y1": 19, "plot_classifi": [19, 21, 23, 25, 32], "plot_2d_separ": [19, 20, 21, 22, 23, 26, 33], "cm2": [19, 20, 21, 22, 24, 33], "scores_imag": [19, 22], "plot_2d_scor": [19, 22], "rebl": [19, 22], "discrete_scatt": [19, 20, 21, 22, 23, 32, 33], "labelpad": [19, 20, 21, 23, 25, 37], "cbar": [19, 22], "set_label": [19, 44], "set_alpha": [19, 22], "draw_al": [19, 22], "pictur": [19, 27], "interv": [19, 20, 24, 25, 37, 42], "predictor": [19, 27, 35, 38], "make_wav": [19, 20, 21, 24, 33], "plot_help": 19, "bayesianridg": [19, 24, 25], "atleast_2d": [19, 25], "1e2": [19, 22, 25, 42], "plot_regress": [19, 25], "9600": [19, 25], "fc": [19, 25], "ec": [19, 25, 26], "organ": 19, "subgroup": [19, 22], "dissimilar": 19, "distinguish": [19, 28], "recent": [19, 28, 36], "uninstal": 19, "threadpoolctl": 19, "nr_sampl": [19, 25], "plot_clust": 19, "cluster_std": [19, 22, 24, 33], "n_cluster": 19, "fit_predict": 19, "difficult": [19, 37], "compress": [19, 22, 23, 26, 30], "contrari": [19, 28], "make_swiss_rol": 19, "locally_linear_embed": 19, "mpl_toolkit": [19, 20, 21, 25, 37], "mplot3d": [19, 20, 21, 25, 37], "axes3d": [19, 21, 25], "123": [19, 23, 30], "figaspect": [19, 25], "ax1": [19, 24, 25, 27], "add_subplot": [19, 22, 25, 27, 37], "3d": [19, 20, 21, 25, 26, 28, 37, 40], "xaxi": [19, 24, 25, 37], "pane": 19, "yaxi": [19, 22, 24, 25, 37], "zaxi": [19, 37], "rainbow": 19, "swiss": 19, "roll": [19, 26], "ax2": [19, 24, 25, 27, 35, 36, 38], "scikit_pca": 19, "x_spca": 19, "ax3": 19, "x_lle": 19, "err": [19, 22, 28], "chess": 19, "reward": 19, "polici": 19, "formal": 19, "languag": 19, "hypothesi": [19, 25], "annot": [19, 20, 21], "l": [19, 20, 21, 22, 23, 25, 26, 27, 28, 29, 32, 36, 41], "relax": [19, 20], "refin": [19, 26], "optima": 19, "flexibl": [19, 20, 22, 23, 28], "theta_i": 19, "receiv": 19, "emit": 19, "neuron": [19, 20, 26], "imagin": [19, 20, 26, 28, 37], "mini": 19, "theta_0": 19, "theta_1": 19, "surfac": [19, 20, 26, 37, 44], "frac": [19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 32, 37, 41], "peculiar": 19, "simpler": [19, 22, 24, 30, 32, 37], "overcom": 19, "true_fun": 19, "pi": [19, 20, 21, 25, 27, 30, 31, 41, 43], "rand": [19, 23, 24, 32, 41], "randn": [19, 20, 22, 24, 25, 30], "x3_test": 19, "scores_x": 19, "scores_i": 19, "show_output": 19, "plot_poli": 19, "polynomial_featur": 19, "include_bia": [19, 21, 24], "linear_regress": 19, "crossvalid": 19, "nmse": 19, "intslid": 19, "feedback": [19, 22], "xkcd": [19, 25], "plot_threefold_split": [19, 22], "miniz": [19, 22], "diagnos": 19, "accid": 19, "necessari": [19, 23, 24, 27, 31, 36, 37], "andrew": [19, 22], "ng": [19, 22], "noth": [19, 25, 26, 29], "domain": [19, 20], "leaf": [19, 23, 24, 32], "unstructur": 19, "increasingli": [19, 27, 36, 42], "intuit": [19, 20, 21, 23], "hypercub": 19, "peter": 19, "norvig": 19, "corner_count": 19, "99": [19, 22, 26, 27, 31], "ds": 19, "proport": [19, 22], "bless": 19, "live": [19, 22, 28], "parametr": [19, 33], "suffici": [19, 23, 27, 36, 41], "minima": [19, 20, 24, 26, 41], "huge": [19, 21, 22, 24], "million": 19, "scalabl": [19, 20, 25], "upcom": 19, "rare": [19, 20], "bring": [19, 24, 26, 31], "imbal": [19, 24, 36], "uninterest": 19, "No": [19, 20, 22, 27, 28], "workflow": [19, 31], "drift": [19, 22, 23], "gather": 19, "deploy": 19, "denot": 20, "ital": 20, "bold": [20, 32], "x_i": [20, 21, 22, 23, 24, 25, 26, 28, 31, 32, 41], "x_0": [20, 21, 22, 25], "uniqu": [20, 22, 23, 24, 28, 37], "caligraph": 20, "capit": [20, 28], "bmatrix": [20, 21, 25, 26], "textbf": [20, 21, 25], "basi": [20, 21, 24, 25], "euclidean": [20, 24, 28, 31, 33, 41], "tensor": [20, 27, 28], "rank": [20, 24, 28, 30, 31], "t_": 20, "4d": [20, 26, 27, 30], "height": [20, 23, 26, 27, 31], "channel": [20, 26, 27], "sum_": [20, 21, 22, 23, 26, 28, 32], "x_1": [20, 21, 22, 24, 25, 26], "x_p": [20, 21, 22, 24, 26], "quad": [20, 21, 25, 26, 32], "prod_": [20, 25], "cdot": [20, 21, 22, 23, 24, 25, 28, 33, 41], "z_0": [20, 26], "z_1": 20, "z_p": 20, "w_i": [20, 21, 22, 23, 24, 25, 26, 28], "w_0": [20, 21, 22, 25, 26], "w_1": [20, 21, 22, 25, 26], "w_p": [20, 21, 22, 26], "geq": [20, 21], "epsilon": [20, 25, 26], "consum": 20, "largest": [20, 23, 28], "argmax": [20, 23, 32], "deriv": [20, 23, 25, 26], "differenti": [20, 23, 26, 30], "rightarrow": [20, 21], "infinit": [20, 25], "nabla": [20, 26], "2x_0": 20, "3x_1": 20, "x_2": [20, 21, 24, 25, 26], "6x_1": 20, "2x_1": 20, "respect": [20, 30, 32], "x0": [20, 21, 23, 25], "g_f": 20, "g_dfx0": 20, "g_dfx1": 20, "plot_gradi": 20, "240": 20, "plot_surfac": [20, 21, 25], "rstride": [20, 21], "cstride": [20, 21], "winter": [20, 24], "i0": 20, "i1": 20, "iz": 20, "82": [20, 24, 39], "scatter3d": 20, "i_0": 20, "i_1": 20, "plot3d": 20, "linewidth": [20, 21, 22, 23, 24, 25, 26, 31, 32, 37], "silver": 20, "set_zlim": [20, 37], "intersect": 20, "dx0": 20, "get_zaxi": 20, "set_tick": 20, "view_init": 20, "box": [20, 22, 23, 24, 25, 34, 37], "get_posit": [20, 23], "set_posit": [20, 23, 24], "y0": [20, 23], "f_x": 20, "mathbb": [20, 21, 25], "dx": 20, "mass": 20, "pmf": 20, "mu_x": 20, "pr": [20, 22, 24], "w_": [20, 23, 24, 26, 28], "augment": 20, "poisson": 20, "tweedi": 20, "intercept": [20, 21], "hat": [20, 21, 22, 23, 26, 32], "w_2": [20, 21, 25, 26], "xw": 20, "yw": 20, "xw_train": 20, "xw_test": 20, "yw_train": 20, "yw_test": 20, "393906": 20, "031804": 20, "sse": 20, "residu": [20, 22, 23, 27, 28], "_i": [20, 22, 23, 24, 25, 28, 41], "y_i": [20, 21, 22, 23, 25, 31, 32], "y_n": [20, 22], "_n": [20, 25], "x_n": [20, 21, 22, 25], "convex": [20, 33], "front": 20, "quadrat": [20, 21, 24, 25, 32], "2n": [20, 21], "steep": 20, "inclin": 20, "declin": 20, "wrt": [20, 27], "downhil": [20, 26], "diverg": [20, 26, 32], "decai": [20, 24], "ks": [20, 26], "invers": [20, 22, 25, 26, 28], "math": [20, 21, 30, 37], "l_fx": 20, "l_dfx0": 20, "plot_learning_r": 20, "learn_rat": 20, "exp_decai": 20, "101": [20, 26], "w_current": 20, "learn_rate_curr": 20, "fw": 20, "fl": 20, "exp": [20, 21, 22, 23, 24, 25, 26, 30, 31, 32, 41], "ls": [20, 23, 25, 32], "bo": [20, 30, 37], "tensorflow_addon": [20, 26], "tfa": [20, 26], "625": [20, 26, 29], "lr_schedul": [20, 26], "schedul": 20, "exponentialdecai": [20, 26], "decay_step": [20, 26], "decay_r": [20, 26], "sgd_decai": [20, 26], "opt_nam": [20, 26], "tab10": [20, 24, 26], "all_path": [20, 26], "opt": [20, 26], "x_histori": [20, 26], "y_histori": [20, 26], "loss_prev": [20, 26], "max_step": [20, 26], "gradienttap": [20, 26], "grad": [20, 26, 27], "apply_gradi": [20, 26], "expand_dim": [20, 26, 27, 36], "lognorm": [20, 24, 26], "x_init": [20, 26], "y_init": [20, 26], "z_prev": [20, 26], "dz_dx": [20, 26], "dz_dy": [20, 26], "number_of_point": [20, 26], "minima_": [20, 26], "x_point": [20, 26], "y_point": [20, 26], "x_mesh": [20, 26], "y_mesh": [20, 26], "xp": [20, 22, 23, 26], "yp": [20, 22, 23, 26], "plot_optim": [20, 26, 36], "jet": [20, 24, 25, 26], "quiver": [20, 26], "scale_unit": [20, 26], "xy": [20, 25, 26], "angl": [20, 21, 26, 27, 31, 37], "prop": [20, 21, 22, 24, 26, 37, 41], "decim": [20, 26, 29], "all_lr_path": [20, 26], "lr_rang": [20, 26], "005": [20, 26], "nesterov": [20, 26], "compat": [20, 23, 24, 26, 27], "v1": [20, 26, 27], "get_vari": [20, 26], "plot_learning_rate_optim": [20, 26], "lrate": [20, 26], "plot_lr": [20, 26], "04": [20, 22, 24, 25, 26, 30, 37], "compare_optim": [20, 26], "optimizer1": [20, 26], "optimizer2": [20, 26], "walk": 20, "nearbi": [20, 21, 25], "karpathi": 20, "l_i": 20, "variant": [20, 24, 26], "sag": 20, "saga": 20, "i_": 20, "increment": [20, 23, 25], "v_i": [20, 28], "sgdregressor": 20, "squared_loss": 20, "x_b": 20, "y_b": 20, "load_extended_boston": 20, "x_b_train": 20, "x_b_test": 20, "y_b_train": 20, "y_b_test": 20, "412": 20, "243": 20, "131": [20, 27], "899": 20, "004": [20, 21], "716": 20, "54": [20, 24], "704": 20, "535": 20, "582": 20, "37": [20, 21, 23, 27, 29, 30], "062": 20, "828": 20, "058": 20, "525": [20, 39], "203": 20, "2980": 20, "781": 20, "843": 20, "187": [20, 28], "961": 20, "264": [20, 21, 27], "616": 20, "2239": 20, "869": 20, "222": 20, "825": 20, "182": 20, "996": 20, "398": 20, "389": 20, "575": 20, "013": [20, 25], "66": [20, 22, 41], "914": [20, 39], "812": [20, 27], "647": 20, "446": 20, "68": [20, 28], "508": 20, "375": [20, 28], "813": 20, "934563673643297": [], "61": [20, 23, 25, 30], "explicitli": [20, 21, 30], "restrict": 20, "strength": 20, "choleski": [20, 25], "conjug": [20, 28], "cg": 20, "414": [20, 36], "557": [20, 28], "465": 20, "127": 20, "079": [20, 27], "332": 20, "941": 20, "059": 20, "584": 20, "051": [20, 28], "012": [20, 37], "334": 20, "849": 20, "745": 20, "431": [20, 28], "63": [20, 24], "405": 20, "045": [20, 28], "746": 20, "467": 20, "692": 20, "622": 20, "092": 20, "195": 20, "275": 20, "671": 20, "098": 20, "634": 20, "277": 20, "913": 20, "395": 20, "792": 20, "390525958610134": [], "__future__": [20, 27, 32], "print_funct": [20, 27, 32], "plot_ridg": 20, "magnitud": [20, 27], "hline": 20, "unimport": 20, "plot_ridge_n_sampl": 20, "Will": [20, 23, 25, 30], "analyz": [20, 22], "happen": [20, 28, 32, 35, 44], "plot_lasso": 20, "00001": 20, "robin": [20, 24], "slowli": 20, "subgradi": 20, "partial_": 20, "subdifferenti": 20, "rho_i": 20, "z_i": [20, 26], "plot_rho": 20, "rho": [20, 24], "c_fx": 20, "fx": 20, "c_fl2": 20, "c_fl1": 20, "rp": 20, "lp": 20, "opt_f": 20, "opt_r": 20, "opt_l": 20, "diamond": 20, "plot_loss_interpret": 20, "1001": 20, "elastic_net": [20, 35], "elastic_net_contour": 20, "darkorang": [20, 22, 23, 32, 41], "l2_contour": 20, "l1_contour": 20, "navi": [20, 22, 41], "spine": [20, 22, 24], "set_color": [20, 24], "sqrt": [20, 21, 22, 23, 25, 26, 27, 28, 30, 31, 32, 39], "cp": 20, "trade": [20, 21, 22, 24, 25, 37, 38, 44], "maintain": [20, 22, 24, 27], "pick": [20, 23, 24, 27, 31, 37, 40], "huber": 20, "past": [20, 28], "insensit": [20, 22], "xf": 20, "yf": 20, "make_forg": [20, 33], "po": [20, 22, 25], "sgdclassifi": 20, "modified_hub": 20, "textrm": [20, 28], "x_1w_1": 20, "w1": [20, 25], "w0": 20, "plot_logreg": 20, "axvlin": [20, 36, 39], "ymin": [20, 25, 31], "ymax": [20, 25, 31], "lr_clf": 20, "sigmoid2d": 20, "w2": [20, 25], "plot_logistic_fit": 20, "360": 20, "xz": 20, "yz": 20, "plot_wirefram": 20, "bug": [20, 25, 34, 37], "l_": [20, 22, 23], "h": [20, 21, 24, 26, 28], "p_n": 20, "q_n": 20, "p_": [20, 22, 23], "q_": [20, 22, 24], "surpris": 20, "cross_entropi": 20, "yhat": 20, "thereof": [20, 26], "saddlepoint": 20, "liblinear": 20, "newton": 20, "rhapson": 20, "hessian": 20, "x_j": [20, 21, 26, 28, 32, 41], "quasi": 20, "broyden": 20, "fletcher": 20, "goldfarb": 20, "shanno": 20, "lbfg": [20, 26], "tri": [20, 23], "c_log": 20, "breast": 20, "spam_data": 20, "banknot": 20, "authent": 20, "x_c": 20, "y_c": [20, 22], "x_c_train": 20, "x_c_test": 20, "y_c_train": 20, "y_c_test": 20, "far": [20, 28, 32, 36, 41], "awai": [20, 28, 41], "sum_1": 20, "sum_i": [20, 22, 24, 31], "sx": 20, "r_": [20, 22, 23, 24], "s_clf": 20, "plot_svc_fit": 20, "rotationx": 20, "rotationi": 20, "zz": [20, 21, 23], "yy_down": 20, "yy_up": 20, "rescal": [20, 24, 27, 31], "set_axis_off": [20, 23, 32], "dist": [20, 37, 41], "foral": [20, 21], "satifi": 20, "lagrangian": 20, "a_i": [20, 21, 26], "reflect": [20, 22, 37], "pm1": 20, "formul": [20, 21], "a_j": [20, 21], "y_j": [20, 21, 26], "smo": 20, "plot_linear_svm": 20, "grai": [20, 27, 36], "coef": [20, 21, 28, 36], "svm_x": 20, "svm_y": 20, "svm_fig": 20, "svm_ax": 20, "side": [20, 22, 23, 27, 32, 36, 39], "sign": [20, 23], "truli": 20, "meaningless": 20, "contraint": 20, "xi_": 20, "attenu": 20, "hinge_loss": 20, "equat": [20, 22, 24, 30], "prune": [20, 23, 32], "plot_linear_svc_regular": 20, "linearsvr": 20, "dat": 20, "021": [20, 28], "241": 20, "531": 20, "951": 20, "048": [20, 28], "569": 20, "617": 20, "decent": 20, "equival": [20, 24, 25, 28], "modifi": [20, 22, 27, 30], "modified_huber_loss": 20, "xmin": [20, 25], "xmax": [20, 25], "yellowgreen": [20, 23, 32], "log2": [20, 23, 32], "darkorchid": 20, "upper": [20, 23, 24, 25, 26, 31, 32, 37, 44], "synapt": 20, "linear_svm": [20, 21], "cm3": 20, "win": [20, 22, 23], "plot_2d_classif": [20, 24, 26, 33], "amongst": 20, "td": [20, 21, 23, 24, 32], "16px": 20, "rendered_html": [20, 23, 24, 32], "cf": 20, "sq": 20, "mod": [20, 36], "egress": 20, "lassif": 20, "dim": [20, 27, 28, 30, 36], "expans": [21, 24, 25], "phi": [21, 25], "xrightarrow": [21, 22, 24], "w_3": 21, "endpoint": [21, 24, 27], "418": 21, "constantli": 21, "x_poli": [21, 24], "selector": [21, 24], "get_feature_names_out": [21, 28], "set_table_styl": [21, 24], "nbsp": [21, 24], "752759": [21, 24], "566647": 21, "426548": 21, "321088": 21, "241702": 21, "181944": 21, "136960": 21, "103098": 21, "077608": 21, "058420": 21, "704286": [21, 24], "313162": 21, "776880": 21, "482337": 21, "144": 21, "631526": 21, "391": 21, "124988": 21, "1057": 21, "713767": 21, "2860": 21, "360362": 21, "7735": 21, "232021": 21, "20918": 21, "278410": 21, "391964": [21, 24], "937563": 21, "697017": 21, "754150": 21, "225640": 21, "273901": 21, "125005": 21, "093639": 21, "617834": 21, "307312": 21, "591951": 21, "350406": 21, "207423": 21, "122784": 21, "072682": 21, "043024": 21, "025468": 21, "015076": 21, "008924": 21, "005283": 21, "063888": 21, "259634": 21, "791409": 21, "144485": 21, "448187": 21, "77": [21, 31], "288869": 21, "159": 21, "515582": 21, "329": [21, 28], "222321": 21, "679": 21, "478050": 21, "1402": 21, "366700": 21, "line_poli": [21, 24], "643": 21, "297": 21, "69": 21, "096": 21, "076": 21, "014": [21, 32], "feature1": 21, "hstack": [21, 22, 24, 25, 28, 30], "152": 21, "azim": 21, "feature2": 21, "set_zlabel": [21, 25, 37], "1200x600": 21, "linear_svm_3d": 21, "dec": [21, 22], "contourf": [21, 22, 23], "cheapli": 21, "k_": 21, "hilbert": 21, "rkh": 21, "poly_degre": [21, 25], "isinst": [21, 24], "grei": [21, 34], "200j": [21, 40], "mercer": 21, "symmetri": [21, 26], "gram": [21, 28], "ldot": [21, 26], "vdot": [21, 25, 26], "ddot": [21, 26], "lookup": 21, "suppli": [21, 37], "precomput": [21, 25], "geometr": [21, 38], "radian": [21, 37], "pairwis": 21, "linear_kernel": 21, "polynomial_kernel": 21, "rbf_kernel": [21, 41], "plot_lin_kernel": 21, "lin_kernel": [21, 41], "k_1": [21, 22], "k_2": [21, 22], "c_0": 21, "plot_poly_kernel": 21, "coef0": 21, "poly_kernel": [21, 41], "radial": 21, "taylor": 21, "plot_rbf_kernel": 21, "goe": [21, 39], "doubl": 21, "plot_rbf_kernel_valu": 21, "rfb_kernel": 21, "remain": [21, 23, 24, 26, 32, 38, 44], "plot_rbf_data": 21, "violat": [21, 24], "punish": 21, "reveal": [21, 34], "0px": 21, "025": 21, "figures": [21, 23, 25, 32], "finetun": [21, 22, 26, 27, 28], "beforehand": [21, 24, 27, 31], "inspect": [21, 24, 27, 41], "tfidf": 21, "subsequ": [21, 26], "idea": [21, 22, 24, 26], "subgraph": 21, "arbitrari": [21, 22, 27], "perceptron": [21, 26], "alpha_i": 21, "alpha_j": 21, "kernelridg": [21, 25, 41], "plot_kernel_ridg": [21, 25], "a1": [21, 32], "a2": [21, 32], "a3": 21, "kernel_ridg": [21, 25, 41], "dualperceptron": 21, "plot_kernel_ridge_svr": 21, "driven": 22, "convinc": 22, "peer": 22, "leadership": 22, "client": 22, "artifact": [22, 27, 34], "marco": 22, "ribeiro": 22, "favourit": 22, "success": [22, 36, 44], "involv": 22, "endlessli": [22, 27], "reformul": 22, "overli": [22, 33], "credit": 22, "card": 22, "technic": 22, "debt": 22, "bewar": 22, "medic": 22, "wild": 22, "bandit": [22, 31], "pretend": 22, "timeseriessplit": [22, 41], "groupshufflesplit": 22, "patch": [22, 27, 28, 37, 44], "1338": 22, "cmap_data": 22, "cmap_group": 22, "cmap_cv": 22, "coolwarm": 22, "percentiles_class": 22, "ii": [22, 28], "perc": 22, "evenli": [22, 33], "group_prior": 22, "dirichlet": 22, "multinomi": 22, "examin": [22, 39], "unstabl": [22, 23], "expens": [22, 23, 24, 25, 27, 28, 31, 37], "plot_cv_indic": 22, "show_group": 22, "get_n_split": 22, "tt": 22, "set_vis": [22, 24, 25, 27], "logistic_regress": 22, "unbalanc": 22, "conserv": 22, "strata": 22, "unbias": 22, "computation": 22, "duplic": [22, 30], "unsampl": 22, "resampl": 22, "repeatedstratifiedkfold": 22, "rectangl": 22, "n_repeat": [22, 23, 24, 32, 39], "400": [22, 23, 28, 38, 39, 44], "102": [22, 28], "rect": 22, "add_artist": [22, 26], "patient": [22, 31], "peopl": [22, 24, 25], "approv": 22, "read_csv": [22, 30, 32], "fivethirtyeight": 22, "trump": 22, "approval_toplin": 22, "adult": 22, "groupbi": [22, 30], "get_group": 22, "set_index": 22, "modeld": 22, "approve_estim": 22, "get_xlim": 22, "get_ylim": 22, "ffaaaa": 22, "presidenti": 22, "kth": 22, "max_train_s": 22, "guidelin": 22, "popular": [22, 23, 25], "theoret": [22, 23], "sound": 22, "literatur": 22, "5x2": 22, "monei": 22, "incorrect": [22, 23, 24], "tn": 22, "tp": [22, 25], "imbalanc": 22, "fraud": 22, "plot_confusion_matrix": 22, "xtickrot": 22, "fsize": 22, "matpotlib": 22, "clip": [22, 27], "set_size_inch": [22, 25, 44], "invert_yaxi": 22, "y_pred_1": 22, "y_pred_2": 22, "y_pred_3": 22, "plot_measur": 22, "clinic": 22, "trail": 22, "drug": 22, "diagnosi": 22, "seriou": 22, "diseas": 22, "omit": 22, "comparison": [22, 36], "zoo": 22, "en": 22, "wiki": [22, 30], "precision_and_recal": 22, "_c": [22, 23], "w_c": [22, 23], "aka": [22, 26], "fontnam": 22, "courier": 22, "cohen": 22, "kappa": 22, "agreement": 22, "inter": [22, 24], "rater": 22, "guess": [22, 28, 37], "p_0": [22, 32], "p_e": 22, "p_o": 22, "matthew": 22, "mcc": 22, "uncertainti": [22, 23, 25, 37], "predicion": 22, "renam": [22, 24], "ys_name": 22, "manner": [22, 36], "ys_train_nam": 22, "ys_test_nam": 22, "transpar": 22, "svc1": 22, "plot_decision_threshold": 22, "subplot_kw": [22, 23, 24, 32], "tick_right": 22, "treshold": 22, "jag": 22, "xp_train": [22, 23], "xp_test": [22, 23], "yp_train": [22, 23], "yp_test": [22, 23], "svc2": 22, "rf2": 22, "plot_pr_curv": 22, "yp_pred": 22, "achiev": [22, 37], "Of": [22, 41], "svc3": 22, "svc4": 22, "textit": 22, "plot_roc_curv": 22, "histogram": [22, 23, 30, 43], "magenta": 22, "cyan": 22, "xb": 22, "yb": 22, "xb_train": 22, "xb_test": 22, "yb_train": 22, "yb_test": 22, "svc_roc": 22, "probs_roc": 22, "plot_roc_threshold": 22, "constrained_layout": 22, "gs": [22, 36], "add_gridspec": 22, "color_fil": 22, "ps": 22, "dummyclassifi": 22, "dc": [22, 24], "most_frequ": [22, 24, 31], "dc2": 22, "irrespect": 22, "itertool": [22, 29, 37], "cycl": 22, "label_binar": 22, "onevsrestclassifi": 22, "interp": 22, "xi": [22, 23], "yi": [22, 23], "binar": 22, "xi_train": 22, "xi_test": 22, "yi_train": 22, "yi_test": 22, "y_score": 22, "all_fpr": 22, "interpol": [22, 25, 27, 42], "mean_tpr": 22, "zeros_lik": [22, 25], "deeppink": 22, "aqua": 22, "cornflowerblu": [22, 23, 26, 32], "make_classif": [22, 23], "brier_score_loss": 22, "100000": [22, 37], "train_sampl": 22, "2000": [22, 27, 30, 32, 40], "xc_train": [22, 23], "xc_test": [22, 23], "yc_train": [22, 23], "yc_test": [22, 23], "calibrate": 22, "plot_calibration_comparison": 22, "get_prob": 22, "nr_plot": [22, 24], "uncalibr": 22, "y_sort": 22, "nicer": [22, 24], "cal_prob": 22, "prob": [22, 23, 24], "0322": 22, "0795": 22, "calib": 22, "svm_platt": 22, "monoton": [22, 23], "distort": 22, "isotonicregress": 22, "iso": 22, "reweight": [22, 23], "oversampl": 22, "minor": [22, 37], "undersampl": 22, "boost": 22, "plot_decision_funct": 22, "sample_weight": [22, 23], "bone": 22, "plot_class_weight": 22, "clf_weight": 22, "class_weight": [22, 24], "clf_no_weight": 22, "underrepres": 22, "w_n": 22, "auto_exampl": 22, "plot_weighted_sampl": 22, "plot_instance_weight": 22, "sample_weight_last_ten": 22, "sample_weight_const": 22, "metacost": 22, "relabel": 22, "sum_j": 22, "p_j": 22, "adacost": 22, "cost_": 22, "ratio_": 22, "pred_i": 22, "actual_i": 22, "root": [22, 30, 31, 32, 33], "rmse": 22, "underpredict": 22, "ridge_pip": 22, "wrong": [22, 39], "inaccur": 22, "class_1": 22, "class_2": 22, "class_i": 22, "w_x": 22, "compute_bias_vari": [22, 23, 32, 39], "y_all_pr": [22, 23, 32, 39], "train_index": [22, 23, 32, 39], "test_index": [22, 23, 32, 39], "bias_sq": [22, 23, 32, 39], "stabil": 22, "inabl": 22, "harder": [22, 25, 27], "adaboostclassifi": [22, 23], "plot_bias_vari": [22, 23, 32, 39], "bias_scor": [22, 23, 32, 39], "var_scor": [22, 23, 32, 39], "err_scor": [22, 23, 32, 39], "v": [22, 23, 24, 25, 26, 28, 29, 32, 33, 36, 38, 39, 40, 41], "set_param": [22, 23, 32, 39], "plot_train_test": 22, "flowchart": 22, "combinatori": [22, 31], "explos": [22, 31], "plot_grid_search_overview": 22, "risk": [22, 23, 28], "retun": 22, "tradeoff": [22, 23], "rel": [22, 23, 32, 37, 38, 39, 40, 44], "Be": [22, 24], "unrepres": 22, "crowd": 23, "intellig": 23, "ti": 23, "soft": [23, 28, 33], "votingclassifi": 23, "decisiontreeclassifi": [23, 32], "x_lin": 23, "y_lin": 23, "x_grid": [23, 24], "y_grid": 23, "combine_vot": 23, "estimators_": [23, 37, 39], "expert": 23, "uncorrel": 23, "puriti": 23, "gini": [23, 32], "recurs": [23, 24, 32], "greedi": [23, 24, 32], "hunt": [23, 32], "adjac": [23, 28, 32, 37], "purest": 23, "plot_depth": [23, 32], "plot_tre": [23, 32], "tree_imag": [23, 32], "criteria": 23, "x_l": 23, "neq": [23, 24, 32], "log_": [23, 32], "idem": [23, 26, 30], "classification_error": [23, 32], "ent": [23, 32], "scaled_": [23, 32], "c_err": [23, 32], "lightgrai": [23, 32], "fancybox": [23, 32], "shadow": [23, 32], "axhlin": [23, 32, 36], "extrapol": [23, 25, 32], "plot_decision_tree_regress": [23, 32], "regr_1": [23, 32], "regr_2": [23, 32], "y_1": [23, 32], "y_2": [23, 32], "emor": 23, "plot_feature_importances_canc": [23, 32], "shallow": [23, 32, 39], "dt": [23, 32], "max_featur": [23, 24, 38], "extratreesclassifi": 23, "run_forest_run": 23, "plot_tree_partit": 23, "mostli": [23, 25, 27, 28, 30, 32, 36], "unaffect": [23, 25], "oversmooth": 23, "plot_bias_variance_rf": 23, "warm_start": 23, "1024": [23, 31, 36, 38, 39], "nr_tree": 23, "prev_n_estim": 23, "histgradientboostingclassifi": 23, "max_it": [23, 24], "baggingclassifi": 23, "diminish": [23, 38], "min_samples_split": 23, "preprun": 23, "overdo": 23, "oob": 23, "grown": 23, "althought": 23, "pessimist": 23, "oob_error": 23, "oob_score_": 23, "ordereddict": 23, "n_clusters_per_class": 23, "n_inform": 23, "disabl": 23, "trajectori": 23, "ensemble_clf": 23, "oob_scor": 23, "error_r": 23, "min_estim": 23, "max_estim": 23, "clf_err": 23, "hypothes": 23, "calibr": 23, "isoton": 23, "heterogen": 23, "implictli": 23, "downsid": [23, 27, 31], "parallelliz": 23, "focus": [23, 27], "stump": [23, 39], "f_i": 23, "g_i": 23, "varepsilon": 23, "s_": [23, 27], "logit": [23, 26], "shrinkag": [23, 24], "impact": [23, 35, 39], "incorrectli": 23, "gentleboost": 23, "bound": [23, 26], "logitboost": 23, "listedcolormap": [23, 44], "xavierbourretsicott": 23, "io": [23, 27, 37], "adaboost_scratch": 23, "estimator_list": 23, "y_predict_list": 23, "estimator_error_list": 23, "estimator_weight_list": 23, "sample_weight_list": 23, "max_leaf_nod": [23, 32], "y_predict": 23, "estimator_error": 23, "estimator_weight": 23, "invert": [23, 24, 28], "linalg": [23, 25, 28, 30], "plot_decision_boundari": 23, "scatter_weight": 23, "cm_bright": 23, "ff0000": 23, "0000ff": 23, "elif": [23, 24, 25, 26, 37], "rdbu": 23, "make_circl": 23, "xa": 23, "ya": 23, "current_ax": 23, "weight_scal": 23, "plot_adaboost": 23, "s_weight": 23, "eventu": 23, "g_0": 23, "pseudo": 23, "r_i": 23, "approx": 23, "g_m": 23, "make_poli": 23, "rnd": 23, "y_no_nois": 23, "gbrt": 23, "staged_predict": 23, "preds_train": 23, "plot_gradient_boosting_step": 23, "vline": 23, "plot_gradient_boost": 23, "all_ax": 23, "p_i": 23, "xa_train": 23, "xa_test": 23, "ya_train": 23, "ya_test": 23, "gbct": 23, "preds_train_cl": 23, "staged_predict_proba": 23, "current_gb_ax": 23, "plot_gb_decision_boundari": 23, "gbmodel": 23, "plot_gboost": 23, "pseudo_residu": 23, "thread": 23, "spawn": 23, "overhead": 23, "n_iter_no_chang": 23, "quantil": [23, 24], "sketch_ep": 23, "multicor": 23, "chunk": 23, "sped": 23, "ram": 23, "shard": 23, "conda": [23, 32, 34], "smarter": [23, 24, 28], "symmetr": 23, "stacker": 23, "meta": [23, 26, 27], "cascad": 23, "hyper": [23, 33, 37], "bay": 23, "20px": [23, 24, 32], "gradientboostingregress": 23, "gradientboostingclassif": 23, "realiti": 24, "seek": 24, "empir": [24, 25], "overpow": [24, 26, 31], "labelencod": [24, 31], "robustscal": [24, 31], "noisy_iri": 24, "skew": 24, "label_encod": 24, "plot_scal": 24, "set_ticks_posit": 24, "tweak": [24, 34], "ep": [24, 33], "unnecessarili": 24, "decision_valu": 24, "extent": [24, 26, 28], "plot_scaling_effect": 24, "show_test": 24, "clf_unscal": 24, "simplic": [24, 26, 37], "x_train_scal": [24, 31], "x_test_scal": [24, 31], "clf_scale": 24, "subtract": 24, "arbitrarili": [24, 26], "feature_rang": 24, "cosin": [24, 28], "twitter": 24, "cox": 24, "yeo": 24, "johnson": 24, "bc_": 24, "eric": 24, "nicola": 24, "hug": 24, "powertransform": 24, "bc": 24, "304": 24, "x_lognorm": 24, "x_chisq": 24, "chisquar": 24, "chi": 24, "x_weibul": 24, "weibul": 24, "d81b60": 24, "0188ff": 24, "ffc107": 24, "axes_idx": 24, "axes_list": 24, "x_trans_bc": 24, "lmbda_bc": 24, "lambdas_": 24, "ax_origin": 24, "ax_bc": 24, "table_font_s": 24, "heading_properti": 24, "cell_properti": 24, "dfstyle": 24, "10px": 24, "boro": 24, "manhattan": 24, "queen": [24, 28], "brooklyn": 24, "bronx": 24, "salari": 24, "142": 24, "219": [24, 28], "vegan": 24, "columntransform": [24, 31], "ordinalencod": 24, "passthrough": 24, "x_ordin": 24, "boro_ordin": 24, "concat": [24, 28, 30], "boro_bronx": 24, "boro_brooklyn": 24, "boro_manhattan": 24, "boro_queen": 24, "blend": 24, "n_": 24, "iy": 24, "n_i": 24, "prior": [24, 37, 41], "n_y": 24, "enc": 24, "plot_blend": 24, "ny": [24, 26], "nii": 24, "ni": 24, "category_encod": 24, "targetencod": 24, "return_df": 24, "pd_te": 24, "boro_encod": 24, "286050": 24, "289964": 24, "427901": 24, "ordinal_encod": 24, "one_hot_encod": 24, "target_encod": 24, "paradigm": 24, "prepar": 24, "x_encod": 24, "mislead": 24, "improperli": 24, "_ax": 24, "_log": 24, "matplotlib_axes_logg": 24, "setlevel": 24, "NOT": [24, 30, 39], "test_scal": 24, "x_test_scaled_badli": 24, "wrongli": 24, "leak": [24, 31], "optimist": [24, 31, 38], "merg": [24, 30], "featureunion": 24, "numeric_pip": 24, "categorical_pip": 24, "union": 24, "safe": 24, "best_pip": 24, "curs": [24, 33], "gene": 24, "express": [24, 30], "cubic": [24, 25], "demand": 24, "rent": 24, "washington": 24, "temp": 24, "feel_temp": 24, "42713": 24, "x_bike_cat": 24, "y_bike": 24, "x_bike": 24, "random_featur": 24, "bike_nam": 24, "summer": 24, "spring": 24, "misti": 24, "rain": 24, "heavy_rain": 24, "random_1": 24, "random_2": 24, "set_opt": 24, "max_column": 24, "get_yaxi": [24, 25, 27], "infrequ": 24, "variancethreshold": 24, "variances_": 24, "var_sort": 24, "ypo": 24, "mathrm": 24, "cov": [24, 25], "overlin": 24, "hierarchi": 24, "x_bike_sc": 24, "rowvar": 24, "dendrogram": 24, "ward": 24, "no_plot": 24, "ivl": 24, "bike_names_ord": 24, "046": [24, 32], "f_regress": 24, "selectpercentil": 24, "mutual_info_regress": 24, "selectfrommodel": 24, "rfe": 24, "ridgecv": 24, "lassocv": 24, "mlxtend": 24, "sequentialfeatureselector": 24, "permutation_import": 24, "trang": 24, "fs": 24, "ftest": 24, "mutualinform": 24, "forwardselect": 24, "floatingforwardselect": 24, "cv_score": 24, "select_pip": 24, "randomforestcv": 24, "scaled_scor": 24, "score_func": 24, "percentil": 24, "get_support": 24, "discrete_featur": 24, "elimin": [24, 39], "n_features_to_select": 24, "ranking_": 24, "support_": 24, "forward": [24, 27, 28, 37, 44], "k_featur": 24, "k_feature_idx_": 24, "importances_mean": 24, "sorted_idx": 24, "resort": 24, "method1": 24, "f_test": [24, 25], "method2": 24, "imp": [24, 31, 35], "imp2": 24, "mask2": 24, "twinx": [24, 36, 38], "m2": 24, "compare_feature_import": 24, "anova": 24, "mi": 24, "judg": 24, "cardin": 24, "nearmiss": 24, "nearhit": 24, "relieff": 24, "rrelieff": 24, "recomput": [24, 27], "backward": [24, 27], "worst": [24, 28, 36], "stochast": 24, "mutat": 24, "simul": [24, 37, 39], "anneal": [24, 26], "agnost": 24, "variancetreshold": 24, "x_select": 24, "f_classif": 24, "chi2": 24, "mutual_info_class": 24, "selectfpr": 24, "selected_featur": 24, "f_valu": 24, "p_valu": 24, "mi_valu": 24, "rfecv": 24, "rfe_selector": 24, "rf_import": 24, "feature_id": 24, "themselv": [24, 25, 36], "wavi": [24, 37], "lreg": 24, "preg": 24, "partit": 24, "which_bin": 24, "bin_nam": 24, "1f": [24, 39], "df_orig": 24, "orig": [24, 28], "df_nr": 24, "x_combin": 24, "ohedf": 24, "000000": [24, 30], "line_bin": 24, "line_combin": 24, "x_product": 24, "bin_snam": 24, "bindf": 24, "b0": 24, "b1": 24, "b2": 24, "b3": 24, "line_product": 24, "multipli": [24, 25, 26, 27, 28], "submodel": 24, "gender": [24, 28, 31], "pageview": 24, "269": 24, "1522": 24, "235": 24, "get_dummi": [24, 35], "df_f": 24, "gender_f": 24, "_f": [24, 25], "df_m": 24, "gender_m": 24, "_m": 24, "gender_f_m": 24, "gender_m_f": 24, "age_m": 24, "pageviews_m": 24, "time_m": 24, "gender_m_m": 24, "age_f": 24, "pageviews_f": 24, "time_f": 24, "gender_f_f": 24, "mcar": 24, "pure": [24, 27, 32], "missing": 24, "faulti": 24, "sensor": [24, 37, 44], "mnar": 24, "sick": 24, "na": 24, "enable_iterative_imput": 24, "knnimput": 24, "iterativeimput": 24, "softimput": 24, "iterativesvd": 24, "matrixfactor": 24, "ignore_warn": 24, "mline": 24, "missing_iri": 24, "smallest": [24, 44], "favorit": 24, "plot_imput": 24, "imputed_mask": 24, "isnan": 24, "x_imp": 24, "imp_pip": 24, "markerfacecolor": 24, "markeredgecolor": 24, "markeredgewidth": 24, "numpoint": 24, "compare_imput": 24, "3rd": [24, 27], "4th": [24, 27], "mice": 24, "eigenvalu": 24, "lambda_i": 24, "missing_valu": [24, 31], "add_ind": 24, "x_complet": 24, "eigenvector": 24, "shrinkage_valu": 24, "over_sampl": 24, "randomoversampl": 24, "adasyn": 24, "under_sampl": 24, "randomundersampl": 24, "editednearestneighbour": 24, "condensednearestneighbour": 24, "easyensembleclassifi": 24, "balancedbaggingclassifi": 24, "smoteenn": 24, "make_imb_pipelin": 24, "n_samples_1": 24, "n_samples_2": 24, "x_syn": 24, "y_syn": 24, "x_syn_train": 24, "x_syn_test": 24, "y_syn_train": 24, "y_syn_test": 24, "x0min": 24, "x0max": 24, "x1min": 24, "x1max": 24, "sampler": 24, "plot_imbal": 24, "sampler2": 24, "simulate_bag": 24, "x_resampl": 24, "y_resampl": 24, "fit_resampl": 24, "x_resampled_i": 24, "y_resampled_i": 24, "build_evalu": 24, "sampling_strategi": 24, "base_estim": 24, "orig_scor": 24, "setp": 24, "mode": [24, 27], "condens": 24, "doen": 24, "es": 24, "repeatedli": [24, 32], "enn": 24, "balancedbag": 24, "bootstrap": [24, 31, 32, 39], "throw": [24, 27, 29, 36], "tradition": 24, "adaboost": 24, "appropri": 24, "forget": [24, 27, 28], "compare_imbal": 24, "k_neighbor": 24, "fit_sampl": 24, "smote_pip": 24, "unpredict": [24, 32], "mc1": 24, "mammographi": 24, "data_imb": 24, "x_imb": 24, "y_imb": 24, "x_imb_train": 24, "x_imb_test": 24, "y_imb_train": 24, "y_imb_test": 24, "probs_origin": 24, "fpr_org": 24, "tpr_org": 24, "sname": 24, "hsv": 24, "roccol": 24, "roc_imbal": 24, "curvi": 24, "crucial": 24, "encapsul": 24, "proper": [24, 41], "uncertain": 25, "randal": 25, "monro": 25, "circumst": 25, "lifespan": 25, "billion": 25, "detector": [25, 27], "25226": 25, "015": 25, "117m": 25, "9b": 25, "notc": 25, "268": 25, "985": 25, "2023": [20, 25, 26], "760m": 25, "718": 25, "joint": 25, "turn": [25, 27, 28, 37, 44], "crank": 25, "plot_joint_distribut": 25, "covariance_matrix": 25, "plot_intersect": 25, "delta": 25, "yr": [25, 32, 37], "multivariate_norm": 25, "cset": 25, "zdir": 25, "zy": 25, "set_ztick": 25, "interact_joint_distribut": 25, "particular": [25, 37], "fake": [25, 31], "gan": 25, "theorem": 25, "condition": 25, "friend": [25, 28], "golf": 25, "weather": [25, 42], "sunni": 25, "gaussiannb": 25, "mu_c": 25, "sigma_c": 25, "mid": 25, "2_c": 25, "naive_bay": 25, "bernoullinb": 25, "multinomialnb": 25, "acycl": 25, "inverseprob": 25, "mlai2015": 25, "compute_kernel": 25, "exponentiated_quadrat": 25, "x_prime": 25, "lengthscal": 25, "squared_dist": 25, "sigma2": 25, "kernel_arg": 25, "update_invers": 25, "quantiti": [25, 27], "eas": 25, "kinv": 25, "inv": 25, "ey": [25, 27, 28, 30], "determin": [25, 28], "logdetk": 25, "det": 25, "kinvi": 25, "ykinvi": 25, "log_likelihood": 25, "posterior_f": 25, "k_star": 25, "k_starstar": 25, "mu_f": 25, "c_f": 25, "nr_point": 25, "add_mean": 25, "show_covari": 25, "show_stdev": 25, "gp_ax": 25, "ro": 25, "stdev": [25, 37], "var_f": 25, "diag": [25, 27], "std_f": 25, "plot_sin": 25, "x_sin": 25, "y_sin": 25, "x_sin_test": 25, "_1": [25, 32], "_2": [25, 28, 32], "pod": 25, "olympic_marathon_men": 25, "xtx": 25, "xty": 25, "895": 25, "1890": 25, "2020": 25, "130": [25, 39, 41], "poly_gamma": 25, "rbf_gamma": 25, "rbf_alpha": 25, "reg2": 25, "un": 25, "certainti": 25, "slack": 25, "epsilon_i": 25, "alpha_1": 25, "mle": 25, "posteriori": 25, "multivari": 25, "int_w": 25, "dw": 25, "drawn": [25, 26], "interact_prior": 25, "impos": 25, "priori": 25, "boldsymbol": 25, "num_pred_data": 25, "x_pred": 25, "1880": 25, "2030": 25, "plot_function_spac": 25, "phi_pr": 25, "num_sampl": 25, "z_vec": 25, "w_sampl": 25, "f_sampl": 25, "beta": 25, "mean_matrix": 25, "tell": [25, 28, 29, 41], "interact_covari": 25, "ticker": [25, 37], "maxnloc": 25, "plot_process": 25, "ax_d": 25, "ax_": 25, "ax_c": 25, "set_major_loc": 25, "get_data_ratio": 25, "plot_process_noiseless": 25, "plot_covm_nois": 25, "prime": 25, "vert": 25, "ell": 25, "smoothli": 25, "plot_gprocess": 25, "AND": 25, "write": [25, 29, 30], "_j": [25, 26, 28, 41], "ast": 25, "analog": [25, 28], "shuffled_olymp": 25, "perm": 25, "permut": [25, 28, 42], "x_shuffl": 25, "y_shuffl": 25, "plot_gp_olymp": 25, "xt": [25, 36], "plot_gp_olympics_mean": 25, "plot_gp_olympics_stdev": 25, "gpyregress": 25, "kern": 25, "input_dim": [25, 27, 28], "basisfunckernel": 25, "gpregress": 25, "custom_kernel": [25, 41], "ratquad": 25, "matern32": 25, "matern52": 25, "brownian": 25, "periodicexponenti": 25, "mlp": [25, 26], "kerneldict": 25, "deepcopi": 25, "plot_kernel": 25, "gridspec_kw": 25, "width_ratio": 25, "optimize_restart": 25, "num_restart": 25, "get_xaxi": [25, 27], "shade": 25, "region": [25, 26, 27, 36], "restart": [25, 26, 36, 41], "ker": 25, "ard": 25, "max_f_ev": 25, "slice": [25, 27, 37], "fixed_input": 25, "plotting_librari": 25, "canva": 25, "plot_data": 25, "tikhonov": 25, "potenti": 25, "instanci": [25, 42], "dy": [25, 26], "errorbar": 25, "advantag": 25, "versatil": 25, "disadvantag": 25, "exce": 25, "dozen": 25, "prove": 25, "band": 25, "performac": 25, "exploit": [25, 37], "asquisit": 25, "shahriari": 25, "induc": 25, "thompson": 25, "mixtur": [25, 28], "ei": [25, 37], "addon": 26, "nightli": 26, "adamax": 26, "draw_neural_net": 26, "layer_s": 26, "draw_bia": 26, "weight_count": 26, "random_weight": 26, "show_activ": 26, "educ": 26, "scale_ratio": 26, "n_layer": 26, "v_space": 26, "h_space": 26, "greenyellow": 26, "lightcor": 26, "w_count": 26, "b_count": 26, "txtarg": 26, "verticalalign": [26, 37], "horizontalalign": 26, "layer_top": 26, "node_s": 26, "radiu": 26, "nx": 26, "nsx": 26, "nsy": 26, "z_": 26, "o_": 26, "a_": 26, "h_": 26, "layer_size_a": 26, "layer_size_b": 26, "layer_top_a": 26, "layer_top_b": 26, "wl": 26, "diff": 26, "neuro": 26, "inspir": 26, "plu": 26, "tini": 26, "_0": 26, "plot_dense_net": 26, "nr_layer": 26, "nr_node": 26, "mathit": 26, "light": [26, 36, 39], "recurr": 26, "mismatch": 26, "regard": [26, 27], "todo": [26, 28, 38], "draw_upd": 26, "nameerror": [28, 36], "traceback": [28, 36], "timestep": 26, "5d": 26, "broadcast": 26, "along": [26, 30, 31], "redund": 26, "a_1": 26, "a_2": 26, "a_p": 26, "nudg": 26, "anim": [26, 37], "a_o": 26, "h_1": 26, "w_l": 26, "b_": 26, "decompos": [26, 30, 39], "z_o": 26, "2z": 26, "rectifi": 26, "01z": 26, "leaky_relu": 26, "activation_deriv": 26, "sig": 26, "plot_activ": [26, 27], "h_l": 26, "recov": 26, "recoveri": 26, "plot_activations_deriv": 26, "piecewis": 26, "neural_network": 26, "mlpclassifi": 26, "plot_boundari": 26, "solver": [26, 30], "hidden_layer_s": 26, "relu_tim": 26, "relu_acc": 26, "mlp_tanh": 26, "tanh_tim": 26, "tanh_acc": 26, "sec": [26, 31], "exact": 26, "output_funct": 26, "plot_output_activ": 26, "shrink": [26, 27, 33], "zig": 26, "zag": 26, "glorot": 26, "xavier": 26, "fan_in": 26, "fan_out": 26, "frozen": [26, 28], "sgd_cyclic": 26, "cyclicallearningr": 26, "initial_learning_r": 26, "maximal_learning_r": 26, "step_siz": 26, "clr_schedul": 26, "scale_fn": 26, "beta_1": 26, "beta_2": 26, "999": 26, "adadelta": 26, "rmsprop_momentum": 26, "250129": [], "306": [20, 26, 28], "250578": [], "plot_nesterov": 26, "lookahead": 26, "_s": 26, "eta_": 26, "cyclic": 26, "hopefulli": 26, "reset": 26, "ball": 26, "accumul": 26, "steepest": 26, "oscil": [26, 41], "veloc": 26, "qquad": 26, "respond": [26, 27], "g_": 26, "m_": 26, "dwindl": 26, "rmsprop_mom": 26, "gamma_2": 26, "u_": 26, "set_se": 26, "pythonhashse": 26, "seed_valu": 26, "cntk": 26, "theano": 26, "branch": [26, 27, 32], "dense_1": [26, 27], "dense_2": [26, 27], "xf_test": 26, "yf_test": 26, "453607": [], "721562": [], "468465": [], "0988096": [], "0003385": [], "6747018": [], "0004403": [], "017712": [], "2071131": [], "0000004": [], "0008842": [], "401243": [], "8699000477790833": [], "learnabl": [26, 28], "earlystop5": 26, "accident": 26, "make_model": 26, "kerastun": 26, "eindhoven": [27, 31], "technolog": [27, 31], "data_dir": [27, 28], "dogs_smal": 27, "model_dir": 27, "makedir": 27, "gdown": [27, 28], "zipfil": 27, "cats_and_dogs_small_1": 27, "h5": 27, "url": [27, 28, 30, 34], "uc": [27, 28], "1p10qm5jvtsjsw3060jkksbrxdy9hwbko": 27, "lecture9_model": 27, "zip_ref": 27, "extractal": 27, "download_cat": 27, "1xojwqgmrwiwlbbcvnxurbz0oyfqss_v0": 27, "lecture9_data": 27, "image_patch": 27, "pixel_out": 27, "skimag": 27, "tonysyu": 27, "iter_pixel": 27, "intens": 27, "imshow_pair": 27, "image_pair": 27, "fontdict": 27, "imshow_tripl": 27, "padding_for_kernel": 27, "rgb": [27, 36], "image_shap": 27, "odd": 27, "assert": 27, "add_pad": 27, "h_pad": 27, "w_pad": 27, "constant_valu": 27, "remove_pad": 27, "inner_region": 27, "grab": 27, "slice_i": 27, "broken": [27, 37], "window_slic": 27, "r_pad": 27, "c_pad": 27, "exclus": 27, "apply_kernel": 27, "original_imag": 27, "iter_kernel_label": 27, "i_pad": 27, "j_pad": 27, "visualize_kernel": 27, "kernel_label": 27, "label2rgb": 27, "bg_label": 27, "convolution_demo": 27, "ever": [27, 28], "cach": 27, "gen_kernel_label": 27, "image_cach": 27, "image_pad": 27, "overlai": 27, "i_step": 27, "convolution_step": 27, "kernel_overlai": 27, "filtered_prev": 27, "overwrit": [27, 36], "convolution_ful": 27, "image_tripl": 27, "horizontal_edge_kernel": 27, "diagonal_edge_kernel": 27, "edge_detect_kernel": 27, "mnist_data": 27, "x_mnist": 27, "y_mnist": 27, "ptp": 27, "hor": 27, "0x2cca0c2e0": [], "photograph": 27, "imageri": 27, "svhn": [27, 36], "41081": [27, 36], "attr": [27, 36, 37], "plot_imag": [27, 36], "grayscal": [27, 36], "x_sub_color": 27, "rgb2grai": [27, 36], "2990": [27, 36], "5870": [27, 36], "1140": [27, 36], "xsm": 27, "normalize_imag": 27, "demo2": 27, "0x2cca0f680": [], "famili": 27, "gabor": 27, "sobel": 27, "haar": 27, "wavelet": 27, "wave": [27, 31, 33], "ondul": 27, "ndimag": 27, "ndi": 27, "img_as_float": 27, "gabor_kernel": 27, "demogabor": 27, "sigma_x": 27, "sigma_i": 27, "freq": [27, 30], "respons": 27, "convolv": 27, "demogabor2": 27, "132": [27, 28], "133": [27, 28], "image3": 27, "image5": 27, "image13": 27, "image_nam": 27, "plot_filter_bank": 27, "kernel_param": 27, "nfrequenc": 27, "nsigma": 27, "ax_col": 27, "contrast": [27, 37], "fmnist_data": 27, "x_fm": 27, "y_fm": 27, "buildfigurelist": 27, "subfiglist": 27, "imgplot": 27, "image2": 27, "demogabor3": 27, "discov": 27, "1x1xd": 27, "reassembl": 27, "5x5": 27, "2x2": 27, "lenght": 27, "agress": 27, "spread": 27, "invari": [27, 28, 36], "abstract": 27, "preserv": [27, 28, 30], "descreas": 27, "conv2d": 27, "maxpooling2d": 27, "28x28x1": 27, "3x3x64": 27, "320": 27, "halv": [27, 44], "max_pooling2d": 27, "conv2d_1": 27, "18496": 27, "max_pooling2d_1": 27, "conv2d_2": 27, "36928": 27, "744": 27, "576": 27, "650": 27, "globalaveragepool": 27, "globalaveragepooling2d": 27, "caution": 27, "destroi": [27, 28], "sequential_1": [27, 28], "conv2d_3": 27, "max_pooling2d_2": 27, "conv2d_4": 27, "max_pooling2d_3": 27, "conv2d_5": 27, "global_average_pooling2d": 27, "lobalaveragepooling2d": 27, "56": [27, 28], "394": 27, "train_imag": 27, "validation_imag": 27, "validation_label": 27, "pickl": 27, "mnist_histori": 27, "wb": 27, "file_pi": 27, "dump": 27, "load_model": 27, "validation_loss": 27, "validation_acc": 27, "1500x900": 27, "rb": 27, "988800048828125": [], "disk": 27, "realist": 27, "jpeg": 27, "3000": [27, 30], "decod": 27, "resiz": [27, 30], "150x150": 27, "shutil": 27, "kaggl": 27, "uncompress": 27, "original_dataset_dir": 27, "dogs_origin": 27, "train_dir": 27, "validation_dir": 27, "mkdir": 27, "train_cats_dir": 27, "train_dogs_dir": 27, "validation_cats_dir": 27, "validation_dogs_dir": 27, "fname": 27, "jpg": [27, 30], "src": 27, "dst": 27, "copyfil": 27, "fly": [27, 29], "train_gener": 27, "flow_from_directori": 27, "target_s": 27, "class_mod": 27, "train_datagen": 27, "validation_datagen": 27, "validation_gener": 27, "data_batch": 27, "labels_batch": 27, "171": [27, 28], "148": 27, "896": [27, 40], "74": [27, 40], "73856": 27, "147584": 27, "flatten_1": 27, "6272": 27, "3211776": 27, "dense_3": [27, 28], "513": 27, "453": [27, 28], "steps_per_epoch": 27, "validation_step": 27, "cats_and_dogs_small_1_histori": 27, "datagen": 27, "rotation_rang": 27, "width_shift_rang": 27, "height_shift_rang": 27, "shear_rang": 27, "slant": 27, "zoom_rang": 27, "horizontal_flip": 27, "horizont": 27, "fill_mod": 27, "didn": 27, "listdir": [27, 37], "img_path": 27, "load_img": 27, "img_to_arrai": 27, "indefinit": 27, "141": 27, "array_to_img": 27, "fit_gener": 27, "cats_and_dogs_small_2": 27, "cats_and_dogs_small_2_histori": 27, "textur": 27, "incept": 27, "7x7": 27, "conv": 27, "1x3": 27, "3x1": 27, "cheaper": [27, 30], "1x1": 27, "nin": 27, "auxiliari": [27, 28], "bypass": 27, "148x148": 27, "72x72": 27, "34x34": 27, "15x15": 27, "remind": 27, "conv2d_10": 27, "max_pooling2d_8": 27, "conv2d_11": 27, "max_pooling2d_9": 27, "conv2d_12": 27, "max_pooling2d_10": 27, "maxpoolin": 27, "g2d": 27, "conv2d_13": 27, "max_pooling2d_11": 27, "flatten_2": 27, "dense_4": 27, "dense_5": 27, "img_tensor": 27, "layer_output": 27, "activation_model": 27, "86m": [], "first_layer_activ": 27, "sharei": 27, "1528": 27, "img_tensor2": 27, "activations2": 27, "first_layer_activation2": 27, "9m": 27, "images_per_row": 27, "layer_nam": 27, "layer_index": 27, "layer_activ": 27, "tile": 27, "n_col": 27, "display_grid": 27, "channel_imag": 27, "palat": 27, "uint8": 27, "ear": 27, "ascent": 27, "input_img": 27, "filter_index": 27, "loss_v": 27, "grads_v": 27, "input_img_data": 27, "disable_eager_execut": 27, "framework": 27, "op": 27, "deprocess_imag": 27, "generate_pattern": 27, "nth": 27, "get_lay": 27, "loss_valu": 27, "grads_valu": 27, "visualize_filt": 27, "filter_img": 27, "horizontal_start": 27, "horizontal_end": 27, "vertical_start": 27, "vertical_end": 27, "vagu": 27, "imagenet": [26, 27], "include_top": 27, "block3_conv1": 27, "input_1": 27, "block1_conv1": 27, "1792": 27, "block1_conv2": 27, "block1_pool": 27, "block2_conv1": 27, "block2_conv2": 27, "block2_pool": 27, "295168": 27, "block3_conv2": 27, "590080": 27, "block3_conv3": 27, "block3_pool": 27, "block4_conv1": 27, "1180160": 27, "block4_conv2": 27, "2359808": 27, "block4_conv3": 27, "block4_pool": 27, "block5_conv1": 27, "block5_conv2": 27, "block5_conv3": 27, "block5_pool": 27, "714": 27, "vgg": 27, "1st": 27, "patterns1": 27, "patterns2": 27, "patterns3": 27, "patterns4": 27, "feather": 27, "greatest": 27, "clear_sess": 27, "discard": [27, 28], "cam": 27, "preprocess_input": 27, "decode_predict": 27, "10_eleph": 27, "pil": 27, "224x224": 27, "african": 27, "eleph": 27, "african_elephant_output": 27, "386": 27, "last_conv_lay": 27, "pooled_grad": 27, "pooled_grads_valu": 27, "conv_layer_output_valu": 27, "14x14": 27, "output_shap": 27, "saniti": 27, "n02504458": 27, "african_eleph": 27, "90988594": 27, "n01871265": 27, "tusker": 27, "085724816": [], "n02504013": 27, "indian_eleph": 27, "0043471307": [], "opencv": 27, "cv2": 27, "imread": [27, 37], "applycolormap": 27, "colormap_jet": 27, "superimposed_img": 27, "imwrit": 27, "elephant_cam": 27, "upscal": 27, "superimpos": [27, 44], "face": [27, 37], "babi": 27, "trunk": 27, "rgb_im": 27, "cvtcolor": 27, "color_bgr2rgb": 27, "contruct": 27, "conv_bas": 27, "input_2": 27, "somewhat": 27, "unfreez": 27, "extract_featur": 27, "sample_count": 27, "inputs_batch": 27, "features_batch": 27, "train_featur": 27, "validation_featur": 27, "cats_and_dogs_small_3a": 27, "cats_and_dogs_small_3a_histori": 27, "despit": [27, 37], "90500003": 27, "freez": [27, 28], "14714688": 27, "8192": [27, 37], "2097408": 27, "257": [27, 28], "353": [27, 28], "097": 27, "665": 27, "cats_and_dogs_small_3b": 27, "cats_and_dogs_small_3b_histori": 27, "906": 27, "set_train": 27, "424": 27, "635": 27, "unlearn": 27, "cats_and_dogs_small_4": 27, "cats_and_dogs_small_4_histori": 27, "90800005": 27, "smooth_curv": 27, "smoothed_point": 27, "smooth_histori": 27, "9039536851123335": 27, "address": [27, 36], "modular": 27, "fight": 27, "imbd": 28, "databas": [28, 30], "markup": 28, "punctuat": 28, "index_from": 28, "88584": 28, "redford": 28, "amaz": 28, "director": 28, "norman": 28, "father": 28, "came": [28, 41], "scottish": 28, "myself": 28, "documentari": 28, "shot": 28, "spoiler": 28, "messag": 28, "dechif": 28, "switchblad": 28, "romanc": 28, "burst": 28, "mal\u00e9fiqu": 28, "preced": [28, 43], "modern": 28, "nencod": 28, "scot": 28, "storytel": 28, "tradit": 28, "event": [28, 31], "elderli": 28, "ladi": 28, "mother": 28, "retel": 28, "battl": 28, "culloden": 28, "she": 28, "charact": [28, 29], "aliv": 28, "her": 28, "passion": 28, "wit": 28, "sodden": 28, "heath": 28, "mile": 28, "born": 28, "wouldn": 28, "18606": 28, "16082": 28, "2801": 28, "2037": 28, "429": 28, "108": 28, "1491": 28, "15302": 28, "3712": 28, "758": 28, "5763": 28, "449": 28, "9211": 28, "982": 28, "64314": 28, "163": 28, "213": 28, "1236": 28, "1794": 28, "2410": 28, "684": 28, "33926": 28, "7336": 28, "3690": 28, "118": 28, "262": [28, 40], "572": 28, "156": 28, "1444": 28, "583": 28, "479": [28, 43], "countvector": 28, "stem": 28, "stopword": 28, "ter": 28, "eri": 28, "feature_extract": 28, "vect": 28, "toarrai": 28, "boob": 28, "cheesi": 28, "giant": 28, "got": [28, 41], "hair": 28, "hundr": 28, "pin": 28, "ridicul": 28, "safeti": 28, "thin": 28, "logisticregressioncv": 28, "5000": [28, 37], "data_s": 28, "train_text": 28, "test_text": 28, "train_text_vec": 28, "test_text_vec": 28, "8538": 28, "plot_important_featur": 28, "top_n": 28, "myrang": 28, "set_frame_on": 28, "naiv": [28, 33], "meet": 28, "lemmat": 28, "nlp": 28, "noun": 28, "verb": 28, "hash": 28, "collis": 28, "awesom": 28, "creativ": 28, "aw": 28, "eso": 28, "nltk": 28, "spaci": 28, "gensim": 28, "t_i": 28, "tfidftransform": 28, "2m": 28, "emb": 28, "surround": 28, "itself": [28, 34], "occurr": 28, "latent": 28, "context": 28, "pool": 28, "cbow": 28, "corpora": 28, "arithmet": [28, 29, 30], "plural": 28, "vec_": 28, "king": 28, "man": 28, "woman": 28, "countri": 28, "unsolv": 28, "footbal": 28, "fo": 28, "foo": [28, 29, 30], "oot": 28, "otb": 28, "tba": 28, "bal": 28, "b_i": 28, "ij": 28, "doc2vec": [], "semant": [28, 31], "tricki": 32, "rnn": [], "leverag": 43, "competit": [], "sequential_8": [], "embedding_2": [], "160000": [], "321": [], "maxlen": 28, "pad_sequ": 28, "elsewher": 28, "maxpooling1d": 28, "globalmaxpooling1d": 28, "home": [], "max_word": 28, "157": [], "3s": [], "18m": [], "0807": [], "9932": [], "5570": [], "8172": [], "400k": [], "embedding_dim": 28, "embedding_lay": 28, "num_token": [], "embeddings_initi": [], "embedding_matrix": [], "stanford": 28, "edu": [28, 41], "6b": 28, "cmu": 28, "af": 28, "theo": 28, "news20": 28, "tar": 28, "gz": 28, "tarfil": 28, "1zod5p9kreabyg5oh2n5mcc": 28, "bozycskih": 28, "unpack": 29, "newsgroup": [], "my_tar": [], "embeddings_index": 28, "maxsplit": 28, "fromstr": 28, "sep": [28, 30], "400000": 28, "board": [], "textvector": [], "lowercas": [], "max_token": [], "20000": [], "output_sequence_length": [], "val_sampl": [], "news_dir": [], "20_newsgroup": [], "dirnam": [], "comp": [], "graphic": [], "38987": [], "class_index": [], "dirpath": [], "fpath": [], "latin": [], "19997": [], "1337": [], "num_validation_sampl": [], "val_label": [], "text_d": [], "from_tensor_slic": [], "voc": [], "get_vocabulari": [], "100d": [], "embedding_vector": 28, "oov": [], "17999": [], "int64": 30, "embedding_5": [], "2000200": [], "64128": [], "max_pooling1d": [], "conv1d_1": [], "82048": [], "global_max_pooling1d": [], "globa": [], "lmaxpooling1d": [], "16512": [], "2580": [], "165": [], "468": [], "sparse_categorical_crossentropi": [], "9509": [], "1686": [], "0x293648430": [], "nowadai": [], "disclaim": 29, "everyth": [28, 29], "comment": 29, "shell": 29, "dynam": 29, "creation": [29, 30, 32], "redeclar": 29, "boolean": [29, 30], "implicitli": 29, "immut": 29, "mutabl": 29, "pack": 29, "bob": 29, "14159265": 29, "place": [29, 30, 37], "hodor": 29, "indent": 29, "scope": 29, "bracket": [29, 44], "myfunc": 29, "func": 29, "argv": 29, "sum1": 29, "sum2": 29, "ret": 29, "greet": 29, "call_func": 29, "other_nam": 29, "john": [29, 30], "compose_greet_func": 29, "get_messag": 29, "testclass": 29, "inherit": 29, "myvar": 29, "mystr": 29, "static": [29, 44], "staticmethod": 29, "decor": 29, "saystat": 29, "declar": 29, "eleg": 29, "functool": 29, "anonym": 29, "mydata": 29, "cumul": [29, 30], "lazi": 29, "lc": 29, "lg": 29, "newlin": 29, "fahrenheit": 29, "celsiu": 29, "t1": 29, "t2": 29, "t3": 29, "t4": 29, "44444444444444": 29, "77777777777778": 29, "fourier": 30, "pseudorandom": 30, "fundament": 30, "richer": 30, "my_arrai": 30, "ndim": 30, "items": 30, "byte": 30, "placehold": [30, 31], "float64": [30, 37], "sit": 30, "elementwis": 30, "upcast": 30, "unari": 30, "9572624389610684": 30, "06832338227931944": 30, "2641917094515025": 30, "familiar": 30, "floor": 30, "ufunc": 30, "84147098": 30, "90929743": 30, "14112001": 30, "7568025": 30, "95892427": 30, "2794155": 30, "6569866": 30, "98935825": 30, "41211849": 30, "stack": 30, "hsplit": 30, "vsplit": 30, "idenm": 30, "vstack": 30, "stepsiz": 30, "comma": 30, "colon": 30, "tentative_numpy_tutori": 30, "reilli": 30, "routin": 30, "sparse_matrix": 30, "csr_matrix": 30, "coo": 30, "row_indic": 30, "col_indic": 30, "eye_coo": 30, "coo_matrix": 30, "sql": 30, "414214": 30, "732051": 30, "mari": 30, "andr": 30, "cecilia": 30, "3200": 30, "1100": 30, "ohio": 30, "nevada": 30, "2002": 30, "pop": 30, "date_rang": 30, "20130101": 30, "abcd": 30, "2013": 30, "279229": 30, "014442": 30, "206311": 30, "444963": 30, "836939": 30, "328902": 30, "361891": 30, "621461": 30, "647378": 30, "271949": 30, "122788": 30, "726806": 30, "569523": 30, "378494": 30, "881282": 30, "589848": 30, "27922882": 30, "01444176": 30, "20631052": 30, "44496293": 30, "83693931": 30, "32890157": 30, "36189055": 30, "62146103": 30, "64737828": 30, "2719488": 30, "12278808": 30, "72680583": 30, "56952335": 30, "37849357": 30, "88128234": 30, "58984755": 30, "read_tabl": 30, "delimit": 30, "to_csv": 30, "tail": 30, "298506": 30, "991226": 30, "643068": 30, "623288": 30, "623289": 30, "023244": 30, "491169": 30, "833890": 30, "694769": 30, "564663": 30, "302115": 30, "942566": 30, "463304": 30, "853698": 30, "621586": 30, "674133": 30, "067041": 30, "280260": 30, "962539": 30, "354855": 30, "sort_index": 30, "iloc": [30, 37], "20130102": 30, "20130103": 30, "346622": 30, "606353": 30, "880836": 30, "129384": 30, "funct": 30, "406463": 30, "286391": 30, "083522": 30, "034810": 30, "616006": 30, "040805": 30, "959403": 30, "993623": 30, "202516": 30, "039395": 30, "832403": 30, "605941": 30, "df1": 30, "data1": 30, "df2": 30, "data2": 30, "ignore_index": [30, 37], "sentinel": 30, "cut": 30, "value_count": 30, "pydata": 30, "bitbucket": 30, "hroja": 30, "primari": 30, "svg": 30, "png": [30, 37], "bmp": 30, "gif": 30, "ecosystem": 30, "pluss": 30, "customiz": 30, "cumsum": 30, "boxplot": 30, "plasma": [30, 37], "gen_web_traffic_data": 31, "weekli": 31, "week": 31, "rhythm": 31, "ma": 31, "plot_web_traff": 31, "mx": 31, "inch": 31, "autoscal": 31, "mimic": 31, "visit": 31, "tweet": 31, "hashtag": 31, "polyfit": [31, 43], "poly1d": 31, "f2": 31, "f10": 31, "f50": 31, "interactiveshel": 31, "3457": 31, "rankwarn": 31, "exec": 31, "code_obj": 31, "user_global_n": 31, "user_n": 31, "sophist": 31, "play_with_degre": 31, "materi": [31, 34], "thorough": 31, "compris": 31, "inbalanc": 31, "whenev": [31, 37], "trustworthi": 31, "greatli": 31, "40536": 31, "app": 31, "lawyer": 31, "quartil": 31, "lq": 31, "uq": 31, "x1_train": 31, "x_enc": 31, "pref_o_attract": 31, "d_d_age": 31, "race": 31, "arm": 31, "9800000000000001": 31, "jump": 31, "210": 31, "39084256954456": 31, "003623016212739808": 31, "lack": 31, "autosklearn": 31, "autosklearnclassifi": 31, "time_left_for_this_task": 31, "per_run_time_limit": 31, "ml_memory_limit": 31, "obliqu": 32, "rq": [32, 33], "homebrew": 32, "debian": 32, "apt": 32, "_k": 32, "impur": 32, "misclassification_error": 32, "leaf1_distr": 32, "leaf2_distr": 32, "leaf1_siz": 32, "leaf2_siz": 32, "gini_index": 32, "plot_heurist": 32, "top_0": 32, "top_1": 32, "bottom_0": 32, "bottom_1": 32, "p_1": 32, "fontweight": 32, "royalblu": 32, "misclass": 32, "kullback": 32, "leibler": 32, "ex": 32, "log_2": 32, "9183": 32, "0817": 32, "gainratio": 32, "splitinfo": 32, "fragment": 32, "borderaxespad": [32, 36], "0x29c5f2580": 32, "interpet": 32, "export_graphviz": 32, "out_fil": 32, "malign": 32, "benign": 32, "dot_graph": 32, "008": 32, "009": 32, "002": 32, "007": 32, "695": 32, "054": 32, "017": 32, "117": [28, 32], "011": 32, "halfwai": 32, "splitpoint": 32, "r_1": 32, "leq": 32, "r_2": 32, "c_i": 32, "min_": 32, "c_1": 32, "c_2": 32, "xr_test": 32, "ram_pric": 32, "semilog": 32, "mbyte": 32, "histor": 32, "data_train": 32, "data_test": 32, "xl_train": 32, "yl_train": 32, "linear_reg": 32, "x_all": [32, 42], "pred_tre": 32, "pred_lr": 32, "undo": 32, "price_tre": 32, "price_lr": 32, "min_samples_leaf": 32, "xc": 32, "yc": 32, "kl": 32, "div": 32, "scheme": 33, "kd": 33, "plot_knn_classif": 33, "member": 33, "parameter": 33, "shrink_threshold": 33, "nearestcentroid": 33, "nc": 33, "centroids_": 33, "suffer": 33, "est": 33, "nrclass": 33, "plot_knn_regress": 33, "_config": 34, "yml": 34, "_toc": 34, "parent": 34, "push": 34, "ghp": 34, "_build": 34, "hide_input_al": 34, "jupyter_nbextensions_configur": 34, "nbextens": 34, "jupyterlab": 34, "slideshow": 34, "nbconvert": 34, "templat": 34, "slidesexport": 34, "reveal_them": 34, "serv": 34, "notebooknam": 34, "handout": 34, "sidenot": 34, "reader": 34, "preview": 34, "acrobat": 34, "chrome": 34, "theme": 34, "css": 34, "custom_rev": 34, "slides_html": 34, "j2": 34, "el": 34, "getelementsbytagnam": 34, "textcont": 34, "indexof": 34, "return_categorical_ind": 35, "return_attribute_nam": [35, 39, 43, 44], "ballfram": 35, "adequ": 35, "ballframe_clean": 35, "trip": 35, "workaround": 35, "76": 35, "elasticsearch": 35, "071968567300115138": 35, "grid_elastic_net": 35, "reg__l1_ratio": 35, "en_r": 35, "biggest": 35, "lesd": 35, "disastr": 35, "favour": 35, "confirm": [35, 36], "10000000000000001": 35, "strech": 35, "en_res2": 35, "encoded_feat": 35, "non_encoded_feat": 35, "oh": [35, 37], "75230929412401049": 35, "twini": 35, "street": 36, "distractor": 36, "1gb": 36, "99289": 36, "x_random": 36, "y_random": 36, "yt": 36, "plot_comparison": 36, "neither": 36, "run_model": [36, 38], "modelname_list": [36, 38], "sample_size_list": [36, 38], "training_times_list": 36, "prediction_times_list": 36, "train_score_list": [36, 38], "test_score_list": [36, 38], "sample_s": [36, 38], "x_sampl": [36, 38], "y_sampl": [36, 38], "survivor": [36, 38], "start_tim": [36, 38], "kick": [36, 38], "eval": [36, 38], "training_tim": [36, 38], "prediction_tim": 36, "05000000000000001": 36, "476": 36, "eval_m": [36, 38], "x_grai": 36, "squeez": 36, "x_st": 36, "9a3742b104a3": 36, "988": 36, "174": 36, "621": 36, "439222354928997": 36, "5362443526132585": 36, "convers": 36, "greyscal": 36, "plotter": 36, "standiz": 36, "xvals_grei": 36, "xvals_st": 36, "interweav": 36, "xvals_al": 36, "3x": 36, "apart": 36, "pca__n_compon": 36, "pca_search": 36, "regul": 36, "run_optim": 36, "5553": 36, "0001668100537200059": 36, "2459": 36, "742636826811277e": 36, "2456": 36, "broad": 36, "promis": 36, "finer": 36, "liklei": 36, "456150627423057": 36, "0028255571775323562": 36, "6846": 36, "y_new": 36, "x_new_grai": 36, "x_new_st": 36, "x_wrong": 36, "y_correct": 36, "y_wrong": 36, "char": 36, "oftentim": 36, "preval": 36, "leaern": 36, "plot_coef": 36, "x_all_grai": 36, "x_all_st": 36, "c_opt": 36, "clearest": 36, "64e": 36, "sift": 36, "movement": 37, "wall": [37, 44], "equip": [37, 44], "ultrasound": [37, 44], "offic": [37, 44], "obstacl": [37, 44], "robotnav": 37, "1497": [37, 44], "angle_": 37, "trial": [37, 41], "plausibl": 37, "meter": 37, "triangl": 37, "mpatch": [37, 44], "funcanim": 37, "embed_limit": 37, "set_tight_layout": 37, "cx": 37, "cy": 37, "curr_x": 37, "cl": 37, "wall_point": 37, "to_jshtml": 37, "mtick": 37, "imageio": 37, "xgbmodel": 37, "runtimewarn": 37, "curr_best": 37, "cdf": 37, "robotarm": 37, "189": 37, "5456": 37, "hyperparam_obj": 37, "hyperparams_sur": 37, "surrogate_model": 37, "objective_model": 37, "acquisition_funct": 37, "hyperparam_spac": 37, "x_obj": 37, "y_obj": 37, "hyperparam_nam": 37, "highest_ei": 37, "model_nam": 37, "surrogate_model_nam": 37, "time_surrog": 37, "hyperparams_obj": 37, "optimal_hyperparam": 37, "hyperparam_point": 37, "lin": 37, "hyperparam_cartesian": 37, "cartesian": 37, "hyperparam_sampl": 37, "static_hyperparam": 37, "to_dict": 37, "regressor_predict": 37, "surrogate_predict": 37, "x_sur": 37, "expected_improv": 37, "next_sampl": 37, "prevent": 37, "parameters_idx": 37, "idxmax": 37, "opt_param": 37, "force_dtyp": 37, "fucntion": 37, "plot_surrog": 37, "show_confid": 37, "show_plot": 37, "store_plot": 37, "ax_sur": 37, "ax_acq": 37, "z_loss": 37, "z_loss_obj": 37, "z_acq": 37, "first_param": 37, "second_param": 37, "x_plot": [37, 41], "y_plot": 37, "x_plot_obj": 37, "y_plot_obj": 37, "logaritm": 37, "log10": 37, "loss_max": 37, "plot_trisurf": 37, "first_hyperparam": 37, "second_hyperparam": 37, "set_major_formatt": 37, "formatstrformatt": 37, "alter": 37, "savefig": [37, 38, 43, 44], "gif_imag": 37, "_it_": 37, "generate_gif": 37, "png_dir": 37, "file_nam": 37, "startswith": 37, "file_path": 37, "gif_filenam": 37, "mimsav": 37, "min_point": 37, "min_loss": 37, "textstr": 37, "boxstyl": 37, "coord": 37, "transax": 37, "bbox": 37, "metadata": 37, "750827e": 37, "738762e": 37, "595858": 37, "110203e": 37, "959110e": 37, "306997": 37, "479472e": 37, "961225e": 37, "595125": 37, "691330e": 37, "086665e": 37, "678333": 37, "569049e": 37, "095662e": 37, "577841e": 37, "329994e": 37, "546295e": 37, "514968e": 37, "955651e": 37, "850456e": 37, "404216e": 37, "023295e": 37, "796360e": 37, "195248e": 37, "180344": 37, "xgclas_param_templ": 37, "xgcla": 37, "classifier_predict": 37, "xgreg_param_templ": 37, "xgreg": 37, "elas_param_templ": 37, "ela": 37, "587": 37, "801607": 37, "007017": 37, "147878": 37, "083768": 37, "00751077": 37, "05878": 37, "0166366": 37, "017038e": 37, "512821": 37, "0408401": 37, "40x40": 37, "stark": 37, "conbin": 37, "conduct": 37, "appar": 37, "conclus": 37, "situat": 37, "decid": 37, "grasp": 37, "suddenli": 37, "broke": 37, "revisit": 37, "svm_best_param": 37, "reset_index": 37, "inplac": 37, "878016e": 37, "028943": 37, "701254e": 37, "000000e": 37, "000024": 37, "xgclas_best_param": 37, "041246": 37, "040984": 37, "017013": 37, "007480": 37, "017999": 37, "kept_column": 37, "x_broken": 37, "svm_broken": 37, "svm_param_templ": 37, "xgclas_broken": 37, "170125": 37, "427985": 37, "168778": 37, "0544343": 37, "rapidli": 37, "third": 37, "versu": 37, "encourag": 37, "herebi": 37, "y_normal": 37, "gpr": [37, 41], "xgreg_gp": 37, "compare_time_sur": 37, "0151084": 37, "elas_gpr": 37, "645191e": 37, "557558": 37, "consider": 37, "led": 37, "prfr": 37, "blocki": 37, "decept": 37, "lastli": 37, "conclud": 37, "distinct": 37, "devnagari": 38, "devanagari": 38, "40923": 38, "90000": 38, "running_times_list": 38, "kdtree": 38, "surprisingli": 38, "lesad": 38, "beyond": 38, "grid_search_rf": 38, "802065217391": 38, "grid_search_knn": 38, "790869565217": 38, "_estim": 38, "_featur": 38, "simultan": 38, "param_dist": 38, "grid_search_rf2": 38, "intrins": 39, "sh": 39, "fun": 39, "938": 39, "578": 39, "754": 39, "125": 39, "421": 39, "84": 39, "profil": 39, "basex": 39, "fact": 39, "perfectli": [39, 41], "auroc": 39, "validation_curv": 39, "staged_decision_funct": 39, "best_it": 39, "test_lin": 39, "colour": 39, "get_color": 39, "4685": 39, "gbt_clf": 39, "rebound": 39, "0021": 40, "0004": 40, "00002": 40, "ns": 40, "893": 40, "47911033421644406": 40, "6153278890011744": 40, "261": 40, "9723302085577779": 40, "5096196352034442": 40, "snd": 40, "true_i": 41, "expsin": 41, "spatial": 41, "pdist": 41, "cdist": 41, "expsine_kernel": 41, "svr_lin": 41, "y_svr_lin": 41, "svr_poli": 41, "y_svr_poli": 41, "svr_rbf": 41, "y_svr_rbf": 41, "svr2": 41, "y_svr2": 41, "scatterpoint": 41, "obvious": [41, 44], "meant": 41, "closur": 41, "build_kernel": 41, "length_scale_rang": 41, "periodicity_rang": 41, "grid_search_expsin": 41, "getfullargspec": 41, "20000000000000001": 41, "875": 41, "svr_opt1": 41, "svr_opt2": 41, "svr_opt3": 41, "upward": 41, "fanci": 41, "gp_expsin": 41, "y_gpr": 41, "y_std": 41, "svr_kernel": 41, "revert": 41, "toronto": 41, "duvenaud": 41, "cookbook": 41, "k_mix": 41, "kernel_simpl": 41, "ko1": 41, "ko2": 41, "ko3": 41, "134": 41, "kernel_opt": 41, "gpr2": 41, "y_gpr2": 41, "y_std2": 41, "gpr3": 41, "y_gpr3": 41, "y_std3": 41, "gpr_mix": 41, "gpr_opt": 41, "solar": 42, "balloon": 42, "balloon_data": 42, "humbl": 42, "x_train_perm": 42, "y_train_perm": 42, "x_test_perm": 42, "y_test_perm": 42, "gpy": 42, "nonthi": 43, "delet": 43, "get_ax": 43, "polar": 43, "par": 43, "hurt": 43, "valdat": 43, "5856": 43, "0508": 43, "mdoel": 43, "regularli": 44, "busi": 44, "trace": 44, "legend_handl": 44, "hp_rang": 44, "log_3": 44, "2_": 44, "3_": 44, "eg": 44, "4_": 44, "critic": 44, "956": [], "nxv": 28, "vxn": 28, "paragraph": 28, "globalaveragepooling1d": 28, "embedding_4": [], "global_average_pooling1d": 28, "lobalaveragepooling1d": 28, "sequential_13": [], "embedding_11": [], "200000": 28, "global_average_pooling1d_7": [], "english": 28, "urigin": [], "redirect": [], "uuid": [], "bf2a469d": [], "0c15": [], "4e31": [], "a0b4": [], "ea05f143b0ac": [], "347m": [], "4mb": [], "708": 28, "673": 28, "225": 28, "603": 28, "739": 28, "654": 28, "216": 28, "338": 28, "245": 28, "515": 28, "857": 28, "372": 28, "588": 28, "619": 28, "549": 28, "027": 28, "976": 28, "115": 28, "998": 28, "066": 28, "208": 28, "532": 28, "409": 28, "041": 28, "249": 28, "415": 28, "954": 28, "368": 28, "379": 28, "146": 28, "201": 28, "719": 28, "236": 28, "495": 28, "158": 28, "091": 28, "266": 28, "516": 28, "648": 28, "164": 28, "081": 28, "336": 28, "228": 28, "638": 28, "473": 28, "328": 28, "084": 28, "785": 28, "099": 28, "039": 28, "279": 28, "579": 28, "044": 28, "049": 28, "325": 28, "498": 28, "607": 28, "181": 28, "166": 28, "803": 28, "666": 28, "637": 28, "561": 28, "output_dim": 28, "set_weight": 28, "weigth": 28, "cnt": 28, "sentenc": 28, "autoregress": 28, "recept": 28, "dilat": 28, "causal": 28, "conv1d": 28, "h_t": 28, "_t": 28, "unbound": 28, "backpropag": 28, "gate": 28, "lstm": 28, "gru": 28, "seq": 28, "sentiment": 28, "contribut": 28, "presenc": 28, "aganinst": 28, "k_i": 28, "b_k": 28, "q_i": 28, "b_q": 28, "b_v": 28, "negat": 28, "strengten": 28, "sequencet": [], "fron": [], "acknowledg": 28, "vu": 28, "list_physical_devic": [], "6492500305175781": [], "6827500462532043": [], "nornmal": [], "7305000424385071": [], "lessen": [], "7412500381469727": [], "7827500104904175": [], "it_train": [], "8022500276565552": [], "sheer": [], "conv2d_27": [], "batch_normalization_7": [], "batc": [], "hnormal": [], "conv2d_28": [], "9248": [], "batch_normalization_8": [], "max_pooling2d_14": [], "dropout_12": [], "conv2d_29": [], "batch_normalization_9": [], "conv2d_30": [], "batch_normalization_10": [], "bat": [], "chnormal": [], "max_pooling2d_15": [], "dropout_13": [], "conv2d_31": [], "batch_normalization_11": [], "conv2d_32": [], "batch_normalization_12": [], "max_pooling2d_16": [], "dropout_14": [], "flatten_5": [], "2048": [], "262272": [], "batch_normalization_13": [], "dropout_15": [], "1290": [], "552": [], "874": [], "551": [], "722": [], "ipykernel_34025": [], "2702396986": [], "invalid": [], "true_divid": [], "25000": [], "100u": [], "2879": [], "8862": [], "worth": [], "114u": [], "3511": [], "8770": [], "error_scor": [], "0x134b7e0f0": [], "iid": [], "pre_dispatch": [], "refit": [], "pivot_t": [], "param_epoch": [], "param_learning_r": [], "00e": [], "np_util": [], "2246": [], "88u": [], "0950": [], "6901": [], "original_model": [], "smaller_model": [], "original_hist": [], "smaller_model_hist": [], "original_val_loss": [], "smaller_model_val_loss": [], "l2_model_hist": [], "resist": [], "l2_model_val_loss": [], "dpt_model_hist": [], "dpt_model_val_loss": [], "sequential_39": [], "dense_119": [], "pend": 1, "tue": 1, "47": 20, "169040": 20, "169176": 20, "93456367364179": 20, "39052595861006": 20, "unfix": 25, "height_ratio": 25, "458370": [], "458531": [], "309857": [], "363654": [], "483482": [], "329407": [], "divers": 26, "09": 26, "551679": 26, "551955": 26, "549837": 26, "889092": 26, "963181": 26, "0090286": 26, "0000066": 26, "8731063": 26, "0004194": 26, "0108315": 26, "0000054": 26, "1064771": 26, "0000001": 26, "0001248": 26, "0000002": 26, "8842999935150146": 26, "9887999892234802": 27, "sequential_2": 27, "conv2d_6": 27, "max_pooling2d_4": 27, "conv2d_7": 27, "max_pooling2d_5": 27, "conv2d_8": 27, "max_pooling2d_6": 27, "conv2d_9": 27, "max_pooling2d_7": 27, "410m": 27, "08572481": 27, "0043471297": 27, "816": 28}, "objects": {}, "objtypes": {}, "objnames": {}, "titleterms": {"an": [0, 2], "open": 0, "machin": [0, 3, 19, 20, 22, 31, 40], "learn": [0, 3, 6, 14, 15, 19, 20, 22, 23, 24, 25, 26, 27, 28, 31, 32, 36, 38], "cours": [0, 2], "sourc": 0, "practic": [0, 19, 20, 21, 23, 24, 25, 26, 27], "orient": 0, "materi": [0, 1, 2], "theori": 0, "welcom": 1, "lectur": [1, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28], "get": [1, 7, 40], "your": [1, 3], "hand": 1, "dirti": 1, "have": 1, "some": [1, 30, 31], "feedback": 1, "lab": [1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18], "background": 1, "tutori": [1, 6, 11, 14, 15], "recommend": 1, "resourc": 1, "prerequisit": 2, "python": [2, 3, 29, 30, 31], "os": 2, "specif": 2, "note": [2, 32, 36, 37], "appl": 2, "silicon": 2, "m1": 2, "m2": 2, "virtual": 2, "environ": 2, "us": [2, 6, 9, 11, 18, 22, 27, 31], "conda": 2, "virtualenv": 2, "instal": [2, 18, 32], "tensorflow": [2, 14], "github": 2, "requir": 2, "packag": 2, "run": [2, 14, 37], "notebook": 2, "altern": 2, "googl": [2, 27], "colab": 2, "1": [3, 4, 5, 7, 8, 9, 10, 12, 13, 16, 17, 18, 19, 37], "overview": [3, 20, 23, 24, 26, 27, 28, 32], "why": [3, 19, 24, 26, 31], "numpi": [3, 30, 31], "scipi": [3, 30, 31], "matplotlib": [3, 30, 31], "scikit": [3, 6, 20, 24, 25, 31, 32], "algorithm": [3, 19, 22, 23, 31, 32], "data": [3, 7, 10, 11, 12, 13, 15, 16, 18, 19, 24, 25, 27, 29, 30, 31, 36, 37, 40, 44], "import": [3, 9, 10, 23, 24, 31], "build": [3, 10, 11, 14, 15, 19, 26, 31], "model": [3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 19, 20, 22, 24, 25, 26, 27, 28, 31, 32, 35, 36, 37, 40, 43], "train": [3, 13, 14, 15, 22, 26, 27, 28, 31, 35], "test": [3, 10, 13, 14, 22, 24, 25, 31], "look": 3, "panda": [3, 30], "fit": [3, 7, 14, 31, 40], "make": [3, 20, 25, 31], "predict": [3, 6, 12, 14, 15, 20, 22, 25, 26, 28, 31, 43], "evalu": [3, 6, 13, 14, 19, 22, 23, 26, 28, 31, 42], "introspect": 3, "1a": 4, "linear": [4, 5, 7, 10, 20, 21, 35, 36, 43], "regress": [4, 15, 19, 20, 21, 22, 23, 25, 32, 33, 35, 37, 43], "quick": [4, 5, 36, 43], "visual": [4, 7, 10, 12, 22, 27, 35, 37, 40, 43], "exercis": [4, 5, 7, 8, 9, 10, 12, 13, 16, 17, 18], "benchmark": [4, 5, 10, 36, 43], "2": [4, 5, 6, 7, 8, 9, 10, 12, 13, 16, 17, 18, 20, 26, 28, 37], "3": [4, 5, 7, 8, 9, 10, 12, 13, 15, 16, 17, 18, 21, 26, 27, 28, 37], "regular": [4, 5, 14, 15, 16, 17, 20, 26, 36, 43], "coeffici": [4, 35, 43], "part": [], "solut": [5, 20], "1b": 5, "classif": [5, 6, 15, 17, 19, 20, 21, 22, 23, 28, 32, 33, 37], "A": [5, 9, 10, 16, 41], "interpret": [5, 16, 20, 25, 27, 36, 37], "misclassif": [5, 16, 36], "4": [5, 8, 9, 10, 11, 12, 13, 16, 17, 18, 22], "paramet": [5, 11, 32, 33], "select": [6, 8, 9, 15, 19, 20, 22, 24, 26, 30, 31], "procedur": [6, 22], "holdout": 6, "cross": [6, 20, 22, 31], "valid": [6, 22, 31, 39], "custom": [6, 34], "cv": 6, "split": [6, 13, 14, 22], "shuffl": [6, 22], "group": [6, 22], "metric": [6, 8, 14, 22, 26], "binari": [6, 15, 22], "probabilist": [6, 22, 25], "uncertainti": [6, 12], "multi": [6, 15, 22, 44], "class": [6, 15, 22, 27, 29, 37], "precis": [6, 22], "recal": [6, 22], "roc": [6, 22], "curv": [6, 14, 22, 36, 38, 39], "hyperparamet": [6, 7, 8, 14, 22, 26, 31, 35, 37, 38, 40], "tune": [6, 10, 14, 15, 21, 22, 24, 26, 27, 31, 35, 38, 40, 41, 44], "grid": [6, 11, 31], "search": [6, 11, 31], "nest": [6, 22, 31], "parallel": 6, "random": [6, 9, 23, 24, 31, 37], "2a": 7, "kernel": [7, 12, 21, 25, 40, 41], "svm": [7, 10, 20, 21, 37], "rbf": [7, 21, 40], "space": [7, 25, 40], "support": [20, 40], "vector": [20, 28, 40], "2b": 8, "dark": 8, "matter": 8, "preprocess": [8, 10, 11, 13, 14, 15, 24, 26, 28], "optim": [8, 13, 14, 19, 20, 22, 25, 26, 37, 44], "threshold": [8, 22, 24], "calibr": [8, 9, 22], "5": [8, 9, 10, 12, 13, 16, 18, 23], "cost": [8, 22], "function": [8, 13, 20, 22, 23, 25, 26, 29, 30, 37], "ensembl": [9, 18, 23, 24, 39], "tree": [9, 23, 32], "detect": 9, "forest": [9, 23], "other": [9, 18, 20, 21, 22, 23, 26], "measur": 9, "featur": [9, 10, 19, 21, 23, 24, 27, 31, 32, 43], "confus": [9, 22], "matrix": [9, 24], "6": [9, 10, 13, 14, 16, 18, 24, 37], "second": 9, "level": [9, 30], "7": [9, 15, 25], "8": [9, 18, 26], "gradient": [9, 20, 23, 26, 39], "boost": [9, 23, 37, 39], "exploratori": [10, 35], "analysi": [10, 17, 23, 29, 33, 35, 39, 44], "pipelin": [10, 11, 24, 31], "first": 10, "5b": 10, "discuss": 37, "engin": [11, 19, 24], "step": [11, 16, 24, 42], "featureunion": 11, "columntransform": 11, "bayesian": [12, 25, 37, 42], "reduc": [12, 20], "mauna": 12, "loa": 12, "neural": [13, 16, 17, 19, 25, 26, 27, 28], "network": [13, 14, 15, 17, 19, 25, 26, 27, 28], "load": [13, 37], "creat": 13, "deep": [13, 14, 15], "net": [13, 16, 20, 26, 27], "exampl": [14, 15, 19, 21, 23, 24, 25, 26, 27, 30, 31, 32], "reshap": [14, 26], "rescal": 14, "label": [14, 19], "format": 14, "sequenti": [14, 24], "The": [14, 21, 22, 44], "input": [14, 19], "layer": [14, 26, 27, 28], "activ": [14, 26, 27], "summari": [14, 19, 20, 21, 22, 23, 24, 26, 28], "choos": [14, 22, 26], "loss": [14, 20, 23, 26, 37], "repeat": [14, 22], "track": 14, "progress": 14, "check": 14, "earli": [14, 26], "stop": [14, 26], "weight": [14, 22, 25, 26], "decai": [14, 26], "dropout": [14, 26], "batch": [14, 26], "normal": [14, 24, 26], "combin": [14, 24, 41], "multipl": [14, 24, 26], "further": [14, 15, 16, 30], "read": [14, 15, 30], "text": [15, 17, 28], "topic": [15, 17], "prepar": 15, "word": [15, 17, 28], "embed": [15, 17, 28], "kera": [15, 27], "7a": 16, "convolut": [16, 27, 28], "simpl": [16, 28, 30, 41], "vgg": 16, "like": 16, "augment": [16, 27], "option": 16, "take": [16, 27], "7b": 17, "sentiment": 17, "automl": 18, "gama": 18, "standard": [18, 24, 28], "case": 18, "NO": 18, "sub": 18, "automat": [18, 24], "covertyp": 18, "imag": [18, 27], "recognit": [18, 38], "tool": 18, "introduct": 19, "what": 19, "induct": 19, "bia": [19, 22, 23, 39], "vs": [19, 20, 22, 26, 37], "statist": [19, 24], "type": [19, 29], "supervis": [19, 24], "flower": 19, "represent": [19, 21, 28, 36], "unsupervis": [19, 24], "cluster": 19, "dimension": [19, 25], "reduct": 19, "reinforc": 19, "overfit": [19, 20, 22, 23, 32], "underfit": [19, 22], "onli": 19, "gener": [19, 20, 25, 27, 34], "count": [19, 28], "better": 19, "transform": [19, 24, 28, 31], "end": 19, "digit": 19, "curs": 19, "consequ": 19, "more": [19, 26, 31, 41], "can": 19, "beat": 19, "clever": 19, "system": [19, 22], "notat": 20, "definit": 20, "basic": [20, 26, 29, 30], "oper": [20, 22, 26, 30], "distribut": [20, 25, 43], "probabl": [20, 22, 25], "aka": 20, "ordinari": 20, "least": 20, "squar": [20, 22], "solv": 20, "descent": [20, 26], "stochast": [20, 25, 26], "sgd": [20, 26], "In": [20, 23, 24, 32], "ridg": [20, 21], "wai": [20, 27], "lasso": 20, "absolut": [20, 24], "shrinkag": 20, "coordin": 20, "l1": 20, "l2": 20, "elast": 20, "logist": 20, "entropi": [20, 23], "method": [20, 21], "solver": 20, "lagrang": 20, "multipli": 20, "geometr": 20, "knn": [20, 24, 33], "soft": [20, 24], "margin": 20, "effect": [20, 22, 23, 25, 26, 27], "perceptron": 20, "multiclass": 20, "one": [20, 28], "rest": 20, "all": 20, "map": [21, 27], "how": [21, 25, 30], "expens": 21, "thi": 21, "trick": 21, "which": 21, "exist": 21, "polynomi": [21, 24, 25, 31], "gaussian": [21, 25, 37, 41, 42], "theorem": 21, "design": 22, "real": [22, 24, 27], "world": [22, 24, 27, 29], "perform": [22, 37], "estim": [22, 26], "techniqu": [22, 23, 24], "k": [22, 33], "fold": 22, "stratifi": 22, "leav": 22, "One": [22, 24], "out": [22, 23], "bootstrap": [22, 23], "time": [22, 37], "seri": [22, 30], "prequenti": 22, "matric": [22, 30], "accuraci": 22, "f1": 22, "score": 22, "decis": [22, 23, 32], "receiv": 22, "characterist": 22, "auroc": 22, "auprc": 22, "brier": 22, "platt": 22, "scale": [22, 24, 28, 31], "isoton": 22, "sensit": 22, "deal": 22, "imbal": 22, "instanc": 22, "r": 22, "error": [22, 23], "varianc": [22, 23, 39], "decomposit": [22, 24], "comput": [22, 25, 30], "understand": [22, 25], "under": [22, 23, 32], "recap": [23, 25, 26, 32, 33], "impur": 23, "base": [23, 24], "bag": [23, 28], "aggreg": 23, "tip": 23, "strength": [23, 32, 33], "weak": [23, 32, 33], "adapt": [23, 26], "adaboost": 23, "variant": [23, 31], "action": 23, "gradientboost": 23, "extrem": 23, "xgboost": [23, 37], "lightgbm": 23, "catboost": 23, "stack": 23, "do": 24, "we": 24, "need": 24, "min": 24, "max": [24, 27], "robust": 24, "maximum": 24, "scaler": 24, "power": 24, "categor": [24, 25], "encod": [24, 26, 28, 31], "ordin": 24, "hot": [24, 28], "dummi": 24, "target": 24, "appli": [24, 31], "set": 24, "distort": 24, "leakag": [24, 31], "onc": 24, "bike": 24, "share": 24, "covari": [24, 25], "univari": 24, "f": 24, "mutual": 24, "inform": [24, 26], "relief": 24, "iter": [24, 30, 37], "wrap": 24, "permut": 24, "comparison": [24, 37], "bin": 24, "interact": [24, 34], "miss": [24, 31], "valu": [24, 31, 32], "imput": [24, 31], "mean": 24, "factor": 24, "singular": 24, "svd": 24, "fancyimput": 24, "handl": [24, 32], "imbalanc": 24, "undersampl": [24, 27], "oversampl": 24, "synthet": 24, "minor": 24, "smote": 24, "resampl": 24, "imblearn": 24, "bay": 25, "rule": 25, "explod": 25, "sun": 25, "covid": 25, "naiv": 25, "On": [25, 32], "numer": 25, "process": [25, 37, 41, 42], "olymp": 25, "marathon": 25, "prior": 25, "p": 25, "w": 25, "sampl": [25, 37], "from": [25, 28, 37], "higher": 25, "noisi": 25, "posterior": 25, "mathbf": 25, "y": 25, "x": 25, "condit": 25, "densiti": 25, "x_": 25, "gpy": 25, "differ": [25, 37, 40], "conclus": 25, "see": 25, "figur": 25, "surrog": [25, 37], "acquisit": 25, "architectur": 26, "mini": 26, "forward": 26, "pass": 26, "tensor": 26, "element": 26, "wise": 26, "backward": 26, "backpropag": 26, "hidden": 26, "relu": 26, "tanh": 26, "output": 26, "initi": [26, 37], "transfer": [26, 27], "rate": 26, "schedul": 26, "momentum": 26, "adam": 26, "moment": 26, "zoo": 26, "memor": 26, "capac": 26, "bottleneck": 26, "9": 27, "demonstr": 27, "streetview": [27, 36], "filter": 27, "bank": 27, "convnet": 27, "border": 27, "zero": 27, "pad": 27, "stride": 27, "pool": 27, "cnn": 27, "vgg16": 27, "inceptionv3": 27, "resnet50": 27, "spatial": 27, "hierarchi": 27, "pre": [27, 28], "fast": 27, "extract": 27, "without": 27, "fine": 27, "awai": 27, "10": [28, 37], "scratch": 28, "word2vec": 28, "properti": 28, "fasttext": 28, "global": 28, "glove": 28, "document": [], "paragraph": [], "1d": 28, "conv1d": [], "pretrain": [], "hello": 29, "complex": [29, 32, 41], "string": 29, "For": 29, "loop": 29, "If": 29, "statement": 29, "scientif": 30, "ndarrai": 30, "univers": 30, "shape": 30, "manipul": 30, "index": 30, "slice": 30, "copi": 30, "view": 30, "shoot": 30, "yourself": 30, "foot": 30, "spars": 30, "datafram": 30, "wrangl": 30, "low": 30, "usag": 30, "advanc": 30, "plot": [30, 37], "librari": 30, "link": 30, "web": 31, "traffic": 31, "line": 31, "avoid": 31, "speed": 31, "date": 31, "autom": 31, "heurist": 32, "mani": 32, "control": 32, "nearest": 33, "neighbor": 33, "shrunken": 33, "centroid": 33, "scalabl": 33, "product": 34, "onlin": 34, "book": 34, "slide": 34, "static": 34, "final": 36, "robot": [37, 44], "navig": [37, 44], "helper": 37, "implement": 37, "60": 37, "point": 37, "xg": 37, "elasticnet": 37, "30": 37, "q1": 37, "warm": 37, "start": 37, "20": 37, "best": 37, "configur": 37, "randomli": 37, "remov": 37, "column": 37, "dataset": 37, "re": 37, "state": 37, "subsequ": 37, "q2": 37, "guassian": 37, "xgbregressor": 37, "gif": 37, "minimum": 37, "over": 37, "object": 37, "runtim": 37, "compar": 37, "gaussianprocessregressor": 37, "probrandomforestregressor": 37, "rfr": 37, "gp": 37, "q3": 37, "nepales": 38, "charact": 38, "randomforest": 38, "size": 39, "try": 40, "extrapol": [41, 42], "wave": 41, "updat": 42, "pollut": 43, "depend": 43, "fidel": 44, "self": [28, 44], "landscap": 44, "doc2vec": 28, "sequenc": 28, "seq2seq": 28, "recurr": 28, "rnn": 28, "attent": 28, "posit": 28}, "envversion": {"sphinx.domains.c": 2, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 6, "sphinx.domains.index": 1, "sphinx.domains.javascript": 2, "sphinx.domains.math": 2, "sphinx.domains.python": 3, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "sphinx.ext.intersphinx": 1, "sphinx": 56}})
\ No newline at end of file
diff --git a/studies/S9 Multi-fidelity optimization.html b/studies/S9 Multi-fidelity optimization.html
index 7ecf9dba8..c28837911 100644
--- a/studies/S9 Multi-fidelity optimization.html	
+++ b/studies/S9 Multi-fidelity optimization.html	
@@ -203,6 +203,7 @@
 
 
 
+<li class="toctree-l1"><a class="reference internal" href="../labs/Lab%202%20-%20Tutorial.html">Lab 2 Tutorial: Model Selection in scikit-learn</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../labs/Lab%204%20-%20Tutorial.html">Lab 4 Tutorial: Data engineering pipelines</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../labs/Lab%206%20-%20Tutorial.html">Lab 6 Tutorial: Deep Learning with TensorFlow</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../labs/Lab%207%20-%20Tutorial.html">Lab 7 Tutorial: Deep Learning for text</a></li>

	cars_per_hour	temperature_at_2m	wind_speed	temperature_diff_2m_25m	wind_direction	hour_of_day	target
42	7.64300	8.5	4.3	-0.2	322.0	13	3.22287
20	7.75061	8.2	4.5	0.2	307.0	14	3.15274
255	8.12415	5.2	2.8	0.3	209.0	8	4.19570
488	7.64108	6.7	2.3	-0.4	247.0	10	3.98155
94	8.31630	6.3	1.2	1.3	265.0	17	4.14155