geometric-intelligence · levtelyatnikov · Nov 26, 2024 · Nov 25, 2024 · Nov 26, 2024 · Nov 26, 2024
diff --git a/configs/transforms/dataset_defaults/REDDIT-BINARY.yaml b/configs/transforms/dataset_defaults/REDDIT-BINARY.yaml
@@ -1,3 +1,3 @@
 defaults:
-  - data_manipulations: equal_gaus_features
+  - data_manipulations@equal_gaus_features: equal_gaus_features
   - liftings@_here_: ${get_required_lifting:graph,${model}}
diff --git a/topobenchmarkx/data/datasets/us_county_demos_dataset.py b/topobenchmarkx/data/datasets/us_county_demos_dataset.py
@@ -141,13 +141,16 @@ def download(self) -> None:
             dataset_name=self.name,
             file_format=self.file_format,
         )
-        # Extract zip file
+
+        # Step 2: extract zip file
         folder = self.raw_dir
         filename = f"{self.name}.{self.file_format}"
         path = osp.join(folder, filename)
         extract_zip(path, folder)
         # Delete zip file
         os.unlink(path)
+
+        # Step 3: organize files
         # Move files from osp.join(folder, name_download) to folder
         for file in os.listdir(osp.join(folder, self.name)):
             shutil.move(osp.join(folder, self.name, file), folder)
@@ -161,12 +164,17 @@ def process(self) -> None:
         processing transformations if specified, and saves the processed data
         to the appropriate location.
         """
+        # Step 1: extract the data
         data = read_us_county_demos(
             self.raw_dir, self.year, self.task_variable
         )
         data_list = [data]
+
+        # Step 2: collate the graphs
         self.data, self.slices = self.collate(data_list)
         self._data_list = None  # Reset cache.
+
+        # Step 3: save processed data
         fs.torch_save(
             (self._data.to_dict(), self.slices, {}, self._data.__class__),
             self.processed_paths[0],

diff --git a/tutorials/homophily_tutorial.ipynb b/tutorials/homophily_tutorial.ipynb
@@ -9,7 +9,7 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "/tmp/ipykernel_97245/3190777372.py:20: UserWarning: \n",
+      "/tmp/ipykernel_1117779/40423503.py:21: UserWarning: \n",
       "The version_base parameter is not specified.\n",
       "Please specify a compatability version level, or None.\n",
       "Will assume defaults for version 1.1\n",
@@ -90,7 +90,7 @@
     }
    ],
    "source": [
-    "cfg = hydra.compose(config_name=\"run.yaml\", overrides=[\"model=hypergraph/unignn2\",\"dataset=hypergraph/coauthorship_cora\",\"transforms=data_manipulations/group_homophily\" ], return_hydra_config=True)\n",
+    "cfg = hydra.compose(config_name=\"run.yaml\", overrides=[\"model=hypergraph/unignn2\", \"dataset=hypergraph/coauthorship_cora\"], return_hydra_config=True)\n",
     "loader = hydra.utils.instantiate(cfg.dataset.loader)\n",
     "\n",
     "dataset, dataset_dir = loader.load()\n",