microsoft · adamjstewart · Mar 22, 2024 · Feb 17, 2024 · Feb 17, 2024 · Feb 17, 2024
diff --git a/docs/api/datamodules.rst b/docs/api/datamodules.rst
@@ -26,6 +26,11 @@ NAIP
 
 .. autoclass:: NAIPChesapeakeDataModule
 
+Sentinel
+^^^^^^^^
+
+.. autoclass:: Sentinel2CDLDataModule
+
 Non-geospatial DataModules
 --------------------------
 

diff --git a/tests/conf/sentinel2cdl.yaml b/tests/conf/sentinel2cdl.yaml
@@ -0,0 +1,18 @@
+model:
+  class_path: SemanticSegmentationTask
+  init_args:
+    loss: "ce"
+    model: "unet"
+    backbone: "resnet18"
+    in_channels: 13
+    num_classes: 134
+    num_filters: 1
+    ignore_index: 0
+data:
+  class_path: Sentinel2CDLDataModule
+  init_args:
+    batch_size: 2
+    patch_size: 16
+  dict_kwargs:
+    cdl_paths: "tests/data/cdl"
+    sentinel2_paths: "tests/data/sentinel2"
diff --git a/tests/data/cdl/2020_30m_cdls.zip b/tests/data/cdl/2020_30m_cdls.zip
diff --git a/tests/data/cdl/2020_30m_cdls/2020_30m_cdls.tif b/tests/data/cdl/2020_30m_cdls/2020_30m_cdls.tif
diff --git a/tests/data/cdl/2020_30m_cdls/2020_30m_cdls.tif.ovr b/tests/data/cdl/2020_30m_cdls/2020_30m_cdls.tif.ovr
diff --git a/tests/data/cdl/2021_30m_cdls.zip b/tests/data/cdl/2021_30m_cdls.zip
diff --git a/tests/data/cdl/2021_30m_cdls/2021_30m_cdls.tif b/tests/data/cdl/2021_30m_cdls/2021_30m_cdls.tif
diff --git a/tests/data/cdl/2021_30m_cdls/2021_30m_cdls.tif.ovr b/tests/data/cdl/2021_30m_cdls/2021_30m_cdls.tif.ovr
diff --git a/tests/data/cdl/2022_30m_cdls.zip b/tests/data/cdl/2022_30m_cdls.zip
diff --git a/tests/data/cdl/2022_30m_cdls/2022_30m_cdls.tif b/tests/data/cdl/2022_30m_cdls/2022_30m_cdls.tif
diff --git a/tests/data/cdl/2022_30m_cdls/2022_30m_cdls.tif.ovr b/tests/data/cdl/2022_30m_cdls/2022_30m_cdls.tif.ovr
diff --git a/tests/data/cdl/2023_30m_cdls.zip b/tests/data/cdl/2023_30m_cdls.zip
diff --git a/tests/data/cdl/2023_30m_cdls/2023_30m_cdls.tif b/tests/data/cdl/2023_30m_cdls/2023_30m_cdls.tif
diff --git a/tests/data/cdl/2023_30m_cdls/2023_30m_cdls.tif.ovr b/tests/data/cdl/2023_30m_cdls/2023_30m_cdls.tif.ovr
diff --git a/tests/data/cdl/data.py b/tests/data/cdl/data.py
@@ -10,8 +10,9 @@
 
 import numpy as np
 import rasterio
+from rasterio import Affine
 
-SIZE = 32
+SIZE = 128
 
 np.random.seed(0)
 random.seed(0)
@@ -22,8 +23,8 @@ def create_file(path: str, dtype: str, num_channels: int) -> None:
     profile["driver"] = "GTiff"
     profile["dtype"] = dtype
     profile["count"] = num_channels
-    profile["crs"] = "epsg:4326"
-    profile["transform"] = rasterio.transform.from_bounds(0, 0, 1, 1, 1, 1)
+    profile["crs"] = "epsg:32616"
+    profile["transform"] = Affine(30, 0.0, 399960.0, 0.0, -30, 4500000.0)
     profile["height"] = SIZE
     profile["width"] = SIZE
     profile["compress"] = "lzw"
@@ -49,7 +50,7 @@ def create_file(path: str, dtype: str, num_channels: int) -> None:
         src.write_colormap(1, cmap)
 
 
-directories = ["2020_30m_cdls", "2021_30m_cdls"]
+directories = ["2023_30m_cdls", "2022_30m_cdls"]
 raster_extensions = [".tif", ".tif.ovr"]
 
 
@@ -77,5 +78,3 @@ def create_file(path: str, dtype: str, num_channels: int) -> None:
         with open(filename, "rb") as f:
             md5 = hashlib.md5(f.read()).hexdigest()
             print(f"{filename}: {md5}")
-
-        shutil.rmtree(dir)
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B01.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B01.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B02.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B02.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B03.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B03.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B04.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B04.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B05.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B05.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B06.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B06.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B07.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B07.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B08.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B08.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B09.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B09.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B10.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B10.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B11.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B11.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B12.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B12.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B8A.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_B8A.jp2
diff --git a/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_TCI.jp2 b/...0.SAFE/GRANULE/L1C_T16TFM_A035544_20220412T163959/IMG_DATA/T16TFM_20220412T162841_TCI.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_AOT_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_AOT_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B02_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B02_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B03_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B03_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B04_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B04_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B08_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_B08_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_TCI_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_TCI_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_WVP_10m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R10m/T26EMU_20220414T110751_WVP_10m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_AOT_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_AOT_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B01_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B01_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B02_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B02_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B03_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B03_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B04_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B04_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B05_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B05_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B06_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B06_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B07_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B07_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B11_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B11_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B12_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B12_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B8A_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_B8A_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_SCL_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_SCL_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_TCI_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_TCI_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_WVP_20m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R20m/T26EMU_20220414T110751_WVP_20m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_AOT_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_AOT_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B01_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B01_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B02_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B02_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B03_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B03_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B04_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B04_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B05_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B05_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B06_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B06_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B07_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B07_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B09_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B09_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B11_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B11_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B12_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B12_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B8A_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_B8A_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_SCL_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_SCL_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_TCI_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_TCI_60m.jp2
diff --git a/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_WVP_60m.jp2 b/...ANULE/L2A_T26EMU_A035569_20220414T110747/IMG_DATA/R60m/T26EMU_20220414T110751_WVP_60m.jp2
diff --git a/tests/data/sentinel2/data.py b/tests/data/sentinel2/data.py
@@ -11,7 +11,7 @@
 from rasterio import Affine
 from rasterio.crs import CRS
 
-SIZE = 36
+SIZE = 128
 
 np.random.seed(0)
 

diff --git a/tests/datasets/test_cdl.py b/tests/datasets/test_cdl.py
@@ -34,8 +34,8 @@ def dataset(self, monkeypatch: MonkeyPatch, tmp_path: Path) -> CDL:
         monkeypatch.setattr(torchgeo.datasets.cdl, "download_url", download_url)
 
         md5s = {
-            2021: "e929beb9c8e59fa1d7b7f82e64edaae1",
-            2020: "e95c2d40ce0c261ed6ee0bd00b49e4b6",
+            2023: "3fbd3eecf92b8ce1ae35060ada463c6d",
+            2022: "826c6fd639d9cdd94a44302fbc5b76c3",
         }
         monkeypatch.setattr(CDL, "md5s", md5s)
         url = os.path.join("tests", "data", "cdl", "{}_30m_cdls.zip")
@@ -48,7 +48,7 @@ def dataset(self, monkeypatch: MonkeyPatch, tmp_path: Path) -> CDL:
             transforms=transforms,
             download=True,
             checksum=True,
-            years=[2020, 2021],
+            years=[2023, 2022],
         )
 
     def test_getitem(self, dataset: CDL) -> None:
@@ -60,7 +60,7 @@ def test_getitem(self, dataset: CDL) -> None:
     def test_classes(self) -> None:
         root = os.path.join("tests", "data", "cdl")
         classes = list(CDL.cmap.keys())[:5]
-        ds = CDL(root, years=[2021], classes=classes)
+        ds = CDL(root, years=[2023], classes=classes)
         sample = ds[ds.bounds]
         mask = sample["mask"]
         assert mask.max() < len(classes)
@@ -75,19 +75,19 @@ def test_or(self, dataset: CDL) -> None:
 
     def test_full_year(self, dataset: CDL) -> None:
         bbox = dataset.bounds
-        time = datetime(2021, 6, 1).timestamp()
+        time = datetime(2023, 6, 1).timestamp()
         query = BoundingBox(bbox.minx, bbox.maxx, bbox.miny, bbox.maxy, time, time)
         next(dataset.index.intersection(tuple(query)))
 
     def test_already_extracted(self, dataset: CDL) -> None:
-        CDL(dataset.paths, years=[2020, 2021])
+        CDL(dataset.paths, years=[2023, 2022])
 
     def test_already_downloaded(self, tmp_path: Path) -> None:
         pathname = os.path.join("tests", "data", "cdl", "*_30m_cdls.zip")
         root = str(tmp_path)
         for zipfile in glob.iglob(pathname):
             shutil.copy(zipfile, root)
-        CDL(root, years=[2020, 2021])
+        CDL(root, years=[2023, 2022])
 
     def test_invalid_year(self, tmp_path: Path) -> None:
         with pytest.raises(

diff --git a/tests/trainers/test_segmentation.py b/tests/trainers/test_segmentation.py
@@ -72,6 +72,7 @@ class TestSemanticSegmentationTask:
             "sen12ms_s1",
             "sen12ms_s2_all",
             "sen12ms_s2_reduced",
+            "sentinel2cdl",
             "spacenet1",
             "ssl4eo_l_benchmark_cdl",
             "ssl4eo_l_benchmark_nlcd",

diff --git a/torchgeo/datamodules/__init__.py b/torchgeo/datamodules/__init__.py
@@ -28,6 +28,7 @@
 from .resisc45 import RESISC45DataModule
 from .seco import SeasonalContrastS2DataModule
 from .sen12ms import SEN12MSDataModule
+from .sentinel2cdl import Sentinel2CDLDataModule
 from .skippd import SKIPPDDataModule
 from .so2sat import So2SatDataModule
 from .spacenet import SpaceNet1DataModule
@@ -43,6 +44,7 @@
 
 __all__ = (
     # GeoDataset
+    "Sentinel2CDLDataModule",
     "ChesapeakeCVPRDataModule",
     "L7IrishDataModule",
     "L8BiomeDataModule",

diff --git a/torchgeo/datamodules/sentinel2cdl.py b/torchgeo/datamodules/sentinel2cdl.py
@@ -0,0 +1,110 @@
+# Copyright (c) Microsoft Corporation. All rights reserved.
+# Licensed under the MIT License.
+
+"""CDLSentinel2 datamodule."""
+
+from typing import Any, Optional, Union
+
+import kornia.augmentation as K
+import torch
+from kornia.constants import DataKey, Resample
+
+from ..datasets import CDL, Sentinel2, random_grid_cell_assignment
+from ..samplers import GridGeoSampler, RandomBatchGeoSampler
+from ..samplers.utils import _to_tuple
+from ..transforms import AugmentationSequential
+from .geo import GeoDataModule
+
+
+class Sentinel2CDLDataModule(GeoDataModule):
+    """LightningDataModule implementation for the CDL dataset.
+
+    .. versionadded:: 0.6
+    """
+
+    def __init__(
+        self,
+        batch_size: int = 64,
+        patch_size: Union[int, tuple[int, int]] = 16,
+        length: Optional[int] = None,
+        num_workers: int = 0,
+        **kwargs: Any,
+    ) -> None:
+        """Initialize a new Sentinel2CDLDataModule instance.
+
+        Args:
+            batch_size: Size of each mini-batch.
+            patch_size: Size of each patch, either ``size`` or ``(height, width)``.
+            length: Length of each training epoch.
+            num_workers: Number of workers for parallel data loading.
+            **kwargs: Additional keyword arguments passed to
+                :class:`~torchgeo.datasets.CDL` (prefix keys with ``cdl_``) and
+                :class:`~torchgeo.datasets.Sentinel2`
+                (prefix keys with ``sentinel2_``).
+        """
+        # Define prefix for Cropland Data Layer (CDL) and Sentinel-2 arguments
+        cdl_signature = "cdl_"
+        sentinel2_signature = "sentinel2_"
+        self.cdl_kwargs = {}
+        self.sentinel2_kwargs = {}
+
+        for key, val in kwargs.items():
+            # Check if the current key starts with the CDL prefix
+            if key.startswith(cdl_signature):
+                # If so, extract the key-value pair to the CDL dictionary
+                self.cdl_kwargs[key[len(cdl_signature) :]] = val
+            # Check if the current key starts with the Sentinel-2 prefix
+            elif key.startswith(sentinel2_signature):
+                # If so, extract the key-value pair to the Sentinel-2 dictionary
+                self.sentinel2_kwargs[key[len(sentinel2_signature) :]] = val
+
+        super().__init__(
+            CDL, batch_size, patch_size, length, num_workers, **self.cdl_kwargs
+        )
+
+        self.train_aug = AugmentationSequential(
+            K.Normalize(mean=self.mean, std=self.std),
+            K.RandomResizedCrop(_to_tuple(self.patch_size), scale=(0.6, 1.0)),
+            K.RandomVerticalFlip(p=0.5),
+            K.RandomHorizontalFlip(p=0.5),
+            data_keys=["image", "mask"],
+            extra_args={
+                DataKey.MASK: {"resample": Resample.NEAREST, "align_corners": None}
+            },
+        )
+
+        self.aug = AugmentationSequential(
+            K.Normalize(mean=self.mean, std=self.std),
+            K.CenterCrop(self.patch_size),
+            data_keys=["image", "mask"],
+        )
+
+    def setup(self, stage: str) -> None:
+        """Set up datasets and samplers.
+
+        Args:
+            stage: Either 'fit', 'validate', 'test', or 'predict'.
+        """
+        self.sentinel2 = Sentinel2(**self.sentinel2_kwargs)
+        self.cdl = CDL(**self.cdl_kwargs)
+        self.dataset = self.sentinel2 & self.cdl
+
+        generator = torch.Generator().manual_seed(0)
+
+        (self.train_dataset, self.val_dataset, self.test_dataset) = (
+            random_grid_cell_assignment(
+                self.dataset, [0.7, 0.10, 0.20], grid_size=8, generator=generator
+            )
+        )
+        if stage in ["fit"]:
+            self.train_batch_sampler = RandomBatchGeoSampler(
+                self.train_dataset, self.patch_size, self.batch_size, self.length
+            )
+        if stage in ["fit", "validate"]:
+            self.val_sampler = GridGeoSampler(
+                self.val_dataset, self.patch_size, self.patch_size
+            )
+        if stage in ["test"]:
+            self.test_sampler = GridGeoSampler(
+                self.test_dataset, self.patch_size, self.patch_size
+            )