Lightning train #27

otavioon · 2024-05-13T21:25:32Z

This PR adds a LightningTrainer operator, used to train Pytorch Lightning models.

Howver, GPU still not working inside jupyter environment.

Below a small train script, supposing original.npy and envelope.npy is a 4-D tensor with shape (N, C, H, W), where N is the number of samples, C is the number of channels (C=1), HxW. The model used is the U-Net from Minerva repository. It is trained to perform a regression (from original, as input and envelope as label).

from minerva.models.nets.unet import UNet
from dasf.datasets import Dataset, DatasetArray
from dasf.pipeline import Pipeline
from dasf.pipeline.executors import DaskPipelineExecutor
import lightning as L
from dasf.ml.dl import LightningTrainer


class LabeledDataset(Dataset):
    def __init__(self, original_path, label_path, chunks=(1, -1, -1)):
        self.original = DatasetArray(
            name="input", root=original_path, chunks=chunks
        )
        self.label = DatasetArray(name="label", root=label_path, chunks=chunks)

    def load(self):
        self.original.load()
        self.label.load()
        return self

    def _lazy_load_cpu(self):
        return self.load()

    def _load_cpu(self):
        return self.load()

    def _lazy_load_gpu(self):
        return self.load()

    def _load_gpu(self):
        return self.load()

    def __len__(self):
        return len(self.original)

    def __getitem__(self, idx):
        return self.original[idx], self.label[idx]


def main():
    original_path = "/workspaces/dasf/data/original.npy"
    label_path = "/workspaces/dasf/data/envelope.npy"

    model = UNet()
    dataset = LabeledDataset(original_path, label_path)
    trainer = LightningTrainer(model=model, use_gpu=True, unsqueeze_dim=0)

    executor = DaskPipelineExecutor(
        local=False, use_gpu=False, address="172.17.0.5", port=8786
    )
    pipeline = Pipeline(
        name="pipeline",
        executor=executor,
        verbose=True,
    )

    pipeline.add(trainer.fit, train_data=dataset)

    pipeline.run()


if __name__ == "__main__":
    main()
``

Signed-off-by: Otavio Napoli <[email protected]>

otavioon added 4 commits May 13, 2024 20:32

Added lightning training operator

2fb4b4a

Signed-off-by: Otavio Napoli <[email protected]>

Added fit documentation

970a0d4

Signed-off-by: Otavio Napoli <[email protected]>

Added a tutorial for running lightning train

3f0fbe4

Added Tutorial 7, lightning Train

0bb1346

otavioon had a problem deploying to continuous_test May 13, 2024 21:25 — with GitHub Actions Failure

SerodioJ merged commit 441e9d3 into main May 14, 2024
2 of 4 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Lightning train #27

Lightning train #27

otavioon commented May 13, 2024

Lightning train #27

Lightning train #27

Conversation

otavioon commented May 13, 2024