KFold_Train.py

import torch
from sklearn.metrics import accuracy_score, confusion_matrix, cohen_kappa_score, precision_score, recall_score, f1_score
import numpy as np
import os
from LabelSmoothing import LabelSmoothing
from fNIRSNet import fNIRSNet
from dataloader import UFFT_subject_data, MA_subject_data, KFold_train_test_set, Dataset


# Select dataset through task_id
task = ['UFFT', 'MA']
task_id = 0
print(task[task_id])

# Set dataset path
UFFT_data_path = 'UFFT_data'
MA_data_path = 'MA_fNIRS_data'

if task_id == 0:
    # UFFT
    num_class = 3  # number of classes; RHT, LHT, and FT
    EPOCH = 120  # number of training epoch
    all_sub = 30  # number of subjects
    batch_size = 64  # batch size
    milestones = [60, 90]  # learning rate decay at specified epoch
    data_path = UFFT_data_path
    # generate the index of test set
    data_index = np.arange(75)
    test_index = [np.arange(15), np.arange(15, 30), np.arange(30, 45), np.arange(45, 60), np.arange(60, 75)]
elif task_id == 1:
    # MA
    num_class = 2  # number of classes; MA and BL
    EPOCH = 120
    all_sub = 29  # number of subjects
    batch_size = 64
    milestones = [60, 90]
    data_path = MA_data_path
    data_index = np.arange(60)
    test_index = [np.arange(12), np.arange(12, 24), np.arange(24, 36), np.arange(36, 48), np.arange(48, 60)]


root_path = os.path.join('save', task[task_id], 'KFold')
while (os.path.exists(root_path) is True):
    print('path is exist')
os.makedirs(root_path)


for n_sub in range(1, all_sub + 1):
    if task_id == 0:
        sub_data, label = UFFT_subject_data(data_path, subject=n_sub)
    elif task_id == 1:
        sub_data, label = MA_subject_data(path=data_path, sub=n_sub)

    n_runs = 0
    for n_fold in range(5):
        n_runs += 1
        print('======================================\n', n_runs)
        path = os.path.join(root_path, str(n_sub), str(n_runs))
        while (os.path.exists(path) is True):
            print('sub path is exist')
        os.makedirs(path)

        # training and test sets
        X_train, y_train, X_test, y_test = KFold_train_test_set(sub_data, label, data_index, test_index, n_fold)

        # load dataset
        train_set = Dataset(X_train, y_train, transform=True)
        test_set = Dataset(X_test, y_test, transform=True)
        train_loader = torch.utils.data.DataLoader(train_set, batch_size=batch_size, shuffle=True)
        test_loader = torch.utils.data.DataLoader(test_set, batch_size=X_test.shape[0], shuffle=False)

        # use GPU or CPU
        device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

        # fNIRSNet
        if task_id == 0:
            net = fNIRSNet(num_class=num_class, DHRConv_width=40, DWConv_height=40, num_DHRConv=4, num_DWConv=8).to(device)
        elif task_id == 1:
            net = fNIRSNet(num_class=num_class, DHRConv_width=30, DWConv_height=72, num_DHRConv=4, num_DWConv=8).to(device)

        criterion = LabelSmoothing(0.1)
        optimizer = torch.optim.AdamW(net.parameters(), lr=1e-3)
        lrStep = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones=milestones, gamma=0.1, last_epoch=-1)

        # save results
        metrics = open(path + '/metrics.txt', 'w')
        # -------------------------------------------------------------------------------------------------------------------- #
        # model training
        for epoch in range(EPOCH):
            net.train()
            train_running_acc = 0
            total = 0
            loss_steps = []
            for i, data in enumerate(train_loader):
                inputs, labels = data
                inputs = inputs.to(device)
                labels = labels.to(device)
                outputs = net(inputs)

                loss = criterion(outputs, labels.long())
                optimizer.zero_grad()
                loss.backward()
                optimizer.step()

                loss_steps.append(loss.item())
                total += labels.shape[0]
                pred = outputs.argmax(dim=1, keepdim=True)
                train_running_acc += pred.eq(labels.view_as(pred)).sum().item()

            train_running_loss = float(np.mean(loss_steps))
            train_running_acc = 100 * train_running_acc / total
            print('[%d, %d, %d] Train loss: %0.5f' % (n_sub, n_runs, epoch, train_running_loss))
            print('[%d, %d, %d] Train acc: %0.3f%%' % (n_sub, n_runs, epoch, train_running_acc))

            # -------------------------------------------------------------------------------------------------------------------- #
            # model evaluation
            net.eval()
            test_running_acc = 0
            total = 0
            loss_steps = []
            with torch.no_grad():
                for data in test_loader:
                    inputs, labels = data
                    inputs = inputs.to(device)
                    labels = labels.to(device)
                    outputs = net(inputs)
                    loss = criterion(outputs, labels.long())

                    loss_steps.append(loss.item())
                    total += labels.shape[0]
                    pred = outputs.argmax(dim=1, keepdim=True)
                    test_running_acc += pred.eq(labels.view_as(pred)).sum().item()

                test_running_acc = 100 * test_running_acc / total
                test_running_loss = float(np.mean(loss_steps))
                print('     [%d, %d, %d] Test loss: %0.5f' % (n_sub, n_runs, epoch, test_running_loss))
                print('     [%d, %d, %d] Test acc: %0.3f%%' % (n_sub, n_runs, epoch, test_running_acc))

                y_label = labels.cpu()
                y_pred = pred.cpu()
                acc = accuracy_score(y_label, y_pred)
                if task_id == 0:
                    # macro mode for UFFT
                    precision = precision_score(y_label, y_pred, average='macro')
                    recall = recall_score(y_label, y_pred, average='macro')
                    f1 = f1_score(y_label, y_pred, average='macro')
                elif task_id == 1:
                    precision = precision_score(y_label, y_pred)
                    recall = recall_score(y_label, y_pred)
                    f1 = f1_score(y_label, y_pred)
                kappa_value = cohen_kappa_score(y_label, y_pred)
                confusion = confusion_matrix(y_label, y_pred)
                metrics.write("acc=%.4f, pre=%.4f, rec=%.4f, f1=%.4f, kap=%.4f" % (acc*100, precision*100, recall*100, f1, kappa_value))
                metrics.write('\n')
                metrics.flush()

            # save model weight
            torch.save(net.state_dict(), os.path.join(path, 'model.pt'))

            lrStep.step()