get_saliency.py

"""
Generate saliency map for images 
This is for generating the saliency maps on the hold-out images
"""
 
import torch
import torch.nn as nn
from torch.autograd import Variable
import torchvision
from torchvision import datasets, models, transforms
from torch.utils.data import DataLoader
import re  
from torch.utils.data.dataset import Dataset
import argparse
import os
import numpy as np
import random
import cv2
from tqdm import tqdm
from smooth_grad import SmoothGrad 

parser = argparse.ArgumentParser()


parser.add_argument('--dataset', type=str, default='imagenet', help='dataset name')
parser.add_argument('--model_path', type=str, default='./', )
parser.add_argument('--model', type=str, default='resnet50', help='model name')
parser.add_argument("--img_folder", required=True, type=str, help='folder to the image files for generating saliency maps') 
parser.add_argument("--GPU", type=str, default='0') 
parser.add_argument("--output_folder", type=str, default="held_out_saliency")

"for smoothgrad"
parser.add_argument('--image', type=str, required=False)
parser.add_argument('--sigma', type=float, default=0.10)
parser.add_argument('--n_samples', type=int, default=50)
parser.add_argument('--cuda', action='store_true', default=True)
parser.add_argument('--guided', action='store_true', default=False)

args = parser.parse_args()

CUDA = torch.cuda.is_available()

os.environ["CUDA_VISIBLE_DEVICES"] = args.GPU


seed = 1
np.random.seed(seed)
random.seed(seed) 
torch.manual_seed(seed)
 

if(args.dataset== 'imagenet'):
    # Load the model
    if(args.model == "resnet50"):
        model = models.resnet50(pretrained=True).cuda() 
    elif(args.model == "densenet"):
        model = models.densenet121(pretrained=True).cuda() 
    elif(args.model == "vggnet"):
        model = models.vgg16_bn(pretrained=True).cuda()
    elif(args.model == "squeezenet"):
        model = models.squeezenet1_0(pretrained=True).cuda() 
    elif(args.model == "resnet152"):
        model = models.resnet152(pretrained=True).cuda()

elif(args.dataset == 'celeb'):
    model = models.resnet18(pretrained=True)
    num_features = model.fc.in_features
    model.fc = nn.Linear(num_features, 307) # multi-class classification (num_of_class == 307)
    model.load_state_dict(torch.load(args.model_path)) 
    model.cuda()

elif(args.dataset == 'place'):
    # th architecture to use
    arch = 'resnet50'

    # load the pre-trained weights
    model_file = '%s_places365.pth.tar' % arch
    if not os.access(model_file, os.W_OK):
        weight_url = 'http://places2.csail.mit.edu/models_places365/' + model_file
        os.system('wget ' + weight_url)

    model = models.__dict__[arch](num_classes=365)
    checkpoint = torch.load(model_file, map_location=lambda storage, loc: storage)
    state_dict = {str.replace(k,'module.',''): v for k,v in checkpoint['state_dict'].items()}
    model.load_state_dict(state_dict)
    model.cuda()

elif(args.dataset == 'imagenette'):
    # Load the model
    # setting up model
    model = models.resnet18(pretrained=True)
    num_features = model.fc.in_features
    model.fc = nn.Linear(num_features, 10) # multi-class classification (num_of_class == 307)
    model.load_state_dict(torch.load(args.model_path)) 
    model = model.cuda()
    model.eval()


model.eval()

 
# Load the datasets
files = []
for r, d, f in os.walk(args.img_folder):
    for file in f: 
        files.append(os.path.join(r, file))
print("total inputs: ",len(files))


# Setup the SmoothGrad
smooth_grad = SmoothGrad(model=model, cuda=args.cuda, sigma=args.sigma,
                         n_samples=args.n_samples, guided=args.guided)


save_folder = args.output_folder
if(not os.path.exists(save_folder)):
    os.mkdir(save_folder) 

if(args.dataset != 'vggface'):
    transform = transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485, 0.456, 0.406],
                             std=[0.229, 0.224, 0.225])
    ])
else:
    transform = transforms.Compose([ 
            transforms.ToTensor(),
            transforms.Normalize([0.489, 0.409, 0.372], [1, 1, 1]),
        ])

for i in range(len(files)):
    smooth_grad.load_image(filename=files[i], transform=transform)
    prob, idx = smooth_grad.forward()
    smooth_grad.generate(filename= save_folder + "/" + files[i].replace(args.img_folder,'').replace('.jpg','').replace('.png',''), idx=idx[0])  # "0" means only calculate the saliency for the top label