-
Notifications
You must be signed in to change notification settings - Fork 0
/
load_and_test.py
91 lines (81 loc) · 3.57 KB
/
load_and_test.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
import random
import numpy as np
from keras import Model
from keras.applications.vgg16 import VGG16
from keras.applications.vgg19 import VGG19
from keras.applications.xception import Xception
from tensorflow.keras.preprocessing import image_dataset_from_directory
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Model
from sklearn.model_selection import train_test_split
from tensorflow.keras.optimizers import Adam
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array
import os
os.environ["TF_GPU_ALLOCATOR"]="cuda_malloc_async"
os.environ["TF_CPP_VMODULE"]="gpu_process_state=10,gpu_cudamallocasync_allocator=10"
def load_training_dataset(dataset_location='./dataset/',
return_format='numpy',
image_size=(100, 100),
batch_size=32,
shuffle=True):
'''
Charge et retourne un dataset à partir d’un dossier contenant
des images où chaque classe est dans un sous-dossier.
Le dataset est peut être renvoyé comme deux tableaux NumPy, sous
la forme d’un couple (features, label) ; ou comme un Dataset
TensorFlow (déjà découpé en batch).
# Arguments
dataset_location: chemin vers le dossier contenant les images
réparties dans des sous-dossiers représentants les
classes.
return_format: soit `numpy` (le retour sera un couple de
tableaux NumPy (features, label)), soit `tf` (le
retour sera un Dataset TensorFlow).
image_size: la taille dans laquelle les images seront
redimensionnées après avoir été chargée du disque.
batch_size: la taille d’un batch, cette valeur n’est utilisée
que si `return_format` est égale à `tf`.
shuffle: indique s’il faut mélanger les données. Si défini à
`False` les données seront renvoyées toujours dans le
même ordre.
# Retourne
Un couple de tableaux NumPy (features, label) si
`return_format` vaut `numpy`.
Un Dataset TensorFlow si `return_format` vaut `tf`.
'''
ds = image_dataset_from_directory(
dataset_location,
labels='inferred',
label_mode='categorical',
batch_size=batch_size,
shuffle=shuffle if return_format == 'tf' else False,
image_size=image_size,
color_mode='rgb',
interpolation='bilinear'
)
if return_format == 'tf':
return ds
elif return_format == 'numpy':
X = np.concatenate([images.numpy() for images, labels in ds])
y = np.concatenate([labels.numpy() for images, labels in ds])
if shuffle:
idx = list(range(len(X)))
random.shuffle(idx)
X = X[idx]
y = y[idx]
return (X, y)
else:
raise ValueError(
'The `return_format` argument should be either `numpy` (NumPy arrays) or `tf` (TensorFlow dataset).')
if __name__ == "__main__":
image_size = (331, 331)
(X, Y) = load_training_dataset(image_size=image_size)
ds = load_training_dataset(image_size=image_size, return_format='tf')
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.8)
# TODO : Transformer en fonction de preprocessing dans un fichier qui s'appellera preproccessing.py
X_train = np.array(X_train) / 255.0
X_test = np.array(X_test) / 255.0
model = keras.models.load_model("trained_model/model09965.h5")
prediction_probas = model.evaluate(X_test, y_test)
print(prediction_probas)