From 6c440e3098148f830c39cad01cff6785a5133b7e Mon Sep 17 00:00:00 2001
From: Sergey Kasyanov <kus7466@gmail.com>
Date: Wed, 9 Aug 2023 16:03:46 +0300
Subject: [PATCH] Fixes

---
 fedot/core/data/data_split.py                               | 6 ++++++
 .../data_operations/sklearn_transformations.py              | 2 --
 2 files changed, 6 insertions(+), 2 deletions(-)

diff --git a/fedot/core/data/data_split.py b/fedot/core/data/data_split.py
index dd5a94dce1..ddb642e855 100644
--- a/fedot/core/data/data_split.py
+++ b/fedot/core/data/data_split.py
@@ -126,6 +126,8 @@ def _are_stratification_allowed(data: Union[InputData, MultiModalData], split_ra
     # check that there are enough labels for two samples
     if not all(x > 1 for x in classes[1]):
         if __debug__:
+            # tests often use very small datasets that are not suitable for data splitting
+            # for test stratification is disabled in that case
             return False
         else:
             raise ValueError(("There is the only value for some classes:"
@@ -144,6 +146,7 @@ def _are_stratification_allowed(data: Union[InputData, MultiModalData], split_ra
 def train_test_data_setup(data: Union[InputData, MultiModalData],
                           split_ratio: float = 0.8,
                           shuffle: bool = False,
+                          shuffle_flag: bool = False,
                           stratify: bool = True,
                           random_seed: int = 42,
                           validation_blocks: Optional[int] = None) -> Tuple[Union[InputData, MultiModalData],
@@ -153,6 +156,7 @@ def train_test_data_setup(data: Union[InputData, MultiModalData],
     :param data: InputData object to split
     :param split_ratio: share of train data between 0 and 1
     :param shuffle: is data needed to be shuffled or not
+    :param shuffle_flag: same is shuffle, use for backward compatibility
     :param stratify: make stratified sample or not
     :param random_seed: random_seed for shuffle
     :param validation_blocks: validation blocks are used for test
@@ -160,6 +164,8 @@ def train_test_data_setup(data: Union[InputData, MultiModalData],
     :return: data for train, data for validation
     """
 
+    # for backward compatibility
+    shuffle |= shuffle_flag
     # check that stratification may be done
     stratify &= _are_stratification_allowed(data, split_ratio)
     # stratification is allowed only with shuffle
diff --git a/fedot/core/operations/evaluation/operation_implementations/data_operations/sklearn_transformations.py b/fedot/core/operations/evaluation/operation_implementations/data_operations/sklearn_transformations.py
index 59ab97c6df..b75e70076c 100644
--- a/fedot/core/operations/evaluation/operation_implementations/data_operations/sklearn_transformations.py
+++ b/fedot/core/operations/evaluation/operation_implementations/data_operations/sklearn_transformations.py
@@ -362,8 +362,6 @@ def _find_binary_features(self, numerical_features: np.array):
         # Calculate unique values per column (excluding nans)
         for column_id, col in enumerate(df):
             unique_values = df[col].dropna().unique()
-            # TODO: test data processed without information about train data
-            #       it may lead to errors
             if len(unique_values) == 2:
                 # Current numerical column has only two values
                 column_info = {column_id: {'min': min(unique_values),