datachecks · ashank2603 · Nov 6, 2024 · Nov 6, 2024 · Nov 8, 2024 · Nov 11, 2024
diff --git a/dcs_core/core/datasource/sql_datasource.py b/dcs_core/core/datasource/sql_datasource.py
@@ -670,7 +670,7 @@ def query_negative_metric(
             total_count_query += f" WHERE {filters}"
 
         if operation == "percent":
-            query = f"SELECT (CAST(({negative_query}) AS float) / CAST(({total_count_query}) AS float)) * 100"
+            query = f"SELECT (CAST(({negative_query}) AS float) / CAST(({total_count_query}) AS float)) * 100 FROM {qualified_table_name}"
         else:
             query = negative_query
 
@@ -718,7 +718,7 @@ def query_get_null_keyword_count(
                    FROM {qualified_table_name}"""
 
         if filters:
-            query += f" AND {filters}"
+            query += f" WHERE {filters}"
 
         result = self.fetchone(query)
 
@@ -731,14 +731,12 @@ def query_timestamp_metric(
         self,
         table: str,
         field: str,
-        operation: str,
         predefined_regex: str,
         filters: str = None,
     ) -> Union[float, int]:
         """
         :param table: Table name
         :param field: Column name
-        :param operation: Metric operation ("count" or "percent")
         :param predefined_regex: regex pattern
         :param filters: filter condition
         :return: Tuple containing valid count and total count (or percentage)
@@ -811,12 +809,7 @@ def query_timestamp_metric(
             )
             total_count = self.fetchone(total_count_query)[0]
 
-            if operation == "count":
-                return valid_count, total_count
-            elif operation == "percent":
-                return valid_count, total_count
-            else:
-                raise ValueError(f"Unknown operation: {operation}")
+            return valid_count, total_count
 
         except Exception as e:
             print(f"Error occurred: {e}")
@@ -826,14 +819,12 @@ def query_timestamp_not_in_future_metric(
         self,
         table: str,
         field: str,
-        operation: str,
         predefined_regex: str,
         filters: str = None,
     ) -> Union[float, int]:
         """
         :param table: Table name
         :param field: Column name
-        :param operation: Metric operation ("count" or "percent")
         :param predefined_regex: regex pattern
         :param filters: filter condition
         :return: Tuple containing count of valid timestamps not in the future and total count
@@ -906,12 +897,7 @@ def query_timestamp_not_in_future_metric(
             )
             total_count = self.fetchone(total_count_query)[0]
 
-            if operation == "count":
-                return valid_count, total_count
-            elif operation == "percent":
-                return valid_count, total_count
-            else:
-                raise ValueError(f"Unknown operation: {operation}")
+            return valid_count, total_count
 
         except Exception as e:
             print(f"Error occurred: {e}")
@@ -921,14 +907,12 @@ def query_timestamp_date_not_in_future_metric(
         self,
         table: str,
         field: str,
-        operation: str,
         predefined_regex: str,
         filters: str = None,
     ) -> Union[float, int]:
         """
         :param table: Table name
         :param field: Column name
-        :param operation: Metric operation ("count" or "percent")
         :param predefined_regex: The regex pattern to use (e.g., "timestamp_iso")
         :param filters: Optional filter condition
         :return: Tuple containing count of valid dates not in the future and total count
@@ -996,13 +980,7 @@ def query_timestamp_date_not_in_future_metric(
             )
             total_count = self.fetchone(total_count_query)[0]
 
-            if operation == "count":
-                return valid_count, total_count
-            elif operation == "percent":
-                return valid_count, total_count
-            else:
-                raise ValueError(f"Unknown operation: {operation}")
-
+            return valid_count, total_count
         except Exception as e:
             logger.error(f"Error occurred: {e}")
             return 0, 0
diff --git a/dcs_core/core/validation/completeness_validation.py b/dcs_core/core/validation/completeness_validation.py
@@ -12,19 +12,27 @@
 #  See the License for the specific language governing permissions and
 #  limitations under the License.
 
+import re
 from typing import Union
 
 from dcs_core.core.datasource.search_datasource import SearchIndexDataSource
 from dcs_core.core.datasource.sql_datasource import SQLDataSource
 from dcs_core.core.validation.base import Validation
+from dcs_core.integrations.databases.oracle import OracleDataSource
 
 
 class CountNullValidation(Validation):
     def _generate_metric_value(self, **kwargs) -> Union[float, int]:
         if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(
+                    r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter
+                )
             return self.data_source.query_get_null_count(
                 table=self.dataset_name,
-                field=self.field_name,
+                field=f'"{self.field_name}"'
+                if isinstance(self.data_source, OracleDataSource)
+                else self.field_name,
                 filters=self.where_filter if self.where_filter is not None else None,
             )
         elif isinstance(self.data_source, SearchIndexDataSource):
@@ -40,9 +48,15 @@ def _generate_metric_value(self, **kwargs) -> Union[float, int]:
 class PercentageNullValidation(Validation):
     def _generate_metric_value(self, **kwargs) -> Union[float, int]:
         if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(
+                    r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter
+                )
             return self.data_source.query_get_null_percentage(
                 table=self.dataset_name,
-                field=self.field_name,
+                field=f'"{self.field_name}"'
+                if isinstance(self.data_source, OracleDataSource)
+                else self.field_name,
                 filters=self.where_filter if self.where_filter is not None else None,
             )
         elif isinstance(self.data_source, SearchIndexDataSource):
@@ -58,9 +72,15 @@ def _generate_metric_value(self, **kwargs) -> Union[float, int]:
 class CountEmptyStringValidation(Validation):
     def _generate_metric_value(self, **kwargs) -> Union[float, int]:
         if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(
+                    r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter
+                )
             return self.data_source.query_get_empty_string_count(
                 table=self.dataset_name,
-                field=self.field_name,
+                field=f'"{self.field_name}"'
+                if isinstance(self.data_source, OracleDataSource)
+                else self.field_name,
                 filters=self.where_filter if self.where_filter is not None else None,
             )
         elif isinstance(self.data_source, SearchIndexDataSource):
@@ -76,9 +96,15 @@ def _generate_metric_value(self, **kwargs) -> Union[float, int]:
 class PercentageEmptyStringValidation(Validation):
     def _generate_metric_value(self, **kwargs) -> Union[float, int]:
         if isinstance(self.data_source, SQLDataSource):
+            if isinstance(self.data_source, OracleDataSource) and self.where_filter:
+                self.where_filter = re.sub(
+                    r"(\b[a-zA-Z_]+\b)(?=\s*[=<>])", r'"\1"', self.where_filter
+                )
             return self.data_source.query_get_empty_string_percentage(
                 table=self.dataset_name,
-                field=self.field_name,
+                field=f'"{self.field_name}"'
+                if isinstance(self.data_source, OracleDataSource)
+                else self.field_name,
                 filters=self.where_filter if self.where_filter is not None else None,
             )
         elif isinstance(self.data_source, SearchIndexDataSource):