getsentry · jan-auer · Feb 19, 2025 · Feb 17, 2025 · Feb 17, 2025
@@ -138,12 +138,7 @@ def reliability(self) -> Reliability.ValueType:
             if self.value != 0
             else float("inf")
         )
-        is_reliable = calculate_reliability(
-            relative_confidence,
-            self.sample_count,
-            CONFIDENCE_INTERVAL_THRESHOLD,
-        )
-        if is_reliable:
+        if relative_confidence <= CONFIDENCE_INTERVAL_THRESHOLD:
             return Reliability.RELIABILITY_HIGH
         return Reliability.RELIABILITY_LOW
 
@@ -174,12 +169,7 @@ def reliability(self) -> Reliability.ValueType:
             self.value / ci_lower if ci_lower != 0 else float("inf"),
             ci_upper / self.value if self.value != 0 else float("inf"),
         )
-        is_reliable = calculate_reliability(
-            relative_confidence,
-            self.sample_count,
-            CONFIDENCE_INTERVAL_THRESHOLD,
-        )
-        if is_reliable:
+        if relative_confidence <= CONFIDENCE_INTERVAL_THRESHOLD:
             return Reliability.RELIABILITY_HIGH
         return Reliability.RELIABILITY_LOW
 
@@ -603,21 +593,6 @@ def _calculate_approximate_ci_percentile_levels(
     return (lower_index / n, upper_index / n)
 
 
-def calculate_reliability(
-    relative_confidence: float,
-    sample_count: int,
-    confidence_interval_threshold: float,
-    sample_count_threshold: int = 100,
-) -> bool:
-    """
-    A reliability check to determine if the sample count is large enough to be reliable and the confidence interval is small enough.
-    """
-    if sample_count < sample_count_threshold:
-        return False
-
-    return relative_confidence <= confidence_interval_threshold
-
-
 def aggregation_to_expression(
     aggregation: AttributeAggregation, field: Expression | None = None
 ) -> Expression:

@@ -402,9 +402,7 @@ def test_count_reliability_backward_compat(self) -> None:
             0
         ]
         assert measurement_count == 5
-        assert (
-            measurement_reliability == Reliability.RELIABILITY_LOW
-        )  # low reliability due to low sample count
+        assert measurement_reliability == Reliability.RELIABILITY_HIGH
 
     def test_count_reliability(self) -> None:
         spans_storage = get_storage(StorageKey("eap_spans"))
@@ -461,9 +459,7 @@ def test_count_reliability(self) -> None:
             0
         ]
         assert measurement_count == 5
-        assert (
-            measurement_reliability == Reliability.RELIABILITY_LOW
-        )  # low reliability due to low sample count
+        assert measurement_reliability == Reliability.RELIABILITY_HIGH
 
     def test_count_reliability_with_group_by_backward_compat(self) -> None:
         spans_storage = get_storage(StorageKey("eap_spans"))
@@ -578,17 +574,13 @@ def test_count_reliability_with_group_by_backward_compat(self) -> None:
         measurement_counts = [v.val_double for v in response.column_values[3].results]
         measurement_reliabilities = [v for v in response.column_values[3].reliabilities]
         assert measurement_counts == [5]
-        assert measurement_reliabilities == [
-            Reliability.RELIABILITY_LOW,
-        ]  # low reliability due to low sample count
+        assert measurement_reliabilities == [Reliability.RELIABILITY_HIGH]
 
         measurement_p90s = [v.val_double for v in response.column_values[4].results]
         measurement_reliabilities = [v for v in response.column_values[4].reliabilities]
         assert len(measurement_p90s) == 1
         assert measurement_p90s[0] == 4
-        assert measurement_reliabilities == [
-            Reliability.RELIABILITY_LOW,
-        ]  # low reliability due to low sample count
+        assert measurement_reliabilities == [Reliability.RELIABILITY_HIGH]
 
     def test_count_reliability_with_group_by(self) -> None:
         spans_storage = get_storage(StorageKey("eap_spans"))
@@ -703,17 +695,13 @@ def test_count_reliability_with_group_by(self) -> None:
         measurement_counts = [v.val_double for v in response.column_values[3].results]
         measurement_reliabilities = [v for v in response.column_values[3].reliabilities]
         assert measurement_counts == [5]
-        assert measurement_reliabilities == [
-            Reliability.RELIABILITY_LOW,
-        ]  # low reliability due to low sample count
+        assert measurement_reliabilities == [Reliability.RELIABILITY_HIGH]
 
         measurement_p90s = [v.val_double for v in response.column_values[4].results]
         measurement_reliabilities = [v for v in response.column_values[4].reliabilities]
         assert len(measurement_p90s) == 1
         assert measurement_p90s[0] == 4
-        assert measurement_reliabilities == [
-            Reliability.RELIABILITY_LOW,
-        ]  # low reliability due to low sample count
+        assert measurement_reliabilities == [Reliability.RELIABILITY_HIGH]
 
     def test_formula(self) -> None:
         """
@@ -873,7 +861,7 @@ def test_aggregation_with_nulls(self) -> None:
                 attribute_name="sum(custom_measurement)",
                 results=[AttributeValue(val_double=5), AttributeValue(is_null=True)],
                 reliabilities=[
-                    Reliability.RELIABILITY_LOW,
+                    Reliability.RELIABILITY_HIGH,
                     Reliability.RELIABILITY_UNSPECIFIED,
                 ],
             ),
@@ -882,7 +870,7 @@ def test_aggregation_with_nulls(self) -> None:
                 results=[AttributeValue(is_null=True), AttributeValue(val_double=5)],
                 reliabilities=[
                     Reliability.RELIABILITY_UNSPECIFIED,
-                    Reliability.RELIABILITY_LOW,
+                    Reliability.RELIABILITY_HIGH,
                 ],
             ),
         ]