unionai-oss · cosmicBboy · Apr 21, 2023 · May 7, 2023 · flyte-bot · Dec 27, 2024
diff --git a/pandera/engines/pandas_engine.py b/pandera/engines/pandas_engine.py
@@ -273,11 +273,13 @@ def _register_numpy_numbers(
 
     builtin_type = getattr(builtins, builtin_name, None)  # uint doesn't exist
 
-    # default to int64 regardless of OS
-    default_pd_dtype = {
-        "int": np.dtype("int64"),
-        "uint": np.dtype("uint64"),
+    # use OS-specific type for integers. This will be int32 for Windows, int64
+    # for other systems.
+    default_int_dtype = {
+        "int": np.dtype("int32"),
+        "uint": np.dtype("uint32"),
     }.get(builtin_name, pd.Series([1], dtype=builtin_name).dtype)
+    # default_int_dtype = pd.Series([1], dtype=builtin_name).dtype
 
     for bit_width in sizes:
         # e.g.: numpy.int64
@@ -292,10 +294,10 @@ def _register_numpy_numbers(
             )
         )
 
-        if np_dtype == default_pd_dtype:
+        if np_dtype == default_int_dtype:
             equivalents |= set(
                 (
-                    default_pd_dtype,
+                    default_int_dtype,
                     builtin_name,
                     getattr(dtypes, pandera_name),
                     getattr(dtypes, pandera_name)(),

diff --git a/tests/core/test_checks.py b/tests/core/test_checks.py
@@ -25,12 +25,14 @@ def test_vectorized_checks() -> None:
     schema = SeriesSchema(
         Int, Check(lambda s: s.value_counts() == 2, element_wise=False)
     )
-    validated_series = schema.validate(pd.Series([1, 1, 2, 2, 3, 3]))
+    validated_series = schema.validate(
+        pd.Series([1, 1, 2, 2, 3, 3], dtype=int)
+    )
     assert isinstance(validated_series, pd.Series)
 
     # error case
     with pytest.raises(errors.SchemaError):
-        schema.validate(pd.Series([1, 2, 3]))
+        schema.validate(pd.Series([1, 2, 3], dtype=int))
 
 
 def test_check_groupby() -> None:

diff --git a/tests/core/test_dtypes.py b/tests/core/test_dtypes.py
@@ -5,6 +5,7 @@
 import dataclasses
 import datetime
 import inspect
+import platform
 import re
 import sys
 from decimal import Decimal
@@ -507,6 +508,10 @@ def test_default_numeric_dtypes():
         == pandas_engine.Engine.dtype(int)
         == pandas_engine.Engine.dtype("int")
     )
+    if platform.system() == "Windows":
+        assert default_int_dtype == np.dtype("int32")
+    else:
+        assert default_int_dtype == np.dtype("int64")
-    if platform.system() == "Windows":
-        assert default_int_dtype == np.dtype("int32")
-    else:
-        assert default_int_dtype == np.dtype("int64")
+    if platform.machine() in ["i386", "x86"]:
+        assert default_int_dtype == np.dtype("int32")
+    else:
+        assert default_int_dtype == np.dtype("int64")
-    if platform.system() == "Windows":
-        assert default_int_dtype == np.dtype("int32")
-    else:
-        assert default_int_dtype == np.dtype("int64")
+    if platform.machine() in ["i386", "x86"]:
+        assert default_int_dtype == np.dtype("int32")
+    else:
+        assert default_int_dtype == np.dtype("int64")
 
     default_float_dtype = pd.Series([1.0]).dtype
     assert (