Xilinx · Giuseppe5 · Apr 26, 2024 · Apr 25, 2024 · Apr 26, 2024 · Apr 26, 2024
diff --git a/src/brevitas/graph/gpfq.py b/src/brevitas/graph/gpfq.py
@@ -17,6 +17,7 @@
 from brevitas.graph.gpxq import StopFwdException
 from brevitas.graph.gpxq import SUPPORTED_CONV_OP
 import brevitas.nn as qnn
+from brevitas.quant_tensor import _unpack_quant_tensor
 from brevitas.quant_tensor import QuantTensor
 
 
@@ -163,6 +164,7 @@ def update_batch(self, module, input, current_layer):
         is_quant_enabled = module.weight_quant.is_quant_enabled
 
         inp = self.process_input(input)
+        inp = _unpack_quant_tensor(inp)
         batch_size = inp.shape[0]
 
         # Preprocess the input to compute the Hessian
@@ -315,7 +317,6 @@ def __init__(
 
     def process_input(self, inp):
         inp = super().process_input(inp)
-        inp = self.layer.input_quant(inp)
 
         is_quant_enabled = self.layer.weight_quant.is_quant_enabled
 

diff --git a/src/brevitas/graph/gptq.py b/src/brevitas/graph/gptq.py
@@ -21,6 +21,7 @@
 from brevitas.graph.gpxq import StopFwdException
 from brevitas.graph.gpxq import SUPPORTED_CONV_OP
 import brevitas.nn as qnn
+from brevitas.quant_tensor import _unpack_quant_tensor
 
 
 class gptq_mode(gpxq_mode):
@@ -144,6 +145,7 @@ def update_batch(self, module, input, current_layer):
         # Update reference to current layer
         current_layer.layer_names.add(self.name)
         inp = self.process_input(input)
+        inp = _unpack_quant_tensor(inp)
         batch_size = inp.shape[0]
 
         # Preprocess the input to compute the Hessian

diff --git a/src/brevitas/graph/gpxq.py b/src/brevitas/graph/gpxq.py
@@ -232,6 +232,8 @@ def process_input(self, inp):
             batch_dim = inp.names.index('N')
             inp.rename_(None)
             inp = inp.transpose(0, batch_dim)
+
+        inp = self.layer.input_quant(inp)
         return inp
 
     @abstractmethod