NVIDIA
Showing with 0 additions and 5 deletions.

+0 −3 tools/checkpoint/saver_qwen2_hf.py

+0 −2 tools/checkpoint/schema_base.py
diff --git a/tools/checkpoint/saver_qwen2_hf.py b/tools/checkpoint/saver_qwen2_hf.py
@@ -123,7 +123,6 @@ def construct_qwen2moe_config(
         raise('Cannot import Qwen2MoeForCausalLM from transformers.')
 
     print("Converting from megatron to qwen2-moe ...")
-    print('Megatron config:', pprint.pformat(megatron_cfg.__dict__))
 
     if megatron_cfg.moe_shared_expert_intermediate_size is not None:
         moe_shared_expert_intermediate_size = megatron_cfg.moe_shared_expert_intermediate_size
@@ -175,7 +174,6 @@ def construct_qwen2_config(
         exit(1)
 
     print("Converting from megatron to qwen2 ...")
-    print('Megatron config:', pprint.pformat(megatron_cfg.__dict__))
 
     config_dict = dict(
         bos_token_id=151643,
@@ -214,7 +212,6 @@ def set_dense_mlp(qwen2_hf, prefix, msg):
 
 
 def set_moe_mlp(qwen2_hf, prefix, msg, md):
-
     shared_expert_mlp_l0_weight_W = msg.pop("shared mlp l0 weight W")
     shared_expert_mlp_l0_weight_V = msg.pop("shared mlp l0 weight V")
     shared_expert_mlp_l1_weight = msg.pop("shared mlp l1 weight")

diff --git a/tools/checkpoint/schema_base.py b/tools/checkpoint/schema_base.py
@@ -77,8 +77,6 @@ def _set(cls, schema, model, params):
         for k, m in schema.items():
             if k in params:
                 cls._set_deep_tensor(model, m, params[k])
-            else:
-                print(f"miss key '{k}'")
 
     def set(self, key, model, params):
         self._set(self[key], model, params)