ROCm · bmullick-amd · Dec 2, 2024 · Dec 2, 2024 · Dec 2, 2024 · Dec 18, 2024
diff --git a/vllm/inputs/preprocess.py b/vllm/inputs/preprocess.py
@@ -160,7 +160,8 @@ def _prepare_decoder_input_ids_for_generation(
         if decoder_input_ids is None:
             # no decoder prompt input ->
             # use decoder_start_token_id as decoder_input_ids
-            decoder_input_ids = self._get_default_enc_dec_decoder_prompt()
+            # decoder_input_ids = self._get_default_enc_dec_decoder_prompt()
+            decoder_input_ids = [decoder_start_token_id]
 
         if force_bos and (len(decoder_input_ids) == 0
                           or decoder_input_ids[0] != decoder_start_token_id):

diff --git a/vllm/model_executor/models/registry.py b/vllm/model_executor/models/registry.py
@@ -90,6 +90,9 @@
     "BartModel": ("bart", "BartForConditionalGeneration"),
     "BartForConditionalGeneration": ("bart", "BartForConditionalGeneration"),
     "Florence2ForConditionalGeneration": ("florence2", "Florence2ForConditionalGeneration"),  # noqa: E501
+    "T5Model": ("t5", "T5ForConditionalGeneration"),
+    "T5ForConditionalGeneration": ("t5", "T5ForConditionalGeneration"),
+    "T5WithLMHeadModel": ("t5", "T5ForConditionalGeneration")
 }
 
 _EMBEDDING_MODELS = {
@@ -484,4 +487,4 @@ def _run() -> None:
 
 
 if __name__ == "__main__":
-    _run()
+    _run()