fixes to LLM generation code

eisenzopf · May 14, 2024 · 5345d7c · 5345d7c
1 parent 9aa673b
commit 5345d7c
Show file tree

Hide file tree

Showing 2 changed files with 4 additions and 7 deletions.
diff --git a/llm_eval/handler.py b/llm_eval/handler.py
@@ -27,12 +27,9 @@ def generate_output(self, text):
             {"role": "user", "content": text },
         ]
         prompt = self.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
-        inputs = self.tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=self.max_length)
-        inputs = {key: value.to(self.device) for key, value in inputs.items()}
-        with torch.no_grad():
-            outputs = self.model.generate(**inputs, max_new_tokens=self.max_new_tokens, do_sample=True, temperature=self.temperature, top_p=self.top_p)
-        responses = [self.tokenizer.decode(output, skip_special_tokens=True) for output in outputs]
-        responses = ' '.join(responses)
+        inputs = self.tokenizer(prompt, return_tensors="pt", padding=True, truncation=True, max_length=self.max_length).to(self.device)
+        outputs = self.model.generate(**inputs, max_new_tokens=self.max_new_tokens, do_sample=True, temperature=self.temperature, top_p=self.top_p)
+        responses = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
         return prompt, responses
 
     def load_dataset(self, dataset):

diff --git a/pyproject.toml b/pyproject.toml
@@ -6,7 +6,7 @@ build-backend = "setuptools.build_meta"
 
 [project]
 name = "llm-eval"
-version = "0.3.16"
+version = "0.3.17"
 authors = [
     {name = "Jonathan Eisenzopf", email = "[email protected]"},
 ]