fix lmdeploy 后端

shell-nlp · shell-nlp · commit 29d3456ea7cb · 2024-08-17T23:50:29.000+08:00
diff --git a/gpt_server/model_backend/lmdeploy_backend.py b/gpt_server/model_backend/lmdeploy_backend.py
@@ -29,13 +29,9 @@ def __init__(self, model_path) -> None:
         backend = backend_map[os.getenv("backend")]
         logger.info(f"后端 {backend}")
         if backend == "pytorch":
-            backend_config = PytorchEngineConfig(
-                model_name="", tp=int(os.getenv("num_gpus", "1")), thread_safe=False
-            )
+            backend_config = PytorchEngineConfig(tp=int(os.getenv("num_gpus", "1")))
         if backend == "turbomind":
-            backend_config = TurbomindEngineConfig(
-                model_name="", tp=int(os.getenv("num_gpus", "1")), thread_safe=True
-            )
+            backend_config = TurbomindEngineConfig(tp=int(os.getenv("num_gpus", "1")))
         pipeline_type, pipeline_class = get_task(model_path)
         logger.info(f"模型架构：{pipeline_type}")
         self.async_engine = pipeline_class(
@@ -45,7 +41,7 @@ def __init__(self, model_path) -> None:
         )
 
     async def stream_chat(self, params: Dict[str, Any]) -> AsyncGenerator:
-        prompt = params.get("prompt","")
+        prompt = params.get("prompt", "")
         logger.info(prompt)
         messages = params["messages"]
         request_id = params.get("request_id", "0")