[Doc] fix the port conflict issue in the usage example (#4379)

EmmonsCurse · web-flow · commit 425205b03c65 · 2025-10-13T20:17:06.000+08:00
diff --git a/docs/get_started/ernie-4.5-vl.md b/docs/get_started/ernie-4.5-vl.md
@@ -27,7 +27,7 @@ export ENABLE_V1_KVCACHE_SCHEDULER=1
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-VL-424B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization wint4 \
        --max-model-len 32768 \
diff --git a/docs/get_started/ernie-4.5.md b/docs/get_started/ernie-4.5.md
@@ -25,7 +25,7 @@ export ENABLE_V1_KVCACHE_SCHEDULER=1
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-300B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization wint4 \
        --max-model-len 32768 \
diff --git a/docs/zh/get_started/ernie-4.5-vl.md b/docs/zh/get_started/ernie-4.5-vl.md
@@ -27,7 +27,7 @@ export ENABLE_V1_KVCACHE_SCHEDULER=1
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-VL-424B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization wint4 \
        --max-model-len 32768 \
diff --git a/docs/zh/get_started/ernie-4.5.md b/docs/zh/get_started/ernie-4.5.md
@@ -25,7 +25,7 @@ export ENABLE_V1_KVCACHE_SCHEDULER=1
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-300B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization wint4 \
        --max-model-len 32768 \
diff --git a/docs/zh/quantization/online_quantization.md b/docs/zh/quantization/online_quantization.md
@@ -15,7 +15,7 @@
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-300B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization wint8 \
        --max-model-len 32768 \
@@ -41,7 +41,7 @@ python -m fastdeploy.entrypoints.openai.api_server \
 python -m fastdeploy.entrypoints.openai.api_server \
        --model baidu/ERNIE-4.5-300B-A47B-Paddle \
        --port 8180 --engine-worker-queue-port 8181 \
-       --cache-queue-port 8182 --metrics-port 8182 \
+       --cache-queue-port 8183 --metrics-port 8182 \
        --tensor-parallel-size 8 \
        --quantization block_wise_fp8 \
        --max-model-len 32768 \