openvinotoolkit · openvino-dev-samples · May 16, 2025 · eaidova · May 19, 2025 · openvino-dev-samples
diff --git a/notebooks/llm-rag-langchain/llm-rag-langchain-genai.ipynb b/notebooks/llm-rag-langchain/llm-rag-langchain-genai.ipynb
@@ -880,19 +880,49 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
+   "execution_count": null,
    "id": "d0bab20b",
    "metadata": {},
    "outputs": [],
    "source": [
+    "from transformers import AutoTokenizer\n",
+    "from openvino_tokenizers import convert_tokenizer\n",
+    "import openvino as ov\n",
+    "\n",
     "export_command_base = \"optimum-cli export openvino --model {} --task text-classification\".format(rerank_model_configuration[\"model_id\"])\n",
     "export_command = export_command_base + \" \" + str(rerank_model_id.value)\n",
     "\n",
     "display(Markdown(\"**Export command:**\"))\n",
     "display(Markdown(f\"`{export_command}`\"))\n",
     "\n",
     "if not Path(rerank_model_id.value).exists():\n",
-    "    optimum_cli(rerank_model_configuration[\"model_id\"], str(rerank_model_id.value), show_command=False, additional_args={\"task\": \"text-classificaton\"})"
+    "    optimum_cli(rerank_model_configuration[\"model_id\"], str(rerank_model_id.value), show_command=False, additional_args={\"task\": \"text-classificaton\"})\n",
+    "    hf_tokenizer = AutoTokenizer.from_pretrained(rerank_model_configuration[\"model_id\"], trust_remote_code=True)\n",
+    "    ov_tokenizer, ov_detokenizer = convert_tokenizer(hf_tokenizer, with_detokenizer=True, number_of_inputs=2)\n",
+    "    ov.save_model(ov_tokenizer, f\"{rerank_model_id.value}/openvino_tokenizer.xml\")\n",
+    "    ov.save_model(ov_detokenizer, f\"{rerank_model_id.value}/openvino_detokenizer.xml\")"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "id": "36c5c855",
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "from transformers import AutoTokenizer\n",
+    "from openvino_tokenizers import convert_tokenizer\n",
+    "import openvino as ov\n",
+    "\n",
+    "export_command_base = \"optimum-cli export openvino --model {} --task text-classification\".format(rerank_model_configuration[\"model_id\"])\n",
+    "export_command = export_command_base + \" \" + str(rerank_model_id.value)\n",
+    "\n",
+    "if not Path(rerank_model_id.value).exists():\n",
+    "    ! $export_command\n",
+    "    hf_tokenizer = AutoTokenizer.from_pretrained(rerank_model_configuration[\"model_id\"], trust_remote_code=True)\n",
+    "    ov_tokenizer, ov_detokenizer = convert_tokenizer(hf_tokenizer, with_detokenizer=True, number_of_inputs=2)\n",
+    "    ov.save_model(ov_tokenizer, f\"{rerank_model_id.value}/openvino_tokenizer.xml\")\n",
+    "    ov.save_model(ov_detokenizer, f\"{rerank_model_id.value}/openvino_detokenizer.xml\")"
    ]
   },
   {

diff --git a/notebooks/llm-rag-langchain/ov_langchain_helper.py b/notebooks/llm-rag-langchain/ov_langchain_helper.py
@@ -601,8 +601,8 @@ def rerank(self, request: Any) -> Any:
         query = request.query
         passages = request.passages
         # # openvino tokenizer can only support 1D list
-        query_passage_pairs = [query + "</s></s> " + passage["text"] for passage in passages]
-        # query_passage_pairs = [[query, passage["text"]] for passage in passages]
+        # query_passage_pairs = [query + "</s></s> " + passage["text"] for passage in passages]
+        query_passage_pairs = [[query, passage["text"]] for passage in passages]
         length = self.ov_model.inputs[0].get_partial_shape()[1]
         if length.is_dynamic:
             features = self.tokenizer.encode(query_passage_pairs)

diff --git a/notebooks/qwen2.5-omni-chatbot/qwen2.5-omni-chatbot.ipynb b/notebooks/qwen2.5-omni-chatbot/qwen2.5-omni-chatbot.ipynb
@@ -55,12 +55,14 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 1,
+   "execution_count": null,
    "id": "0116846d-da6f-4e81-b6be-0a882a3eb872",
    "metadata": {},
    "outputs": [],
    "source": [
-    "%pip install -q \"git+https://github.com/huggingface/transformers\" \\\n",
+    "%pip uninstall transformers\n",
+    "\n",
+    "%pip install -q \"git+https://github.com/huggingface/[email protected]\" \\\n",
     "\"torchvision\" \"accelerate\" \"qwen-omni-utils[decord]\" \"gradio>=4.19\" --no-cache-dir --extra-index-url https://download.pytorch.org/whl/cpu\n",
     "%pip install -q \"openvino==2025.1.0\" \"nncf>=2.16.0\""
    ]