From e1a9c13634fbbda5a5c4c62ee8560deb40e78121 Mon Sep 17 00:00:00 2001 From: chengmengli06 Date: Thu, 22 Feb 2024 23:11:08 +0800 Subject: [PATCH] update export doc --- docs/source/export.md | 9 ++++++--- .../\345\234\250\347\272\277\351\242\204\346\265\213.md" | 3 ++- 2 files changed, 8 insertions(+), 4 deletions(-) diff --git a/docs/source/export.md b/docs/source/export.md index 994de068e..9ab9b31d4 100644 --- a/docs/source/export.md +++ b/docs/source/export.md @@ -98,7 +98,11 @@ pai -name easy_rec_ext -project algo_public - --export_done_file: 导出完成标志文件名, 导出完成后,在导出目录下创建一个文件表示导出完成了 - --clear_export: 删除旧的导出文件目录 - --place_embedding_on_cpu: 将embedding相关的操作放在cpu上,有助于提升模型在gpu环境下的推理速度 -- 注: 如果是双塔召回模型(如dssm, mind等)一般还需要进行模型切分和索引构建, 参考下面章节 +- 模型导出之后可以使用(EasyRecProcessor)\[./predict/在线预测.md\]部署到PAI-EAS平台 + +### 双塔召回模型 + +如果是双塔召回模型(如dssm, mind等), 模型导出之后, 一般还需要进行模型切分和索引构建, 才能使用(EasyRecProcessor)\[./predict/在线预测.md\]部署到PAI-EAS上. #### 模型切分 @@ -166,8 +170,7 @@ pai -name easy_rec_py3_ext -Dextra_params='--index_output_dir=oss://{oss_bucket}/dssm/export/user'; ``` --Dtables: 物品向量表 - +- -Dtables: 物品向量表 - -Dextra_params: - --index_output_dir: 索引输出目录, 一般设置为已切分好的用户塔模型目录,便于用EasyRec Processor部署 - --index_type: 索引类型,可选 IVFFlat | HNSWFlat,默认为 IVFFlat diff --git "a/docs/source/predict/\345\234\250\347\272\277\351\242\204\346\265\213.md" "b/docs/source/predict/\345\234\250\347\272\277\351\242\204\346\265\213.md" index 9f07043cd..56f496945 100644 --- "a/docs/source/predict/\345\234\250\347\272\277\351\242\204\346\265\213.md" +++ "b/docs/source/predict/\345\234\250\347\272\277\351\242\204\346\265\213.md" @@ -66,7 +66,7 @@ eascmd -i -k -e desc alirec_rank 配置文件(alirec_rank.json)解析: -- processor: easyrec-1.5, 更多版本可以参考[文档](./processor.md#release) +- processor: easyrec-2.0, 更多版本可以参考[文档](./processor.md#release) - storage: 挂载oss模型目录 - warm_up_data_path: PAI-EAS服务启动之前会使用warmup_data_path指定的请求数据[预热服务](https://help.aliyun.com/zh/pai/user-guide/warm-up-model-services) - 文件格式参考[TensorFlow服务请求](https://help.aliyun.com/document_detail/111055.html) @@ -74,6 +74,7 @@ eascmd -i -k -e desc alirec_rank - model_config - fg_mode: bypass模式表示不使用fg(Feature generation)功能, 如需要使用FG请参考文档[RTP FG](../feature/rtp_fg.md). - save_req: 保存请求到挂载模型目录下(以.pb结尾), 可以重命名以后(.bin)作为warmup文件. + - faiss_ivf_nprobe: 向量召回模型向量检索参数(IVFFlat索引), 默认值为100 - 其它参数是所有EAS服务通用的, 请参考[EAS文档](https://help.aliyun.com/zh/pai/user-guide/parameters-of-model-services). ## 界面部署