Skip to content

Commit

Permalink
update export doc
Browse files Browse the repository at this point in the history
  • Loading branch information
chengmengli06 committed Feb 22, 2024
1 parent 4310cfb commit e1a9c13
Show file tree
Hide file tree
Showing 2 changed files with 8 additions and 4 deletions.
9 changes: 6 additions & 3 deletions docs/source/export.md
Original file line number Diff line number Diff line change
Expand Up @@ -98,7 +98,11 @@ pai -name easy_rec_ext -project algo_public
- --export_done_file: 导出完成标志文件名, 导出完成后,在导出目录下创建一个文件表示导出完成了
- --clear_export: 删除旧的导出文件目录
- --place_embedding_on_cpu: 将embedding相关的操作放在cpu上,有助于提升模型在gpu环境下的推理速度
- 注: 如果是双塔召回模型(如dssm, mind等)一般还需要进行模型切分和索引构建, 参考下面章节
- 模型导出之后可以使用(EasyRecProcessor)\[./predict/在线预测.md\]部署到PAI-EAS平台

### 双塔召回模型

如果是双塔召回模型(如dssm, mind等), 模型导出之后, 一般还需要进行模型切分和索引构建, 才能使用(EasyRecProcessor)\[./predict/在线预测.md\]部署到PAI-EAS上.

#### 模型切分

Expand Down Expand Up @@ -166,8 +170,7 @@ pai -name easy_rec_py3_ext
-Dextra_params='--index_output_dir=oss://{oss_bucket}/dssm/export/user';
```

-Dtables: 物品向量表

- -Dtables: 物品向量表
- -Dextra_params:
- --index_output_dir: 索引输出目录, 一般设置为已切分好的用户塔模型目录,便于用EasyRec Processor部署
- --index_type: 索引类型,可选 IVFFlat | HNSWFlat,默认为 IVFFlat
Expand Down
3 changes: 2 additions & 1 deletion docs/source/predict/在线预测.md
Original file line number Diff line number Diff line change
Expand Up @@ -66,14 +66,15 @@ eascmd -i <AccessKeyID> -k <AccessKeySecret> -e <EndPoint> desc alirec_rank

配置文件(alirec_rank.json)解析:

- processor: easyrec-1.5, 更多版本可以参考[文档](./processor.md#release)
- processor: easyrec-2.0, 更多版本可以参考[文档](./processor.md#release)
- storage: 挂载oss模型目录
- warm_up_data_path: PAI-EAS服务启动之前会使用warmup_data_path指定的请求数据[预热服务](https://help.aliyun.com/zh/pai/user-guide/warm-up-model-services)
- 文件格式参考[TensorFlow服务请求](https://help.aliyun.com/document_detail/111055.html)
- 建议使用线上真实的请求来warmup, 能够显著降低初始请求的延迟
- model_config
- fg_mode: bypass模式表示不使用fg(Feature generation)功能, 如需要使用FG请参考文档[RTP FG](../feature/rtp_fg.md).
- save_req: 保存请求到挂载模型目录下(以.pb结尾), 可以重命名以后(.bin)作为warmup文件.
- faiss_ivf_nprobe: 向量召回模型向量检索参数(IVFFlat索引), 默认值为100
- 其它参数是所有EAS服务通用的, 请参考[EAS文档](https://help.aliyun.com/zh/pai/user-guide/parameters-of-model-services).

## 界面部署
Expand Down

0 comments on commit e1a9c13

Please sign in to comment.