快速开始

下载模型

模型放置路径如下所示：

models
├── Layout // https://huggingface.co/opendatalab/PDF-Extract-Kit/tree/main/models/Layout
│   ├── model_final.pth 
│   └── config.json 
├── MFD // https://huggingface.co/opendatalab/PDF-Extract-Kit/tree/main/models/MFD
│   └── weights.pt 
├── MFR // https://huggingface.co/wanderkid/unimernet_base/tree/main
│   └── unimernet_base
│       ├── config.json
│       ├── preprocessor_config.json
│       ├── tokenizer.json
│       ├── tokenizer.jsontokenizer_config.json
│       └── unimernet_base.pth // unimernet原仓库的unimernet_base.pth已改名为pytorch_model.pth，重命名即可。
├── PaddleOCR
│   ├── ch_ppocr_mobile_v2.0_cls_infer // https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
│   │   ├── inference.pdiparams
│   │   ├── inference.pdiparams.info
│   │   └── inference.pdmodel  
│   ├── ch_PP-OCRv3_det_infer // https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
│   │   ├── inference.pdiparams
│   │   ├── inference.pdiparams.info
│   │   └── inference.pdmodel  
│   └──  ch_PP-OCRv3_rec_slim_infer // https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_slim_infer.tar
│       ├── inference.pdiparams
│       ├── inference.pdiparams.info
│       └── inference.pdmodel  
├── RapidTable // https://pan.baidu.com/share/init?surl=PI9fksW6F6kQfJhwUkewWg&pwd=p29g
│   ├── ch_ppstructure_mobile_v2_SLANet.onnx
│   └── en_ppstructure_mobile_v2_SLANet.onnx 
└── vikp // https://huggingface.co/vikp/surya_order/tree/main
    └── surya_order
	    ├── config.json
        ├── generation_config.json
		├── model.safetensors
        └── preprocessor_config.json

安装

创建conda环境

conda create -p ./ENV python=3.10
conda activate ./ENV

安装依赖包

pip install -r requirements.txt
pip install unimernet==0.2.1
pip install DataPrep4LLM_Algos/detectron2-0.6+pt2.3.1cu121-cp310-cp310-linux_x86_64.whl

或从https://miropsota.github.io/torch_packages_builder/detectron2/ 下载合适版本detectron2安装。

修改ENV/lib/python3.10/site-packages/detectron2/data/transforms/transform.py第46行"Image.LINEAR"为"IMAGE.BILINEAR"。

运行

cd DataPrep4LLM_Algos
python main.py --pdf <pdf文档或文件夹>

如需在cpu上运行，需修改configs/layoutlmv3_base_inference.yaml中的"cuda"为"cpu"。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

快速开始

下载模型

安装

运行

Files

README.md

Latest commit

History

README.md

File metadata and controls

快速开始

下载模型

安装

运行