marker-deploy

简介

一个简易的pdf转markdown服务

前端项目地址：marker-ui
后端项目地址：marker-api

特性

基于marker的PDF转Markdown服务，支持OCR识别
基于Vditor的markdown编辑器
基于docker部署

部署

在运行安装命令之前，请确保您的机器上安装了 Docker 和 Docker Compose

git clone https://github.com/zivenyang/marker-deploy.git --recursive
cd marker-deploy
docker-compose up -d --build

前端日志查看：docker logs -f marker-ui
后端日志查看：docker logs -f marker-api

使用

访问http://localhost:28000/进行访问

点击第一个图标上传pdf文件进行识别，识别时长取决与本机算力，第一次使用会从huggingface上下载模型，本镜像默认使用的cpu计算，识别时间较长（约10分钟），如需使用gpu请修改docker-compose.yml中的api服务，参考Turn on GPU access with Docker Compose

中文识别需要将在marker-deploy/marker-api/server.py中将默认语言改为Chinese以提高中文识别准确率，修改后记得返回marker-deploy目录使用docker-compose up -d --build重新构建服务

@app.post("/convert")
async def convert_pdf_to_markdown(pdf_file: UploadFile = File(...), extract_images: bool = True):
    Settings.DEFAULT_LANG="Chinese" # 将默认语言设置为中文
    if extract_images == False:
        Settings.EXTRACT_IMAGES = False
        print("Print EXTRACT_IMAGES set to False")
    else:
        Settings.EXTRACT_IMAGES = True
...

效果

不足

暂不支持图片预览，但接口有返回base64编码

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
images		images
marker-api @ 4cea700		marker-api @ 4cea700
marker-ui @ b4012a9		marker-ui @ b4012a9
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
docker-compose.yml		docker-compose.yml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

marker-deploy

简介

特性

部署

使用

效果

不足

依赖

About

Releases

Packages

License

zivenyang/marker-deploy

Folders and files

Latest commit

History

Repository files navigation

marker-deploy

简介

特性

部署

使用

效果

不足

依赖

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Packages