Skip to content

zivenyang/marker-deploy

Repository files navigation

marker-deploy

简介

一个简易的pdf转markdown服务

特性

  • 基于marker的PDF转Markdown服务,支持OCR识别
  • 基于Vditor的markdown编辑器
  • 基于docker部署

部署

在运行安装命令之前,请确保您的机器上安装了 DockerDocker Compose

git clone https://github.com/zivenyang/marker-deploy.git --recursive
cd marker-deploy
docker-compose up -d --build

前端日志查看:docker logs -f marker-ui
后端日志查看:docker logs -f marker-api

使用

访问http://localhost:28000/进行访问

点击第一个图标上传pdf文件进行识别,识别时长取决与本机算力,第一次使用会从huggingface上下载模型,本镜像默认使用的cpu计算,识别时间较长(约10分钟),如需使用gpu请修改docker-compose.yml中的api服务,参考Turn on GPU access with Docker Compose 使用教程

中文识别需要将在marker-deploy/marker-api/server.py中将默认语言改为Chinese以提高中文识别准确率,修改后记得返回marker-deploy目录使用docker-compose up -d --build重新构建服务

@app.post("/convert")
async def convert_pdf_to_markdown(pdf_file: UploadFile = File(...), extract_images: bool = True):
    Settings.DEFAULT_LANG="Chinese" # 将默认语言设置为中文
    if extract_images == False:
        Settings.EXTRACT_IMAGES = False
        print("Print EXTRACT_IMAGES set to False")
    else:
        Settings.EXTRACT_IMAGES = True
...

效果

识别效果

不足

  • 暂不支持图片预览,但接口有返回base64编码

依赖

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published