Skip to content

Files

Latest commit

fad8c3b · Oct 15, 2023

History

History
110 lines (80 loc) · 6.25 KB

README.md

File metadata and controls

110 lines (80 loc) · 6.25 KB

简体中文 | English

PaddleMIX应用示例基于paddlevlp、ppdiffusers和paddlenlp开发,简单易用功能强大。聚合业界优质预训练模型并提供开箱即用的开发体验,覆盖跨模态和多场景的模型库搭配,可满足开发者灵活定制的需求。

特性

开箱即用的工具集

Appflow提供丰富的开箱即用工具集,覆盖跨模态多场景应用,提供产业级的效果与极致的推理性能。

from paddlemix.appflow import Appflow

paddle.seed(1024)
task = Appflow(app="text2image_generation",
               models=["stabilityai/stable-diffusion-v1-5"]
               )
prompt = "a photo of an astronaut riding a horse on mars."
result = task(prompt=prompt)['result']

跨模态多场景应用

应用名称 调用模型 静态图推理
开放世界检测分割(Openset-Det-Sam) grounded sam
自动标注(AutoLabel) blip2 grounded sam
检测框引导的图像编辑(Det-Guided-Inpainting) chatglm-6b stable-diffusion-2-inpainting grounded sam
文图生成(Text-to-Image Generation) runwayml/stable-diffusion-v1-5 fastdeploy
文本引导的图像放大(Text-Guided Image Upscaling) ldm-super-resolution-4x-openimages
文本引导的图像编辑(Text-Guided Image Inpainting) stable-diffusion-2-inpainting fastdeploy
文本引导的图像变换(Image-to-Image Text-Guided Generation) stable-diffusion-v1-5 fastdeploy
文本条件的视频生成(Text-to-Video Generation) text-to-video-ms-1.7b
音频生成图像(Audio-to-Image Generation) imagebind stable-diffusion-2-1-unclip
音频描述(Audio-to-Caption Generation) chatglm-6b whisper
音频对话(Audio-to-Chat Generation) chatglm-6b whisper fastspeech2
音乐生成(Music Generation) chatglm-6b minigpt4 audioldm

更多应用持续开发中......

安装

环境依赖

pip install -r requirements.txt

更多关于PaddlePaddle和PaddleNLP安装的详细教程请查看 Installation

源码安装

git clone https://github.com/PaddlePaddle/PaddleMIX
pip install -e .

#appflow 依赖包安装
pip install -r paddlemix/appflow/requirements.txt

快速开始

这里以开放世界检测分割为例:

一键预测

PaddleMIX提供一键预测功能,无需训练,直接输入数据即可输出结果:

>>> from paddlemix.appflow import Appflow
>>> from ppdiffusers.utils import load_image

>>> task = Appflow(task="openset_det_sam",
                   models=["GroundingDino/groundingdino-swint-ogc","Sam/SamVitH-1024"],
                   static_mode=False) #如果开启静态图推理,设置为True,默认动态图
>>> url = "https://paddlenlp.bj.bcebos.com/models/community/CompVis/stable-diffusion-v1-4/overture-creations.png"
>>> image_pil = load_image(url)
>>> result = task(image=image_pil,prompt="dog")

参数说明

参数 是否必须 含义
--app Yes 应用名称
--models Yes 需要使用的模型,可以是单个模型,也可以多个组合
--static_mode Option 是否静态图推理,默认False
--precision Option 当 static_mode == True 时使用,默认fp32,可选择trt_fp32、trt_fp16