GitHub

Requirements

diffusers>=0.31.0

模型转换

StableDiffusion 1.4

经过 profile 后本项目暂时只对 UNet 部分采用 TensorRT 推理。该网络部分有三个输入：

如果 do_classifier_free_guidance 为 True 即 guidance_scale 大于 1.0 时，输入会 cat 两个 latents，否则为一个 latents，这会直接影响该变量的第一个维度，为 1 或者 2。对于最后两个维度，在文生图任务中由模型配置决定，为 64x64；在图生图任务中，形状为输入图像的 8 倍下采样，所以最后两个维度为动态的
第二个输入是 scale 没什么好说的
第三个输入的第一维和第一个输入类似，第二个维度来自 tokenizer 编码 text 输入，长度会被 pad 到 77（固定的，当输入大于该值也会截取到该值），第三个维度的 768 是固定的，所以第一个维度是动态的就行

python tools/export_unet.py --model-dir /data/models/stable-diffusion-v1-4

按照上述配置导出后，支持输入的图像的宽高范围为 [256,1024]。

StableDiffusion 3.5 - large

经过 profile 后本项目暂时只对 transformer 部分采用 TensorRT 推理。该网络部分有三个输入：

如果 do_classifier_free_guidance 为 True 即 guidance_scale 大于 1.0 时，输入会 cat 两个 latents，否则为一个 latents，这会直接影响该变量的第一个维度，为 1 或者 2。对于后面三个维度，来自模型配置文件，所以为固定的 (-1,16,128,128)
第二个输入由上面第一个输入的第一维确定，且只有一个维度（一个或两个值），为动态维度
第三个输入和第四个输入的第一维和第一个输入类似。对于后续维度：

prompt_embeds = text_encoder(prompt_input_ids.to(self.device), output_hidden_states=True)
# (1,768)
pooled_prompt_embeds = prompt_embeds[0]
# (1,77,768)
prompt_embeds = prompt_embeds.hidden_states[-2]
# (1,1280)
pooled_prompt_embeds_2 = prompt_embeds[0]
# (1,77,1280)
prompt_embeds_2 = prompt_embeds.hidden_states[-2]
# (1,77,2048)
clip_prompt_embeds = torch.cat([prompt_embeds, prompt_embeds_2], dim=-1)
# (1,256,4096)
t5_prompt_embeds = xxx

然后代码中 clip_prompt_embeds 有个 pad 操作，参数是 (0,t5_prompt_embeds.shape[-1]-clip_prompt_embeds.shape[-1])，即左边不填充，右边填充，此时 clip_prompt_embeds 的形状变成 (1,77,4096)。然后倒数第二维拼接，得到的形状为 (1,333,4096)。同时 pooled_xxx 不作处理直接在最后一维拼接，得到的形状是 (1,2048)。

python tools/export_sd3_5_unet.py --model-dir /data/models/stable-diffusion-3.5-large

Run

当输入指定了 --image-path 时，pipeline 为图生图，否则为文生图；同时，可以指定是否使用 TensorRT 推理 UNet 部分。

python tools/offline_inference.py --model-dir /data/models/stable-diffusion-v1-4 --image-path assets/dog.jpg <--use-trt>

Supported Models

Q && A

Q: 报错 getPluginCreator could not find plugin: InstanceNormalization_TRT version: 1 [pluginV2Runner.cpp::load::308] Error Code 1: Serialization (Serialization assertion creator failed.Cannot deserialize plugin since corresponding IPluginCreator not found in Plugin Registry)

A: 在推理最前部分加上 trt.init_libnvinfer_plugins(None, "")，当时使用 C++ 推理与遇到了类似问题。

Q: 当导出的 ONNX 模型大于 2GB 时报错 onnx.onnx_cpp2py_export.checker.ValidationError: The model does not have an ir_version set properly.

A: 将 protobuf 的版本降至 3.20.3.

Q: 运行 TensorRT 的 img2img 时报错 IExecutionContext::getTensorShape: Error Code 7: Internal Error (/up_blocks.1/Concat: axis 3 dimensions must be equal for concatenation on axis 1. Condition '==' violated: 16 != 15. Instruction: CHECK_EQUAL 16 15.)，根据不同的输入图有不同的维度匹配错误

A: TODO

Q: StableDiffusion 3.5 Large 导出的 TensorRT 推理精度有问题，已知使用 polygrphy 验证了 ONNX 和 TensorRT 的精度是对齐的。

A: TODO

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
assets		assets
sd		sd
tools		tools
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Requirements

模型转换

StableDiffusion 1.4

StableDiffusion 3.5 - large

Run

Supported Models

Q && A

About

Releases

Packages

Languages

zhangts20/sd

Folders and files

Latest commit

History

Repository files navigation

Requirements

模型转换

StableDiffusion 1.4

StableDiffusion 3.5 - large

Run

Supported Models

Q && A

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages