Onnx Optimization is taking a long time to generate tokens #1

dynamikapps · 2021-01-24T21:42:04Z

Hi,

Thanks for created the everything gpt tutorial. It's been very helpful. I'm noticing that the Onynx optimized model is taking a long time to generate more than 200 token. By a long time I mean anywhere from 10m-15m or even timing out. This happens even on the colab using the V100. When trying to generate a token on AWS using the configuration you mentioned, it usually times out. I would love to get your thoughts on a resolution for this.

dynamikapps · 2021-01-28T13:44:34Z

Also I notice the GPT-2-Simple generates text much faster than the Pytorch or ONNX versions. Why is that?

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Onnx Optimization is taking a long time to generate tokens #1

Onnx Optimization is taking a long time to generate tokens #1

dynamikapps commented Jan 24, 2021

dynamikapps commented Jan 28, 2021

Onnx Optimization is taking a long time to generate tokens #1

Onnx Optimization is taking a long time to generate tokens #1

Comments

dynamikapps commented Jan 24, 2021

dynamikapps commented Jan 28, 2021