[QUESTION] large file scoring #206

vince62s · 2024-03-04T12:32:30Z

When scoring a large file (say > 100K records) why does it start with a high throughput , for instance say 50 it/sec, and quickly after a few 10K records it drops significantly (more than half)

Thanks

vince62s · 2024-03-04T12:33:58Z

could it be the same as: #158

ricardorei · 2024-03-14T18:34:44Z

Training is typically influenced by various factors, but for inference, batch sorting is employed to minimize padding. Consequently, the longest batches end up being processed in the end resulting in a higher number of tokens per batch compared to the beginning.

ricardorei · 2024-03-14T18:35:06Z

you can check the difference by setting length_batching to False

vince62s added the question Further information is requested label Mar 4, 2024

vince62s closed this as completed Mar 14, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[QUESTION] large file scoring #206

[QUESTION] large file scoring #206

vince62s commented Mar 4, 2024

vince62s commented Mar 4, 2024

ricardorei commented Mar 14, 2024

ricardorei commented Mar 14, 2024

[QUESTION] large file scoring #206

[QUESTION] large file scoring #206

Comments

vince62s commented Mar 4, 2024

vince62s commented Mar 4, 2024

ricardorei commented Mar 14, 2024

ricardorei commented Mar 14, 2024